Aceeași problemă este în PDF.
În acest manual voi arăta cum să blitz documentele electronice ale formatelor DjVu PDF.
- [*] Dacă în documentul DjVu nu există niciun strat de text OCR, atunci trebuie să îl facem cu FineReader-7 (8).
- Utilizând programul DjvuOCR, procesați proiectul de lucru FineReader, extrageți informațiile necesare din acesta și creați un strat text + integrați-l în fișierul DjVu.
Acum vom vindeca pentru claritate o carte DjVu.
- Deschideți programul DjvuOCR și selectați "Decodarea fișierului DjVu"
- Faceți clic pe "Adăugați" și selectați "rău" carte DjVu
- Faceți clic pe "Răsfoiți" și selectați directorul unde să salvați fișierele tif.
Aici merită menționat faptul că, în medie, dimensiunea fișierului 1-tif va fi = 3,5 mb și dacă în cartea dvs. va fi, de exemplu, 500 de pagini, aveți nevoie de 3,5 * 500 = 1,750 GB de spațiu liber. Acest lucru trebuie luat în considerare.
- Faceți clic pe "Prelucrare". așteptăm.
- Când fereastra cu sugestia de salvare a fișierului proiectului zboară, faceți clic pe "YES", apelați fișierul proiectului și salvați-l într-un director convenabil.
- Prima etapă a fost finalizată cu succes
Aici voi remarca imediat ca, ca recunoastere, merita sa folositi FineReader, pentru ca programul de procesare a proiectelor de lucru a fost scris pentru proiectele sale și a fost versiunea a 7-a sau a opta (pentru al 9-lea nu știu și 10 nu este cu siguranță potrivit), deoarece programul de procesare funcționează cu frf-shkami, care, de exemplu, nu mai este utilizat în versiunea 10.
[*] Pentru a face acest lucru, trebuie să convertiți fișierul DjVu în tif-uri, de exemplu. pentru că FineReader va continua să lucreze cu ei, recunoscând textul.
[*] Încărcați tif-uri în FineReader și recunoașteți textul în ele. Ca rezultat, creați un proiect de lucru FineReader.
- Deschideți FineReader 7 (8)
- Rulați DjvuOCR și selectați "Manager de înregistrare OCR în modul lot"
- Deschidem o carte cusută cu un strat de text OCR, de exemplu, utilizând programul WinDjView;
- Mergeți la "Instrumente" și bifați caseta de lângă "Selectați textul":
- Deschideți FineReader-10
- Trecem prin meniu: FILE -> NOU DESFĂȘURARE