Cum se face o selecție

Aceeași problemă este în PDF.

În acest manual voi arăta cum să blitz documentele electronice ale formatelor DjVu PDF.

Aici voi remarca imediat ca, ca recunoastere, merita sa folositi FineReader, pentru ca programul de procesare a proiectelor de lucru a fost scris pentru proiectele sale și a fost versiunea a 7-a sau a opta (pentru al 9-lea nu știu și 10 nu este cu siguranță potrivit), deoarece programul de procesare funcționează cu frf-shkami, care, de exemplu, nu mai este utilizat în versiunea 10.

[*] Pentru a face acest lucru, trebuie să convertiți fișierul DjVu în tif-uri, de exemplu. pentru că FineReader va continua să lucreze cu ei, recunoscând textul.

[*] Încărcați tif-uri în FineReader și recunoașteți textul în ele. Ca rezultat, creați un proiect de lucru FineReader.

Utilizând programul DjvuOCR, procesați proiectul de lucru FineReader, extrageți informațiile necesare din acesta și creați un strat text + integrați-l în fișierul DjVu.

Acum vom vindeca pentru claritate o carte DjVu.
- Deschideți programul DjvuOCR și selectați "Decodarea fișierului DjVu"
Faceți clic pe "Adăugați" și selectați "rău" carte DjVu
Faceți clic pe "Răsfoiți" și selectați directorul unde să salvați fișierele tif.

Aici merită menționat faptul că, în medie, dimensiunea fișierului 1-tif va fi = 3,5 mb și dacă în cartea dvs. va fi, de exemplu, 500 de pagini, aveți nevoie de 3,5 * 500 = 1,750 GB de spațiu liber. Acest lucru trebuie luat în considerare.
Faceți clic pe "Prelucrare". așteptăm.
Când fereastra cu sugestia de salvare a fișierului proiectului zboară, faceți clic pe "YES", apelați fișierul proiectului și salvați-l într-un director convenabil.
Prima etapă a fost finalizată cu succes

Deschideți FineReader 7 (8)

Următorul fișier -> Deschide imaginile -> selectați toate tif-urile noastre și adăugați-le în pachet.

Alegem limba rusă de recunoaștere și dă clic pe "pentru a recunoaște totul"

După ce FineReader 7 (8) a recunoscut textul în toate paginile tif, faceți clic pe:

FILE -> AMBALAJ ÎNCHIS -> SCURTAM ȘI NEMINEM NUMELE;

Apoi, ieși din FineReader-bine și du-te la FineReader-proiectul nou creat să învețe mai departe de el toate conținuturile (cu fișiere ascunse) în același director în care FineReader-proiect. Acest lucru este necesar pentru ca DjvuOCR să poată procesa fișierele frf în etapa următoare.

A doua etapă a fost finalizată cu succes.

Rulați DjvuOCR și selectați "Manager de înregistrare OCR în modul lot"

Apoi, faceți clic pe "Deschideți proiectul de decodor" și adăugați fișierul dprj creat în prima etapă.

Apoi, în setări, bifați "Transfer normal" "Ignorați erorile"

Apoi dați clic pe "Răsfoiți" și selectați directorul în care am salvat proiectul FineReader și extras fișierele frf din acesta.

Dacă nu dorim să editați după crearea stratului OCR, vă recomandăm să verificați imediat caseta "Creați cărți DJVU?". În acest caz, stratul OCR este automat integrat în cartea DjVu.

Ultimul - faceți clic pe "Răsfoiți" și selectați dosarul pentru salvarea recunoscutului.

Toate celelalte setări pot fi lăsate "ca atare", dacă nu există probleme cu scalele și paginile inutile.

Faceți clic pe "Prelucrare"

Felicitări! Acum, cartea ta DjVu este cusută și are un text OCR-layer.

Deschidem o carte cusută cu un strat de text OCR, de exemplu, utilizând programul WinDjView;
Mergeți la "Instrumente" și bifați caseta de lângă "Selectați textul":

Acum putem selecta textul folosind cursorul și îl putem copia în tampon:

De asemenea, efectuați o căutare după cuvinte:

Deschideți FineReader-10
Trecem prin meniu: FILE -> NOU DESFĂȘURARE

Apoi treceți prin: ADOBE PDF -> CONVERT TO PDF (imagine cu căutare)

Am selectat fișierul PDF pacient, l-am deschis, am trecut recunoașterea automată.

Apoi, după ce recunoașterea sa terminat, fișierul pdf rezultat va zbura către noi, pe care îl salvăm în directorul dorit utilizând meniul Adobe Reader: FILE - SAVE AS. READY.

Articole similare

Pagina anterioară

Pagina următoare