Cum se face o selecție

Aceeași problemă este în PDF.

În acest manual voi arăta cum să blitz documentele electronice ale formatelor DjVu PDF.

    [*] Dacă în documentul DjVu nu există niciun strat de text OCR, atunci trebuie să îl facem cu FineReader-7 (8).

    Aici voi remarca imediat ca, ca recunoastere, merita sa folositi FineReader, pentru ca programul de procesare a proiectelor de lucru a fost scris pentru proiectele sale și a fost versiunea a 7-a sau a opta (pentru al 9-lea nu știu și 10 nu este cu siguranță potrivit), deoarece programul de procesare funcționează cu frf-shkami, care, de exemplu, nu mai este utilizat în versiunea 10.

    [*] Pentru a face acest lucru, trebuie să convertiți fișierul DjVu în tif-uri, de exemplu. pentru că FineReader va continua să lucreze cu ei, recunoscând textul.

    [*] Încărcați tif-uri în FineReader și recunoașteți textul în ele. Ca rezultat, creați un proiect de lucru FineReader.

  • Utilizând programul DjvuOCR, procesați proiectul de lucru FineReader, extrageți informațiile necesare din acesta și creați un strat text + integrați-l în fișierul DjVu.

    Acum vom vindeca pentru claritate o carte DjVu.

    • Deschideți programul DjvuOCR și selectați "Decodarea fișierului DjVu"
  • Faceți clic pe "Adăugați" și selectați "rău" carte DjVu
  • Faceți clic pe "Răsfoiți" și selectați directorul unde să salvați fișierele tif.

    Aici merită menționat faptul că, în medie, dimensiunea fișierului 1-tif va fi = 3,5 mb și dacă în cartea dvs. va fi, de exemplu, 500 de pagini, aveți nevoie de 3,5 * 500 = 1,750 GB de spațiu liber. Acest lucru trebuie luat în considerare.

  • Faceți clic pe "Prelucrare". așteptăm.

  • Când fereastra cu sugestia de salvare a fișierului proiectului zboară, faceți clic pe "YES", apelați fișierul proiectului și salvați-l într-un director convenabil.

  • Prima etapă a fost finalizată cu succes
  • Deschideți FineReader 7 (8)
  • Următorul fișier -> Deschide imaginile -> selectați toate tif-urile noastre și adăugați-le în pachet.
  • Alegem limba rusă de recunoaștere și dă clic pe "pentru a recunoaște totul"

  • După ce FineReader 7 (8) a recunoscut textul în toate paginile tif, faceți clic pe:

    FILE -> AMBALAJ ÎNCHIS -> SCURTAM ȘI NEMINEM NUMELE;
  • Apoi, ieși din FineReader-bine și du-te la FineReader-proiectul nou creat să învețe mai departe de el toate conținuturile (cu fișiere ascunse) în același director în care FineReader-proiect. Acest lucru este necesar pentru ca DjvuOCR să poată procesa fișierele frf în etapa următoare.
  • A doua etapă a fost finalizată cu succes.
    • Rulați DjvuOCR și selectați "Manager de înregistrare OCR în modul lot"
  • Apoi, faceți clic pe "Deschideți proiectul de decodor" și adăugați fișierul dprj creat în prima etapă.
  • Apoi, în setări, bifați "Transfer normal" "Ignorați erorile"
  • Apoi dați clic pe "Răsfoiți" și selectați directorul în care am salvat proiectul FineReader și extras fișierele frf din acesta.
  • Dacă nu dorim să editați după crearea stratului OCR, vă recomandăm să verificați imediat caseta "Creați cărți DJVU?". În acest caz, stratul OCR este automat integrat în cartea DjVu.
  • Ultimul - faceți clic pe "Răsfoiți" și selectați dosarul pentru salvarea recunoscutului.
  • Toate celelalte setări pot fi lăsate "ca atare", dacă nu există probleme cu scalele și paginile inutile.
  • Faceți clic pe "Prelucrare"
  • Felicitări! Acum, cartea ta DjVu este cusută și are un text OCR-layer.
    • Deschidem o carte cusută cu un strat de text OCR, de exemplu, utilizând programul WinDjView;
    • Mergeți la "Instrumente" și bifați caseta de lângă "Selectați textul":
  • Acum putem selecta textul folosind cursorul și îl putem copia în tampon:

  • De asemenea, efectuați o căutare după cuvinte:

    • Deschideți FineReader-10
    • Trecem prin meniu: FILE -> NOU DESFĂȘURARE
  • Apoi treceți prin: ADOBE PDF -> CONVERT TO PDF (imagine cu căutare)
  • Am selectat fișierul PDF pacient, l-am deschis, am trecut recunoașterea automată.
  • Apoi, după ce recunoașterea sa terminat, fișierul pdf rezultat va zbura către noi, pe care îl salvăm în directorul dorit utilizând meniul Adobe Reader: FILE - SAVE AS. READY.
  • Articole similare