Scanarea și recunoașterea inventarelor de arhivă în - FineReader 8

Scanarea și recunoașterea inventarului de arhivă în FineReader sunt mult mai rapid decât să introduceți manual în Word, sau chiar mai mult pentru a câștiga mâna în fonduri de arhivă.

1. Nu scanați fiecare pagină individual, ci mai multe pagini într-un mod automat. Setați întârzierea la 4 secunde. - acest lucru este suficient pentru a întoarce pagina.

2. Selectați modul de scanare - scala gri. Scanarea în modul alb-negru va complica foarte mult recunoașterea. Alegeți acest mod numai pentru inventarele moderne cu o calitate foarte bună, tipărite pe o imprimantă laser sau o imprimantă matrică cu puncte bune. Scanarea în modul color încetinește scanarea, crește cantitatea de fișiere de pe disc, calitatea recunoașterii nu este afectată.

2.1. Glisați fereastra "Imagine" mai largă pentru a vedea imediat rezultatele scanării. Fereastra "Text" nu este încă necesară, reducând dimensiunea acesteia.

2.2. Începeți scanarea. Scanați toate foile din inventarul de arhivă, inclusiv titlurile și foile de asigurare. În procesul de scanare în modul automat, trebuie doar să întoarceți foile - tot ce poate face programul.

3. Dacă limitele celulelor sunt exprimate clar (înregistrări moderne de arhivă de înaltă calitate), încercați să rulați recunoașterea fundalului în timpul scanării.

4. Deseori nu există granițe (inventare vechi tipărite pe o mașină de scris, de la Lexicon). Pentru a nu marca manual blocurile pe fiecare pagină, le puteți salva și încărca. Selectați blocul "Tabel" de pe pagina a doua (unde există un tabel, nu există capace de inventar), setați manual coloanele, salvați selecția și încărcați pentru toate paginile.

4.1. Selectați instrumentul "Selectare tabel", selectați blocul.

4.2. Selectați instrumentul Adăugare linie verticală, selectați coloanele.

4.3. Salvați șablonul - alegeți Imagine | Salvați șablonul de bloc ....

4.4. Evidențiați pagina fără blocuri marcate (toate, în cazul în care nu există nici o prefață, pagina de titlu) în fereastra „pachet“ - click pe a treia pagină, Shift țineți apăsat, faceți clic pe ultima pagină. Ca opțiune - selectați toate paginile. Blocuri de încărcare - selectați Imaginea | Descărcați șablonul de bloc .... Selectați fișierul salvat anterior. Blocurile sunt acum alocate pe toate paginile pachetului.

4.5. Corect pe toate paginile blocurile. Țineți Alt. Glisați blocul pentru a se potrivi cu tabela de inventar. Adăugați margini orizontale - selectați instrumentul "Adăugați o linie orizontală", dați clic în locurile în care doriți să separați liniile una de alta prin linii. Pentru a trece rapid la pagina următoare / anterioară, utilizați tastele Alt + Jos. Alt + Sus.

5. Dacă lista de arhivă este tipărită pe o mașină de scris sau pe o imprimantă matrică din Lexicon, setați tipul de tipărire "Typewriter" în setări.

5.1. Selectați Instrumente | Opțiuni ... În fila General, faceți clic pe butonul Opțiuni avansate .... Selectați tipul de tipărire "Tipograf".

6. Porniți recunoașterea fundalului - selectați Procesul | Pornește recunoașterea fundalului.

7. În timp ce scanați / recunoașteți, puteți selecta blocuri (dacă nu sunt deja selectate), corectați și corectați erorile de recunoaștere.

7.1. Trageți fereastra "Text" mai largă, reduceți dimensiunea ferestrei "Imagine".

8. Treceți prin toate paginile, corectați erorile de recunoaștere. Pentru a trece rapid la pagina următoare / anterioară, utilizați tastele Alt + Jos. Alt + Sus. Când editați, verificați imaginea mărită sub text - în Word'e este necesar să verificați originalul pe hârtie, ceea ce este destul de incomod.

8.1. Verificați crahierele recunoscute incorect - adesea FineReader introduce o cratimă (de-fis) în loc de liniuțe moi. Alegeți Edit | Găsiți .... În linia "Text pentru căutare", tastați "- ^ l" (sau tastați o cratimă, faceți clic pe butonul >> și selectați meniul Transfer rapid). Nu sunt atât de multe greșeli, așa că asigurați-vă că ați verificat întregul text.

8.2. Recunoașteți coloana "Numărul cazului" nu este necesară, deoarece Puteți aranja numerele în Word automat utilizând listele. AutoAF acceptă o astfel de numerotare. Cazurile pot fi de asemenea numerotate prin AutoRecord.

9. Transferați rezultatele în Word. În opțiuni, anulați modificările și graficele moi.

9.1. Selectați Instrumente | Opțiuni ... În "4. Faceți clic pe butonul "Formate ...". În fila "RTF / DOC / Word XML" selectați designul "Tabele, paragrafe, fonturi".

9.2. Debifați Păstrați împărțirea pe linii. Păstrați separarea după pagină. Salvați culoarea textului. În Word, nu trebuie să ștergeți pauze suplimentare de pagină, inventarul va consta dintr-un tabel, nu din mai multe separat.

9.3. Bifați caseta de selectare Transfer transfer soft. Întreruperile moi nu sunt de obicei necesare și nu împiedică.

9.4. Puteți bifa caracterele incerte evidențiate (în FineReader albastru colorat), apoi vor fi colorate și în Word'e. După verificarea inventarului, deselectați-l.

9.5. Debifați Salvare fotografii. astfel încât Cuvântul să nu aibă linii negre suplimentare.

9.6. Selectați Procesul | Salvați rezultatele Transferați toate paginile la | Microsoft Word.

10. În Word, selectați totul, setați un format de font, un format de paragraf, eliminați designul inutil.

11. Eliminați paragrafe inutile, pauze de linii, pagini, secțiuni între tabele, astfel încât tabelele să se integreze într-una.

12. Pentru a alinia toate coloanele. Transformați masa în text și înapoi în tabel.

12.1. Eliminați toate marcajele de paragrafe din celulele tabelului.

Alegeți Edit | Înlocuiți .... În câmpul Căutare, tastați textul p (marcajul paragrafului). În câmpul "Înlocuiește", introduceți un spațiu (apăsați o dată spațiul). Faceți clic pe butonul "Înlocuiește tot". Când vi se solicită, faceți clic pe "Nu".

Dacă anteturile sunt alcătuite din mai multe paragrafe, de exemplu, o poziție și o adnotare, salvați marcările de paragrafe. Înlocuiți semnele paragrafului cu un alt text, de exemplu @@@.

12.2. Conversia tabelului în text. Selectați tabelul | Evidențiați | Tabel. Selectați tabelul | Conversie | Tabelul din text ...

12.3. Transformarea textului într-o tabelă - selectați meniul Tabel | Conversie | Textul din tabel .... Selectați lățimea coloanei automate "După conținut", astfel încât lățimea fiecărei coloane să fie ajustată automat - numărul, numărul este mai restrâns, titlul este mai mare. Selectați delimitatorul tab-ului.

Dacă este necesar, după conversia tabelelor, înlocuiți textul @@@ cu marcajul de paragraf ^ p.

13. Anulați transferul rândurilor în tabel, astfel încât fiecare titlu să fie plasat complet pe pagină. Selectați tabelul | Evidențiați | Tabel. Selectați tabelul | Tabel proprietăți .... În fila "Linie", debifați Activați transferul de linii către pagina următoare.

Prin AutoScribe, este mai ușor și mai rapid să anulați împachetarea în linie.

14. Faceți titlurile înregistratorului de inventar. astfel încât să nu se îndepărteze de text și să nu rămână la sfârșitul paginii. Selectați rândul tabelului cu titlul rubricatorului - selectați meniul Tabel | Evidențiați | String. Setați tipul cu caractere aldine. Selectați Format | Paragraful .... În fila "Poziție pe pagină", ​​marcați Stakeout în paginile | nu rupeți următoarea.

Prin AutoScribe, rubricile directorului sunt mai ușor și mai rapid.

15. Scoateți spațiile inutile. puneți-vă, faceți. În același timp, în toate etapele, identificați erorile de recunoaștere.

17. Salvați inventarul ca text. Transferați la Fondul de arhivă prin AutoAF.

18. Salvați pachetul detectat ca imagini JPEG pentru fondul de utilizare - selectați Fișier | Salvați rezultatele Salvați imagini .... Verificați Salvare | Asta e tot. Selectați Tip fișier "JPEG, gri (* .jpg)".

Încercați să salvați imaginile într-un format fără distorsiuni și să procesați programul IBCB pentru a șterge fundalul.

19. Salvați întregul inventar în format PDF sau DJVU - selectați Fișier | Salvați rezultatele Salvați paginile .... Verificați | Salvare | Toate paginile. Selectați Tip fișier "Document PDF (* .pdf)". Pentru a selecta calitatea dorită de salvare, faceți clic pe butonul "Format ...".

Salvați textul sub grafic.

P.S. În noua versiune a FineReader 9.0, interfața este modificată semnificativ. Programul din fișiere nu a fost testat.