Lucrarea se confruntă adesea cu nevoia de a recunoaște textul. Fie că este o carte scanate, PDF document, sau ai nevoie doar pentru a trage textul din imagine. În acest articol vreau să-ți spun cum o fac, și de a împărtăși o anumită experiență. Să sperăm că sfaturile din articol poate ajuta utilizatorii începători să învețe calitativ recunoaște textul din imagini scanate sau alte fișiere grafice. Voi vorbi despre avantajele și dezavantajele de recunoaștere on-line. Și vezi ce program pe care doriți să instalați și cum să-l utilizați pentru înaltă calitate OCR pe imagini.
Ce înțelegem prin cuvintele „recunosc textul?“
Recunoaștere text - este de a traduce textul din imagine în text sau simboluri într-o prezentare de calculator. Dacă imaginea scanată este un text, apoi, după recunoașterea pe care îl obține sub forma unui document (PDF, MS Word, Excel, HTML, RTF, TXT), care pot fi editate. Recunoașterea, de exemplu, este folosit pentru a converti cărți sau documente scanate în format electronic. Fișierul creat va fi exact la fel ca și structura originală a documentului va fi salvat aranjament de tabele, coloane și numele de fonturi. În care detectează video de mult mai ușor de a lucra cu textul, și trimite prin rețea.
Ai nevoie să recunoască rapid textul scanat?
Servicii on-line pentru a vă ajuta. Destul de des în practica mea, am avut ocazia de a recunoaște textul on-line. Foarte ușor de utilizat serviciile de recunoaștere on-line în cazul în care sunteți, de exemplu, nu la locul de muncă. Eu dau cateva link-uri:
OCRconvert.com - este un serviciu online gratuit care vă permite să recunoască text din JPEG fișiere PDF, fișiere, etc. în general, orice imagine scanată pot fi convertite în text.
- textul recunoscut trebuie să fie copiate dintr-o pagină web. Nu există nici o caracteristică de export în * .doc sau * .docx. După cum știți, nu ce fel de reținere formatarea de exprimare nu poate fi batut - doar un text. Dacă nu contează - atunci nici o problema.
OnlineOCR.ru - permite să recunoască textul din imagini simple, document scanat sau o fotografie. Rezultatul poate fi obținut în oricare dintre cele 6 formate acceptate.
FineReader online - cu ajutorul acestui serviciu puteți transfera imaginile capturate în format electronic, convenabil pentru editare și stocare.
Puteți utiliza serviciile lor în cazul în care trebuie să recunoască textul de la doar una sau câteva imagini - nimic mai mult. În acest caz, este posibil și nu are nici un sens pentru a stabili un program pentru a recunoaște textul.
Dezavantajele de servicii on-line:
- Trebuie să fii înregistrat în sistem
- Limita privind numărul de documente de recunoaștere
- Nu există nici o posibilitate de a crea un proces de recunoaștere. Dacă imaginile complexe de pagini interconectate formule și text în diferite limbi - este foarte dificil de a obține un rezultat decent de recunoaștere.
- În funcție de Internet.
Cum de a recunoaște textul scanat utilizând programul.
Principalele caracteristici ale ABBYY FineReader:
- Precizia recunoașterii și păstrarea formatarea documentului.
- Interfata prietenoasa - program foarte ușor de utilizat.
- Recunoașterea imaginilor digitale de la orice sursă.
- Traduceri în formate electronice populare - DOCX, XLSX, PDF și altele.
- Există instrumente pentru a îmbunătăți calitatea fotografiilor documentelor.
- scenarii tipice pentru traducerea în cele mai populare formate.
- Rularea direct de la Microsoft Word, aplicații Office, Excel, Outlook.
- Suporta 179 de limbi de recunoaștere.
Exemplu: cum să recunoască textul din imagine
Instalați și rulați programul. În continuare, avem nevoie pentru a deschide programul acele imagini, textul de la care doriți să recunoască și să-l salvați ca document Microsoft Word.
FineReader vă solicită imediat pentru a selecta un scenariu în care vom lucra. În cazul nostru, au deja o imagine (ecran în afara amplasamentului ABBYY FineReader), așa că voi alege „imagine în Microsoft Word». În cazul dumneavoastră, poate fi un alt scenariu.
De îndată ce am o imagine pe care doriți să identificați programul pentru a determina locația elementelor în modul automat și a încercat să recunoască textul pe pagină. Dacă nu sunteți mulțumit de modul în care programul a identificat blocuri de text și imagini - poate elimina că marca programul și, cu ajutorul barei de instrumente pentru a alege pentru a indica faptul că este necesar să se recunoască ca text sau tabel, și lăsați-l ca o imagine.
De exemplu, antetul site-ului (în imagine) are un model și un text, dar nu trebuie să recunoască, așa că am stat ca imaginea sa. Deci, nu toate blocurile de imagine. Evidențiați că există o imagine, și că este necesar să se recunoască ca text.
De îndată ce intra în zona de recunoaștere setarea, limba textului (sau de a folosi implicit limba „Auto“) - va trebui să re-recunoască imaginea.
După re-recunosc toate paginile programului va avea ca rezultat în Microsoft Word videdokumenta. Dacă doriți să salvați într-un format diferit - în tab-ul „Save“ doar pentru a alege formatul dorit. Astfel, aveți posibilitatea să creați fișiere PDF din imagini scanate, etc.
După cum puteți vedea, după ajustarea corespunzătoare a ariei de detecție (ceea ce nu este în serviciile on-line), rezultatul este pur și simplu uimitoare! Programul se poate ocupa o astfel de sarcină dificilă pentru 5+. Ca întotdeauna - FineReader mulțumit de fiabilitatea și calitatea muncii!
Asta este! Am văzut exemplul cum să recunoască textul de calitate, cu aproape orice imagine. Sperăm că veți fi articole utile si alte pe site-ul nostru. Mult noroc!
maestru Nikolai Serebryakov- Activitate: 11K
- Reputație: 187
Nikolai Serebryakov maestru acum 2 ani
+3 Răspuns Închide
Alexander. revenire- Activitate 1414
- Reputație: -29
- Sex: Masculin
Alexander. Acum Troll 2 ani