Recunoașterea optică a caracterelor (OCR) este procesul de extragere a textului dintr-o imagine a paginii. Imaginea paginii este o imagine electronică a textului și a altor elemente posibile (titluri, imagini etc.). Imaginile paginilor pot fi obținute ca urmare a scanării unui document de hârtie sau a deschiderii unui fișier imagine. Aceste fișiere pot fi primite prin e-mail, prin fax sau prin propriul scaner.
Aceste imagini nu conțin text pentru editare. Ele reprezintă un set de puncte (pixeli) care împreună formează o imagine a textului. Cu ajutorul recunoașterii, se verifică imaginea textului și se creează text care poate fi editat pe computer, fără reapelarea manuală.
Imaginea este procesată folosind tehnologia de recunoaștere optică și se creează text din aceasta.
În timpul recunoașterii, OmniPage folosește opțiunile selectate pe bara de instrumente OmniPage pentru a determina fluxul de text pe pagină și creează, de asemenea, zone ordonate în jurul unor părți ale paginilor. Aceasta vă permite să determinați ce elemente vor fi recunoscute ca text și care vor fi salvate ca imagini. După recunoaștere, textul rezultat poate fi stocat în diverse aplicații pentru procesarea de text, foi de calcul și aspectul documentului.
Capacități de recunoaștere OmniPage
În plus față de recunoașterea textului, OmniPage poate stoca următoarele elemente ale documentului atunci când este recunoscut.
imagine
Exemple de imagini sunt fotografiile, logo-urile și desenele.
Formatarea textului
Tipurile, dimensiunile și stilurile de fonturi (cum ar fi bold sau italic) sunt exemple de caractere de formatare a textului. Exemple de formatare a paragrafelor sunt spațierea paragrafelor, liniuțele, tabelarea, spațierea liniilor și alinierea.
Formatarea paginii
Exemple de formatare a paginii sunt structura coloanei, plasarea paragrafelor, prelucrarea tabelei și aspectul imaginii.
Programul OmniPage recunoaște numai caractere tipărite: de exemplu, tastat pe o imprimantă sau text scris de text. Textul scris de mână (de exemplu, o semnătură) poate fi salvat ca o imagine.