Cum se creează o nouă limbă, Finereader

Cum se creează o nouă limbă

În procesul de recunoaștere, programul se bazează pe cunoașterea limbii specificate ca limbă de recunoaștere. Atunci când se prelucrează texte care conțin multe construcții nefiresc, de exemplu articole, crește probabilitatea de erori de recunoaștere. Înainte de recunoașterea unui astfel de document, trebuie să creați o nouă limbă.

  1. Numele noii limbi.
  2. În câmpul Limbă de bază, se folosește limba, pe baza căreia creați o nouă limbă. Acest câmp afișează limba pe care ați selectat-o ​​în dialogul Proprietăți de limbă. În lista derulantă, puteți selecta o altă limbă.
  3. Alfabetul limbii indică alfabetul limbii pe baza căruia creați o nouă limbă. Faceți clic pe butonul pentru a edita alfabetul.

Dicționar. care vor fi utilizate de sistem atunci când recunoaște și verifică textul recunoscut. Sunt disponibile următoarele opțiuni:

  • nu
    Nu conectați dicționarul la limba respectivă.
  • Dicționarul încorporat
    Utilizați dicționarul furnizat împreună cu programul.

Dicționar de utilizare
Pentru a umple un dicționar sau conectați dicționarul personalizat sau un fișier text vechi în Windows (ANSI) -kodirovke (cuvinte trebuie să fie separate prin spații sau alte caractere care nu sunt incluse în alfabetul), faceți clic pe Properties ...

Notă. Când verificați cuvintele vocabular ortografice ale limbii de utilizator nu ies în evidență, în cazul în care textul s-au întâlnit în forma în care acestea sunt date în dicționar, sau în formularul standard: toți tinerii, toate cu majuscule, cu o scrisoare de capital.

Tipul cuvântului din dicționar

Posibile ortografii de cuvinte în text

aBc, abc, Abc, ABC

  • Expresie regulată
    Puteți crea un dicționar de limbă personalizat utilizând expresii regulate.

    Puteți specifica proprietăți suplimentare ale limbii. Pentru aceasta, faceți clic pe butonul Avansat ...
    În dialogul Proprietăți limitate suplimentare, puteți specifica:

    • Simboluri care pot apărea la începutul sau sfârșitul unui cuvânt
    • Caractere non-alfabetice care sunt scrise separat de cuvinte
    • Specificați caracterele ignorate care pot apărea în interiorul unui cuvânt
    • Simboluri care nu pot fi găsite în textele recunoscute cu conexiunea acestei limbi (caractere interzise)
    • Toate caracterele recunoscute ale limbii
    • Opțiunea Prezența cifrelor arabe și romane, abrevieri etc. în text.
  • După ce limbajul este creat, selectați-l pentru recunoaștere.

    Implicit, limba utilizată va fi salvată în dosarul documentului ABBYY FineReader. Puteți specifica un alt folder pentru stocarea limbilor personalizate în câmpul Folder pentru stocarea dicționarelor personalizate în fila Suplimentare din dialogul Opțiuni (Instrumente> Opțiuni ...).

    Cum se creează o nouă limbă

    Articole similare