Tehnici de recunoaștere model

În prezent, există multe sarcini care necesită să ia o decizie în funcție de prezența imaginii unui obiect sau pentru ao clasifica. Capacitatea de a „recunoaște“ este considerat a fi principala caracteristică a creaturi biologice, în timp ce sistemul informatic al acestei proprietăți este nu posedă pe deplin.

Luați în considerare elementele comune ale modelului de clasificare.

Clasa - un set de obiecte cu proprietăți comune. prezența „similaritate“ este destinat obiectelor din aceeași clasă. Pentru recunoașterea problemei poate fi determinată prin orice număr de clase este mai mare decât 1. Numărul de clase este notată cu numărul de S. Fiecare clasă are propria marca de identificare a clasei.

Clasificare - procesul de alocare a eticheta unei clase de obiecte, în conformitate cu unele descriere a proprietăților acestor obiecte. Qualifier - un dispozitiv care primește ca intrare un set de atribute obiect, și, ca urmare a emiterii etichetei de clasă.

Verificarea - procesul de comparare instanță a obiectului cu același model sau clasă de obiecte descriere.

Sub modul în care înțelegem numele câmpului în spațiul caracteristică, care afișează o multitudine de obiecte sau fenomene ale lumii materiale. Indicator - descrierea cantitativă a unei proprietăți a obiectului de testare sau fenomen.

spațiu Caracteristică este un spațiu N-dimensional definit pentru această problemă de recunoaștere, unde N - numărul de atribute măsurate fix pentru orice obiect. Vectorul spațiu caracteristică x, corespunzător sarcinii de recunoaștere a obiectului este vectorul N-dimensional cu componente (x_1, x_2, ..., x_N), care sunt valori caracteristice obiectului.

Cu alte cuvinte, recunoașterea model poate fi determinată ca atribuirea inițială a datelor într-o anumită clasă, prin selectarea de caracteristici esențiale sau proprietăți care caracterizează aceste date, greutatea totală de detalii irelevante.

Exemple de sarcini de clasificare sunt:

  • Recunoașterea caracterului;
  • recunoașterea vorbirii;
  • stabilirea unui diagnostic medical;
  • Prognoza meteo;
  • Face recognition
  • clasificarea documentelor și altele.

În cele mai multe cazuri, materia primă se obține din imaginea camerei. Problema poate fi formulată ca un preparat de vectori corespunzători pentru fiecare clasă din imaginea examinată. Procesul poate fi privit ca procesul de codificare constă în atribuirea unei valori pentru fiecare caracteristică a spațiului caracteristică pentru fiecare clasă.

Dacă luăm în considerare două clase de obiecte: adulți și copii. Ca semne de posibil să se aleagă înălțimea și greutatea. După cum se poate observa din figură, aceste două clase formează două seturi disjuncte, care pot fi explicate prin atributele selectate. Dar nu alege întotdeauna parametrii corecți care urmează să fie măsurate ca o indicație a claselor. De exemplu, parametrii selectați nu vor lucra pentru a crea clase disjuncte de jucători de fotbal și jucători de baschet.

Tehnici de recunoaștere model

A doua sarcină de recunoaștere este selectarea trăsăturilor caracteristice sau proprietăți ale imaginilor originale. Această problemă poate fi atribuită pretratarea. Dacă luăm în considerare problema recunoașterii vorbirii, puteți selecta caracteristici, cum ar fi vocale și consoane. Un semn trebuie să aibă o anumită proprietate caracteristică a clasei, în timp ce comune pentru această clasă. Semne care descriu diferențele dintre - semne interclass. Simptomele comune tuturor claselor nu poartă informații utile, și nu sunt văzute ca un semn de recunoaștere a sarcinii. Alegerea semnelor este una dintre cele mai importante sarcini legate de construcția sistemului de recunoaștere.

Odată definite atributele necesare pentru a determina procedura de decizie optimă pentru clasificare. Luați în considerare sistemul de recunoaștere a modelului proiectat să recunoască diferite clase M desemnate ca M_1, m_2, ..., m_3. Apoi, putem presupune că spațiul este format din regiuni M imagine, fiecare conținând un punct de manieră corespunzătoare dintr-o clasă. Apoi, problema recunoașterii poate fi considerată clădire Desparte clasa M, bazată pe vectorii de măsurare primite.

imagine Soluție sarcini pre-procesare, extracție caracteristică, și problema obținerii soluției optime și clasificarea este de obicei asociată cu necesitatea de a evalua un număr de parametri. Acest lucru conduce la problema de estimare a parametrilor. Mai mult, este evident că caracteristicile de selecție poate utiliza informații suplimentare din natura claselor.

obiecte Compararea poate fi făcută pe baza reprezentării acestora sub forma unor măsurători vectoriale. Datele de măsurare, care este reprezentat ca numere reale. Apoi similitudinea vectorilor de atribut a două obiecte pot fi descrise de distanța euclidiană.

unde d - dimensiunea vectorilor.

Împărtășiți cele 3 grupe de metode de recunoaștere model:

  • potrivire de model. Acest grup include clasificarea cea mai apropiată clasificare medie de distanța până la cel mai apropiat vecin. De asemenea, în comparație cu grupul de model includ metode structurale de recunoaștere.
  • Metode statistice. După cum sugerează și numele, metodele statistice utilizate unele informații statistice în rezolvarea problemei recunoașterii. Metoda determină obiectul aparține unei anumite clase pe baza probabilității În unele cazuri, se ajunge la definirea unei probabilități a posteriori a obiectului care aparține unei anumite clase, cu condiția ca caracteristicile acestei facilitate a avut valori corespunzătoare. Un exemplu este metoda bazată pe reguli de decizie bayesiană.
  • Retele neuronale. Metodele de detectare de clasă separate. O trăsătură distinctivă a celorlalți este abilitatea de a învăța.

În continuare, considerăm o varietate de metode referitoare la diferite grupuri.

Clasificarea cea mai apropiată valoare medie

În abordarea clasică, recunoașterea de model, în care pentru clasificarea unui obiect necunoscut este reprezentat ca un vector caracteristici elementare. semne pe baza sistemului de recunoaștere poate fi proiectat în diferite moduri. Acești vectori pot fi cunoscute în sistem în prealabil prin învățare sau de prezis, în timp real, pe baza oricăror modele.

Un algoritm simplu este fragmentul de etichetare vectorul de date de referință de clasă utilizând clasa așteptare (valoarea medie).

unde X_ (i, j) - semnul de referință j-lea de clasa I, numărul n_j- de vectori de referință din clasa i.

Apoi, un obiect necunoscut se va referi la clasa I, în cazul în care este mult mai aproape de clasa de matematică vectorul i așteptări decât vectorii de așteptările altor clase. Această metodă este adecvată pentru aplicațiile în care fiecare puncte de clasă sunt compacte și departe de alte clase de puncte.

Tehnici de recunoaștere model

Dificultățile apar în cazul în care clasele vor avea un pic mai complicat, de exemplu, așa cum se arată mai jos. În acest caz, clasa 2 este împărțită în două regiuni disjuncte care sunt descrise prost cu o singură valoare medie. De asemenea, clasa 3 este prea întinsă, probe de clasa a treia x_2 mare de coordonate valori mai apropiate de valoarea medie a prima clasa decât treia.

Tehnici de recunoaștere model

Această problemă poate fi uneori rezolvată prin schimbarea de calcul la distanță.

Vom lua în considerare caracteristicile valorilor de clasă „spread“ - σ_i, de-a lungul fiecare coordonată i. Deviația standard este rădăcina pătrată a varianței. distanța euclidiană scalată între vectorul x și vectorul este egal cu așteptările x_c

Tehnici de recunoaștere model

Această formulă distanță va reduce numărul de erori de clasificare, dar, de fapt, cele mai multe dintre problemele pe care nu se poate imagina o astfel de clasă simplă.

Clasificarea de distanța până la cel mai apropiat vecin

O altă abordare a clasificării este de a clasifica un vector caracteristic x necunoscute clasei căreia probele individuale, vectorul este cel mai apropiat. Această regulă se numește regula de cel mai apropiat vecin. Clasificarea în funcție de cel mai apropiat vecin poate fi mai eficientă, chiar dacă clasele au o structură complicată atunci când clase sau se intersectează.

Această abordare nu necesită ipoteze cu privire la modelele de distribuție ale vectorilor în spațiu. Algoritmul folosește doar informația despre probele de referință cunoscute. soluții Metoda bazată pe calculul distanței x pentru fiecare probă într-o bază de date și de a găsi distanța minimă. Avantajele acestei abordări sunt evidente:

  • orice moment puteți adăuga noi modele într-o bază de date;
  • copac și structura de date grila poate reduce cantitatea de distanțele calculate.

În plus, soluția va fi mai bine, dacă ne uităm la baza mai mult de un cel mai apropiat vecin și k. Apoi, pentru k> 1 oferă cea mai bună selecție de distribuție vector în spațiul d-dimensional. Cu toate acestea, utilizarea eficientă a valorilor k depinde dacă o cantitate suficientă de spațiu în fiecare zonă este disponibil. Dacă există mai mult de două clase care fac decizia corectă este mai complicată.

literatură

articole similare