Selectarea obiectelor în mișcare

1.1.1. Imagine digitală

Procesarea imaginilor color poate fi împărțită condiționat în două domenii principale:

· Prelucrarea imaginilor în culori naturale,

· Prelucrarea imaginilor în pseudo culori.

În primul caz, imaginea este formată dintr-un înregistrator de imagini color. În cel de-al doilea caz, sarcina constă în atribuirea culorilor la unele valori ale intensității unui semnal monocrom sau la anumite intervale de intensitate a acestuia.

Imaginea este înțeleasă ca funcție a două variabile reale I (x, y). unde I este intensitatea (luminozitatea) în punctul cu coordonatele (x, y). Pentru procesarea pe un computer, imaginea trebuie să fie cuantizată și cuantificată. Imaginea cuantificată și cuantificată se numește digitală. Imaginea digitală A (m, n) este reprezentată într-un spațiu discret bidimensional, unde m este numărul liniei și n este numărul coloanei.

Un element situat la intersecția liniei m și a coloanei n este numit pixel. Intensitatea unui pixel poate fi descrisă fie ca un număr real, fie ca un număr întreg. Intensitatea relativă în cifre reale variază în mod normal, de la 0 la 1, și numere întregi de la 0 la semnalul 255.Obychno fizice care apar la punctul (x, y). este o funcție care depinde de mulți parametri (z este adâncimea, # 955; - lungimea de undă, t - timpul). Printre caracteristicile imaginilor digitale se numără:

Rezoluție: măsurată de obicei în dpi (punct per inch - numărul de puncte pe inch). De exemplu, rezoluția ecranului monitorului este, de obicei, 72 dpi, când este imprimată pe hârtie - 600 dpi, când este înregistrată pe un CCD cu o singură dimensiune a elementului de 9 microni, rezoluția va fi de aproape 3000 dpi.

1. Cameră color.

2. Cameră alb-negru.

3. Camera cu filtru IR.

Model de culoare RGB.

Un model color sau un spațiu de culoare reprezintă o reprezentare matematică a unui anumit set de culori. Există câteva modele matematice de bază. Una dintre cele mai utilizate pe scară largă este modelul RGB. Se bazează pe trei culori de bază: roșu, verde și albastru. Culorile de acest tip se numesc aditivi, deoarece se obțin prin adăugarea la negru. Culorile rămase sunt obținute printr-o combinație de culori de bază. De exemplu, combinația de verde și roșu dă o culoare galbenă, combinația de verde și albastru este albastru, iar combinația celor trei culori este albă. Acest spațiu de culoare este utilizat în grafica computerizată, deoarece o astfel de organizație simplifică arhitectura sistemului. În programele PC, canalul de imagine este codificat într-un singur octet. În modelul RGB - trei canale: roșu, albastru și verde, adică RGB - model cu trei canale color. Fiecare canal poate lua valori de la 0 la 255 în zecimal sau de la 0 la FF în notație hexazecimală. În RGB, fiecare culoare poate avea 256 gradări: de la albastru roșu pur sau verde în funcție de canal (FF) până la negru (00). Astfel, modelul RGB conține doar 2563 sau 16777216 culori.

Figura 1 Modelul RGB

Selectarea obiectelor în mișcare

Foarte des, modelul RGB este reprezentat ca un cub. În trei colțuri ale cubului există culori pure: roșu, verde și albastru. În celelalte trei colțuri, combinațiile lor complete: galben, albastru și violet. Între culorile alb-negru, este desenată o diagonală reprezentând gradarea gri.

Model de culoare YUV.

În loc de valorile lui R, G, B, valorile corectate ale lui R ', G', B 'sunt folosite aici. Formulele de corecție sunt simple și depind de un standard specific. În tehnologia digitală, intervalul de valori RGB este [0; 255] pentru fiecare componentă, în timp ce pentru componentele spațiului de culoare YUV intervalele sunt după cum urmează: [0; 255] pentru Y, [-112; 112] pentru U și [-157; 157] pentru V. Pe lângă YUV, puteți găsi asemenea nume: YIQ, YDbDr, YCbCr. Acestea nu sunt alte modele, ele sunt soiuri de YUV. Ele diferă în coeficienții în formule și în standardele în care sunt aplicate. YIQ este folosit în standardul NTSC, YDbDr - în SECAM.

Construirea modelelor de fundal și selectarea primelor elemente

1. obiecte fixe,

2. Deplasarea temporară a obiectelor,

3. Obiectele în mișcare lentă,

4. Obiectele care efectuează fluctuații periodice,

5. obiecte fixe cu o imagine în schimbare dinamică,

6. Mutarea obiectelor.

Metodele de detectare a obiectelor în mișcare sau de evidențiere în alt mod a primului element pot fi împărțite în următoarele grupuri:

1. Metoda de scădere a fundalului.

2. Metodele probabile.

3. Diferența de timp.

Metoda de scădere a fundalului.

Modelul de fundal poate fi construit și pe baza mai multor primele cadre. Valoarea totală a intensității pixelilor modelului de fundal este luată fie ca medie aritmetică

sau o valoare centrală mediană în secvența sortată.

Dezavantaje importante atunci când se construiește un model de fundal prin calcularea mediei aritmetice:

· Prezența mișcării în cadre,

· Modificări accidentale sau abrupte ale luminozității (strălucire, lumină).

Unde indexul t indică numărul cadrului, iar coeficientul a variază de obicei între 0,05 și 0,15 și este rata de actualizare.

Principalul avantaj al algoritmilor de mai sus este ușurarea implementării acestora. Dezavantajele includ sensibilitate ridicată la schimbările de iluminare scenă (cea mai poate fi segmentată în prim-plan) și imposibilitate camera de zgomot de prelucrare de fundal dinamic, o probabilitate de eroare mare a primelor (fals pozitive din cauza imagini de zgomot), iar al doilea tip (treci obiecte) la clasificarea anumitor pixeli de imagine. Unul dintre motive este constanta valorii pragului h. În mod ideal, pragul ar trebui să fie pentru fiecare pixel. De exemplu, pentru zonele cu contrast scăzut, ar trebui să fie mai mic.

Pentru a rezolva aceste probleme, se utilizează un model adaptiv pentru modelul de fundal și prim-plan:

,

.

Există, de asemenea, un model adaptiv încorporat pentru valoarea de prag:

Valoarea coeficienților a, k este luată în intervalul de la 0 la 1. Factorul de ponderare y determină gradul de actualizare a pragului de fond și h. Această modificare a scăderii de fond ia în considerare modificările repetate ale condițiilor externe, precum și pentru a evita segmentarea obiectelor care apar în imagine ca fundal în mișcare.

Pentru funcționarea corectă a acestei metode, trebuie să selectați cu atenție valoarea k. Dacă este prea mic, obiectele din prim plan vor fi rapid clasificate ca fundal, ceea ce va duce la segmentarea incorectă în cadrele ulterioare. În plus, nu va fi posibilă detectarea obiectelor oprite. Dacă valoarea pentru acest factor este prea mare, obiectele din prim-plan nu vor intra niciodată în fundal, ceea ce nu permite reflectarea modificărilor pe termen lung ale scenei.

În metodele probabilistice, schimbarea valorilor pixelilor cu timpul este considerată ca un proces pixel, i. E. Serii de timp constând în valori ale intensității pixelilor. La un moment arbitrar de timp t pentru fiecare pixel (x, y) istoria sa este cunoscută:

Schimbarea pixelilor de fundal este modelată utilizând o variabilă aleatoare distribuită în mod normal cu o densitate # 951; (

unde μ este așteptarea matematică, # 963; - deviația rădăcină medie-pătrată.

Pentru mai multe cadre consecutive, pentru fiecare pixel, parametrii μ și # 963; iar apoi utilizând valoarea pragului determină dacă pixelul aparține primului rând sau fundalului.

După evaluarea inițială a valorilor parametrilor pentru fiecare cadru următor și pentru fiecare pixel, inegalitatea

Dacă este executat, atunci acest pixel este segmentat în fundal, altfel - în față.

Cu fiecare cadru nou, calculul valorilor așteptărilor matematice și RMS crește. Prin urmare, după calculul inițial, valorile pot fi actualizate cu fiecare cadru nou:

Această metodă vă permite să separați fundalul din fundal utilizând o operație de scădere per-pixel a două sau mai multe cadre consecutive. Metoda diferenței de timp definește bine modificările dinamice ale scenei, dar de obicei nu poate izola în întregime toate bloburile omogene. Cel mai adesea, această metodă este utilizată împreună cu alte metode, ceea ce permite o separare destul de stabilă a fundalului din fundal.

Cea mai simplă modalitate de a implementa această metodă constă în găsirea diferenței dintre intensitatea pixelilor cadrului curent și cea anterioară și compararea cu pragul h.

Dacă această valoare depășește o valoare de prag, atunci acest pixel este considerat a fi anteroplan, în caz contrar fundalul. Principala dificultate este alegerea corectă a valorii pragului.

2. Rezultatele experimentale.

Selectarea obiectelor în mișcare

După primirea măștii de vedere frontală, este necesar să selectați piesele conectate sau așa-numitele bloburi pe ea. În plus, problema rezolvării problemelor de eliminare a unor zone de interes, în care sa produs mișcarea, nu este rezolvată. Un astfel de rezultat este de obicei obținut din cauza zgomotului camerei. Pentru a rezolva această problemă, trebuie să efectuați următorii pași:

1. Scoateți pixeli de interes,

2. Pentru a efectua procesarea morfologică,

3. Selectați obiectul într-o cutie dreptunghiulară.

Pentru a elimina pixelii, masca din prim plan este împărțită în zone de aceeași dimensiune, iar numărul de pixeli este calculat în fiecare zonă. Se calculează diferența dintre rezultatul rezultat și numărul maxim de pixeli din zonă. Dacă diferența dată este mai mare decât valoarea de prag, atunci această zonă este considerată a fi fundalul, altfel - în prim-plan.

Pentru a obține zonele legate în jur, se efectuează o operație de dilatare. Zonele vecine pentru zona marcată ca prim plan sunt, de asemenea, marcate ca prim plan.

Un grup de zone interconectate sunt plasate într-un cadru dreptunghiular. Marginea cadrului este zona extremă a zonei selectate.

Selectarea obiectelor în mișcare

Figura 2 Metoda diferenței de timp

Selectarea obiectelor în mișcare

Figura 3 Metoda de scădere a fundalului

Selectarea obiectelor în mișcare

Figura 4 Metoda probabilistică

Tabelul 1. Caracteristicile de timp.

Articole similare