Cum am învățat rețeaua neuronală să recunoască rochii și pantofi, rusbase

Cum am învățat rețeaua neuronală să recunoască rochii și pantofi, rusbase

Așa că am avut cizme de pe tocuri de pană, ghete, cizme stilete pe un larg toc cizme cu blană, etc.

Și ultimul. Nu am înțeles cum se va comporta neuronul cu definiția materialului încălțămintei. Adică, dacă rețeaua de cizme din piele cizme înalte din piele să-l caute, sau în rezultatele căutării vor forma materiale de toate cizme similare, dar diferite?

În general, după ce am pregătit un clasificator de pantofi, am început să se considere ceva dintr-un amestec de Alexander Vassiliev, Viaceslav Zaitsev și Valentin Yudashkin.

Descărcarea imaginilor pentru antrenament se realizează automat în jumătate de către algoritmi interni, jumătate de mână. După ce este bifată matricea foto, nu există duplicate și imagini aleatorii necorespunzătoare. Mai mult, toate fișierele sunt reduse la nume uniform și un format (extensie).

Cum am învățat rețeaua neuronală să recunoască rochii și pantofi, rusbase

Cu ceea ce a făcut aici

Rețelele neuronale sunt acum populare dincolo de comunitățile profesionale înguste. O creștere a interesului pentru inteligența artificială din partea publicului larg a fost înregistrată la începutul primăverii, când AlphaGo. jucătorul de rețea din Google, a câștigat runda la Lee Ci Dol, campion mondial pentru acest joc. Pepper a fost adăugat în istoria inițialelor personalizate pentru imagini de stil Prisma. Mlvch și mai devreme Deepart.io.

În general, trebuie să spun că mulți oameni sunt implicați în rețele. Acest rechin de piață de Internet, „Yandex“ (de exemplu, caracteristica lor recentă pentru Auto.ru -recognition face și modelul de masina din imagine), Microsoft (serviciu What-Dog.net definirea câine rasa fotografie.), Mail.ru și Facebook (o divizie a Facebook AI Research), și, bineînțeles, Google. Dar sunt și tineri start-up (numai cei care au suficienți bani pentru calculul puterii).

Rețelele diligente sunt studiate în universități tehnice din întreaga lume, în special la MIPT. Apropo, în competiții de cercetări științifice, mergem în mod regulat la finale împreună cu dezvoltatorii acestui institut.

Concurenții din acest domeniu, desigur, foarte mult. Potrivit datelor noastre, aproximativ 23 de companii din 10 țări lucrează la recunoașterea modei la sfârșitul primăverii. Cei mari jucători online pe piețele occidentale de vânzare cu amănuntul au fost deja procesate de către companiile locale: e-Bay, Zalando, setul Net, Macy, Yoox - lista poate continua. Dar credem că există suficient spațiu pentru toată lumea.

Poate că v-ați dorit și acum să vă implicați în rețele. Se răcește!

Apoi, spuneți imediat cele două puncte la care trebuie să fiți gata.

Încă o dată, să spunem că o parte importantă a tehnologiei este datele de instruire. Acesta este primul "dar". Pentru ca rețeaua să distingă cu succes un tip de obiect, este necesar să se colecteze câteva mii de exemple ale acestui obiect, pe care se va desfășura formarea. Deseori numărul de obiecte este sute. Bazele de formare finală pot număra sute de mii, milioane de obiecte.

Deși este necesar să se facă o rezervă că acum există diferite tehnologii de formare accelerată. De exemplu, o serie publică de imagini deja pregătite ImageNet; rețele neuronale precondiționate, capabile să recunoască imaginile și nu necesită o lungă pregătire a rețelei pentru a funcționa.

În al doilea rând, stocarea și prelucrarea seturilor mari de date necesită o putere considerabilă de calcul și fonduri pentru infrastructură. Pentru învățare și pentru rețele, aveți nevoie de cel puțin 3-4 GB de memorie, iar pentru unele arhitecturi aveți nevoie de toate cele 11 concerte. Cardurile nu sunt ieftine: pentru un proiect mic, o carte costă aproximativ 100 000 de ruble. În plus, aveți nevoie de mult spațiu pe disc pentru datele în sine.

Astfel, tehnologia rețelelor neuronale se dezvoltă, iar cererea pentru aceasta este minunată. Pe Internet, puteți găsi o mulțime de literatură și de cercetare pe această temă, chiar și codul de program al rețelelor este disponibil. Asta este, pe de o parte, tehnologia este destul de general disponibilă, dar, pe de altă parte, în prezent rămâne complexă și prost înțeleasă. Companiile mari desfășoară în mod regulat tot felul de concursuri pentru cei mai buni algoritmi și adesea lupta merge doar pentru zeci și sute de precizie a algoritmilor.

Prin urmare, cu lucrarea noastră privind recunoașterea mobilă în industria modei, am mers la finalul KDD. cea mai mare conferință din lume în domeniul descoperirii cunoștințelor și al minelor de date. Textul raportului este disponibil pe link.

Continuăm să cultivăm tehnologia dezvoltării.