Student la Facultatea de Informatică, HSE
Dacă explicăm "pe degete", atunci elementele principale ale oricărei rețele neuronale sunt neuronii. Fiecare neuron primește unul sau mai multe semnale (numere) la intrarea sa, le procesează într-un mod complicat (sau nu foarte) și apoi trece rezultatul mai departe.
Neuronii sunt combinați în straturi succesive. Separat, există două straturi extreme - intrare și ieșire. Prin stratul de intrare, rețeaua neuronică primește informații și scoate rezultatul procesării sale prin stratul de ieșire. Toate straturile intermediare sunt numite ascunse.
Fiecare strat ascuns este conectat la două sisteme adiacente (anterioare și viitoare) complexe de legături (îmi pare rău pentru tautologie). În cel mai simplu caz, fiecare dintre neuronii săi primește semnale de la fiecare neuron al stratului anterior, este procesat și apoi îl lasă pentru fiecare neuron al următorului strat.
Totuși, asta nu este totul. Fiecare conexiune are o "greutate". Adică, semnalul de la un neuron, în timp ce trece la cel din urmă, schimbă puțin valoarea (valoarea acestui semnal este înmulțită cu această "greutate").
Dacă greutățile legăturilor sunt atribuite valorilor aleatoare, atunci nu se va face nimic semnificativ cu o astfel de rețea neurală. Adică trebuie să fie selectate cumva. Cu alte cuvinte, rețeaua neuronală trebuie să fie pregătită.
Cum merge învățarea, este mai ușor de arătat prin exemplu. Să presupunem că pregătim o rețea neuronală pentru a distinge imaginile pisicilor de imaginile câinilor. Apoi, pe stratul de intrare al rețelei neuronale dăm imaginea, iar pe ieșire rețeaua neuronală returnează o pereche de numere reale de la 0 la 1 fiecare. Primul inseamna cat de mult retelele neuronale sunt sigure ca acesta este un caine, iar al doilea este ca o pisica. De ce fac acest lucru este o intrebare la care nu se raspunde pur si simplu. Asta este, dacă primul număr este mai mare, rețeaua neuronală a decis că a văzut câinele și, dacă a doua, apoi pisica.
Deci, timpul să pregătești grila. Dă imaginea rețelei neuronale. Aceasta ne răspunde cu această pereche de numere (a, b). Dar știm cine e în imagine, nu? Prin urmare, corectăm rețeaua neurală. Și anume, suntem „forțați să se ghiftui“ în stratul de ieșire al perechii (1, 0), în cazul în care câinele sau (0, 1), în cazul în care o pisică, și apoi există unele magie (pentru ao înțelege, trebuie să aveți unele cunoștințe de matematică), care determină rețele neuronale pentru a redistribui ponderea obligațiunilor. Cea mai obișnuită metodă de a crea această magie - așa-numita. "metoda erorilor de propagare a spatelui", dar există și altele.
După o serie de imagini diferite, vom roti la fel, ponderea conexiunilor dintre neuroni este construit în așa fel încât va fi bine pentru a distinge pisici de la câini.