Predarea cu profesorul (învățarea în limba engleză) este una din modalitățile de învățare a mașinilor. în timpul căruia sistemul de testare este forțat instruit cu ajutorul exemplelor de "stimulare-reacție". Din punctul de vedere al ciberneticii. este un tip de experiment cibernetic. Între intrările și ieșirile de referință (stimul-reacție) poate exista o anumită dependență, dar nu este cunoscută. Este cunoscut doar un set finit de precedente - perechi de "stimul-răspuns", numite eșantion de formare. Pe baza acestor date este necesară pentru a restabili relația (a construi un model al relației stimul-răspuns, potrivit pentru proiecție), adică construi un algoritm capabil de orice obiect pentru a da un răspuns destul de exactă. Pentru a măsura exactitatea răspunsurilor, precum și pentru a învăța prin exemple. poate fi introdusă o calitate funcțională.
Principiul stabilirii acestui experiment
Acest experiment este un caz special al unui experiment cibernetic cu feedback. Setarea acestui experiment presupune existența unui sistem experimental, a unei metode de antrenament și a unei metode de testare a sistemului sau a caracteristicilor de măsurare.
Sistemul experimental la rândul său, este format din sistemul de testare (utilizat), stimuli spațiale derivate din mediul extern, și sistemul de management de armare (parametrii regulatorului intern). Ca armare un sistem automat de gestionare a dispozitivului de reglare poate fi utilizat (de exemplu, termostat) sau operator uman (profesor) capabil să răspundă la sistemul de reacție testat și stimulii din mediu prin aplicarea regulilor speciale armaturii starea memoriei sistemului altera.
Există două opțiuni: (1) atunci când sistemul de reacție testat nu se schimba starea mediului, și (2), atunci când sistemul de reacție schimbă stimulii de mediu. Aceste scheme indică asemănarea fundamentală a unui astfel de sistem general cu sistemul nervos biologic.
Tipologia sarcinilor de învățare cu profesorul
Tipuri de date de intrare
Tipuri de răspunsuri
- Atunci când setul de răspunsuri posibile este infinit (răspunsurile sunt numere reale sau vectori), ei vorbesc despre problemele regresiei și aproximării;
- Atunci când există multe răspunsuri posibile, discutați despre sarcinile de clasificare și de recunoaștere a modelului;
- Atunci când răspunsurile caracterizează comportamentul viitor al unui proces sau al unui fenomen, ele vorbesc despre sarcini de predicție.
Tipuri degenerate de sisteme de management al armării ("profesori")
- Sistemul de armare cu control prin reacție (sistem controlat de R) - se caracterizează prin faptul că canalul de informații din mediul extern către sistemul de armare nu funcționează. Acest sistem, în ciuda existenței unui sistem de management, se referă la învățarea spontană. deoarece sistemul de testare este instruit în mod autonom, sub acțiunea numai a semnalelor sale de ieșire, indiferent de "corectitudinea" lor. Cu această metodă de învățare, nu sunt necesare informații externe pentru a controla modificarea stării memoriei;
- Sistemul de armare cu managementul stimulentelor (sistem controlat S) se caracterizează prin faptul că canalul de informații de la sistemul testat la sistemul de armare nu funcționează. În ciuda ieșirile de canal non-funcționale din sistemul supus încercării, se referă la învățarea cu profesorul, ca și în acest caz, sistemul de armare (profesor) face ca sistemul supus încercării de a produce o reacție în conformitate cu o anumită regulă, dar nu au fost luate în considerare prezența adevărată reacție a sistemului de testare.
Această distincție permite o privire mai îndeaproape diferențele dintre diferitele modalități de învățare, ca linia de demarcație dintre predare și învățare cu profesorul, fără a mai subțire profesor. În plus, o astfel de diferență a făcut posibilă prezentarea unor restricții pentru sistemele neuronale artificiale pentru sistemele controlate S și R (vezi teorema de convergență Perceptron).