§ 1.10. Principiul optimalității lui Bellman
Fie starea unui anumit sistem fizic determinată de vectorul f -dimensional. Să presupunem, în plus, că există o familie de transformări cu un vector variabil (soluție) și care joacă rolul unui parametru și ia vectorul y într-un vector
Un proces constând într-o alegere de soluții este numit un proces pas.
Asociază cu un proces pas o anumită funcție scalară
numit criteriul sau funcția de venit.
Secvența soluțiilor admise se numește politică (strategie). Politica care oferă valoarea maximă a funcției de venit este denumită politică optimă sau strategie optimă.
Principiul optimalității [44]. Strategia optimă are proprietatea că, indiferent de starea inițială și de decizia inițială adoptată, deciziile ulterioare ar trebui să constituie o strategie optimă pentru stat care a apărut ca urmare a deciziei inițiale.
Aceasta afișează principiul de bază al ecuației dinamice de programare (ecuația Bellman), care pot fi considerate ca unele relații de recurență care descriu optimizarea unei mai multe trepte de limitare caz sub creștere nerestricționată a numărului de pași. Ecuațiile Bellman sunt ecuații funcționale și li se poate da o formă diferită.
De exemplu, dacă luăm în considerare problema maximizării funcționalității
atunci, după cum se arată în [44], soluția acestei probleme se reduce la rezolvarea ecuației funcționale
unde este "funcția de venit pe un număr infinit de pași"
în terminologia Bellman [44].