Etanșeitatea legăturii dintre semnul rezultant X și factorul Y cu forma neliniară a conexiunii lor se estimează utilizând coeficientul de determinare R 2, care este în conformitate cu aceeași formulă (8) de la punctul 5.6 ca și pentru conexiunea liniară. O evaluare calitativă a strânsei legăturii se face pe scara Cheddock.
Un analog al coeficientului de corelație pentru un caz neliniar este raportul de corelare.
5.8 Multiplă regresie
Deoarece în minerit indicatorii de producție importanți sunt cel mai adesea explicați prin mai mulți factori, atunci pentru prognoza lor se aplică o regresie multiplă, ale cărei parametri sunt determinate și de metoda celor mai mici pătrate.
Vedere generală a modelului :,
unde x1. x2. ..., xk sunt factori independenți, iar y este exponentul rezultat. În acest caz, funcția de regresie multiplă poate fi liniară sau neliniară.
Foarte importantă este întrebarea câți factori independenți pot fi în ecuația de regresie multiplă pentru o anumită dimensiune a eșantionului n. De obicei, se folosește o astfel de regulă: numărul de observații nu trebuie să fie mai mic de 8-10 ori mai mare decât numărul de factori din ecuația de regresie.
Cea mai convenabilă formă de calcul a regresiei multiple multiple este matricea. Iată formulele de calcul care pot fi ușor implementate într-un computer utilizând pachetul software Mathcad.
Să presupunem că ecuația de regresie dorită are forma :.
Introducem matricea estimărilor parametrilor de regresie. Este necunoscut.
Pentru a compila regresia, luăm un eșantion din volumul n și scriem valorile observate ale semnelor X1. X2. ..., Xk și Y.
Pe baza datelor obținute, scriem matricele:
. . Aici, xij denotă valoarea observată a atributului i pentru observația j.
În formă de matrice, ecuația de regresie are forma: X × A = Y
Înmulțim ambele părți ale ecuației din stânga cu matricea transpusă XT.
Obținem: X T × X × A = X T × Y. Denumim matricea momentelor B = X T × X. Apoi, din ecuația matricei B × A = × T × Y se poate găsi matricea estimărilor:
Calcularea coeficientului de determinare se face prin formula:
Raportul de corelare se găsește prin formula :.
Modelul este verificat pentru adecvarea criteriului Fisher :. unde n este mărimea eșantionului, k este numărul de variabile din ecuația de regresie. Apoi, conform tabelului, punctele critice ale distribuției Fisher-Snedekor (Anexa 7), găsim valoarea critică a criteriului
Dacă valoarea observată a criteriului F este mai mare decât valoarea critică, atunci recunoaștem regresia multiplă rezultată ca fiind adecvată; dacă valoarea observată a criteriului F se dovedește a fi mai mică decât valoarea critică, atunci concluzionăm că modelul construit nu este adecvat celui real.
Nota 1 Această metodă de testare a modelului de adecvare poate fi aplicată atât modelelor bidimensionale atât lineare, cât și neliniare.
Observația 2 Abordarea matricei în formularea ecuației de regresie poate fi de asemenea utilizată pentru cazul regresiei liniare cu o variabilă.
Să luăm în considerare un exemplu de regresie multiplă.
Sarcina. Se studiază dependența producției lunare de cărbune de pe amplasament pe grosimea stratului în curs de dezvoltare și adâncimea de lucru.
Introducem notarea factorilor:
Y - producția lunară de cărbune; X1 - grosimea rezervorului, X2 - adâncimea de lucru.
Folosind esența fizică a factorilor, definim caracteristicile dependente și independente.
Atributul rezultat (dependent) este Y;
semne independente - X1 și X2.
Datele inițiale pentru 20 de lave care funcționează în aproximativ aceleași condiții sunt prezentate în tabel:
Numărul de variabile independente este k = 2.
Ecuația de regresie liniară are forma:
Calculele se pot face folosind pachetul software Mathcad.
Implementarea calculelor tuturor parametrilor și caracteristicilor necesare ale acestei sarcini în mediul Mathcad este demonstrată mai jos.
Folosind rezultatele calculelor, tragem concluzii.
1) Ecuația de regresie liniară are forma:
Aceasta înseamnă că, pe măsură ce crește grosimea rezervorului (X1), producția lunară de cărbune crește, iar cu o creștere a adâncimii de lucru (X2), producția lunară de cărbune scade.
2) Coeficientul de determinare este R 2 = 0,612. În consecință, variațiile caracteristicilor lui X1 și X2 reprezintă 61,2% din variația totală a semnei rezultante a Y. Restul varianței Y (38,8%) este explicat de alți factori care nu au fost evidențiate în acest model. Folosind scara Cheddock, se poate argumenta că există o relație semnificativă între producția lunară de cărbune și factorii independenți, cum ar fi grosimea rezervorului și adâncimea de lucru.
3) Raportul de corelare pentru un model multiplu liniar este