Proprietățile coeficientului de corelare selectivă

1. Valoarea absolută a coeficientului de corelare a eșantionului nu depășește 1 ().

2. Dacă un coeficient de corelație eșantion este 0 și linia de regresie selectivă - linie dreaptă, și nu sunt conectate și dependența liniară a corelației. .

În acest caz liniile de regresie drepte sunt paralele cu axele de coordonate.

Notă. Dacă coeficientul de corelație a eșantionului. apoi semnele și pot fi conectate printr-o corelare neliniară sau chiar o dependență funcțională.

3. Dacă valoarea absolută. atunci valorile caracteristice observabile sunt legate de o relație funcțională liniară.

4. Pe măsură ce valoarea absolută a coeficientului de corelație selectivă crește, dependența de corelație liniară devine mai aproape și când devine funcțională.

Amplitudinea coeficientului de corelație caracterizează forța relației liniare dintre semne ():

dacă - conexiunea este slabă;

dacă - conexiunea este moderată;

dacă - conexiunea este vizibilă;

dacă - conexiunea este ridicată;

dacă - conexiunea este foarte mare;

dacă - conexiunea este funcțională.

5. Semnul coeficientului de corelare selectiv coincide cu semnul coeficientului de regresie selectiv :. și determină direcția de comunicare. Dacă - conexiunea este directă, - conexiunea este inversă.

Noi multiplicăm prima și a doua egalitate; .

Semnul sub radical trebuie să coincidă cu semnul coeficientului de regresie, adică . în cazul în care; . în cazul în care.

Coeficientul de corelație selectivă este egal cu coeficienții medii de regresie a eșantionului geometric.

Estimări punctuale și intermediare ale coeficienților de corelație ai unei populații distribuite în mod normal

Dacă proba are un volum suficient de mare și bine reprezintă populația generală, concluzia privind îngustimii dependenței liniare dintre variabilele obținute conform eșantionului într-o anumită măsură, poate fi extins la populația generală. Ca o estimare punct, se ia coeficientul de corelație a populației generale.

Pentru estimarea intervalului coeficientului de corelație a unei populații distribuite în mod normal (), avem:

Testarea ipotezei semnificației coeficientului de corelație selectivă

Lasă populația generală bidimensională. distribuite în mod normal. Din acest set a fost extras un eșantion de volum și s-a găsit un coeficient de corelație selectivă. care sa dovedit a fi diferit de 0.

Din moment ce eșantionul este selectat aleator, nu se poate concluziona încă că coeficientul de corelație al populației generale este, de asemenea, diferit de 0.

Suntem interesați de acest coeficient. Prin urmare, este nevoie de un anumit nivel de semnificație a pentru a testa ipoteza nulă că coeficientul general de corelare în ipoteza concurenței este egal cu zero.

Dacă ipoteza este respinsă, înseamnă că coeficientul de corelație selectivă este semnificativ diferit de 0, a și este legat de o relație liniară.

Dacă ipoteza nulă este acceptată, atunci coeficientul de corelație selectivă nu este semnificativ și nu este legat de o relație liniară.

Ca un criteriu pentru testarea ipotezei nula, luăm o variabilă aleatoare. unde este mărimea eșantionului.

Valoarea valabilității ipotezei nula are o distribuție a studenților cu grade de libertate. Indicăm valoarea criteriului calculat din datele de observație și formulează regula pentru testarea ipotezei nul.

Pentru că, pentru un anumit nivel de semnificație a testa ipoteza nulă a egalității la zero coeficient de corelație generală normală variabilă aleatoare bidimensionale cu o ipoteză concurente trebuie să calculeze criteriul valoare observată și tabelul punctelor de distribuție Student critică pentru un nivel de semnificație dată, precum și numărul de grade de libertate pentru a găsi punctul critic pentru critic duplex zona.

Dacă - nu există niciun motiv pentru a respinge ipoteza nulă. Dacă - respinge ipoteza nulă și coeficientul de corelație, prin urmare, selectiv semnificativ diferit de 0. adică liniar și corespondență.

Anterior, a fost luată în considerare etanșeitatea relației de corelare liniară. Întrebare: cum să evaluați etanșeitatea oricărei conexiuni de corelație?

Deoarece toate valorile caracteristice sunt împărțite în grupuri, este posibil să se reprezinte varianța totală a caracteristicilor ca sumă a variației intragrup și inter-grup.

Definiție: Varianța de grup este variația valorilor unei caracteristici aparținând unui grup, față de media grupului.

unde este frecvența valorilor la. Numărul grupului. Grupul grupului mediu. Este volumul grupului.

Definiție: Varianța intragrup este media aritmetică a variației grupului ponderată de volumul grupurilor.

- volumul întregii populații.

Definiție: Varianța de grup reprezintă variația mediei de grup față de media totală.

unde este media totală.

Definiție: O variație generală este dispersia valorilor unei caracteristici a întregii populații în raport cu o caracteristică comună.

Pentru a estima strânsa corelație neliniară, sunt introduse caracteristicile de corelare:

1) este o relație de corelație selectivă cu.

2) - relație de corelare selectivă cu.