Simpson Paradox (paradoxul Yule-Simpson, care combină paradoxul) - efect fenomen în statisticile atunci când prezența a două grupe de date, fiecare dintre ele relație identic direcționate observate atunci când combinarea acestor grupuri, în funcție de direcția este inversată.
Istoria descoperirii paradoxului
Exemplu cu jetoane
Să fie patru pălării (două negre și două gri), 41 de jetoane (23 de culori și 18 alb) și două mese (A și B). Chips-urile sunt distribuite pe pălării după cum urmează:
- Într-o pălărie neagră de pe masa A sunt 5 cipuri colorate și 6 cipuri albe.
- În pălăria gri de pe masa A sunt 3 chips-uri colorate și 4 alburi.
- Într-o pălărie neagră de pe masa B există 6 ștampile colorate și 3 așchii albe.
- În pălăria gri de pe masa B sunt 9 cipuri colorate și 5 cipuri albe.
Să presupunem că vrei să scoți un cip colorat.
Dacă sunteți aproape de tabelul A, atunci probabilitatea de a recupera un chip de culoare dintr-o pălărie neagră este 5/11 = 35/77. și de la pălăria gri de pe aceeași masă - 3/7 = 33/77; astfel, cipul de culoare are mai multe șanse de a ieși din pălăria neagră decât din cea gri.
Dacă vă aflați lângă masa B, atunci probabilitatea de a obține un chip de culoare dintr-o pălărie neagră este 6/9 = 28/42. și din pălăria gri - 9/14 = 27/42; astfel, și aici chipul de culoare are mai multe șanse să scape din pălăria neagră decât din cea gri.
Să presupunem acum că chips-uri ale celor două pălării negre pliate într-o pălărie neagră pe o masă B și două chips-uri gri de pălării - într-o pălărie gri de pe masa B. La prima vedere, ar fi logic să se presupună că probabilitatea de a extrage o bucată de culoare de pălărie neagră mai mare decât din gri. Dar acest lucru nu este adevărat:
- Probabilitatea tragerii unui cip de culoare dintr-o pălărie neagră pe masa B este 11/20 = 231/420,
- Probabilitatea de a scoate un chip colorat din pălăria gri de pe masa B este 12/21 = 240/420,
și anume Mai multe șanse de a extrage un chip color dintr-o pălărie gri decât dintr-o pălărie neagră [4].
Exemplu cu pietre
Să avem patru seturi de pietre. Probabilitatea de a trage o piatră neagră din numărul 1 este mai mare decât cea din numărul 2 setat. La rândul său, probabilitatea de a trage o piatră neagră din setul 3 este mai mult decât din numărul 4 setat. Combinați setul # 1 cu setul # 3 (obțineți setul I) și setul # 2 cu setul # 4 (setul II). Intuitiv te poți aștepta ca probabilitatea de a trage o piatră neagră din set va fi mai mare decât din setul II. Cu toate acestea, în cazul general, acest lucru nu este adevărat.
Dovada matematică este. Fie n i> numărul de pietre negre din setul i (eșantion), m i> - numărul total de pietre din i-set pentru i = 1. 2. 3. 4. Condiție:
Probabilitatea de a trage o piatră neagră din seturile I și II, respectiv:
Expresia pentru mulțimea I nu este întotdeauna mai mare decât expresia setului II. De exemplu: n 1 = 6. m 1 = 13. n 2 = 4. m 2 = 9. n 3 = 6. m 3 = 9. n 4 = 9. m 4 = 14 = 6,
Raportul dintre numărul cântărit al celor recuperați și cei nerecuperați în rândul celor care nu au luat medicamentul în acest caz va fi de 0,685, adică mai mic decât cei care iau medicamentul. Acest lucru elimină paradoxul și arată raportul dintre recuperat și cel nerecuperat fără a lua medicamentul pentru aceeași proporție de bărbați și femei ca și cei care au luat medicamentul, ceea ce face posibilă compararea acestor cifre.