Domanda:
Errore statistico quando non si controllano le variabili?
JackOfAll
2015-12-04 02:59:20 UTC
view on stackexchange narkive permalink

Quando qualcuno dice "Non si vede mai una Ferrari che si arrugginisce come una Honda", il difetto logico è che una Honda è tipicamente usata come guidatore quotidiano durante inverni rigidi, mentre una Ferrari è una seconda o terza macchina limitata all'uso nei weekend soleggiati.

Ovviamente, devi controllare variabili come il chilometraggio e le condizioni meteorologiche. C'è un nome per questo errore? Errore logico? Errore dei tassi di base? Differenze nei gruppi confrontati?

Sembra che il tipo di ragionamento a cui ti riferisci sarebbe una sorta di inferenza di causalità dalla correlazione, e non so se c'è un bel nome per questo, sebbene l'errore "post hoc" (da post hoc ergo propter hoc)potrebbe funzionare.
Cinque risposte:
gung - Reinstate Monica
2015-12-04 03:10:45 UTC
view on stackexchange narkive permalink

Potresti chiamarlo bias da variabile omessa, (sebbene questo non contenga "errore" nel nome). È una forma di endogeneità; strettamente correlato al bias da variabile omesso / un'altra forma di endogeneità è l ' errore ecologico, che ha "errore" nel nome.

Per quello che vale, non sono sicuro che l'affermazione come la presenti ("Non vedi mai una Ferrari che si arrugginisce come una Honda") è legittimamente un errore. È semplicemente una dichiarazione di un'osservazione empirica (ed è presumibilmente corretta). Se qualcuno concludesse che Farraris non può arrugginire come Honda, questo sarebbe un errore.

Penguin_Knight
2015-12-04 04:14:17 UTC
view on stackexchange narkive permalink

Non esiste un "errore" che abbia il nome di confusione, per quanto ne so. Ma se qualcuno ha erroneamente suggerito una relazione causale (come la marca dell'auto e la ruggine), l'abbiamo chiamata "relazione spuria".

Carlos Cinelli
2017-11-21 03:28:44 UTC
view on stackexchange narkive permalink

Questo non è un errore statistico (associativo), questo è un errore logico di un'affermazione causale. Prendiamo l'affermazione: "non si vede mai una Ferrari arrugginita come una Honda ". Statisticamente questo significa che la ruggine osservata nella "popolazione" di Ferrari è in qualche modo diversa dalla ruggine osservata nella "popolazione" delle Honda. Questo potrebbe essere vero e non sarebbe affatto un errore statistico.

L'errore entra in gioco quando qualcuno lo usa per dedurre che questa associazione osservata è causata da un meccanismo specifico, come le qualità intrinseche di Ferrari o Honda. Quindi, quando affermi: "il difetto logico è che una Honda è tipicamente usata come guidatore quotidiano durante gli inverni rigidi, mentre una Ferrari è una seconda o terza macchina limitata al fine settimana soleggiato" cosa stai facendo sta spiegando un possibile meccanismo causale che porta anche a tale associazione, quindi l'associazione osservata non può escludere due diversi modelli causali.

Pertanto, anche se l'associazione è legittima nella popolazione, ciò che potrebbe non essere legittimo è la spiegazione causale di tale associazione. Questo errore logico di inferire un meccanismo causale specifico dall'associazione è solitamente chiamato "falsa causa". Ma questo errore è solo il vecchio semplice errore di "affermazione del conseguente" errore: il modello causale che le Ferrari sono migliori di quelle della Honda genererebbe l'associazione osservata. Ma è un errore concludere che, poiché l'associazione è vera, questo specifico modello causale è vero. Esistono diversi modelli concorrenti che potrebbero generare la stessa associazione osservata, come la tua spiegazione alternativa di come Ferrari e Honda avranno modelli di utilizzo diversi.

Questa associazione "spuria" può sorgere per diversi motivi, non solo per non riuscire a "controllare" una variabile.Quando è dovuto al mancato controllo di una causa comune, di solito lo chiamiamo "pregiudizio confondente".Ma puoi effettivamente creare un'associazione non causale controllando le variabili sbagliate. Come mostrato in questa altra risposta, nel modello seguente, "controllare" il tipo di auto di proprietà del paziente altererebbe la stima dell'effetto:

enter image description here

Questo di solito è chiamato "bias collider" o "bias di selezione".Puoi anche avere pregiudizi dovuti al controllo per i mediatori, a causa di errori di misurazione e così via.

Aksakal
2015-12-04 03:10:00 UTC
view on stackexchange narkive permalink

Puoi chiamarlo confondente o mediazione a seconda dell'esatta relazione tra le variabili di controllo e le variabili di interesse

Penso che voglia un nome per un errore piuttosto che per il fenomeno stesso.
Deke
2015-12-11 05:30:57 UTC
view on stackexchange narkive permalink

"La correlazione non implica la causalità".

Chiaramente CarMake ha una correlazione molto forte con la ruggine: CarMake = Honda ha spesso ruggine, CarMake = Ferrari non ha mai ruggine.

Ma questo non significa che CarMake CAUSI la ruggine. Invece, ConsumerDesireForLuxuryCar causa CarMake = Ferrari e ConsumerDesireForLuxuryCar causa anche TakingCareOfCar che causa NoRust.

Non sarei in disaccordo con le altre risposte, ma "La correlazione non implica la causa "è una frase molto comunemente usata nelle statistiche e cattura succintamente questa situazione (e anche molte altre).

Sto cercando il passo oltre "La correlazione non è causalità".È ovvio C! = C, ma PERCHÉ la correlazione non è causa in questo esempio di ruggine?È solo la variabile in agguato o il chilometraggio o l'uso stagionale?


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...