Domanda:
Correlazione dipendente dal fattore
Dave
2011-05-26 07:40:03 UTC
view on stackexchange narkive permalink

Se prendo una serie di misurazioni e provo la correlazione della variabile $ A $ rispetto alla variabile $ B $ e ottengo una correlazione significativa, per me ha senso. Ma cosa succederebbe se un'ulteriore analisi rivelasse che di questi fattori, esiste solo una correlazione positiva significativa all'interno di un gruppo e quel gruppo è sovrarappresentato? La correlazione globale è ancora valida o, dopo un'ispezione più dettagliata, è un effetto di distorsione del campione?

Ecco alcuni grafici per spiegare:

La correlazione globale

global correlation

Le correlazioni separate dal gruppo

grouping separated correlation

Solo un piccolo commento: sembra che la correlazione complessiva possa essere in parte spiegata dal fatto che le unità appartenenti al gruppo A hanno tutte punteggi più bassi mentre considerare il valore B da solo non aiuta a separare i tre gruppi.
Penso che se ci fornisci più contenuti (ad esempio, cosa significano i gruppi) otterrai consigli migliori su cosa fare.
Tre risposte:
#1
+8
JMS
2011-05-26 10:12:45 UTC
view on stackexchange narkive permalink

Conosci il paradosso di Simpson? Questo sembrerebbe essere ciò che stai osservando qui.

Modifica: non ho risposto alla tua domanda :) Quello che dovresti fare esattamente è in una certa misura dipendente dal contesto (i gruppi sono significativi? Questo rappresenta un problema nella progettazione dello studio? ecc.). Per lo meno dovresti segnalare entrambi i risultati IMO.

#2
+7
Henrik
2011-05-26 18:45:17 UTC
view on stackexchange narkive permalink

Sono d'accordo con il consiglio di JMS, che la risposta dipende totalmente dal contesto.

Ma quello che stai guardando può anche essere considerato un effetto di moderazione.

Nelle statistiche, la moderazione si verifica quando la relazione tra due variabili dipende da una terza variabile.

(citato da wikipedia)

Una moderazione è statisticamente significativa se in una regressione multipla si analizza l'interazione del predittore con la terza variabile è significativo.

#3
+5
rolando2
2011-05-27 02:28:02 UTC
view on stackexchange narkive permalink

I commenti precedenti sono tutti buoni, ma con campioni di gruppo di dimensioni 5, 7 e 11, non mi fiderei di nessuna delle loro correlazioni per quanto potrei lanciarli. Dovrai anche assegnare all'intero r un ampio intervallo di confidenza. btw Bel lavoro sul grafico.

+1, buon punto. Ho preso come esempio, non i dati effettivi, ma rileggendo l'OP di certo non l'ho detto.


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...