Domanda:
Dati di misure ripetute non accoppiati
Chris Beeley
2013-08-19 13:39:46 UTC
view on stackexchange narkive permalink

Mi rendo conto che questa è una di quelle domande tipo "Non iniziare da qui", e in effetti ho detto loro di non "iniziare da qui", ma sarebbe un peccato spazzare via i dati.

Fondamentalmente ho alcuni dati di intervallo normale, cose di tipo scala Likert, da due gruppi, al tempo uno e al tempo due, e so che alcuni soggetti nel tempo due sono gli stessi del tempo uno, quindi in realtà i dati dovrebbero essere accoppiato. Tuttavia, i dati sono stati raccolti in modo anonimo, quindi abbiamo solo due gruppi da confrontare.

Il mio pensiero migliore è che potrei segnalare una stima molto prudente della differenza e poi dire "per tutti i problemi con la raccolta dei dati, questo è probabilmente l'effetto minimo ".

Modifica: aggiunto-

Se anche la significatività è possibile, ovvero" e sono ragionevolmente sicuro che questo effetto sia diverso da zero ", fantastico.

Non so nemmeno da dove cominciare a cercare un modo così stupido di analizzare i dati. Il bootstrap sarebbe davvero utile?

Eventuali suggerimenti ricevuti con gratitudine, come dico quelli altamente conservatori che penso andrebbero bene.

Se sei interessato solo alla dimensione dell'effetto (cioè la differenza media standardizzata), la questione dei dati accoppiati e non accoppiati difficilmente influenza i tuoi risultati. L'accoppiamento offre solo un vantaggio in termini di test di significatività. Allora cosa vuoi sapere veramente?
Se non puoi essere sicuro dell'appartenenza ai gruppi, non puoi ignorare la possibilità di pregiudizi dovuti a campionamento non uniforme, ad es. alcune persone si sono annoiate, o sono morte, o altro e non sono tornate. D'altra parte, ci sono molti casi in cui è vero (la maggior parte dei sondaggi di opinione, per esempio?) Quindi la metodologia per questo caso sarebbe di ampio interesse.
Una risposta:
Jake Westfall
2013-08-22 01:04:01 UTC
view on stackexchange narkive permalink

Un semplice test t a due campioni sarebbe in realtà un modo conservativo per testare le differenze di orario qui.

Supponiamo che $ t_ {paired} $ sia la statistica t che potresti ottenere da un test t accoppiato sui tuoi dati, se conoscessi gli accoppiamenti, mentre $ t_ {unpaired} $ è la statistica t che ottieni da un semplice test t a due gruppi sui dati. Queste due statistiche t hanno la seguente relazione: $$ t_ {paired} = \ frac {t_ {unpaired}} {\ sqrt {1-r}} $$ dove $ r $ è la correlazione tra i punteggi del tempo 1 e punteggi del tempo 2, che non puoi stimare perché non conosci gli accoppiamenti nei dati.

$ t_ {paired} = t_ {unpaired} $ quando e solo quando $ r = 0 $. Ma nota che questa è anche esattamente la condizione in cui $ t_ {paired} $ prende il suo valore minimo $ ^ 1 $. All'aumentare di $ r $, $ t_ {paired} $ diventa sempre più grande rispetto a $ t_ {unpaired} $.

Quindi, se riporti solo il test t a due campioni, essenzialmente assumendo che $ r = 0 $, quello che stai realmente facendo è riportare un limite inferiore sul $ t_ {paired} $ corretto. Se si ha una differenza significativa in base al test t a due campioni, anche il test t accoppiato mostrerebbe sicuramente una differenza significativa se si potesse calcolarla. Ma se non c'è una differenza significativa secondo il test t a due campioni, è ancora possibile che la differenza sarebbe significativa se si potesse calcolare il test t accoppiato.


$ ^ 1 $ Tecnicamente, teoricamente, $ r $ potrebbe scendere fino a -1 e questo sarebbe effettivamente il valore minimo della funzione nell'intervallo di $ r $. E quando $ r<0 $, il $ t $ -test accoppiato è in realtà meno potente del $ t $ -test non accoppiato. Tuttavia, nella vita reale sarebbe improbabile (senza ulteriori informazioni sul contesto specifico) che i punteggi time1 e time2 abbiano una correlazione negativa. È persino improbabile che la correlazione sia 0. Molto probabilmente c'è una modesta correlazione positiva.

Mi dispiace che ci sia voluto così tanto tempo per assegnare la taglia, sono stato raggiunto con il lavoro. Grazie mille per questa utile risposta, che vale 50 punti. In effetti ha ispirato un'altra domanda che posterò non appena ne avrò la possibilità.
Nessun problema @ChrisBeeley. A proposito, volevo menzionare una piccola correzione a qualcosa che ho scritto nel mio post. Ho detto che il valore minimo di $ t_ {paired} $ si verificava quando $ r = 0 $. Ma tecnicamente, teoricamente, $ r $ potrebbe scendere fino a -1 e questo sarebbe effettivamente il valore minimo della funzione nell'intervallo di $ r $. Tuttavia, nella vita reale sarebbe estremamente raro e strano che i punteggi time1 e time2 abbiano una correlazione negativa. È persino improbabile che la correlazione sia 0. Molto probabilmente c'è una modesta correlazione positiva. Quindi penso che il mio ragionamento sopra sia ancora valido.
Oh sì, buon punto, non ci avevo pensato. Ma sì, sono abbastanza d'accordo che è una considerazione teorica ed estremamente improbabile nella vita reale. Potrei andare a divertirmi ora cercando di pensare a cose che sono correlate negativamente al Tempo 1 e al Tempo 2.


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...