Cosa significa se il valore F in ANOVA unidirezionale è inferiore a 1?
Ricorda che il rapporto F è
$$ \ frac {\ sigma ^ 2 + \ frac {r \ times \ sum_ {i = 1} ^ t \ tau_i ^ 2} {t-1}} {\ sigma ^ 2} $$
Cosa significa se il valore F in ANOVA unidirezionale è inferiore a 1?
Ricorda che il rapporto F è
$$ \ frac {\ sigma ^ 2 + \ frac {r \ times \ sum_ {i = 1} ^ t \ tau_i ^ 2} {t-1}} {\ sigma ^ 2} $$
Il rapporto F è una statistica. Quando l'ipotesi nulla di nessuna differenza di gruppo è vera, il valore atteso del numeratore e del denominatore del rapporto F sarà uguale. Di conseguenza, anche il valore atteso del rapporto F quando l'ipotesi nulla è vera è vicino a uno (in realtà non è esattamente uno, a causa delle proprietà dei valori attesi dei rapporti).
Quando il valore nullo l'ipotesi è falsa e ci sono differenze di gruppo tra le medie, il valore atteso del numeratore sarà maggiore del denominatore In quanto tale il valore atteso del rapporto F sarà maggiore rispetto all'ipotesi nulla, e sarà anche più probabilmente maggiore di uno.
Tuttavia, il punto è che sia il numeratore che il denominatore sono variabili casuali, così come il rapporto F. Il rapporto F è tratto da una distribuzione. Se assumiamo che l'ipotesi nulla sia vera, otteniamo una distribuzione, e se assumiamo che sia falsa con varie ipotesi sulla dimensione dell'effetto, sulla dimensione del campione e così via, otteniamo un'altra distribuzione. Quindi eseguiamo uno studio e otteniamo un valore F. Quando l'ipotesi nulla è falsa, è ancora possibile ottenere un rapporto F inferiore a uno. Maggiore è la dimensione dell'effetto della popolazione (in combinazione con la dimensione del campione), più F la distribuzione si sposterà a destra e sarà meno probabile che otteniamo un valore inferiore a uno.
Il seguente grafico estratto da G-Power3 dimostra l'idea data a vari La distribuzione del rosso è la distribuzione di F quando H0 è vera La distribuzione del blu è la distribuzione di F quando H0 è falsa date varie ipotesi. Si noti che la distribuzione del blu include valori inferiori a uno, ma sono molto improbabili. / p>
La tua domanda nel titolo è una domanda interessante che mi è passata per la mente anche oggi. Voglio solo aggiungere una correzione. Il rapporto F è: $$ \ frac {MS_ {treatment}} {MS_ {residual}} = \ frac {\ frac {SS_ {treatment}} {t-1}} {\ frac {SS_ {residual}} { t (r-1)}} $$ Quello che hai scritto è $$ \ frac {E (MS_ {treatment})} {E (MS_ {residual})} $$ Mentre la prima frazione può è minore di 1, la seconda frazione non può essere minore di 1. Ma questo non è un problema poiché è un quoziente di aspettative.
Nota che mentre i valori della statistica F inferiori a 1 possono verificarsi per caso quando l'ipotesi nulla è vera (o quasi vera) come altri hanno spiegato, valori vicini a 0 possono indicare violazioni delle ipotesi da cui dipende ANOVA. Alcuni analisti esamineranno l'area a sinistra della statistica nella distribuzione F come un valore p che verifica le violazioni delle ipotesi. Alcune delle violazioni che portano a piccole statistiche F includono varianze disuguali, randomizzazione impropria, mancanza di indipendenza o semplicemente falsificazione dei dati.
Il problema qui è che il test di ipotesi implica un valore null E un'ipotesi alternativa, e quindi; la regione di rigetto è determinata da entrambe le ipotesi.
Considera un esempio più semplice. Se stai studiando un processo che potrebbe avere una MEDIA pari a zero, ma non potrebbe avere una media inferiore a zero, potresti essere interessato a eseguire il seguente test
\ begin {equation} \ begin { array} {c} H_ {0}: \ mu = 0 \ H_ {1}: \ mu> 0 \\ end {array} \ nonumber \ end {equation}
a un livello alfa. La tua regione di rifiuto dell'ipotesi nulla è a destra di zero. Non è impossibile per te ottenere una media campionaria negativa, anche se con una piccola probabilità. Se dovessi ottenere una media campione negativa nel tuo esperimento, non metteresti in dubbio la veridicità dell'esperimento.
Ora considera la tua domanda. Il motivo per cui la regione di rifiuto per la statistica F è a destra è a causa dell'ipotesi alternativa nell'ANOVA unidirezionale. Stai verificando l'ipotesi che
\ begin {equation} \ begin {array} {c} H_ {0}: \ sum \ tau_ {i} ^ {2} = 0 \ H_ {1}: \ sum \ tau_ {i} ^ {2} \ ne 0 \\ end {array} \ nonumber \ end {equation}
L'ipotesi nulla impone di utilizzare la distribuzione F centrale e l'ipotesi alternativa , forzare la distribuzione a destra quando l'ipotesi alternativa è vera significa che tutta la probabilità di errore di tipo I deve essere posizionata a destra.
È possibile che la statistica del test sia inferiore a uno? Quando l'ipotesi nulla è vera, è certamente possibile; proprio come nell'esempio precedente dove era possibile che la statistica del test fosse negativa anche se la MEDIA dei dati fosse zero.
Dopo aver cercato in una cartella che non cercavo da anni (come una cartella reale e non una cartella del computer) ho trovato questo documento che potrebbe interessare a questa domanda:
Voelkle, MC, Ackerman, PL, & Wittmann, WW (2007). Dimensioni degli effetti e rapporti F < 1.0. Metodologia: European Journal of Research Methods for the Behavioral and Social Sciences , 3 (1), 35–46. doi: 10.1027 / 1614-2241.3.1.35
L'abstract dice:
I testi statistici standard indicano che il valore atteso del rapporto $ F $ è $ 1,0 $ (più precisamente : $ N / (N-2) $) in un'ANOVA a effetti fissi completamente bilanciata, quando è vera l'ipotesi nulla. Anche se alcuni autori suggeriscono che l'ipotesi nulla è raramente vera nella pratica (ad esempio, Meehl, 1990), i rapporti $ F $ $ < 1.0 $ sono riportati abbastanza frequentemente in letteratura. Tuttavia, le statistiche sulla dimensione dell'effetto standard (ad esempio, $ f $ di Cohen) spesso producono valori positivi quando $ F < 1.0 $, il che sembra creare confusione sulla significatività delle statistiche sulla dimensione dell'effetto quando l'ipotesi nulla può essere vera. Data la ripetuta enfasi sulla segnalazione delle dimensioni degli effetti, è dimostrato che a fronte di $ F < 1,0 $ è fuorviante riportare solo le stime delle dimensioni degli effetti campione come spesso raccomandato. Le cause dei rapporti $ F $ $ < 1.0 $ vengono riviste, illustrate da un breve studio di simulazione. Vengono discussi il calcolo e l'interpretazione delle statistiche sulla dimensione dell'effetto corretto e non corretto in queste condizioni. Il calcolo delle misure corrette della forza dell'associazione e l'incorporazione degli intervalli di confidenza della dimensione dell'effetto sono utili nel tentativo di ridurre la confusione sui risultati quando le dimensioni del campione sono piccole. Raccomandazioni dettagliate sono dirette ad autori, editori di riviste e revisori.
Oggi uno studente mi ha posto una domanda simile.La risposta breve è che F è < 1 quando c'è più varianza all'interno dei gruppi che tra.
Quanto segue è un esempio di ciò:
Valori del gruppo 1: 25, 50, 75 Valori gruppo 2: 26, 50, 75 Valori del gruppo 3: 27, 50, 75
C'è poca differenza tra i mezzi del gruppo:
Media gruppo 1 = 50,00 Media gruppo 2 = 50,33 Media gruppo 3 = 50,66
Ma le differenze all'interno dei gruppi rispetto alle medie del gruppo sono relativamente grandi.La maggior parte dei punteggi sono circa 25 punti diversi dalla media:
Valori del gruppo 1: -25, 0, 25 Valori del gruppo 2: -24,33, -0,33, 24,66 Valori del gruppo 3: -23,66, -0,66, 24,33
Questo scenario porta a una grande quantità di varianza all'interno dei gruppi (600,55) e una piccola variazione tra (0,33).
Il risultato è un rapporto F di 0,00055!
Se il valore di F è inferiore a uno, la somma media dei quadrati dovuta ai trattamenti è inferiore alla somma dei quadrati a causa di un errore. Pertanto, non è necessario calcolare F l'ipotesi nulla è vera tutti i campioni sono ugualmente significativi.