Una moneta viene lanciata 900 volte e le teste sono apparse 490 volte. Il risultato supporta l'ipotesi che la moneta sia imparziale?
Una moneta viene lanciata 900 volte e le teste sono apparse 490 volte. Il risultato supporta l'ipotesi che la moneta sia imparziale?
Qui la naturale ipotesi nulla $ H_0 $ è che la moneta sia imparziale, cioè che la probabilità $ p $ di una testa sia uguale a $ 1/2 $. L'ipotesi alternativa più ragionevole $ H_1 $ è che $ p \ ne 1/2 $, sebbene si possa sostenere l'ipotesi alternativa unilaterale $ p>1 / 2 $.
Dobbiamo scegliere il livello di significatività del test. Dipende da te. Due numeri tradizionali sono $ 5 $% e $ 1 $%.
Supponiamo che valga l'ipotesi nulla. Quindi il numero di teste ha * distribuzione binomiale con media $ (900) (1/2) = 450 $ e deviazione standard $ \ sqrt {(900) (1/2) (1/2)} = 15 $.
La probabilità che nel lancio di una moneta equa il numero di teste differisca da $ 450 $ per $ 40 $ o più (in entrambe le direzioni) è, per simmetria, $$ 2 \ sum_ {k = 490} ^ {900} \ binom {900} {k} \ left (\ frac {1} {2} \ right) ^ {900}. $$ Questo non è pratico da calcolare a mano, ma Wolfram Alpha fornisce una risposta di circa $ 0,008419 $.
Quindi, se la moneta fosse imparziale, un numero di teste diverso da $ 450 $ per $ 40 $ o più sarebbe piuttosto improbabile. Avrebbe probabilità inferiore a $ 1 $%. quindi al livello di significatività di $ 1 $%, rifiutiamo l'ipotesi nulla.
Possiamo anche usare l'approssimazione normale al binomio per stimare la probabilità che il numero di teste sia $ \ ge 490 $ o $ \ le 410 $ sotto l'ipotesi nulla $ p = 1/2 $. La nostra normale ha media $ 450 $ e la varianza $ 15 $ è $ \ ge 490 $ con probabilità la probabilità che una normale standard sia $ \ ge 40/15 $. Dalle tabelle per il normale, questo è di circa $ 0,0039 $. Doppio per tenere conto della coda sinistra. Otteniamo circa $ 0,0078 $, abbastanza vicino al valore fornito da Wolfram Alpha, e inferiore a $ 1 $ \%. Quindi, se usiamo $ 1 $ \% come livello di significatività, rifiutiamo di nuovo l'ipotesi nulla $ H_0 $.
Commenti: $ 1 $. Nell'approssimazione normale al binomio, otteniamo una migliore approssimazione alla probabilità che il binomio sia $ \ ge 490 $ calcolando la probabilità che la normale sia $ \ ge 489,5 $. Se vuoi cercarlo, questa è la correzione della continuità . Se usiamo l'approssimazione normale con correzione di continuità, troviamo che la probabilità di $ 490 $ o più o $ 410 $ o meno teste è di circa $ 0,008468 $, abbastanza vicino alla risposta "esatta" fornita da Wolfram Alpha. Così possiamo trovare una stima molto accurata, come ai vecchi tempi, usando le tabelle del normale standard e facendo l'aritmetica "a mano".
$ 2 $. Supponiamo di utilizzare l'ipotesi alternativa un po 'meno naturale $ p>1 / 2 $. Se $ p = 1/2 $, la probabilità di $ 490 $ o più è di circa $ 0,00421 $. Quindi, ancora una volta al livello di significatività di $ 1 $%, rifiuteremmo l'ipotesi nulla, anzi la rifiuteremmo anche se usassimo il livello di significatività $ 0,005 $.
L'impostazione di un livello di significatività è sempre necessario, perché è possibile che una moneta equa produca, diciamo, $ 550 $ o più teste in lanci da $ 900 $, solo ridicolmente improbabile.
Se la moneta è imparziale, la probabilità di "testa" è $ \ frac {1} {2} $. Pertanto, il numero di teste lanciate in 900 tentativi, $ X $, ha una distribuzione $ {\ rm Binomiale} (900, \ frac {1} {2}) $ sotto l'ipotesi nulla di una moneta equa. Quindi, il valore $ p $ - la probabilità di vedere un risultato così estremo o più estremo dato che la moneta è lontana, è
$$ P (X \ geq 490) $$
Se cerchi il valore $ p $ bilaterale, sarebbe
$$ 1 - P (410 < X < 490) $$
lasciate a voi la descrizione del motivo per cui è così.
Sappiamo che la funzione di massa per $ Y \ sim {\ rm Binomial} (n, p) $, è
$$ P (Y = y) = \ binom { n} {y} p ^ y (1-p) ^ {ny} $$
Lascio a te il calcolo del $ p $ -valore che cerchi.
Nota: la dimensione del campione qui è sufficientemente grande da poter utilizzare l'approssimazione normale alla distribuzione binomiale. Ho descritto sopra come calcolare il valore esatto $ p $.
L ' esempio dalla pagina di Wikipedia su Bayes Factor sembra abbastanza pertinente alla domanda. Se abbiamo due modelli, M1 dove la moneta è esattamente non distorta (q = 0,5) e M2 dove la probabilità di una testa è sconosciuta, quindi usiamo una distribuzione a priori piatta su 1. Calcoliamo quindi il fattore di bayes
$ K = \ frac {p (x = 490 | M_0)} {p (x = 490 | M_1)} $
dove
$ p (x = 490 | M1) = \ mathrm {nchoosek} (900,490) \ frac12 ^ {900} = 7,5896 \ times10 ^ {- 4} $
e
$ p (x = 490 | M2) = \ int_0 ^ 1 \ mathrm {nchoosek} (900,490) q ^ {490} (1-q) ^ {410} dq = \ frac {1} {901} $
fornisce un Bayes fattore di $ K \ circa 1,4624 $, che secondo la normale scala di interpretazione è "appena degno di nota".
Si noti tuttavia (i) il fattore Bayes ha una penalità occam incorporata che favorisce i modelli semplici, e M1 è molto più semplice in quanto non ha parametri di disturbo, mentre M2 fa; (ii) un forfettario a priori su $ q $ non è fisicamente ragionevole, in pratica una moneta sbilanciata sarà quasi equa a meno che la moneta non sia ovviamente asimmetrica; (iii) è stata una giornata lunga e avrei potuto facilmente commettere un errore in qualche (qualsiasi) punto dell'analisi dalle ipotesi ai calcoli.
Nota che la moneta è parziale se è un oggetto fisico come la sua asimmetria significa che non avrà la stessa probabilità di uscire testa come croce.
La tua domanda potrebbe essere affrontata in diversi modi.
Il tradizionale test di ipotesi è progettato per escludere possibilità, non necessariamente per dimostrarle. In questo caso possiamo usare $ H_0: p = 0.5 $ come ipotesi nulla e vedere se i dati (i 490 su 900 teste) possono essere usati per rifiutare questa ipotesi nulla calcolando un valore p. Se il valore p è inferiore a $ \ alpha $, rifiutiamo il valore nullo, ma un valore p $ > \ alpha $ non significa che possiamo dire che i dati supportano il valore nullo, ma solo che è coerente con l'ipotesi che il null è vero, ma in verità il null potrebbe essere falso, solo la verità è un valore di $ p $ molto vicino a $ 0,5 $.
L'approccio "equivalenza" sarebbe definire imparziale non come $ p = 0,5 $ ma scegli piuttosto una piccola regione intorno a 0,5 da considerare come imparziale $ 0,5- \ epsilon < p < 0,5+ \ epsilon $. Quindi, se l'intervallo di confidenza sulla proporzione vera si trova completamente all'interno dell'intervallo di equivalenza di "imparziale", i dati supporterebbero l'ipotesi di "imparzialità".
Un altro approccio sarebbe quello di utilizzare un approccio bayesiano da cui partiamo con una distribuzione a priori sulla proporzione reale $ p $ includendo una massa puntiforme a 0,5 e il resto della probabilità diffusa tra i valori possibili. Quindi combinalo con i dati per ottenere un posteriore. Se la probabilità posterioun di $ p = 0,5 $ è sufficientemente alta, ciò sosterrebbe l'affermazione di essere imparziali.
E un'illustrazione R:
Non preoccupandoci di approssimare in base al normale, possiamo guardare un binomio distribuito variabile casuale con n = 900 ep = 0,5 sotto l'ipotesi nulla (cioè se la moneta fosse non corretto quindi p = probabilità di testa (o croce) = 0,5).
Se volessimo testare l'alternativa che Ha: p<> 0,5 ad alfa 0,05 possiamo guardare le code della distribuzione sotto il nulla come segue e vedere che 490 non rientra nell'intervallo {421, 479 } e quindi rifiutiamo Ho.
n<-900p<-0.5qbinom (c (0.025,0.975), size = n, prob = p) # 421 479
Per chiarire l'approccio bayesiano:
Inizi non sapendo nulla, tranne che P (Heads)
è in [0,1]
. Quindi inizia con un'entropia massima prima -> uniform (0,1)
. Questo può essere rappresentato come una distribuzione beta -> beta(1,1)
.
Ogni volta che lanci la moneta esegui un aggiornamento bayesiano della P della moneta (Teste)
moltiplicando ogni punto nella distribuzione per la sua probabilità (moltiplicare per x
se tiri testa, moltiplicare per (1-x)
se ottieni croce) e normalizza nuovamente la probabilità totale a 1. Questo è ciò che fa la distribuzione beta, quindi se il primo tiro è testa avrai beta (2,1)
. Nel tuo caso hai beta(490,510)
.
Da lì calcolerei l'intervallo di probabilità del 95% e se 0,5 non è in quell'intervallo, inizierei a ottenere sospettoso.
La prima volta che ho eseguito questo esercizio sono rimasto davvero sorpreso di quanto tempo ci sia voluto per convergere ... Ho iniziato perché qualcuno ha detto "se lanci una moneta 100 volte, sai P (Heads)
a +/- 1% "questo risulta essere totalmente sbagliato, hai bisogno di magnitudini superiori a 100 flip.
Ipotesi nulla, Ho: P = 0,5 (P = Q = 0,5)
H1: P> 0,5
dove P è il problema di prevalenza.
sappiamo z = (pP) / sqrt (PQ / N)
dove p = 490/900 = 0,54
Ora z = (0,54-0,5) / sqrt ( (0,5 * 0,5) / 900)
z = 2
quindi al 5% di LOS (cioè 1,64<2) Ho è rifiutato
quindi la moneta è di parte .....