Probabilità che il numero di teste superi la somma dei tiri di dado

user239903

2020-08-26 04:08:59 UTC

view on stackexchange narkive permalink

Indichi $ X $ la somma dei punti che vediamo nei $ 100 $ tiri di dado e lascia $ Y $ indica il numero di teste nei $ 600 $ lanci di monete.Come posso calcolare $ P (X > Y)? $

Intuitivamente, non credo che ci sia un bel modo per calcolare la probabilità;tuttavia, penso che possiamo dire $ P (X > Y) \ approx 1 $ poiché $ E (X) =350 $ , $ E (Y) = 300 $ , $ \ text {Var} (X) \circa 292 $ , $ \ text {Var} (Y) = 150 $ , il che significa che le deviazioni standard sono piuttosto piccole.

C'è un modo migliore per affrontare questo problema?La mia spiegazione sembra piuttosto ondulata e mi piacerebbe capire un approccio migliore.

Un modo sarebbe usare le normali approssimazioni a $ X $ e $ Y, $ quindi, per indipendenza, a $ X-Y $

Userei solo un'approssimazione normale a meno che non avessi bisogno di una risposta esatta.

La tua spiegazione * è * ondulata, e questo è un ottimo approccio.Questi calcoli rapidi e semplici consentono di verificare se qualche altro calcolo complicato o adattamento del modello può avere senso.Sono essenzialmente l'equivalente di probabilità di [problemi di Fermi] (https://en.wikipedia.org/wiki/Fermi_problem).Se ti intervistassi, sarei davvero molto felice delle tue idee.(Ancora più felice se hai inventato anche altri approcci, come una simulazione in qualsiasi pacchetto software.)

Potresti chiedere al tuo inquisitore di essere più realistico? "Tutti conoscono" la somma dei punti che dovremmo vedere in 100 lanci di dadi e questo non accadrà;metà del motivo per cui esistono giochi di dadi. Quando avevo circa 12 anni, un insegnante convinse la classe a lanciare centinaia di dadi e il risultato fu molto chiaro. I numeri due e cinque avevano una probabilità doppia rispetto a quanto dicevano le statistiche.Prima di negarlo, provalo! Aspetta, però ... n. Due e cinque?Non conosci diversi giochi di dadi che dipendono dai sette?Non è questo da dire, su due e cinque?

tira <- 100 ribalta <- 600 ddice <- rep (1/6, 6) for (n in 2: rolls) { ddice <- (c (0, ddice, 0,0,0,0,0)) c (0,0, ddice, 0,0,0,0) + c (0,0,0, ddice, 0,0,0) + c (0,0,0,0, ddice, 0,0) + c (0,0,0,0,0, ddice, 0) + c (0,0,0,0,0,0, ddice)) / 6} sum (ddice * (1-pbinom (1: flips, flips, 1/2))) # monete di probabilità altro # 0.00809003 sum (ddice * dbinom (1: flips, flips, 1/2)) # probabilità uguaglianza # 0.00111972 sum (ddice * pbinom (0: (flips-1), flips, 1/2)) # dice di probabilità altro # 0.99079025

set.seed (825) d = replicate (10 ^ 6, sum (sample (1: 6,100, rep = T)) - rbinom (1,600, .5)) media (d > 0) [1] 0.990736 2 * sd (d > 0) / 1000 [1] 0.0001916057 # aprx 95% di margine di errore di simulazione

importa numpy come np c = np.random.randint (0, 2, size = (10000, 100, 6)). sum (axis = -1) d = np.random.randint (1, 7, size = (10000, 100)) (d.sum (asse = -1) > c.sum (asse = -1)). sum () --> 9923

dalle raccolte import defaultdict # definire le distribuzioni di una singola moneta e morire moneta = tupla ((i, 1/2) for i in (0, 1)) die = tupla ((i, 1/6) for i in (1, 2, 3, 4, 5, 6)) # una semplice funzione per calcolare la somma di due variabili casuali def add_rv (a, b): sum = defaultdict (float) for i, p in a: per j, q in b: somma [i + j] + = p * q tupla di ritorno (sum.items ()) # calcola la somma di 600 monete e 100 dadi coin_sum = dice_sum = ((0, 1),) per _ nell'intervallo (600): coin_sum = add_rv (coin_sum, coin) per _ nell'intervallo (100): dice_sum = add_rv (dice_sum, die) # calcola la probabilità che la somma dei dadi sia maggiore prob = 0 per i, p in dice_sum: per j, q in coin_sum: se io > j: prob + = p * q print ("probabilità di 100 dadi sommati a più di 600 monete =% .10f"% prob)

# Memorizza i PMF delle variabili come frame di dati con le colonne "value" e "prob". # Importante che i valori siano consecutivi e crescenti per coerenza quando convolgono, # quindi includi valori intermedi con probabilità 0 se necessario! # Funzione per verificare se il dataframe è conforme alla precedente definizione di PMF # Usa message_intro per spiegare quale controllo sta fallendo is.pmf <- function (x, message_intro = "") { if (! is.data.frame (x)) {stop (paste0 (message_intro, "Not a dataframe"))} if (! nrow (x) > 0) {stop (paste0 (message_intro, "Dataframe has no rows"))} if (! "value"% in% colnames (x)) {stop (paste0 (message_intro, "No 'value' column"))} if (! "prob"% in% colnames (x)) {stop (paste0 (message_intro, "No 'prob' column"))} if (! is.numeric (x $ value)) {stop (paste0 (message_intro, "'value' column not numeric"))} if (! all (is.finite (x $ value))) {stop (paste0 (message_intro, "Does 'value' contains NA, Inf, NaN etc?"))} if (! all (diff (x $ value) == 1)) {stop (paste0 (message_intro, "'value' not consecutive and ascending"))} if (! is.numeric (x $ prob)) {stop (paste0 (message_intro, "colonna 'prob' non numerica"))} if (! all (is.finite (x $ prob))) {stop (paste0 (message_intro, "Does 'prob' contains NA, Inf, NaN etc?"))} if (! all.equal (sum (x $ prob), 1)) {stop (paste0 (message_intro, "la colonna 'prob' non somma a 1"))} return (TRUE) } # Funzione per convolgere i PMF di x e y # Notare che per convolgere in R è necessario invertire il secondo vettore # nome1 e nome2 vengono utilizzati nella segnalazione degli errori per i due input convolve.pmf <- funzione (x, y, name1 = "x", name2 = "y") { is.pmf (x, message_intro = paste0 ("Checking", name1, "is valid PMF:")) is.pmf (y, message_intro = paste0 ("Checking", name2, "is valid PMF:")) x_plus_y <- data.frame ( value = seq (from = min (x $ value) + min (y $ value), to = max (x $ value) + max (y $ valore), di = 1), prob = convolve (x $ prob, rev (y $ prob), type = "open") ) return (x_plus_y) } # Sia x_i il punteggio dei singoli lanci di dadi i # Nota PMF di x_i è lo stesso per ogni i = 1 fino a i = 100) x_i <- data.frame ( valore = 1: 6, prob = rep (1/6, 6) ) # Sia t_i il totale di x_1, x_2, ..., x_i # Memorizzeremo i PMF di t_1, t_2 ... in un elenco t_i <- list () t_i [[1]] <- x_i # t_1 è solo x_1 quindi ha lo stesso PMF # PMF di t_i è la convoluzione di PMF di t_ (i-1) e x_i per (i in 2: 100) { t_i [[i]] <- convolve.pmf (t_i [[i-1]], x_i, nome1 = incolla0 ("t_i [[", i-1, "]]"), nome2 = "x_i") } # Sia x la somma dei punteggi di tutti i 100 lanci di dadi indipendenti x <- t_i [[100]] is.pmf (x, message_intro = "Il controllo di x è PMF valido:") # Sia y il numero di teste in 600 lanci di monete, così ha la distribuzione binomiale (600, 0,5): y <- data.frame (valore = 0: 600) y $ prob <- dbinom (y $ valore, dimensione = 600, prob = 0,5) is.pmf (y, message_intro = "Il controllo di y è PMF valido:") # Sia z il negativo di y (nota che invertiamo l'ordine per mantenere i valori crescenti) z <- data.frame (value = -rev (y $ value), prob = rev (y $ prob)) is.pmf (z, message_intro = "Il controllo di z è PMF valido:") # Sia d la differenza, d = x - y = x + z d <- convolve.pmf (x, z, name1 = "x", name2 = "z") is.pmf (d, message_intro = "Il controllo di d è PMF valido:") # Prob (X > Y) = Prob (D > 0) somma (d [d $ valore > 0, "prob"]) # [1] 0.9907902