Domanda:
La stima della densità del kernel assume valori maggiori di 1
Björn Pollex
2010-12-30 02:27:47 UTC
view on stackexchange narkive permalink

Sto usando scipy.stats.gaussian_kde per stimare un pdf per alcuni dati. Il problema è che il pdf risultante assume valori maggiori di 1. Per quanto ho capito, questo non dovrebbe accadere. Mi sbaglio? In tal caso, perché?

(+1 al possibile duplicato) Giusto per trasmetterlo rapidamente: la probabilità è definita come un'area sotto una curva.Una probabilità associata al valore di un PDF in un singolo punto viene moltiplicata per 0 (cioè la larghezza di una linea) quindi semmai la probabilità stessa è 0. Il thread collegato fornisce un'eccellente ulteriore elaborazione su questo.
Una risposta:
shabbychef
2010-12-30 02:33:49 UTC
view on stackexchange narkive permalink

Ti sbagli. Il CDF non dovrebbe essere maggiore di 1, ma il PDF potrebbe esserlo. Si pensi, ad esempio, al PDF di una variabile casuale gaussiana con media zero e deviazione standard $ \ sigma $: $$ f (x) = \ frac {1} {\ sqrt {2 \ sigma \ pi}} \ exp ( - \ frac {x ^ 2} {2 \ sigma ^ 2}) $$ se rendi $ \ sigma $ molto piccolo, allora per $ x = 0 $, il PDF è arbitrariamente grande!

Un'altra possibile fonte di confusione è che il pdf di una variabile casuale discreta (chiamata anche pmf - funzione di massa di probabilità) in effetti non può superare 1.
@Aniko: Questa è davvero una fonte di confusione. Penso di aver capito adesso.
Questa domanda è un duplicato di http://stats.stackexchange.com/q/4220/919.


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 2.0 con cui è distribuito.
Loading...