Domanda:
Qual è la differenza tra varianza empirica e varianza?
Zia
2011-06-01 14:24:43 UTC
view on stackexchange narkive permalink

Per quanto ne so, la varianza è calcolata come

$$ \ text {variance} = \ frac {(x- \ text {mean}) ^ 2} {n} $$

while

$$ \ text {Empirical Variance} = \ frac {(x- \ text {mean}) ^ 2} {n (n-1)} $$

È corretto? O c'è qualche altra definizione? Spiega gentilmente con un esempio o qualsiasi riferimento per la lettura su questo argomento

Ho usato Latex per modificare la presentazione della tua domanda. Se questo non è ciò che intendevi, fammelo sapere
Una risposta:
#1
+17
Henry
2011-06-01 14:46:10 UTC
view on stackexchange narkive permalink

Nella tua espressione per la varianza, devi prendere una somma (o integrale) nella popolazione

$$ \ text {variance} = \ frac {\ sum_i (x_i- \ text {mean}) ^ 2} {n} $$

Se i tuoi dati sono un campione della popolazione, questa espressione ti darà una stima distorta della varianza della popolazione. Una stima imparziale sarebbe la seguente (nota il cambiamento nel denominatore dalla tua espressione), spesso chiamata varianza campione

$$ \ text {varianza campione} = \ frac {\ sum_i (x_i- \ text {mean}) ^ 2} {n-1} $$

Se d'altra parte stavi cercando di stimare la varianza della media campionaria, allora avresti un numero più piccolo, più vicino alla tua espressione . La radice quadrata di questo è chiamata errore standard della media e una stima ragionevole è

$$ \ text {errore standard} = \ sqrt {\ frac {\ sum_i ( x_i- \ text {mean}) ^ 2} {n (n-1)}} $$

Vedi http://en.wikipedia.org/wiki/Bias_of_an_estimator#Sample_variance per una spiegazione del perché la varianza $ 1 / n \ sum_ {i} (x_ {i} - \ bar {x}) ^ 2 $ è uno stimatore parziale, e http://vdov.net/~acosta/content/mle-normal/ per una spiegazione del perché è lo stimatore di massima verosimiglianza per variabili normali.
Potresti chiarire quale si chiama "varianza empirica"?
@GuillaumeChérel - Non ho usato la parola "empirico" perché il punto che stavo cercando di fare è che la domanda chiave è distinguere tra la stima della varianza (o deviazione standard) della popolazione e la stima della distribuzione dell'errore nella stima della media.Altri potrebbero chiamare qualsiasi stima dei parametri dalle osservazioni come * empirica *
Vedo.In effetti, la parola * empirico * è vaga, e questo è precisamente il mio problema: mi sono imbattuto nel termine * varianza empirica * durante la lettura di un articolo che presenta un algoritmo che voglio implementare.Non riesco a trovare alcuna idea se dividere la somma delle differenze al quadrato per $ n $ o $ n - 1 $.Quindi supponevo che le persone che usavano il termine * empirico * si riferissero implicitamente all'uno o all'altro.Qualche idea?
È solo un'ipotesi, ma possono significare "varianza campionaria" e potrebbero essere più propensi a dividere per $ n-1 $ quando lo calcolano


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...