Supponiamo che $ X $ sia distribuito $ N (\ mu, \ sigma ^ 2) $ dove $ \ mu \ neq 0 $.
Posso usare il metodo Delta per dire che $ log (X) $ ~ $ N (log (\ mu), \ sigma ^ 2 / \ mu ^ 2) $?
Supponiamo che $ X $ sia distribuito $ N (\ mu, \ sigma ^ 2) $ dove $ \ mu \ neq 0 $.
Posso usare il metodo Delta per dire che $ log (X) $ ~ $ N (log (\ mu), \ sigma ^ 2 / \ mu ^ 2) $?
Non è il caso.
Perché $ \ log (X) $ sia normale, $ X $ deve essere lognormale.
(Considera: se $ Z = \ log ( X) $ è normale, quindi $ X = \ exp (Z) $ ... e quando esponenti una variabile casuale normale, ciò che ottieni viene chiamato variabile casuale lognormale.)
Più in generale, prendendo i log "attirano" valori più estremi a destra (valori alti) rispetto alla mediana, mentre i valori all'estrema sinistra (valori bassi) tendono ad essere allungati indietro. Quindi, se è simmetrico prima di prendere i registri, sarà relativamente inclinato dopo. Questa è una semplice conseguenza della forma della funzione $ \ log (x) $:
(la linea è tangente alla curva. In generale non lo fa ' t necessariamente avvicinarsi all'origine, in questo caso è solo un artefatto del particolare valore di $ m $)
Valori molto vicini alla mediana (indicati da $ m $ nel grafico) sperimenteranno un ridimensionamento approssimativamente lineare (la linea blu tratteggiata). I valori molto al di sopra di $ m $ verranno tirati indietro verso $ m $ rispetto al riscalamento sperimentato dai valori medi, mentre i valori molto al di sotto di $ m $ saranno allontanati ulteriormente da $ m $, rispetto a quel riscalamento lineare.
Di conseguenza, i valori a una distanza uguale, $ d $ sopra e sotto $ m $ prima della trasformazione non saranno ugualmente distanti da essa in seguito - il valore trasformato sopra sarà più vicino a $ \ log (m) $ di il valore trasformato sotto sarà. Ciò accadrebbe per ogni valore di $ d $.
Quindi $ X $ simmetrico implica asimmetrico $ \ log (X) $.
Ora parliamo non di normalità, ma di normalità approssimativa. (Per semplicità, supponiamo che la distribuzione sia tale che i valori saranno essenzialmente sempre positivi, ovvero se i valori originali fossero normali, la possibilità di un valore negativo è estremamente bassa.)
Ce n'è uno situazione in cui i valori approssimativamente normali tendono a essere ancora approssimativamente normali dopo la trasformazione.
Questo è quando la deviazione standard è molto piccola rispetto alla media (basso coefficiente di variazione).
Se guardi il diagramma sopra, considera i valori sull'asse x in una banda molto stretta intorno a $ m $. L'effetto di estensione / estensione è minimo (la curva nera non ha spazio per allontanarsi dalla linea tangente blu), quindi la forma sembra ancora normale.
Ecco un esempio: il grafico in alto è un insieme di dati approssimativamente normali (il grafico QQ mostra una linea abbastanza retta) e anche il suo registro è approssimativamente normale (il grafico QQ mostra ancora una linea abbastanza retta). Questo perché il coefficiente di variazione nei valori originali era piuttosto piccolo (da qualche parte intorno a 0,2 credo): la trasformazione non lineare era ancora quasi lineare nel ristretto intervallo di valori intorno al centro.
In questa situazione, il metodo delta tende effettivamente ad essere utile per fornire valori approssimativi per la media e la varianza dei valori logaritmici, sebbene non sarebbe effettivamente la distribuzione dei log di una variabile casuale esattamente normale.
No. $ X $ potrebbe essere negativo. Pertanto, $ \ log (X) $ non restituirà un numero reale con probabilità positiva. La distribuzione normale è definita solo sulla linea reale. QED.
No. esempio di contatore: $ x \ sim \ mathcal {N} (- 1,1) $
Se $ X $ è normalmente distribuito, anche $ \ log (X) $ può essere normalmente distribuito?
Altre risposte hanno affermato che non è possibile. In effetti, teoricamente , non è possibile. Se $ X $ è normalmente distribuito, $ X $ può avere valori negativi e $ \ log (X) $ non esiste per input negativo.
Tuttavia, nella pratica , si potrebbe trattare di una distribuzione che è solo approssimativamente distribuita normalmente e che ha un dominio $ X>0 $ . Per una simile distribuzione potrebbe essere ancora interessante immaginare cosa accadrà quando prendiamo la trasformazione $ \ log (X) $ .
Il metodo delta approssima la trasformazione $ \ log (X) $ per linearizzazione. Questa approssimazione funzionerà bene quando la differenza intorno alla media (il punto in cui linearizzi) non è troppo grande.
L'immagine seguente illustra la trasformazione per diversi coefficienti di variazione di $ X $ (vedere immagini simili qui).
Puoi vedere come l'immagine a sinistra non è così vicina a una trasformazione lineare e l'istogramma risultante di $ Y = \ log (X) $ , disegnato al margine, non assomiglia tanto a una distribuzione normale ed è distorta. Tuttavia, l'immagine a destra è più vicina a una trasformazione lineare e la variabile trasformata assomiglia ragionevolmente a una distribuzione normale.
I valori di $ \ mu $ e $ \ sigma $ nell'ultima immagine a destra mostrano che il metodo Delta funziona per quel caso:
> ymean
[1] 2.995604
Registro > (xmean)
[1] 2.995921
>
> ysig
[1] 0,02521176
> xsig / 20
[1] 0,02519255
>
Il metodo Delta sarà meno accurato quando $ \ sigma / \ mu $ è maggiore perché l'approssimazione con linearizzazione è meno accurata.
L'immagine sotto lo dimostra. Mostra simulazioni di 10.000 punti per $ Y = \ log (X) $ dove $ X \ sim N (\ mu_X = 1, \ sigma_X = CV) $ dove $ CV $ è stato variato (valori $ X<0 $ span> sono stati rimossi).
La curva spezzata rossa mostra che la media di $ Y = \ log (X) $ può essere ragionevolmente approssimata invertendo la formula per la media di un log- variabile distribuita normale.
If $ Y = \ exp (X) $ o $ X = \ log (Y) $ , dove $ X \ sim N (\ mu_X, \ sigma_X ^ 2) $ quindi $ \ mu_Y = \ exp (\ mu_X + 0.5 \ sigma_X ^ 2) $ e l'inverso $ \ mu_X \ approx \ log (\ mu_Y) -0.5 \ sigma_X ^ 2 $ .
Potremmo anche fare lo stesso per la relazione per la varianza di una distribuzione normale logaritmica ma questa è un'espressione un po 'imbarazzante, quindi semplifichiamo un po' le cose e compiliamo l'approssimazione Delta $ \ sigma_X \ approx \ sigma_Y / \ mu_Y $ .
Quindi finiamo con
$$ \ mu_X \ approx \ log (\ mu_Y) -0.5 \ sigma_Y ^ 2 / \ mu_Y ^ 2 $$
questa è la curva rossa nel grafico sopra e sembra corrispondere bene con i dati.
In questa domanda:
I risultati di Monte Carlo diventano più distorti con più campionamenti
si tratta di un logaritmo di $ X $ dove è la percentuale del rendimento mensile di un investimento.La media è 1.01 e la sd = 0.04 tale che il coefficiente di variazione è molto piccolo.
In questa domanda, il metodo delta funziona, ma il metodo più preciso è ancora migliore.
Se $ X $ è normalmente distribuito, può anche $ log (X) $ essere distribuito normalmente?
Sì.È possibile.E in effetti è vero se e solo se $ X \ sim \ mathcal {N} (\ mu, 0) $ , con $ \ mu > 0 $ , nel qual caso $ log (X) \ sim \ mathcal {N} (log (\ mu), 0) $ span>.
Nota: "Can" è diverso da "must".