Domanda:
Se $ X $ è distribuito normalmente, può anche essere distribuito normalmente $ \ log (X) $?
JCWong
2014-04-09 01:54:45 UTC
view on stackexchange narkive permalink

Supponiamo che $ X $ sia distribuito $ N (\ mu, \ sigma ^ 2) $ dove $ \ mu \ neq 0 $.
Posso usare il metodo Delta per dire che $ log (X) $ ~ $ N (log (\ mu), \ sigma ^ 2 / \ mu ^ 2) $?

E se $ \ mu $ fosse negativo? $ \ Log (\ mu) $ è ancora definito come un numero reale?
Anche quando $ \ mu / \ sigma $ è enorme, quindi (discutibilmente) potremmo trascurare la possibilità di un valore negativo, le aspettative sono sbagliate: $ X = \ exp (\ log (X)) $ avrebbe una media di $ \ exp (\ log (\ mu) + \ sigma ^ 2 / (2 \ mu ^ 2)), $ che è strettamente maggiore di $ \ mu $. * È * vero che le distribuzioni lognormali con deviazioni standard geometriche molto piccole sono approssimativamente normali, a condizione che i parametri siano scelti in modo appropriato.
Cinque risposte:
Glen_b
2014-04-09 04:13:00 UTC
view on stackexchange narkive permalink

Non è il caso.

Perché $ \ log (X) $ sia normale, $ X $ deve essere lognormale.

(Considera: se $ Z = \ log ( X) $ è normale, quindi $ X = \ exp (Z) $ ... e quando esponenti una variabile casuale normale, ciò che ottieni viene chiamato variabile casuale lognormale.)

Più in generale, prendendo i log "attirano" valori più estremi a destra (valori alti) rispetto alla mediana, mentre i valori all'estrema sinistra (valori bassi) tendono ad essere allungati indietro. Quindi, se è simmetrico prima di prendere i registri, sarà relativamente inclinato dopo. Questa è una semplice conseguenza della forma della funzione $ \ log (x) $:

enter image description here

(la linea è tangente alla curva. In generale non lo fa ' t necessariamente avvicinarsi all'origine, in questo caso è solo un artefatto del particolare valore di $ m $)

Valori molto vicini alla mediana (indicati da $ m $ nel grafico) sperimenteranno un ridimensionamento approssimativamente lineare (la linea blu tratteggiata). I valori molto al di sopra di $ m $ verranno tirati indietro verso $ m $ rispetto al riscalamento sperimentato dai valori medi, mentre i valori molto al di sotto di $ m $ saranno allontanati ulteriormente da $ m $, rispetto a quel riscalamento lineare.

Di conseguenza, i valori a una distanza uguale, $ d $ sopra e sotto $ m $ prima della trasformazione non saranno ugualmente distanti da essa in seguito - il valore trasformato sopra sarà più vicino a $ \ log (m) $ di il valore trasformato sotto sarà. Ciò accadrebbe per ogni valore di $ d $.

Quindi $ X $ simmetrico implica asimmetrico $ \ log (X) $.


Ora parliamo non di normalità, ma di normalità approssimativa. (Per semplicità, supponiamo che la distribuzione sia tale che i valori saranno essenzialmente sempre positivi, ovvero se i valori originali fossero normali, la possibilità di un valore negativo è estremamente bassa.)

Ce n'è uno situazione in cui i valori approssimativamente normali tendono a essere ancora approssimativamente normali dopo la trasformazione.

Questo è quando la deviazione standard è molto piccola rispetto alla media (basso coefficiente di variazione).

Se guardi il diagramma sopra, considera i valori sull'asse x in una banda molto stretta intorno a $ m $. L'effetto di estensione / estensione è minimo (la curva nera non ha spazio per allontanarsi dalla linea tangente blu), quindi la forma sembra ancora normale.

Ecco un esempio: il grafico in alto è un insieme di dati approssimativamente normali (il grafico QQ mostra una linea abbastanza retta) e anche il suo registro è approssimativamente normale (il grafico QQ mostra ancora una linea abbastanza retta). Questo perché il coefficiente di variazione nei valori originali era piuttosto piccolo (da qualche parte intorno a 0,2 credo): la trasformazione non lineare era ancora quasi lineare nel ristretto intervallo di valori intorno al centro.

enter image description here

In questa situazione, il metodo delta tende effettivamente ad essere utile per fornire valori approssimativi per la media e la varianza dei valori logaritmici, sebbene non sarebbe effettivamente la distribuzione dei log di una variabile casuale esattamente normale.

Sycorax
2014-04-09 02:07:41 UTC
view on stackexchange narkive permalink

No. $ X $ potrebbe essere negativo. Pertanto, $ \ log (X) $ non restituirà un numero reale con probabilità positiva. La distribuzione normale è definita solo sulla linea reale. QED.

Aksakal
2014-04-09 01:55:58 UTC
view on stackexchange narkive permalink

No. esempio di contatore: $ x \ sim \ mathcal {N} (- 1,1) $

La domanda era se $ \ log (X) $ PU essere distribuito normalmente se $ X $ è distribuito normalmente.Questo esempio non dimostra che l'affermazione è falsa, quindi non è un controesempio.Dovresti mostrare che è impossibile che $ \ log (X) $ sia normale se $ X $ è normale (cosa che ovviamente è; ad esempio, vedi la risposta di Sycorax).
Sextus Empiricus
2020-08-04 16:04:13 UTC
view on stackexchange narkive permalink

Se $ X $ è normalmente distribuito, anche $ \ log (X) $ può essere normalmente distribuito?

Teoricamente: no

Altre risposte hanno affermato che non è possibile. In effetti, teoricamente , non è possibile. Se $ X $ è normalmente distribuito, $ X $ può avere valori negativi e $ \ log (X) $ non esiste per input negativo.

In pratica: sì

Tuttavia, nella pratica , si potrebbe trattare di una distribuzione che è solo approssimativamente distribuita normalmente e che ha un dominio $ X>0 $ . Per una simile distribuzione potrebbe essere ancora interessante immaginare cosa accadrà quando prendiamo la trasformazione $ \ log (X) $ .


Il metodo Delta

Il metodo delta approssima la trasformazione $ \ log (X) $ per linearizzazione. Questa approssimazione funzionerà bene quando la differenza intorno alla media (il punto in cui linearizzi) non è troppo grande.

L'immagine seguente illustra la trasformazione per diversi coefficienti di variazione di $ X $ (vedere immagini simili qui).

Puoi vedere come l'immagine a sinistra non è così vicina a una trasformazione lineare e l'istogramma risultante di $ Y = \ log (X) $ , disegnato al margine, non assomiglia tanto a una distribuzione normale ed è distorta. Tuttavia, l'immagine a destra è più vicina a una trasformazione lineare e la variabile trasformata assomiglia ragionevolmente a una distribuzione normale.

linearization, Delta method, with different scales

I valori di $ \ mu $ e $ \ sigma $ nell'ultima immagine a destra mostrano che il metodo Delta funziona per quel caso:

  > ymean
[1] 2.995604
Registro > (xmean)
[1] 2.995921
>
> ysig
[1] 0,02521176
> xsig / 20
[1] 0,02519255
>
 

Più preciso del metodo Delta

Il metodo Delta sarà meno accurato quando $ \ sigma / \ mu $ è maggiore perché l'approssimazione con linearizzazione è meno accurata.

L'immagine sotto lo dimostra. Mostra simulazioni di 10.000 punti per $ Y = \ log (X) $ dove $ X \ sim N (\ mu_X = 1, \ sigma_X = CV) $ dove $ CV $ è stato variato (valori $ X<0 $ span> sono stati rimossi).

simulations with varying CV

La curva spezzata rossa mostra che la media di $ Y = \ log (X) $ può essere ragionevolmente approssimata invertendo la formula per la media di un log- variabile distribuita normale.

  • If $ Y = \ exp (X) $ o $ X = \ log (Y) $ , dove $ X \ sim N (\ mu_X, \ sigma_X ^ 2) $ quindi $ \ mu_Y = \ exp (\ mu_X + 0.5 \ sigma_X ^ 2) $ e l'inverso $ \ mu_X \ approx \ log (\ mu_Y) -0.5 \ sigma_X ^ 2 $ .

  • Potremmo anche fare lo stesso per la relazione per la varianza di una distribuzione normale logaritmica ma questa è un'espressione un po 'imbarazzante, quindi semplifichiamo un po' le cose e compiliamo l'approssimazione Delta $ \ sigma_X \ approx \ sigma_Y / \ mu_Y $ .

Quindi finiamo con

$$ \ mu_X \ approx \ log (\ mu_Y) -0.5 \ sigma_Y ^ 2 / \ mu_Y ^ 2 $$

questa è la curva rossa nel grafico sopra e sembra corrispondere bene con i dati.

Applicazione pratica:

In questa domanda:

I risultati di Monte Carlo diventano più distorti con più campionamenti

si tratta di un logaritmo di $ X $ dove è la percentuale del rendimento mensile di un investimento.La media è 1.01 e la sd = 0.04 tale che il coefficiente di variazione è molto piccolo.

In questa domanda, il metodo delta funziona, ma il metodo più preciso è ancora migliore.

Mark L. Stone
2018-07-14 07:18:33 UTC
view on stackexchange narkive permalink

Se $ X $ è normalmente distribuito, può anche $ log (X) $ essere distribuito normalmente?

Sì.È possibile.E in effetti è vero se e solo se $ X \ sim \ mathcal {N} (\ mu, 0) $ , con $ \ mu > 0 $ , nel qual caso $ log (X) \ sim \ mathcal {N} (log (\ mu), 0) $ span>.

Nota: "Can" è diverso da "must".

Non sapevo che le variabili distribuite normalmente potessero assumere valori infiniti o indefiniti (ad esempio, $ \ log (x) $ quando $ x \ leq 0 $) con probabilità diversa da zero.
@Do non reintegrare Monica Grazie per il tuo commento.ho appena modificato la mia risposta per specificare $ \ mu> 0 $, piuttosto che $ \ mu \ ge 0 $ originariamente dichiarato
Indipendentemente dal valore di $ \ mu $, $ P (X \ leq 0)> 0 $.
@Do non reintegrare Monica No, ho specificato varianza = 0, questa è la chiave della mia risposta.Questo è normale.
Grazie a chi ha downvotato una risposta CORRETTA e spiegata.
Il parametro di varianza in una normale non è strettamente positivo?
@Dimitriy V. Masterov Non necessariamente.Una variabile casuale normale con varianza zero è una variabile casuale normale singolarmente continua, il che significa che è supportata in uno spazio dimensionale inferiore.in questo caso, 0D, rispetto allo spazio, 1D, in cui è definito.È la stessa di una distribuzione delta di Dirac., Le persone hanno più familiarità con il normale multivariato singolarmente continuo, ovvero il normale multivariato con matrice di covarianza singolare. 1D Il normale con varianza zero ha una matrice di covarianza singolare https://stats.stackexchange.com/questions/157834 / esempio-di-variabile-casuale-singolarmente-continua / 157841 # 157841
@Do non reintegrare Monica Si prega di vedere il mio commento precedente.
Non ho sottovalutato la tua risposta, ma penso che chiamare una variabile casuale degenerata "normalmente distribuita con una varianza pari a zero" sia discutibile e, in ogni caso, sembra mancare completamente il punto della domanda.


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...