Domanda:
La curva pandemica COVID-19 è una curva gaussiana?
Samos
2020-03-22 20:14:53 UTC
view on stackexchange narkive permalink

Abbiamo tutti sentito parlare molto di "appiattire la curva".Mi chiedevo se queste curve - che sembrano campane - possono essere qualificate come gaussiane nonostante ci sia una dimensione temporale.

enter image description here

Bene, sai che la distribuzione gaussiana si estende infinitamente in entrambe le direzioni.È vero per questa distribuzione?
@user76284 Le distribuzioni gaussiane sono validamente utilizzate come modelli per molte cose che in linea di principio non si estendono nemmeno all'infinito (punteggi dei test?).Un esempio di fisica: le velocità sono effettivamente limitate da ± c, ma una distribuzione di velocità gaussiana descrive i gas del pozzo a temperatura ambiente.
Nessuna di queste curve mi sembra gaussiana, ignorando che non useresti il termine per i dati temporali.Inoltre sembra ovvio che tale grafica sarebbe molto semplificata per il consumo da un vasto pubblico
Ho il sospetto che una buona risposta a questa domanda dovrebbe almeno prendere in considerazione modelli matematici di epidemiologia, oltre ai dati reali.Vedi https://en.wikipedia.org/wiki/Mathematical_modelling_of_infectious_disease per un'introduzione ad alcuni degli approcci.Vedi anche https://en.wikipedia.org/wiki/Compartmental_models_in_epidemiology per i modelli compartimentali che utilizzano equazioni differenziali.
Queste curve non sono "distribuzioni" nel senso generalmente inteso in probabilità e statistica.Una curva della frequenza dei casi rispetto al tempo che appaia gaussiana mostrerebbe necessariamente un'accelerazione * nella crescita rispetto all'inizio esponenziale suggerito dalla maggior parte dei modelli di trasmissione.Questo viene facilmente verificato tracciando dati * affidabili * su scale logaritmiche: la curva sembrerebbe parabolica.Quasi * ogni * curva che sale e poi scende, senza alcun improvviso cambiamento di pendenza, può essere approssimata con una parabola, suggerendo che questa domanda potrebbe non portare a nessuna intuizione o procedure statistiche utili.
Dodici risposte:
Alexis
2020-03-22 20:25:34 UTC
view on stackexchange narkive permalink

No.

Ad esempio:

  • Non nel senso di una distribuzione probabilità gaussiana: la curva a campana di una distribuzione normale (gaussiana) è un istogramma (una mappa della densità di probabilità rispetto ai valori di una singola variabile), ma le curve che citi sono (come noti) una mappa dei valori di una variabile (nuovi casi) rispetto a una seconda variabile (tempo). (@Accumulation e @TobyBartels sottolineano che le curve gaussiane sono costrutti matematici che potrebbero non essere correlati alle distribuzioni di probabilità; dato che stai ponendo questa domanda sulle statistiche SE, ho assunto che affrontare la distribuzione gaussiana fosse una parte importante della risposta alla domanda.)

  • I possibili valori in una distribuzione normale si estendono da $ - \ infty $ a $ \ infty $ , ma una curva epidemica non può avere valori negativi sull'asse y e viaggia abbastanza a sinistra o a destra sulla x , finirai tutti i casi, o perché la malattia non esiste o perché Homo sapiens non esiste.

  • Le distribuzioni normali sono continue, ma i fenomeni misurati dalle curve epidemiche sono in realtà discreti non continui: rappresentano nuovi casi durante ogni discreta unità di tempo. Sebbene possiamo suddividere il tempo in unità significative più piccole ( in una certa misura), alla fine ci imbattiamo nel fatto che le persone con nuove infezioni sono dati di conteggio (discreti).

  • Le distribuzioni normali sono simmetriche rispetto alla loro media, ma nonostante il fumetto trasmetta un utile messaggio di salute pubblica sulla necessità di appiattire la curva, le curve epidemiche effettive sono spesso distorte a destra, con code lunghe e sottili come mostrato di seguito.

Epidemic curve from the WHO Situation Report yellow fever in Angola, 15 September 2016: http://www.who.int/emergencies/yellow-fever/situation-reports/23-september-2016/en/

  • Le distribuzioni normali sono unimodali, ma le curve epidemiche effettive possono presentare uno o più dossi (cioè possono essere multimodali, possono anche, come nella risposta di @SextusEmpiricus, essere endemiche doveritornano ciclicamente).

  • Infine, ecco una curva epidemica per COVID-19 in Cina, puoi vedere che la curva generalmente diverge dalla curva gaussiana (ovviamente ci sono problemi con l'affidabilità dei dati, dato che molti casi eranonon conteggiato):

COVID-19 epidemic curve, China, December 31, 2019–February 25, 2020

Grazie.Il punto 4 è davvero buono.Questa è una semplice approssimazione per spiegare un fenomeno che non riflette la verità (cfr. Curve bimodali nel paese scandinavo).
Inoltre, i dati di conteggio e la distribuzione distorta mi hanno fatto pensare alla distribuzione di Poisson.
@Samos Poisson è una variazione interessante della tua domanda originale!Tuttavia, tutti i miei punti si applicano ancora (sebbene il secondo abbia bisogno di qualche ritocco perché Poisson ha ipotesi diverse rispetto alla gaussiana, ma sono ancora violate dalle epidemie. :)
Sono d'accordo con i punti 1 e 4, ma penso che 2 e 3 manchi lo spirito della domanda.Ovviamente, nessun dato del mondo reale sarà * esattamente * normale, ma solo * approssimativamente * normale.Inoltre, ci sono distribuzioni normali troncate e * tutti * i dati sono discreti perché abbiamo solo un numero finito di punti campione.
@gardenhead Re Point 3, data ≠ distribuzione parametrica (come normale o Poisson).Il punto 2 ha più strati di sfumature che non volevo approfondire.Sei libero di aggiungere una tua risposta.:) Presumo che tu sia soddisfatto del punto 5, anche se i punti 2 e 3 sono delle piccole lendini da scegliere.:)
Quelli non sono affatto pignoli, le distribuzioni normali vengono utilizzate sempre per dati discreti (o quando i limiti tra infinito negativo e positivo non hanno senso), ad esempio quasi tutti i sondaggi.I punti 2 e 3 sono semplicemente argomenti errati.Allo stesso modo le distribuzioni gamma vengono utilizzate per i processi di poisson se vengono soddisfatte determinate condizioni.Il modo corretto per parlare dei punti 2 e 3 è sostenere che le ipotesi richieste per l'approssimazione continua non hanno senso.
@eps Penso che tu stia rispondendo a una domanda diversa da quella posta.Non stavo scrivendo su approssimazioni o test * ovunque * nella mia risposta.
La [definizione] (https://en.wikipedia.org/wiki/Gaussian_function) data da wikipedia non dice nulla sul fatto che sia una densità di probabilità.
Anche il primo punto non è valido.Almeno i due successivi sono tecnicamente corretti in senso pedante (anche se mancano il punto, poiché la curva potrebbe essere approssimativamente gaussiana).Ma il primo punto è completamente sbagliato;una curva gaussiana è una curva gaussiana indipendentemente da ciò che rappresenta.Questi primi tre punti distraggono dagli ultimi due punti corretti e rilevanti.
@TobyBartels Consiglieresti di migrare la domanda a MO.SE?
@TobyBartels Ho anche reso più esplicito che il primo punto è rispetto alla probabilità.Penso che questo sia un punto ragionevole da fare su un sito web di statistiche.
Intendi Math Overflow?Non è matematica a livello di ricerca, quindi non ci starebbe, ma si adatterebbe bene alla matematica.Non so quanto dovrebbe essere ampio il CV;questa domanda riguarda sicuramente la statistica in un certo senso, ma forse non il senso rilevante.
Apprezzo la tua riformulazione del n. 1 e sono d'accordo che non è più errato.(Detto questo, penso ancora che i punti veramente importanti siano gli ultimi due, e in questo modo vengono sepolti dietro le cose meno importanti.)
Potresti spiegare il significato della curva epidemica nel tuo ultimo punto?È un grafico cumulativo, quindi non ti aspetteresti che diverga da un modello gaussiano istantaneo?
@EdwardBrey Questo è davvero un buon punto.(L'ho aggiunto più tardi, cercando di afferrare rapidamente una curva epidemica C19, e legit era troppo veloce e sciatto al riguardo. Anche se non sembrano nemmeno CDF nomali. :) Colpirò quell'aggiunta e troverò un miglioreimmagine da aggiungere in seguito.Grazie e stai bene.
@EdwardBrey Ho modificato l'ultimo punto con una curva epidemica (conteggi) per incorporare il tuo commento.
Sextus Empiricus
2020-03-22 20:40:26 UTC
view on stackexchange narkive permalink

Le curve epidemiologiche per le infezioni respiratorie sono curve molto irregolari. Si veda ad esempio l'epidemia di SARS del 2002/2003

SARS https://www.who.int/csr/sars/epicurve/epiindex/en/index1.html

e per le malattie endemiche possono avere un andamento stagionale. Vedi ad esempio il logo euromomo

seasonal flu and common cold

Oltre all'appiattimento della curva in generale non essendo una curva gaussiana, la situazione sarà anche più sfumata. L'immagine che gira su internet è un caso molto estremo dove la curva si attacca molto al di sopra della soglia e viene dimezzata di dimensioni a seguito delle misure. Ha abbozzato una situazione perfetta per sostenere misure drastiche. Questo potrebbe non essere necessariamente il caso di covid-19.

Rappresentazioni più sfumate mostrano soglie diverse e presentano differenze più sottili nelle curve. Come qui

curves with thresholds

https://www.vaccinarsinpuglia.org/notizie/2017/10/al-via-la-sorveglianza-dellinfluenza-stagione-2017-18

* "** L '** estate" * non esiste, quindi, nessuna possibilità.È un peccato per tutti, ma avere due emisferi su un pianeta è probabilmente meglio a lungo termine.
Tim
2020-03-22 20:54:57 UTC
view on stackexchange narkive permalink

Non sono un epidemiologo e dovresti porre questa domanda agli epidemiologi.

Prima di tutto, disegnare curve gaussiane è semplice, dal momento che anche il software di plottaggio di base le ha implementate (ad esempio Microsoft Excel), quindi quando le persone hanno bisogno di disegnare "una distribuzione", spesso disegnano gaussiane. Le cifre "appiattisci la curva" hanno lo scopo di mostrare l'idea generale del fenomeno, non l'esatta distribuzione di ciò che sarà e potrebbe essere accaduto (nessuno lo sa in anticipo, poiché ci sono troppe incognite e troppe parti in movimento). Anche le scale delle figure non sono realistiche; alcuni esperti sottolineano che la differenza potrebbe essere molto più alta rispetto a tali cifre.

Per quanto riguarda la forma gaussiana dell'epidemia, per quanto ne so, questa è nota come legge di Farr. Prima il numero di persone infette aumenta, poi diminuisce, quindi è simile a una curva gaussiana, ma è lontana dall'essere una misura esatta. Puoi trovare la discussione in questo thread di Twitter, che fornisce come esempio di uno studio che applicava la legge di Farr alla previsione dei casi di HIV / AIDS negli Stati Uniti, come puoi vedere dalla trama, non ha nulla a che fare con il risultato effettivo.

enter image description here

Puoi trovare alcune cifre, più serie, nell'articolo ampiamente citato di Ferguson et al (2020). Come puoi vedere, sono "in aumento e in diminuzione, ma tutt'altro che gaussiano, in alcune simulazioni anche multimodali o distorte. Naturalmente, questa è ancora una simulazione, quindi una distribuzione molto più semplificata di quanto ci si potrebbe aspettare dai dati effettivi.

enter image description here

enter image description here

Come si traccia facilmente una curva a campana in Excel?O un programma di disegno come Inksape?
@d-b Google per ["excel normal distribution"] (https://www.google.com/search?q=excel+normal+distribution) e troverai facilmente esempi.
Il tuo link di Farr dice "Tuttavia, la deviazione standard dovrebbe rimanere il più vicino possibile a 1 - questa è la caratteristica distintiva di una curva a campana".che è solo bizzarro.Non c'è niente che "definisca" sd = 1 (ea meno che non si tratti di una quantità adimensionale, questo non ha nemmeno alcun senso).
Una distribuzione normale * standard * ha media zero e deviazione standard 1. Mi chiedo se la citazione di Farr stia usando la terminologia in modo altrettanto specializzato.
La curva nera (epidemia non attenuata) è molto simmetrica e potrebbe essere facilmente scambiata per una curva gaussiana.Poiché il numero di infezioni ha un elemento casuale e poiché le probabilità sono basse ma non pari a zero su entrambe le estremità (il virus potrebbe essere rimasto inosservato più a lungo del previsto) la forma non è sorprendente.Sarebbe bello analizzare le differenze specifiche.
Pere
2020-03-23 18:25:06 UTC
view on stackexchange narkive permalink

Non ma (con i giusti presupposti che in pratica non è probabile che valgano) una specie di.

Come sottolinea Michael Reid, il numero di persone infette di un'epidemia in condizioni costanti semplificate (costante R0) è governato dall'equazione logistica, che porta a un sigmoide, la funzione logistica. La derivata della funzione logistica è la curva di densità a campana della distribuzione logistica, che non è normale nonostante sembri normale a prima vista. Poiché il derivato rappresenterebbe il numero di nuove persone infette per unità di tempo e le metriche comuni come il numero di decessi al giorno o il numero di nuovi casi segnalati al giorno sono più o meno proporzionali a una versione ritardata e sfocata del numero di nuove persone infette, seguono anche una curva simile alla funzione di densità della distribuzione logistica.

Tuttavia, alcune ipotesi dell'equazione logistica potrebbero non essere valide per l'epidemia di coronavirus - in effetti, potrebbero non valere per nessuna popolazione reale, sebbene l'equazione logistica sia un modello comune e utile nelle dinamiche della popolazione:

  • Nell'equazione dinamica si presume che tutta la popolazione si riproduca, cioè che tutte le persone che sono state infettate continuino a infettare più persone. In realtà, a un certo punto le persone infette smettono di diffondere l'infezione.
  • Le condizioni (R0) sono considerate costanti. Nel mondo reale, vengono introdotte misure di contesa e quindi R0 cambia.
"R0 costante" è un po 'un passo falso: R0 si applica al * caso indice * nella circostanza in cui * ogni * individuo che quella persona incontra può essere infettato.Una volta ottenuta la prima trasmissione umana umana, quella non è più la situazione, poiché la seconda persona non ha probabilità di infettare la prima.
Nel modello logistico, il numero di persone che vengono infettate da un individuo è R0 moltiplicato per il tasso di persone che non sono state infettate.Pertanto, una volta ottenuta la prima trasmissione umana, la probabilità di una nuova infezione decade anche se R0 si mantiene costante.Questo è il motivo per cui la curva di infezione è un sigmoide e non esponenziale.In effetti, è quasi esponenziale solo mentre le persone infette sono una parte molto piccola della popolazione.
"vengono introdotte misure di contesa e quindi R0 cambia" non dovrebbe essere "quindi R cambia"
R0 cambia con le misure di contesa perché ogni persona infetta infetterebbe in media meno persone supponendo che tutti possano essere infettati.https://en.wikipedia.org/wiki/Basic_reproduction_number Se intendiamo R (non R0) come il numero effettivo di persone infette da una persona infetta, R cambia quando parte della popolazione non può più essere infettata, come ha sottolineato Alexis,e quindi R diminuisce naturalmente da R0 a 0 - quando tutti sono stati infettati.Si noti che l'equazione logistica non tiene conto del fatto che le persone smettono di essere contagiose a un certo punto, quindi si dimentica l'immunità del gregge.
Questa dovrebbe essere la risposta accettata.Grazie per le informazioni.
Acccumulation
2020-03-25 08:14:10 UTC
view on stackexchange narkive permalink

Sembra che ci siano tre domande qui:

  1. è la distribuzione effettiva dei casi gaussiana? No.

  2. Le curve sono date nel grafico gaussiano? Non proprio.Penso che quello rosso sia un po 'storto e quello blu decisamente storto.

  3. Can grafici di un valore rispetto al tempo possono essere considerati gaussiani? Sì.

In matematica, una funzione gaussiana, spesso indicata semplicemente come gaussiana, è una funzione della forma $$ f (x) = ae ^ {- {\ frac {(xb) ^ {2}} {2c ^ {2}}}} $$ per costanti reali arbitrarie a, be non zero c.

https://en.wikipedia.org/wiki/Gaussian_function

Non è necessario che si tratti di una distribuzione di probabilità.

user953847-abecode
2020-03-23 10:21:01 UTC
view on stackexchange narkive permalink

Risposta breve, no.Mi chiedevo la stessa cosa e ho scoperto un modo per tracciare le popolazioni di persone suscettibili, infette e guarite.È un modello chiamato modello compartimentale di epidemiologia e l'algoritmo specifico è chiamato Gillespie Algorithm.C'è del codice Python nel secondo link ma l'ho provato in R e sembra così susceptible, green; infected, red; recovered, blue e ecco il notebook se sei interessato.

Sembra che qualcosa come la distribuzione di Poisson sarebbe più vicina, ma nelle giuste condizioni, potremmo approssimare il Poisson con una distribuzione normale / gaussiana.Questa è l'interpretazione generosa.Le altre interpretazioni sono: 1, il CDC in realtà non conosce la forma giusta, o 2, il CDC vuole smorzarlo per il consumo pubblico.

Vedi anche https://www.youtube.com/watch?v=k6nLfCbAzgo
Se capisco stai suggerendo che sarebbe possibile adattare la curva rossa come Poisson?(In caso contrario, quanto segue è probabilmente irrilevante, scusa)!La curva potrebbe adattarsi a una curva di Poisson * forma *, ma questo non si adatta a una distribuzione di Poisson.La * distribuzione * è discreta e non ha un elemento temporale.Potresti adattare le morti / casi al giorno a una distribuzione di Poisson (con tasso variabile), anche se anche in questo caso immagino che un modello troppo disperso come il binomio negativo sia un punto di partenza più appropriato.
Sì, grazie per averlo fatto notare!Sono caduto nella stessa trappola / incomprensione relativa all'argomento che mi ha incuriosito in primo luogo, ovvero usare la forma gaussiana / normale per un fenomeno temporale.
Michael Reid
2020-03-23 18:10:34 UTC
view on stackexchange narkive permalink

L'analisi più semplice di un'epidemia porta a un modello di curva logistica.Il tasso di nuove infezioni sarà il derivato dei casi totali, che sotto quel modello darebbe una curva a forma di campana (normale nel mezzo ma con code molto più grasse - vedi il commento di Dirk sotto).

Le ipotesi alla base del modello sono un tasso di trasmissione costante, esattamente come sarebbe il caso della crescita esponenziale, ma a differenza della crescita esponenziale c'è la presenza di un limite di saturazione.In molte epidemie il limite di saturazione sarebbe l'intera popolazione (cioè alla fine tutti saranno stati esposti e acquisiti l'immunità).Nel caso di COVID-19, si spera che non sia così, quindi sarà necessario un aggiustamento ondulato in modo tale che i limiti di diffusione in un sottoinsieme dell'intera popolazione.

La mia fonte per questo è stato questo eccellente video di YouTube 1.(Forse esiste una fonte migliore di YouTube?)

La derivata della curva logistica decade come exp (-x) e la gaussiana è più veloce (come exp (-x²)).
Sì, ci sono due rapporti di interesse "logistico vs gaussiano": ** 1. ** come dice Dirk e [mostra qui] (https://stats.stackexchange.com/a/146874/251427), c'è una buona corrispondenza;** 2. ** la distribuzione cumulativa di entrambi è [quasi la stessa] (http://visionlab.harvard.edu/Members/Anne/Math/Logistic_vs_Gaussian.html).
Itamar Mushkin
2020-03-24 17:31:19 UTC
view on stackexchange narkive permalink

Non sono un epidemiologo, ma un'altra differenza fondamentale tra quella curva e una curva gaussiana è che la curva gaussiana decade a zero in modo relativamente veloce (come $ e ^ {- t ^ 2} $ dopo un po 'di tempo $ t $ ), mentre ci si può aspettare che un'epidemia reale diminuisca a un ritmo molto più lento alla fine, o potrebbe anchenon decade a $ 0 $ ma a qualche altra costante (si spera bassa), ovvero il virus potrebbe non estinguersi del tutto come suggerisce la curva gaussiana.

LeBorgne
2020-04-23 17:48:47 UTC
view on stackexchange narkive permalink

No.Come dimostrato qui su vari paesi, finora, un modo ragionevole per modellare le curve dei casi confermati di daily new e dei decessi per Covid-19 è usare:

  • un esponenziale crescente all'inizio
  • una curva logistica quando la curva inizia ad appiattirsi (guarda il video di 3Blue1Brown)
  • un esponenziale decrescente subito dopo il primo picco
  • in seguito, potremmo non disporre di dati da raccontare.

Vedi ad esempio l'Italia al 22 aprile 2020 (con Logistica adatta prima del picco, esponenziale dopo):

enter image description here

Per quanto riguarda gli Stati Uniti, il modello logistico finora è sufficiente:

enter image description here

Infine, è più difficile dirlo per la Cina:

enter image description here

per favore aggiungi i riferimenti completi per i tuoi link nel caso in cui muoiano in futuro, grazie!
La distribuzione logistica in realtà assomiglia molto alla distribuzione normale.Può essere approssimato da esso (vedere l'approssimazione di Taylor di [questa curva] (https://www.wolframalpha.com/input/?i=Log%28e%5E-x%2F%281%2Be%5E-x%29% 5E2% 29)) ed è principalmente diverso solo per le code (che qui non sono molto rilevanti).La linea di fondo: con queste curve che assomigliano a forme di sigmoide sarai in grado di trovare molte corrispondenze (anche se come mostra il caso cinese, queste curve di forme di sigmoide sono forti semplificazioni).
chrishmorris
2020-03-25 20:55:29 UTC
view on stackexchange narkive permalink

Nelle prime fasi di un'epidemia la crescita è esponenziale.I due parametri chiave sono R0 (numero medio di persone infettate da ogni persona che lo cattura) e tempo di incubazione.L'obiettivo è ridurre R0: quando è inferiore a 1,0 l'epidemia è finita.La maggior parte delle contee è ancora in quella fase per COVID-19.

Una volta che una frazione significativa della popolazione diventa immune, un modello esponenziale non è più adatto.Vedi l'ottima risposta di user953847 sopra.

Sextus Empiricus sottolinea che i dati effettivi sono irregolari.Questo è vero per tutti i dati reali.Tuttavia, i modelli ideali possono essere utili per trovare e comunicare le tendenze alla base delle irregolarità.

Cos'è R0?Come si relaziona alla domanda?Esiste una formula che utilizza R0?Qual è la formula?
Nell'esempio che fornisco (la curva per la SARS) puoi vedere che i dati non sono solo rumorosi per i quali un modello ideale può fornire una misura.I dati sono molto irregolari, potresti descriverli meglio come bitorzoluti invece che granulosi.Ha più componenti, ad esempio il picco molto alto e sottile nel mezzo è l'epidemia di Amoy Gardens.Lo stesso vale per il tasso di morte (la curva EuroMomo '), questi mostrano un'onda di forma più o meno sinusoidale ma con picchi e valli molto diversi ogni anno, e inoltre durante l'inverno c'è occasionalmente un piccolo picco alto che si riferisce a un'epidemia di fumi.
Mike D.
2020-04-14 06:14:24 UTC
view on stackexchange narkive permalink

La crescita biologica (cumulativa) di epidemie di virus, o alberi, o esseri umani, o altri fenomeni biologici, in generale segue la funzione logistica: 1 / (1 + e ^ -1). La curva logistica è sigmoidea oa forma di S. Non si "appiattisce" ma ha un punto di flesso.

Il primo derivato è il tasso di crescita. Quella curva segue la distribuzione logistica. È a forma di campana come la curva gaussiana, sebbene sia diversa. F (x) = e ^ -x / (1 + e ^ -x) ^ 2. Il picco della curva del tasso di crescita è contemporaneo (perché l'asse x è il tempo) con il punto di flesso della curva di crescita cumulativa.

La seconda derivata è l'accelerazione. È a forma di S su un lato, come un'onda sinusoidale inclinata a destra. L'accelerazione passa attraverso l'asse x (uguale a zero) quando la velocità raggiunge il picco e la crescita cumulativa si flette. Successivamente l'accelerazione è negativa (decelerazione) e dopo essere immersa in territorio negativo si avvicina asintoticamente all'asse x dal basso.

La funzione Gompertz è un caso specializzato della funzione logistica generale e talvolta viene utilizzata per studi di crescita perché ha parametri che possono essere risolti tramite regressione lineare. Uno dei parametri è l'asintoto superiore della curva di crescita cumulativa. Quel parametro corrisponderebbe al totale dei decessi o ai casi totali se quelli fossero ciò che stavi stimando.

A volte viene utilizzata anche la distribuzione Weibull, un altro caso specializzato con parametri. Abbiamo usato il Weibull per sviluppare i cosiddetti modelli di crescita individuali degli alberi quando ero uno studente universitario.

Questa è la matematica della crescita. Non è "esponenziale" o "logaritmico". È logistico.

Le curve logistiche sigmoidi si appiattiscono, ma non invertono la direzione e tornano indietro, come possono fare le curve epidemiche.Ti interessa affrontare questo problema?
La curva sigmoidea è la frazione della popolazione che è stata esposta;il nuovo tasso di infezione (o il totale infetto, o letti ospedalieri) è la pendenza di questo sigma (che raggiunge il picco, quindi decade).Questo modello presuppone che la diffusione sia satura (piuttosto che essere soppressa e contenuta).
meduz
2020-03-27 14:27:53 UTC
view on stackexchange narkive permalink

In effetti, questa curva sembra adattarsi bene a una distribuzione gaussiana inversa.Questa distribuzione è ampiamente utilizzata in psicologia o economia per descrivere la distribuzione dei ritardi temporali.IANAE (I Am Not An Epidemiologist ©), ma ci sono somiglianze di questi processi con una pandemia (dove ciò che è indicato nel grafico dalla variabile $ x $ saràtempo dall'inizio della pandemia):

typical IG distributions

Nota che per alcuni valori, sembra vicino a una distribuzione gaussiana "a forma di campana".La media e la deviazione standard controllano il tempo del picco e lo "spread" della curva.

Potresti chiarire perché la curva potrebbe essere un buon modello, a parte la somiglianza visiva?
spero che le mie modifiche siano d'aiuto, chiedi se hai bisogno di maggiori dettagli ..
Se capisco mi stai suggerendo di adattare la curva a quella di una gaussiana inversa?Sebbene le curve possano adattarsi, non è la stessa cosa che adattarsi alla distribuzione.La curva che stai descrivendo è definita nel tempo, mentre la curva della distribuzione definisce la probabilità (densità) di un singolo campione che assume quel valore - non esiste un elemento temporale.
grazie @owen88 per il commento - c'erano molti presupposti nascosti nella mia risposta.Ho apportato alcune modifiche per risolverli, spero che questo lo renda più chiaro.
Sostieni che ogni individuo ha una sorta di velocità per acquisire il virus, che questa è distribuita normalmente e, di conseguenza, la curva epidemiologica del numero di infezioni è gaussiana inversa.Tuttavia, gli eventi di infezioni non sono * indipendenti *.Dovrebbe esserci una componente di crescita in cui il tasso di infezioni dipende dal numero attuale di infezioni.--------- L'uso di queste distribuzioni gaussiane inverse è forse più applicabile come piccola parte in una sorta di modello meccanicistico complesso.Ad esempio, potremmo modellare il "tempo di incubazione" come una gaussiana inversa.
Ciao @meduz, non sono ancora sicuro di seguire.Forse il modo più semplice per chiarire: qual è l'asse xey nel tuo grafico?La domanda originale aveva grafici con axese x = tempo, y = no.casi.Se stai usando lo stesso axese, puoi solo dire che la forma può sembrare gaussiana inversa, ma non è la stessa dei dati che seguono una distribuzione gaussiana inversa.
gli assi seguono le consuete convenzioni così come vengono usate nella letteratura in generale e wikipedia (io wikipedia) in particolare.quindi sì.x = tempo e f (x) numero di casi.hai perfettamente ragione.
IANAE = Non sono un epidemiologo.per commentare il commento di @SextusEmpiricus - è perfettamente giusto presumere che non siano indipendenti e che tu possa fare un modello più istruito.almeno una gaussiana inversa è * meno sbagliata * di una gaussiana, vedere la domanda originale che è "La curva pandemica COVID-19 è una curva gaussiana?"e l'obiettivo di dare una tale risposta.
* "In effetti, questa curva è anche ben descritta da una distribuzione gaussiana inversa. Questa distribuzione è ampiamente utilizzata in psicologia o in economia e il suo uso è giustificato dai processi sottostanti che generano tale curva," * Non è ben descritta da unla distribuzione gaussiana inversa e il suo utilizzo non sono giustificati dal processo sottostante che genera tali curve.Le differenze nella "velocità per ammalarsi" sono solo una piccola parte del processo totale e hanno solo una piccola influenza sulla forma generale della curva.Non ci si dovrebbe aspettare che qualsiasi somiglianza sia basata su un principio meccanicistico.
grazie @SextusEmpiricus per questo commento aggiuntivo.ma questo si sviluppa molto più della domanda che è stata posta e più verso la modellazione di un'epidemia complessa per la quale esiste una vasta letteratura.Ho modificato di nuovo per evitare di pensare che esista una cosa come una "velocità per ammalarsi".
@meduz - la tua combinazione di definizioni dell'asse x e dell'asse y non è coerente con l'idea di tracciare una gaussiana inversa;in particolare l'asse y dovrebbe essere una densità di probabilità, non un conteggio.
caro @owen88 questo grafico è tratto da wikipedia e per avere un conteggio, dovresti considerare di moltiplicare la distribuzione per il conteggio della popolazione.
Se si scala in base alla popolazione, si presume implicitamente che l'intera popolazione otterrà CV-19.Sembra che il modello che stai proponendo sia in realtà un modello sullo spazio degli iperparametri per la gamma inversa.Ma questo è molto diverso dal dire che segue una distribuzione gaussiana inversa (che suggerisce il campionamento da quella distribuzione - cosa che non sei, se suggerisci di poter scalare l'asse y per popolazione).Questo è anche in contrasto con il tuo confronto con l'uso di Gamma inversa per misurare gli intervalli di tempo.Se non sei d'accordo, forse potresti far luce sull'analogia con gli intervalli di tempo?
sì, l'intera popolazione potrebbe ottenere COVID-19.Questo non è un modello epidemiologico, ma una descrizione delle dinamiche che potresti osservare sulla popolazione.Secondo me è importante in SE concentrarsi sulla risposta alla domanda originale, se vuoi fare una domanda sull'analogia con gli intervalli di tempo, sarei felice di rispondere alla tua stessa domanda.


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 4.0 con cui è distribuito.
Loading...