Abbiamo tutti sentito parlare molto di "appiattire la curva".Mi chiedevo se queste curve - che sembrano campane - possono essere qualificate come gaussiane nonostante ci sia una dimensione temporale.
Abbiamo tutti sentito parlare molto di "appiattire la curva".Mi chiedevo se queste curve - che sembrano campane - possono essere qualificate come gaussiane nonostante ci sia una dimensione temporale.
No.
Ad esempio:
Non nel senso di una distribuzione probabilità gaussiana: la curva a campana di una distribuzione normale (gaussiana) è un istogramma (una mappa della densità di probabilità rispetto ai valori di una singola variabile), ma le curve che citi sono (come noti) una mappa dei valori di una variabile (nuovi casi) rispetto a una seconda variabile (tempo). (@Accumulation e @TobyBartels sottolineano che le curve gaussiane sono costrutti matematici che potrebbero non essere correlati alle distribuzioni di probabilità; dato che stai ponendo questa domanda sulle statistiche SE, ho assunto che affrontare la distribuzione gaussiana fosse una parte importante della risposta alla domanda.)
I possibili valori in una distribuzione normale si estendono da $ - \ infty $ a $ \ infty $ , ma una curva epidemica non può avere valori negativi sull'asse y e viaggia abbastanza a sinistra o a destra sulla x , finirai tutti i casi, o perché la malattia non esiste o perché Homo sapiens non esiste.
Le distribuzioni normali sono continue, ma i fenomeni misurati dalle curve epidemiche sono in realtà discreti non continui: rappresentano nuovi casi durante ogni discreta unità di tempo. Sebbene possiamo suddividere il tempo in unità significative più piccole ( in una certa misura), alla fine ci imbattiamo nel fatto che le persone con nuove infezioni sono dati di conteggio (discreti).
Le distribuzioni normali sono simmetriche rispetto alla loro media, ma nonostante il fumetto trasmetta un utile messaggio di salute pubblica sulla necessità di appiattire la curva, le curve epidemiche effettive sono spesso distorte a destra, con code lunghe e sottili come mostrato di seguito.
Le distribuzioni normali sono unimodali, ma le curve epidemiche effettive possono presentare uno o più dossi (cioè possono essere multimodali, possono anche, come nella risposta di @SextusEmpiricus, essere endemiche doveritornano ciclicamente).
Infine, ecco una curva epidemica per COVID-19 in Cina, puoi vedere che la curva generalmente diverge dalla curva gaussiana (ovviamente ci sono problemi con l'affidabilità dei dati, dato che molti casi eranonon conteggiato):
Le curve epidemiologiche per le infezioni respiratorie sono curve molto irregolari. Si veda ad esempio l'epidemia di SARS del 2002/2003
https://www.who.int/csr/sars/epicurve/epiindex/en/index1.html
e per le malattie endemiche possono avere un andamento stagionale. Vedi ad esempio il logo euromomo
Oltre all'appiattimento della curva in generale non essendo una curva gaussiana, la situazione sarà anche più sfumata. L'immagine che gira su internet è un caso molto estremo dove la curva si attacca molto al di sopra della soglia e viene dimezzata di dimensioni a seguito delle misure. Ha abbozzato una situazione perfetta per sostenere misure drastiche. Questo potrebbe non essere necessariamente il caso di covid-19.
Rappresentazioni più sfumate mostrano soglie diverse e presentano differenze più sottili nelle curve. Come qui
Non sono un epidemiologo e dovresti porre questa domanda agli epidemiologi.
Prima di tutto, disegnare curve gaussiane è semplice, dal momento che anche il software di plottaggio di base le ha implementate (ad esempio Microsoft Excel), quindi quando le persone hanno bisogno di disegnare "una distribuzione", spesso disegnano gaussiane. Le cifre "appiattisci la curva" hanno lo scopo di mostrare l'idea generale del fenomeno, non l'esatta distribuzione di ciò che sarà e potrebbe essere accaduto (nessuno lo sa in anticipo, poiché ci sono troppe incognite e troppe parti in movimento). Anche le scale delle figure non sono realistiche; alcuni esperti sottolineano che la differenza potrebbe essere molto più alta rispetto a tali cifre.
Per quanto riguarda la forma gaussiana dell'epidemia, per quanto ne so, questa è nota come legge di Farr. Prima il numero di persone infette aumenta, poi diminuisce, quindi è simile a una curva gaussiana, ma è lontana dall'essere una misura esatta. Puoi trovare la discussione in questo thread di Twitter, che fornisce come esempio di uno studio che applicava la legge di Farr alla previsione dei casi di HIV / AIDS negli Stati Uniti, come puoi vedere dalla trama, non ha nulla a che fare con il risultato effettivo.
Puoi trovare alcune cifre, più serie, nell'articolo ampiamente citato di Ferguson et al (2020). Come puoi vedere, sono "in aumento e in diminuzione, ma tutt'altro che gaussiano, in alcune simulazioni anche multimodali o distorte. Naturalmente, questa è ancora una simulazione, quindi una distribuzione molto più semplificata di quanto ci si potrebbe aspettare dai dati effettivi.
Non ma (con i giusti presupposti che in pratica non è probabile che valgano) una specie di.
Come sottolinea Michael Reid, il numero di persone infette di un'epidemia in condizioni costanti semplificate (costante R0) è governato dall'equazione logistica, che porta a un sigmoide, la funzione logistica. La derivata della funzione logistica è la curva di densità a campana della distribuzione logistica, che non è normale nonostante sembri normale a prima vista. Poiché il derivato rappresenterebbe il numero di nuove persone infette per unità di tempo e le metriche comuni come il numero di decessi al giorno o il numero di nuovi casi segnalati al giorno sono più o meno proporzionali a una versione ritardata e sfocata del numero di nuove persone infette, seguono anche una curva simile alla funzione di densità della distribuzione logistica.
Tuttavia, alcune ipotesi dell'equazione logistica potrebbero non essere valide per l'epidemia di coronavirus - in effetti, potrebbero non valere per nessuna popolazione reale, sebbene l'equazione logistica sia un modello comune e utile nelle dinamiche della popolazione:
Sembra che ci siano tre domande qui:
è la distribuzione effettiva dei casi gaussiana? No.
Le curve sono date nel grafico gaussiano? Non proprio.Penso che quello rosso sia un po 'storto e quello blu decisamente storto.
Can grafici di un valore rispetto al tempo possono essere considerati gaussiani? Sì.
In matematica, una funzione gaussiana, spesso indicata semplicemente come gaussiana, è una funzione della forma $$ f (x) = ae ^ {- {\ frac {(xb) ^ {2}} {2c ^ {2}}}} $$ per costanti reali arbitrarie a, be non zero c.
https://en.wikipedia.org/wiki/Gaussian_function
Non è necessario che si tratti di una distribuzione di probabilità.
Risposta breve, no.Mi chiedevo la stessa cosa e ho scoperto un modo per tracciare le popolazioni di persone suscettibili, infette e guarite.È un modello chiamato modello compartimentale di epidemiologia e l'algoritmo specifico è chiamato Gillespie Algorithm.C'è del codice Python nel secondo link ma l'ho provato in R e sembra così e ecco il notebook se sei interessato.
Sembra che qualcosa come la distribuzione di Poisson sarebbe più vicina, ma nelle giuste condizioni, potremmo approssimare il Poisson con una distribuzione normale / gaussiana.Questa è l'interpretazione generosa.Le altre interpretazioni sono: 1, il CDC in realtà non conosce la forma giusta, o 2, il CDC vuole smorzarlo per il consumo pubblico.
L'analisi più semplice di un'epidemia porta a un modello di curva logistica.Il tasso di nuove infezioni sarà il derivato dei casi totali, che sotto quel modello darebbe una curva a forma di campana (normale nel mezzo ma con code molto più grasse - vedi il commento di Dirk sotto).
Le ipotesi alla base del modello sono un tasso di trasmissione costante, esattamente come sarebbe il caso della crescita esponenziale, ma a differenza della crescita esponenziale c'è la presenza di un limite di saturazione.In molte epidemie il limite di saturazione sarebbe l'intera popolazione (cioè alla fine tutti saranno stati esposti e acquisiti l'immunità).Nel caso di COVID-19, si spera che non sia così, quindi sarà necessario un aggiustamento ondulato in modo tale che i limiti di diffusione in un sottoinsieme dell'intera popolazione.
La mia fonte per questo è stato questo eccellente video di YouTube 1.(Forse esiste una fonte migliore di YouTube?)
Non sono un epidemiologo, ma un'altra differenza fondamentale tra quella curva e una curva gaussiana è che la curva gaussiana decade a zero in modo relativamente veloce (come $ e ^ {- t ^ 2} $ dopo un po 'di tempo $ t $ ), mentre ci si può aspettare che un'epidemia reale diminuisca a un ritmo molto più lento alla fine, o potrebbe anchenon decade a $ 0 $ ma a qualche altra costante (si spera bassa), ovvero il virus potrebbe non estinguersi del tutto come suggerisce la curva gaussiana.
No.Come dimostrato qui su vari paesi, finora, un modo ragionevole per modellare le curve dei casi confermati di daily new e dei decessi per Covid-19 è usare:
Vedi ad esempio l'Italia al 22 aprile 2020 (con Logistica adatta prima del picco, esponenziale dopo):
Per quanto riguarda gli Stati Uniti, il modello logistico finora è sufficiente:
Infine, è più difficile dirlo per la Cina:
Nelle prime fasi di un'epidemia la crescita è esponenziale.I due parametri chiave sono R0 (numero medio di persone infettate da ogni persona che lo cattura) e tempo di incubazione.L'obiettivo è ridurre R0: quando è inferiore a 1,0 l'epidemia è finita.La maggior parte delle contee è ancora in quella fase per COVID-19.
Una volta che una frazione significativa della popolazione diventa immune, un modello esponenziale non è più adatto.Vedi l'ottima risposta di user953847 sopra.
Sextus Empiricus sottolinea che i dati effettivi sono irregolari.Questo è vero per tutti i dati reali.Tuttavia, i modelli ideali possono essere utili per trovare e comunicare le tendenze alla base delle irregolarità.
La crescita biologica (cumulativa) di epidemie di virus, o alberi, o esseri umani, o altri fenomeni biologici, in generale segue la funzione logistica: 1 / (1 + e ^ -1). La curva logistica è sigmoidea oa forma di S. Non si "appiattisce" ma ha un punto di flesso.
Il primo derivato è il tasso di crescita. Quella curva segue la distribuzione logistica. È a forma di campana come la curva gaussiana, sebbene sia diversa. F (x) = e ^ -x / (1 + e ^ -x) ^ 2. Il picco della curva del tasso di crescita è contemporaneo (perché l'asse x è il tempo) con il punto di flesso della curva di crescita cumulativa.
La seconda derivata è l'accelerazione. È a forma di S su un lato, come un'onda sinusoidale inclinata a destra. L'accelerazione passa attraverso l'asse x (uguale a zero) quando la velocità raggiunge il picco e la crescita cumulativa si flette. Successivamente l'accelerazione è negativa (decelerazione) e dopo essere immersa in territorio negativo si avvicina asintoticamente all'asse x dal basso.
La funzione Gompertz è un caso specializzato della funzione logistica generale e talvolta viene utilizzata per studi di crescita perché ha parametri che possono essere risolti tramite regressione lineare. Uno dei parametri è l'asintoto superiore della curva di crescita cumulativa. Quel parametro corrisponderebbe al totale dei decessi o ai casi totali se quelli fossero ciò che stavi stimando.
A volte viene utilizzata anche la distribuzione Weibull, un altro caso specializzato con parametri. Abbiamo usato il Weibull per sviluppare i cosiddetti modelli di crescita individuali degli alberi quando ero uno studente universitario.
Questa è la matematica della crescita. Non è "esponenziale" o "logaritmico". È logistico.
In effetti, questa curva sembra adattarsi bene a una distribuzione gaussiana inversa.Questa distribuzione è ampiamente utilizzata in psicologia o economia per descrivere la distribuzione dei ritardi temporali.IANAE (I Am Not An Epidemiologist ©), ma ci sono somiglianze di questi processi con una pandemia (dove ciò che è indicato nel grafico dalla variabile $ x $ saràtempo dall'inizio della pandemia):
Nota che per alcuni valori, sembra vicino a una distribuzione gaussiana "a forma di campana".La media e la deviazione standard controllano il tempo del picco e lo "spread" della curva.