Spiacenti, sono un po 'nuovo qui, quindi scusami se questo non aiuta troppo.
La US Social Security Administration conserva i registri di nascite e morti e ha le loro informazioni disponibili per l'acquisto un prezzo alto): Qui
Tuttavia ho trovato una fonte che afferma di averlo acquistato e lo offre gratuitamente (oltre a offrire i dati ordinati per data sul sito ): Qui
Suppongo che tu possa semplicemente usarlo come campione e passare attraverso tutti i dati con uno script e scoprire quante persone muoiono effettivamente il giorno del loro compleanno. Lo farei da solo ma mi rimangono 20 minuti per il download (sono circa 1,5 GB), quindi cercherò di ricontattarti sulle statistiche io stesso se trovo il tempo di scrivere uno script.
Ovviamente gli Stati Uniti non possono rappresentare l'intera popolazione mondiale, ma è un buon inizio. Presumo che vedrai un tasso più elevato di decessi nei compleanni a causa dei "problemi del primo mondo" perché stiamo usando gli Stati Uniti e penso che l'effetto sarebbe meno visibile in tutto il mondo ...
Aggiornamento - Numeri: D
Ho esaminato il file principale della morte della previdenza sociale dalla fonte gratuita, quindi non c'è modo di sapere se le informazioni sono valide. Tuttavia, data la dimensione che sono ~ 3 Gigabyte ciascuno e che non c'è motivo per nessuno di falsificare questo tipo di file ... presumo che siano validi.
Puoi vedere il codice che Lo leggevo qui: http://pastebin.com/9wUFuvpN
È scritto in C #, legge le righe dell'indice di morte una per una e poi analizza la data utilizzando regex. Ho pensato che il file fosse fondamentalmente questo formato:
`(Social Security Number) (First Name) (LastName) (Middle Name) (Some Letter) (MM-DD-YYYY of Death) (MM-GG-AAAA di nascita) "
Ho fatto in modo che le espressioni regolari selezionassero l'ultima parte per le date di nascita / morte, controlla se uno qualsiasi dei campi è solo 0 (che presumo significhi che la previdenza sociale non ha potuto ottenere un mese / data valido per il record) e scartare gli 0. Quindi controllerà se il giorno di nascita e il mese di nascita corrispondono al giorno della morte / mese di morte e lo aggiungerà al conteggio dei morti per compleanno. Aggiungerà tutti i record che non sono 0 al conteggio delle morti.
Fornisce i risultati in questo formato:
Morti al compleanno / Linee di morte totali esaminate - Persone con uno 0 in uno qualsiasi dei loro record
Sarebbe fantastico se qualcuno potesse ricontrollare quel codice, poiché ho trovato parecchi errori che ho fatto prima e potevo solo dire perché i miei risultati non avevano senso statistico.
Ecco l'output della console:
Facendo un po 'di matematica ...
- Il file 1 aveva 44665 Morti in un compleanno su 14879058 Morti in totale
- File 2 ha avuto 47060 Morti in un compleanno su 15278724 Morti in totale
- File 3 ha avuto 49289 Morti in un compleanno su 15374049 Morti in totale
- In totale abbiamo 141014 morti in un compleanno su 45531831.
Quindi abbiamo una probabilità dello 0,3097% di morire il giorno di un compleanno mentre statisticamente (1 / 365) ci indurrebbe a credere che ci sia solo ~ 0,27397% di possibilità di morire per un compleanno. Questo è effettivamente un aumento del 13% della possibilità di morte per un compleanno da 1/365. Ovviamente questo campione è solo per gli americani e ha solo 45 milioni di record, sono sicuro che le organizzazioni che originariamente hanno pubblicato il loro articolo hanno avuto accesso a indici di morte molto più affidabili e più ampi. Tuttavia, penso che sia davvero valido che la morte in un compleanno sia più probabile della morte in qualsiasi altro giorno.
Ecco un articolo del Time che cita salti nei motivi della morte nei compleanni: Articolo
Modifica 2: @cbeleites ha sottolineato che ho dimenticato di tenere conto delle morti nello stesso giorno, il che sarebbe un fattore enorme nell'aumento dei decessi nei compleanni. A rigor di termini i miei dati sono ancora validi ma non ho buttato via se una persona è morta lo stesso giorno in cui è nata. È interessante notare che i miei risultati non sono stati influenzati troppo pesantemente da questo errore, quindi sembra che questi record non includano la morte il primo giorno. Lo esaminerò più tardi. Penso che ci sarebbero statistiche molto interessanti che posso cercare come la morte nei giorni del mese e fare una mappa termica di qualche tipo. Probabilmente proverò a farlo prima o poi ...