EDIT: prova solo ad aggiungere qualche parola in più.
Come studente di dottorato in Biostatistica, mi sento benissimo con quello che ha detto @ Frank-Harrell. Ed è abbastanza corretto !!! Gli studenti del nostro dipartimento hanno ottimi posti di lavoro dopo la laurea.
D'altra parte, @StasK ha citato l'articolo " Non siamo Data Science?", ma lo ha intitolato " gli statistici non sono riconosciuti come data scientist ". Questo è un po 'fuorviante per me. Gli statistici potrebbero non essere chiamati scienziati dei dati. Ma chi altri può affermarlo formalmente? Ad ogni modo, ciò che afferma l'articolo, almeno per me, è che la statistica ha il grande potenziale per contribuire alla scienza dei dati. Il problema principale, se ci sono, che impedisce a Statistics di promuovere la scienza dei dati è che le persone di Statistics non sono ben addestrate per il calcolo su larga scala e la programmazione efficiente. Citato da quell'articolo segue.
E alle statistiche. Le statistiche hanno un enorme potenziale per contribuire alla scienza dei dati. Ci sono problemi di ricerca aperti che richiedono che i metodi statistici classici di campionamento, progettazione e inferenza causale vengano "scalati" per essere fattibili con enormi set di dati. Pochi degli informatici e altri che dominano il panorama della scienza dei dati sono esperti in questi concetti e molti hanno una visione "algoritmica" dell'analisi dei dati. La scienza dei dati ha bisogno di un pensiero statistico e di nuovi framework di base: ad esempio, qual è la "popolazione" quando ci si confronta con i Big Data generati da Google?
In effetti, molte aziende stanno iniziando a raccogliere dati prospetticamente per test interni e convalida, e c'è poco apprezzamento per il potere dei principi di progettazione. Gli statistici potrebbero promuovere importanti progressi attraverso lo sviluppo del "design sperimentale per il 21 ° secolo"!
Si può senza dubbio affermare che le scienze informatiche sono in una posizione migliore, ma manca solo il pensiero statistico. Ma per me, considero le due componenti principali il "cervello" e le "mani"! Se la progettazione dell'esperimento è difettosa all'inizio o se l'inferenza è parziale alla fine, ci ritroveremo con una storia completamente diversa sulla conclusione e sulla strategia aziendale.
Per semplificare tutto ciò che desidero trasmettere qui, i professionisti della scienza dei dati hanno davvero bisogno sia di un ottimo pensiero statistico che di una programmazione.
FINE MODIFICA:
Per decidere quale grado si intende conseguire, per sapere quali set di competenze ti qualificano per lavorare nell'area della scienza dei dati. In base a ciò che ho saputo, se desideri entrare nel campo della scienza dei dati, quali abilità "difficili vorresti essere equipaggiato sono fondamentalmente due: la forte capacità analitica e una buona computazione e programmazione abilità. Puoi andare su Quora e cercare "data science", "data scientist", ecc., Per avere un'idea di come appare il campo e di cosa hai bisogno per prepararti per quell'area. Ecco due domande di Quora che potresti voler rispondere:
- Che cos'è la scienza dei dati?
- Come posso diventare un scienziato dei dati?
Alcune domande del genere, capisci il mio punto.
(Le competenze trasversali , come orali e Anche le capacità di comunicazione scritta e la capacità di lavorare in team sono molto importanti. E in alcune circostanze, anche più importanti delle tue capacità analitiche in una certa misura. Ma certamente la discussione sulle soft skills è certamente fuori tema per il bene delle tue domande.)
Ora torniamo alle tue domande.
Quali sono le scelte di laurea che mi porterebbero dove voglio andare?
Una volta che hai una visione chiara e un pensiero profondo su ciò che devi imparare, dovresti essere in grado di rispondere da solo. Il mio suggerimento sarebbe Informatica, Matematica o statistica applicata, Biostatistica, Fisica, Ingegneria o qualsiasi altra laurea che coinvolga pesantemente l'analisi e il calcolo. In sostanza, una laurea interdisciplinare che ti aiuti a formare sia l'analisi dei dati che la programmazione ti farà sicuramente guadagnare un'ottima posizione per lavorare nell'area della scienza dei dati.
Esiste un consenso sul fatto che una laurea in scienze applicate la matematica o la statistica mi metterebbero in una posizione migliore per entrare nel campo della scienza dei dati?
Non sono a conoscenza se esiste un tale consenso formalmente riconosciuto da ricercatori accademici o professionisti industriali, ma io può darti notizie / rapporti da siti web che mostrano come le statistiche avranno un ruolo importante da svolgere con l'evoluzione dell '"era dei big data". Credo che questi articoli ti daranno almeno la certezza che le statistiche dovrebbero essere una buona scelta.
- Per i laureati di oggi, solo una parola: statistiche
- In che modo la scienza statistica può portare avanti i progetti di ricerca sui big data?
- Discovery with Data: Leveraging Statistics with Computer Science to Transform Science and Society
- We Are Data Science
- [The Era of Big Data] Articoli imperdibili sui Big Data
L'ultimo è dal mio blog, in cui ho raccolto alcuni articoli importanti da media e siti famosi, come NYTimes, Forbes, McKinsey, Harvard Business Review, ecc. Puoi trovarne alcuni che delineano il futuro del campo della scienza dei dati, e le competenze necessarie per quel campo. Ad esempio, ecco la citazione di NYTimes, le parole di Hal Varian.
"Continuo a dire che il lavoro sexy nei prossimi 10 anni saranno gli statistici", ha detto Hal Varian, capo economista in Google. "E non sto scherzando."
Ciò che la maggior parte degli articoli elabora è che come disciplina che studia i dati - "la scienza dei dati", il campo della statistica è in forte espansione a questo punto storico. Quindi, se c'è un consenso, questi articoli ne sarebbero i segni.
Infine, poiché ti potrebbe sembrare che ti sto convincendo a ottenere una laurea in Statistica o Biostatistica, non lo faccio hanno quell'intenzione, sebbene siano ottime scelte come ho indicato in precedenza. Tutti i diplomi che si adattano ai tuoi interessi (come l'apprendimento automatico in scienze informatiche) sono buoni da considerare, purché tu sappia che stai preparando le tue capacità analitiche e di calcolo. Puoi persino apprendere queste abilità da solo attraverso i corsi aperti su Coursera.