Domanda:
Scelte di laurea per la scienza dei dati?
user60305
2014-11-12 04:18:32 UTC
view on stackexchange narkive permalink

Attualmente sto finendo un B.S. in matematica e vorrebbe frequentare la scuola di specializzazione (un master per principianti, con possibilità di un successivo dottorato) con un occhio di riguardo verso l'ingresso nel campo della scienza dei dati. Sono anche particolarmente interessato all'apprendimento automatico.

Quali sono le scelte di laurea che mi porterebbero dove voglio andare?

Esiste un consenso sul fatto che un laureato laurea in matematica applicata, statistica o informatica mi metterebbe in una posizione migliore per entrare nel campo della scienza dei dati?

Grazie a tutti per l'aiuto, questa è una grande scelta per me e qualsiasi input è davvero apprezzato. Di solito faccio le mie domande su Mathematics Stack Exchange, ma ho pensato che chiedere qui mi avrebbe dato una prospettiva più ampia e meglio arrotondata.

Potresti provare lo scambio di stack di data science per questo Q.
@JeremyMiles: È un'ottima idea, mi sono appena iscritto lì di recente, quindi ci proverò.
Cinque risposte:
Frank Harrell
2014-11-12 05:29:47 UTC
view on stackexchange narkive permalink

Se ottieni un master in statistica applicata (seguito forse da un dottorato di ricerca) e hai un background informatico molto forte non sbaglierai. Un MS o un dottorato di ricerca in Biostatistica porta a un ottimo percorso di lavoro e se finisci per non apprezzare la ricerca biomedica o farmaceutica, saresti comunque idoneo per un campo correlato alla statistica applicata non medica.

Grazie per questo consiglio.Dal tuo post ho cercato di più nei dipartimenti di biostatistica e uno che è particolarmente allettante è il programma di biostatistica attraverso l'Indiana University presso IUPUI (dal momento che può essere completato part-time e potrei acquisire esperienza lavorativa mentre frequento).Fai molti dottorato in statistica / biostatistica.i programmi offrono la possibilità di partecipare a tempo parziale o è una rarità relativa?
Da quello che so è raro.
StasK
2014-11-12 10:41:25 UTC
view on stackexchange narkive permalink

La realtà agghiacciante è che gli statistici non sono riconosciuti come data scientist. Quindi, anche se ottenere una laurea in statistica ti preparerà sicuramente bene per la scienza dei dati, potresti non avere tutte le opportunità che potresti pensare che il nome del maggiore implicherebbe.

Non ho il risponde per te (e nessuno lo fa ... tranne Hal Varian, e potresti voler parlare con lui direttamente - se non puoi Google le sue informazioni di contatto, non dovresti prendere in considerazione una carriera nella scienza dei dati :)). I miei due centesimi da prendere in considerazione sarebbero:

  1. Un programma in informatica, con un minimo in statistica. Una laurea in informatica di per sé non ti equipaggerà bene in scienza dei dati, secondo me, poiché ciò che gli statistici vedono nella "scienza dei dati senza statistiche" è che gli scienziati dei dati finiscono per reinventare le statistiche. Quindi farai meglio ad impararlo correttamente all'inizio.
  2. Un programma di Master in scienze analitiche professionale ( Rutgers, NC State - non quello Approvo questi, ti faccio solo degli esempi). I programmi del Master in scienze professionali combinano circa il 60% delle ore di credito del programma di studi scientifici con circa il 40% del curriculum aziendale. Vorrei avere la possibilità di prendere questa laurea quando ero all'università. Ovviamente questo presuppone che te lo puoi permettere: puoi frequentare la maggior parte dei dottorati di ricerca. programmi e ottenere il supporto finanziario completo, ma dovrai pagare tu stesso per un master.

Sfoglia Academia.SE per ulteriori indicazioni su come strutturare la tua formazione post-laurea e che tipo di laurea potresti o non potresti desiderare. È interessante notare che Data Science.SE è attualmente (novembre 2014) in uno stato beta ed è difficilmente una beta sana e felice.

Perché non si parla di economia, @stask?
L'OP ha chiesto di [una sorta di] * scienza *.L'economia non è una * scienza * ... anche se è sicuramente un'occupazione ben pagata :)
Mi sembra eccessivamente duro dire che "l'economia non è una scienza".Tuttavia, sono certamente d'accordo sul fatto che alcune parti dell'economia siano meno scientifiche di altre.
+1 per entrambi i tuoi punti.Molti dei miei colleghi hanno seguito il programma NC State.Aggiungerei che un M.S. dell'informaticain un programma che è pesante per l'apprendimento automatico sarebbe anche una buona opzione - supponendo che l'OP sia ragionevolmente esperto nella programmazione, di cui avranno comunque bisogno per essere un "Data Scientist".Penso che il pregiudizio contro gli statistici sia lo stereotipo secondo cui sono più teorici o che usano Stata, ecc., Per lavorare su problemi su scala ridotta.In termini di economia, devo dire che i miei blogger di statistiche preferiti sono gli economisti.
Wayne, è una cosa divertente dire che gli statistici usano Stata.R è più adatto a lavorare con dati di strutture strane e SAS può leggere e scrivere enormi set di dati senza alcuna modifica alla sintassi, ma Stata non è uno strumento peggiore di questi due.Sono di parte, però, anche se pensavo che fosse ovvio nei miei post.gung, in termini di struttura di Kuhn delle rivoluzioni scientifiche, data la quantità di dibattito in economia, non si è del tutto formato come scienza.
@Wayne: oggi e storicamente, sia SAS che R / S-PLUS sono stati molto più popolari tra gli statistici di Stata (io stesso sono un utente di Stata).Il linguaggio S da cui provenivano R e S-PLUS, era quasi sconosciuto al di fuori dei circoli statistici ma è diventato estremamente popolare al giorno d'oggi (R).Sfortunatamente, c'è un'enorme distorsione di ciò che fanno gli statistici, per non parlare degli strumenti che usano.
@StasK: Mi piace molto Stata - l'ho comprato l'anno scorso - e non intendevo criticare né lui né i suoi utenti.È più popolare tra gli economisti che tra gli statistici, immagino.Il punto che stavo cercando di sottolineare è che lo stereotipo che esclude "Statistician" da "Data Science" è la percezione che la Data Science riguardi i big data (Hadoop, SQL enorme, ecc.) Che spesso sono in forma libera (text mining, ecc.) e richiede team di Data Scientist, mentre gli statistici lavorano indipendentemente sugli esperimenti, ecc. È uno stereotipo, ovviamente.
La presentazione di Terry Speed sui Big Data aiuta a far luce sulle numerose distorsioni e stereotipi: http://vimeo.com/91502942
Aaron Zeng
2014-11-12 09:16:07 UTC
view on stackexchange narkive permalink

EDIT: prova solo ad aggiungere qualche parola in più.

Come studente di dottorato in Biostatistica, mi sento benissimo con quello che ha detto @ Frank-Harrell. Ed è abbastanza corretto !!! Gli studenti del nostro dipartimento hanno ottimi posti di lavoro dopo la laurea.

D'altra parte, @StasK ha citato l'articolo " Non siamo Data Science?", ma lo ha intitolato " gli statistici non sono riconosciuti come data scientist ". Questo è un po 'fuorviante per me. Gli statistici potrebbero non essere chiamati scienziati dei dati. Ma chi altri può affermarlo formalmente? Ad ogni modo, ciò che afferma l'articolo, almeno per me, è che la statistica ha il grande potenziale per contribuire alla scienza dei dati. Il problema principale, se ci sono, che impedisce a Statistics di promuovere la scienza dei dati è che le persone di Statistics non sono ben addestrate per il calcolo su larga scala e la programmazione efficiente. Citato da quell'articolo segue.

E alle statistiche. Le statistiche hanno un enorme potenziale per contribuire alla scienza dei dati. Ci sono problemi di ricerca aperti che richiedono che i metodi statistici classici di campionamento, progettazione e inferenza causale vengano "scalati" per essere fattibili con enormi set di dati. Pochi degli informatici e altri che dominano il panorama della scienza dei dati sono esperti in questi concetti e molti hanno una visione "algoritmica" dell'analisi dei dati. La scienza dei dati ha bisogno di un pensiero statistico e di nuovi framework di base: ad esempio, qual è la "popolazione" quando ci si confronta con i Big Data generati da Google?

In effetti, molte aziende stanno iniziando a raccogliere dati prospetticamente per test interni e convalida, e c'è poco apprezzamento per il potere dei principi di progettazione. Gli statistici potrebbero promuovere importanti progressi attraverso lo sviluppo del "design sperimentale per il 21 ° secolo"!

Si può senza dubbio affermare che le scienze informatiche sono in una posizione migliore, ma manca solo il pensiero statistico. Ma per me, considero le due componenti principali il "cervello" e le "mani"! Se la progettazione dell'esperimento è difettosa all'inizio o se l'inferenza è parziale alla fine, ci ritroveremo con una storia completamente diversa sulla conclusione e sulla strategia aziendale.

Per semplificare tutto ciò che desidero trasmettere qui, i professionisti della scienza dei dati hanno davvero bisogno sia di un ottimo pensiero statistico che di una programmazione.

FINE MODIFICA:

Per decidere quale grado si intende conseguire, per sapere quali set di competenze ti qualificano per lavorare nell'area della scienza dei dati. In base a ciò che ho saputo, se desideri entrare nel campo della scienza dei dati, quali abilità "difficili vorresti essere equipaggiato sono fondamentalmente due: la forte capacità analitica e una buona computazione e programmazione abilità. Puoi andare su Quora e cercare "data science", "data scientist", ecc., Per avere un'idea di come appare il campo e di cosa hai bisogno per prepararti per quell'area. Ecco due domande di Quora che potresti voler rispondere:

  1. Che cos'è la scienza dei dati?
  2. Come posso diventare un scienziato dei dati?

Alcune domande del genere, capisci il mio punto.

(Le competenze trasversali , come orali e Anche le capacità di comunicazione scritta e la capacità di lavorare in team sono molto importanti. E in alcune circostanze, anche più importanti delle tue capacità analitiche in una certa misura. Ma certamente la discussione sulle soft skills è certamente fuori tema per il bene delle tue domande.)

Ora torniamo alle tue domande.

Quali sono le scelte di laurea che mi porterebbero dove voglio andare?

Una volta che hai una visione chiara e un pensiero profondo su ciò che devi imparare, dovresti essere in grado di rispondere da solo. Il mio suggerimento sarebbe Informatica, Matematica o statistica applicata, Biostatistica, Fisica, Ingegneria o qualsiasi altra laurea che coinvolga pesantemente l'analisi e il calcolo. In sostanza, una laurea interdisciplinare che ti aiuti a formare sia l'analisi dei dati che la programmazione ti farà sicuramente guadagnare un'ottima posizione per lavorare nell'area della scienza dei dati.

Esiste un consenso sul fatto che una laurea in scienze applicate la matematica o la statistica mi metterebbero in una posizione migliore per entrare nel campo della scienza dei dati?

Non sono a conoscenza se esiste un tale consenso formalmente riconosciuto da ricercatori accademici o professionisti industriali, ma io può darti notizie / rapporti da siti web che mostrano come le statistiche avranno un ruolo importante da svolgere con l'evoluzione dell '"era dei big data". Credo che questi articoli ti daranno almeno la certezza che le statistiche dovrebbero essere una buona scelta.

  1. Per i laureati di oggi, solo una parola: statistiche
  2. In che modo la scienza statistica può portare avanti i progetti di ricerca sui big data?
  3. Discovery with Data: Leveraging Statistics with Computer Science to Transform Science and Society
  4. We Are Data Science
  5. [The Era of Big Data] Articoli imperdibili sui Big Data

L'ultimo è dal mio blog, in cui ho raccolto alcuni articoli importanti da media e siti famosi, come NYTimes, Forbes, McKinsey, Harvard Business Review, ecc. Puoi trovarne alcuni che delineano il futuro del campo della scienza dei dati, e le competenze necessarie per quel campo. Ad esempio, ecco la citazione di NYTimes, le parole di Hal Varian.

"Continuo a dire che il lavoro sexy nei prossimi 10 anni saranno gli statistici", ha detto Hal Varian, capo economista in Google. "E non sto scherzando."

Ciò che la maggior parte degli articoli elabora è che come disciplina che studia i dati - "la scienza dei dati", il campo della statistica è in forte espansione a questo punto storico. Quindi, se c'è un consenso, questi articoli ne sarebbero i segni.

Infine, poiché ti potrebbe sembrare che ti sto convincendo a ottenere una laurea in Statistica o Biostatistica, non lo faccio hanno quell'intenzione, sebbene siano ottime scelte come ho indicato in precedenza. Tutti i diplomi che si adattano ai tuoi interessi (come l'apprendimento automatico in scienze informatiche) sono buoni da considerare, purché tu sappia che stai preparando le tue capacità analitiche e di calcolo. Puoi persino apprendere queste abilità da solo attraverso i corsi aperti su Coursera.

(+1) I laureati in Fisica o Ingegneria non dovrebbero certo scoraggiarsi dall'entrare in Data Science, ma non sono sicuro che considererei la lettura di quelle materie tra le vie più dirette, per qualcuno che sta * partendo * per entrareesso.
+1 Si noti che l'affermazione "Il problema principale, se esiste, che impedisce alla statistica di promuovere la scienza dei dati è che le persone di Statistica non sono ben addestrate per il calcolo su larga scala e la programmazione efficiente" presuppone implicitamente che scienza dei dati = big data.Direi che molti (la maggior parte?) Problemi non sono in grado di generare dati a miliardi o la maggiore dimensione del campione - che troppo spesso è confusa per la popolazione - contribuisce poco a risolvere un problema e può effettivamente ostacolare la capacità dell'analista di rilevareun segnale.
Aspetti positivi, @ThomasSpeidel.E in effetti, molti problemi scientifici o industriali sono di piccole dimensioni, come gli esperimenti nelle aziende farmaceutiche e molti altri che richiedono persone come soggetti.In quelle situazioni, le tecniche decisamente "big data" sono meno applicabili.L'ascesa dei Big Data è davvero il risultato della rivoluzione di Internet mobile e dei social media su Internet.Detto questo, la maggior parte delle applicazioni Big Data sono correlate all'area IT.Ecco perché le persone nel campo delle scienze informatiche ora dominano la cosiddetta era dei big data.
Randy Bartlett
2014-11-15 22:57:19 UTC
view on stackexchange narkive permalink

Se hai già una laurea in matematica e desideri analizzare i dati sul campo, un master in statistica farà molto di più di una seconda laurea in matematica. Solo le statistiche, il biostato e l'OR (non così sicuro) insegnano le ipotesi statistiche sottostanti per i problemi statistici. La statistica insegna già più matematica del necessario per analizzare i dati, ad esempio la teoria della misura e la teoria dei grandi campioni.

Inoltre, l'apprendimento automatico statistico è saldamente nel campo delle statistiche. Questi sono gli strumenti in ML che utilizziamo per analizzare i dati. Gli altri strumenti sono per la gestione dei dati.

Nisha Dhiman
2019-07-15 14:23:11 UTC
view on stackexchange narkive permalink

Scegli PG nella scienza dei dati.Questo è disponibile principalmente nelle università statunitensi e in Europa.E so che diventano davvero costosi.Quindi, perché non vai per la laurea post-laurea online in Data Science and Engineering che includerà l'apprendimento automatico.Ne ho uno in mente: Great Learning-PG in Data Science and Engineering



Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...