Domanda:
Quale linguaggio di programmazione per l'inferenza statistica?
nkint
2010-11-20 20:57:20 UTC
view on stackexchange narkive permalink

solo per curiosità ... Qual è la lingua più usata qui? R? MATLAB? Pitone? Java?

Cosa per prototipo o per produzione? Ad esempio penso che MATLAB sia utilizzato principalmente per la prototipazione, python per entrambi prot. e produzione ...

praticamente risolto qui: http://stackoverflow.com/questions/2200460/what-programming-languages-are-good-for-statistics
Made wiki poiché questo è del tutto soggettivo.
Sei risposte:
Mike Anderson
2010-11-21 08:00:15 UTC
view on stackexchange narkive permalink

Bene, puoi PAGARE per MATLAB, e poi (1) programmare le cose di cui hai veramente bisogno da zero o (2) PAGARE DI PIÙ per i toolbox MATLAB. E scopri che fare statistiche utili in MATLAB era un ripensamento gestito nella sempre meno utile Statistics Toolbox. Oppure ... puoi scaricare R GRATUITAMENTE e cercare (e trovare!) I pacchetti di cui hai bisogno, che puoi anche scaricare GRATUITAMENTE.

Molte cose di produzione su piccola scala possono essere fatte in R. Se stai facendo qualcosa di veramente grande (pensa al censimento degli Stati Uniti), probabilmente devi imparare a studiare SAS e far pagare al tuo datore di lavoro.

pslice
2010-11-22 03:02:26 UTC
view on stackexchange narkive permalink

Non potrei essere più d'accordo con un voto per R. R è la "Lingua Franca" del mondo delle statistiche. È la definizione di punta di diamante, mentre la maggior parte dei pacchetti per MATLAB e SAS richiede diversi mesi. La lingua è molto semplice da capire rispetto a SAS. Ti dà anche la possibilità di connetterti con C / C ++ / Python e database.

Considera la versione Revolution Analytics di R per prestazioni un po 'più elevate.

http: // www.revolutionanalytics.com/products/revolution-r.php

Devo dire che non sono d'accordo sul fatto che R sia più semplice da imparare rispetto a SAS. Potrebbe essere perché ho imparato prima SAS e SPSS, ma penso che SAS, SPSS (PASW ora) e Stata siano tutti linguaggi più facili da imparare rispetto a R. Tuttavia, è un argomento soggettivo.
Mi sembra che R offra all'utente molto di più in termini di funzionalità. Va ben oltre ciò che può fare SAS / SPSS.
Non sono in disaccordo con questo, ma questo non lo rende più facile da capire. Penso che sia abbastanza trasparente con quali oggetti sto lavorando in SAS, SPSS o Stata e il formato / natura di quegli oggetti, ma non è così trasparente in R. Sebbene R possa essere più all'avanguardia, raramente ho un necessità di tecniche statistiche all'avanguardia nel mio lavoro quotidiano.
Difficile pensare che i sistemi closed source siano trasparenti.Anche se utilizzavi solo vecchi metodi statistici, R è un sistema più efficiente per usarli e forma una cassetta degli attrezzi di ricerca riproducibile completa.
whuber
2010-11-22 21:36:32 UTC
view on stackexchange narkive permalink

La "popolarità" dipende dalla comunità e dalla definizione di "statistiche". In tutto il mondo, assumendo una visione ampia dell '"inferenza statistica" includendo qualsiasi metodo per trarre conclusioni o intraprendere azioni sulla base di dati quantitativi, non c'è dubbio che Excel batte tutte le altre applicazioni, comprese R, SAS, Stata, SPSS e S-Plus. (I collegamenti puntano a diversi tipi di statistiche, ma sono molto suggestivi, per non dire altro.) Python e MATLAB non sono nemmeno dei blip nelle statistiche. Non sto dicendo che questa sia una buona cosa o che ci dovrebbe piacere: è così che è ed è così che rimarrà per molto tempo.

Non dovremmo trarre alcuna inferenza da ciò che può sembrare popolare "qui" in questo forum. I fornitori di software commerciali supportano i propri forum, quindi naturalmente un posto come SE favorirà le persone che utilizzano software supportato meno attivamente, in particolare soluzioni gratuite, open source e accademiche.

Shane
2010-11-21 01:19:09 UTC
view on stackexchange narkive permalink

Dovrebbe essere chiaro guardando i tag più popolari che R è la lingua più popolare su questo sito. Non si può dedurre direttamente se questo lo renda il linguaggio più popolare per l'analisi statistica, ma si potrebbe supporre lo stesso.

MichaelSnot
2010-11-22 11:44:40 UTC
view on stackexchange narkive permalink

R e SAS hanno ciascuno i propri pro e contro. Penso che più statistici debbano accettare il fatto che è disponibile un sacco di ottimo software statistico, piuttosto che litigare all'infinito su quale sia superiore.

R è gratuito. SAS è molto costoso. R ti dà la possibilità di fare qualsiasi cosa. SAS può o non può. R ha incredibili capacità grafiche. Vedere la grafica SAS fa sembrare di nuovo il 1985. SAS ha un ottimo supporto clienti. Supporto R = ore di ricerca negli archivi delle mailing list. Anche con un nome come "R", i risultati dei motori di ricerca sono spesso scadenti. R è estremamente lento e non gestisce bene set di dati di grandi dimensioni. SAS funziona bene con set di dati di grandi dimensioni. SAS tende ad essere più robusto. Nella mia esperienza, quando si tratta di modellazione a effetti misti o qualsiasi cosa che coinvolga la progettazione di esperimenti (come l'analisi di progetti crossover), SAS è superiore.

Per simulazioni di forza bruta su larga scala, utilizzo Fortran. Usavo C, ma ho scoperto che Fortran è molto più facile da usare. Non ho mai usato MATLAB. Se ho bisogno della potenza statistica di R ma della velocità di Fortran, scriverò le operazioni che richiedono molto tempo (cioè i cicli) in Fortran e chiamerò la subroutine da R.

Bene, il supporto R sono posti come qui, che sono spesso più efficaci di un supporto a pagamento. Per Google, c'è rseek.org, funziona molto bene. Il 99% dei casi di R-is-slow può essere risolto con qualche pensiero; ci sono anche pacchetti per gestire dati enormi (non è semplice neanche in SAS). R è un linguaggio di programmazione, SAS è un SQL esteso.
+1 perché questa risposta * è * utile, ma penso che i tuoi punti sul supporto, la velocità e la capacità di R di gestire dati di grandi dimensioni siano obsoleti o diventino così rapidamente.
Secondo @Matt e @mbq's commenterò sulle prestazioni di R, ma vorrei aggiungere che R è abbastanza buono per gli (N) LME. Ricordo un discorso di Doug Bates alla [conferenza DSC 2009] (http://j.mp/ht1oTG) dove ha mostrato come il pacchetto `lme4` gestisce facilmente molti effetti casuali (come riscontrato ad esempio nella valutazione educativa ). La mia (ma limitata) esperienza (SAS `NLMIXED` * vs. * R` lme4`) conferma questo punto: R non è affatto più lento di SAS quando si tratta di applicare [IRT] complessi (http://j.mp / hVEMB5) e gestisce anche set genetici di dati di grandi dimensioni (grazie all'intelligente implementazione C).
john2
2016-06-12 07:42:41 UTC
view on stackexchange narkive permalink

La mia preferenza va a Python e forse a Java. Innanzitutto, sono veri linguaggi di programmazione. In secondo luogo, sono le lingue più popolari (indice TIOBE). Puoi anche convertire tra queste lingue utilizzando diversi linguaggi di scripting. In passato ho utilizzato la piattaforma DMelt http://jwork.org/dmelt/ per eseguire calcoli statistici, e sono rimasto molto colpito dalla grafica in 2D e 3D, che può essere facilmente ottenuta per documenti professionali . Il pacchetto R non mi ha impressionato con la grafica.

Questo non risolve la questione del linguaggio più popolare per l'inferenza statistica.Riguarda principalmente le tue preferenze personali con una menzione di quali sono i linguaggi di programmazione popolari.


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 2.0 con cui è distribuito.
Loading...