Biblioteche open source nella scienza

Bene

2013-08-03 15:29:52 UTC

view on stackexchange narkive permalink

È una buona o una cattiva pratica utilizzare i pacchetti R di CRAN per la ricerca? Sto parlando di pacchetti comuni come: modelli semplici per regressione, stima, econometria.
La maggior parte di essi utilizza funzioni che possono essere scritte facilmente da soli.

I miei argomenti sì:

È ora di concentrarsi sulla parte principale della ricerca
La comunità è un buon controllo di qualità
R offre molti metodi moderni
Alcuni modelli sono troppo complicati per scriverli da soli

I miei argomenti con:

Non tutti i pacchetti di R sono stati creati in un ambiente accademico
Potrebbero esserci bug che influenzano il risultato e io non lo so
La maggior parte dei modelli può essere scritta da zero in un breve periodo di tempo

Come possiamo utilizzare l'open source senza rischiare di fallire nel risultato? Esistono alcuni indicatori di qualità per i pacchetti in generale e per R?

Vedi Fortunes 102 (pagina 12) [qui] (http://cran.r-project.org/web/packages/fortunes/vignettes/fortunes.pdf)

Questa affermazione è un buon punto.

Tendo a pensare che scrivere qualcosa da zero quando è disponibile una libreria adatta sia quasi sempre una cattiva idea. Tutti gli argomenti che potresti invocare contro il software open-source (possibilità di bug, nessuna garanzia che siano stati adeguatamente testati, non necessariamente sviluppati da statistici / accademici / economisti / ingegneri del software ...) sono ancora più validi contro le soluzioni casalinghe.

Mi piace questa domanda, ma poiché è principalmente basata sull'opinione, mi aspetto che presto appariranno voti vicini.

Sono un accademico, ma l'implicazione che solo gli accademici possano scrivere software decente è troppo assurda anche per discuterne in dettaglio. Allo stesso modo, potrebbero esserci bug nel tuo codice di cui non sei a conoscenza; altrimenti li correggeresti. E così via...

Domande pertinenti: [R vs SAS, perché SAS è preferito dalle società private?] (Http://stats.stackexchange.com/questions/33780/r-vs-sas-why-is-sas-prefered-by-private- aziende) [Il linguaggio R è affidabile nel campo dell'economia?] (http://stats.stackexchange.com/questions/25811/is-the-r-language-reliable-for-the-field-of-economics? lq = 1)

Nick, non volevo dire che solo gli accademici possono scrivere codice decente. Volevo insinuare che in un ambiente accademico si è (o si dovrebbe essere) costretti a lavorare correttamente.

Uno è costretto a * scrivere pubblicazioni * correttamente. Il software utilizzato è raramente sottoposto a controllo.

Questo mi ricorda l '[errore di Excel] (http://www.huffingtonpost.com/dean-baker/reinhart-rogoff-austerity_b_3343688.html) in economia

"Potrebbero esserci bug che influenzano il risultato e io non lo so" - ma tu * potresti * e questa è la chiave! Nel software closed source potrebbero esserci bug ma non hai modo di i) saperlo o ii) correggere il bug. In open source, poiché chiunque può vedere il codice sorgente, i bug possono essere individuati più facilmente e risolti; il problema dei molti occhi. Vorrei assicurarmi che il software commerciale ha fatto quello che ha detto che ha fatto ecc. E questo è difficile da fare, con l'open source posso, purché abbia abbastanza familiarità con il linguaggio usato * e * la tecnica. È importante sottolineare che posso * effettivamente * controllare.

@GavinSimpson sì e no. In teoria, potresti davvero andare a vedere di persona. In pratica, anche per algoritmi moderatamente complessi, può essere tutt'altro che banale scoprire errori di implementazione. Sei giusto per programmatori di grande esperienza, ma non lo considero un vantaggio utile per l'utente medio. Detto questo, * amo e supporto * il software open source.

@MarcClaesen Ma tu * puoi *, questo è importante. * Ci sono * bug anche nel software commerciale ma non puoi cercare da solo. I problemi di bug non dovrebbero essere una truffa del software del sistema operativo ma una truffa del closed source. Tutti i software hanno bug. Il software del sistema operativo ha più occhi, i bug vengono individuati più facilmente ecc. Questo era il mio punto.

@Gavin Simpson I tuoi commenti sul software commerciale sono accurati nella misura in cui il codice compilato è inaccessibile vedendo anche il codice sorgente. Ma il software commerciale spesso include codice nella propria lingua che può essere ispezionata, ad es. MATLAB, Stata. Inoltre, in linea di principio, tutti possono guardare in profondità, in profondità all'interno di R, ma solo una piccola frazione di utenti può trovare bug nel codice davvero fondamentale. Suggerisco che questa canzone spesso cantata esageri le differenze pratiche. C'è una differenza di principio, ma le differenze pratiche non sono così grandi come spesso affermato.