Domanda:
Classificazione multi-etichetta: punteggio Brier o perdita di registro?
Guy Manzur
2017-08-12 02:59:16 UTC
view on stackexchange narkive permalink

Sto utilizzando il pacchetto scikit con RandomForestClassifier, cercando di prevedere classificazioni binarie o multietichetta.

Sto cercando un modo per stimare l'affidabilità del modello, ma non riesco davvero a capire se utilizzare il punteggio di Brier o un segnapunti Log Loss.

Capisco che entrambi possano stimare l'affidabilità delle probabilità che il modello produce.

Posso comunque chiarire quali sono i pro e i contro di ciascun metodo e perché / quando dovrei sceglierne uno rispetto a un altro?

Dovrebbe essere una classificazione multi-classe, non multi-etichetta (sic) nel titolo?
Tre risposte:
Frank Harrell
2017-12-31 19:20:15 UTC
view on stackexchange narkive permalink

Poiché la funzione di probabilità logaritmica (combinata con la precedente se si utilizza la modellazione bayesiana) è il criterio di ottimalità del gold standard, è meglio usare la probabilità logaritmica (una traduzione lineare della regola del punteggio di accuratezza logaritmica).Questo si estende automaticamente a $ Y $ ordinale e multinomiale (politomico).Ci sono solo tre ragioni a cui posso pensare per non utilizzare la probabilità logaritmica per riassumere il valore predittivo del modello:

  1. cerchi di descrivere le prestazioni del modello utilizzando una misura che il modello non stava ottimizzando (non è una cattiva idea; spesso perché usiamo il punteggio di Brier)
  2. hai una singola probabilità prevista di uno o zero che era "sbagliata", restituendo un valore infinito per il punteggio logaritmico
  3. spesso è difficile sapere "quanto è buono" un valore dell'indice (lo stesso per il punteggio di Brier, non tanto per $ c $ -index, cioè probabilità di concordanza o AUROC)
Thomas Cleberg
2017-08-17 16:56:12 UTC
view on stackexchange narkive permalink

Ciascuna di queste misure può essere appropriata, a seconda di ciò su cui ci si vuole concentrare.

Il punteggio di Brier è fondamentalmente la somma degli errori al quadrato delle stime di probabilità classwise.Ti informerà sia sull'accuratezza del modello che sulla precisione "sicura" del modello.

Non si desidera utilizzare il punteggio Brier per assegnare un punteggio a un problema di classificazione ordinale.Se per esempio perdere una classe 1 predire la classe 2 è meglio che prevedere la classe 3.Il punteggio di Brier pesa tutti i mancati allo stesso modo.

L'entropia incrociata (perdita logaritmica), fondamentalmente, misurerà l'incertezza relativa tra le classi che il tuo modello produce rispetto alle classi vere.Negli ultimi dieci anni circa, è diventata una delle statistiche di punteggio del modello standard per i problemi di classificazione multiclasse (e binaria).

Lily Long
2017-08-12 03:12:02 UTC
view on stackexchange narkive permalink

Questo documento sembra parlare un po ': http://faculty.engr.utexas.edu/bickel/Papers/QSL_Comparison.pdf

E l'ho ottenuto da questa risposta: Giustificare e scegliere una regola di punteggio adeguata

Ho già letto questa risposta e non mi era abbastanza chiara.Apprezzerò ulteriori chiarimenti


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...