Sto calcolando il punteggio F per un set di dati sandbox: 100 pazienti medici, 20 dei quali hanno il cancro. Il nostro classificatore classifica erroneamente 20 pazienti sani come malati di cancro e 5 pazienti con cancro come sani, il resto è corretto.
Calcoliamo Veri positivi ; Veri negativi ; Falsi positivi ; e Falsi negativi .
Ci siamo imbattuti in un dibattito su quale classe viene prima, quelle che testano "Positivo" per il cancro o la classe di maggioranza, ad es. quelli che sono "sani".
Domanda esplicita: qual è il tasso di veri positivi corretto in questo set di dati? È:
- # di pazienti sani previsti su # di pazienti sani effettivi
- # di pazienti con cancro previsti su # di pazienti con cancro effettivi
Punti bonus se puoi fare riferimento a letteratura che supporta una supposizione o l'altra.
Nota, ho sfogliato alcuni testi sui punteggi f ma non ho visto una discussione esplicita su questo punto:
https://en.wikipedia.org/wiki/F1_score http://rali.iro.umontreal.ca/rali/sites/default/ files / publis / SokolovaLapalme-JIPM09.pdf
Il testo di Wikipedie sulla precisione e il richiamo sembra suggerire che "vero positivo" sia definito da qualunque "test" venga eseguito, e quindi in questo caso definito come la classe di minoranza perché il "test" è per il cancro. Tuttavia non trovo la discussione abbastanza rigorosa da convincermi. Se descrivo semplicemente il test in termini di test per pazienti "sani", cambio il punteggio f, ma questo era solo un cambiamento semantico. Mi aspetto che il punteggio f abbia una definizione matematicamente rigorosa.