Per avere una rete neurale che funzioni perfettamente sul set di addestramento, ma scarsamente sul set di convalida, cosa dovrei fare?Per semplificare, consideriamolo un compito di classificazione CIFAR-10.
Ad esempio, "nessun dropout" e "nessuna regolarizzazione" sarebbero utili, ma "più livelli" non necessariamente.Mi chiedo anche: la "dimensione del batch" e la scelta dell'ottimizzatore fanno la differenza sull'overfitting?