Certamente il CLT informa le applicazioni in ogni momento, dal momento che ci occupiamo di distribuzioni di medie o somme molto frequentemente (inclusi casi che potrebbero non essere sempre ovvi; per esempio, $ s_n ^ 2 $ - la varianza del campione con denominatore $ n $ - è una media, quindi la varianza del campione ordinaria è solo una media leggermente ridimensionata).
Il CLT può dirti di aspettarti un approccio alla normalità con l'aumento della dimensione del campione per una particolare statistica, ma non quando , esattamente, puoi trattarlo come normale.
Quindi, mentre sai che la normalità dovrebbe intervenire alla fine, per sapere se sei abbastanza vicino a una particolare dimensione del campione, tu dovrà controllare (diciamo algebricamente, o più spesso tramite simulazione).
A volte potresti imbatterti in "regole pratiche" che dicono "oh, n = 30 è sufficiente perché il teorema del limite centrale si attivi ". Tali regole non hanno senso senza specificare le circostanze esatte (di quale distribuzione abbiamo a che fare, di quali proprietà ci interessano e "quanto vicino è abbastanza vicino").
Se hai un $ X $ con una distribuzione come questa:
Allora il campione significa, $ \ bar X $ per $ n = 1000 $ hanno una forma come questa:
... che per alcuni scopi potrebbe essere giusto trattare come normale (proporzione entro 2 sds della media, dire); per altri scopi (probabilità di essere più di 3 sds sopra la media, diciamo), forse no.
A volte n = 2 è sufficiente, a volte n = 1000 non è sufficiente.
Un altro esempio: il terzo e il quarto momento campione sono medie, quindi dovrebbe essere applicato il CLT. Il test di Jarque-Bera si basa su questo (più Slutsky, immagino, per il denominatore, insieme all'indipendenza asintotica), al fine di ottenere una distribuzione chi-quadrato per la somma dei quadrati di valori standardizzati. Ma come avevano sottolineato Bowman e Shenton (5 anni prima!), Questo non dovrebbe funzionare bene fino a campioni di grandi dimensioni. In effetti le mie stesse simulazioni suggeriscono che per i dati normali, la normalità bivariata dell'asimmetria e della curtosi non si attiva bene fino a quando le dimensioni del campione non sono sorprendentemente grandi (a dimensioni del campione piccole e medie, i contorni della distribuzione articolare sembrano più una banana che un'anguria)
Sempre più spesso, tuttavia, le dimensioni del campione possono essere enormi. Ho aiutato con diversi problemi di dati reali in cui le dimensioni del campione erano davvero molto grandi (in milioni). In quelle situazioni, le cose che il CLT suggerisce dovrebbero avvicinarsi alla normale poiché $ n $ si avvicina all'infinito sono spesso estremamente ben approssimate dalle distribuzioni normali.
Non direi che il CLT è inutile: ti dice a quale distribuzione cercare - ma non fa altro che indicarlo come un risultato finale; devi ancora verificare se è un'approssimazione adatta ai tuoi scopi alla dimensione del campione che hai.