Domanda:
Comprensione dei grafici di controllo statistico
Dave Kincaid
2011-09-09 17:52:12 UTC
view on stackexchange narkive permalink

Le carte di controllo sono di gran moda nella mia azienda in questi giorni. I nostri "analisti di dati" (le quotazioni sono apposta) stanno ponendo limiti di controllo su quasi tutti i grafici che producono. L'altro giorno stavamo esaminando alcuni grafici delle chiamate nel nostro call center di supporto nell'ultimo anno. Abbiamo misurazioni del numero di chiamate per ogni settimana che vengono tracciate su un grafico a linee. Recentemente, gli analisti che preparano questi grafici hanno iniziato a mettere delle linee sui grafici che indicano i "limiti di controllo".

La domanda che ho è su come stanno calcolando dove dovrebbero essere questi limiti di controllo. Quando ho chiesto come hanno determinato i limiti, ecco la risposta che ho ottenuto:

Per prima cosa troviamo una sezione del grafico in cui i punti sembrano alquanto stabili (ovvero piccola varianza), quindi calcoliamo la media di questi punti. Quindi calcoliamo l'errore standard di quei punti e tracciamo i limiti di controllo a +/- 3 errori standard dalla media che abbiamo calcolato.

È corretto calcolare la media in questo modo? Sembra che dovremmo usare TUTTI i punti per calcolare la media invece di buttare fuori tutto ciò che "sembra" varia troppo.

Ha senso porre limiti di controllo su una misurazione come questa (il numero di chiamate in arrivo in un call center)? Finché le misurazioni rientrano nei limiti di controllo, consideriamo la settimana normale. Se la misurazione per il volume delle chiamate di una settimana è al di fuori di questi limiti di controllo, è considerata significativa e richiede ulteriori analisi. Qualcosa mi sembra artificiale in tutto questo.

Davvero * significavano * "errore standard" (della media) e non "deviazione standard"? (Indipendentemente da ciò, non c'è * nulla * di giusto nelle procedure che descrivi; niente di tutto ciò ha alcuna giustificazione in teoria o in pratica; e hai ragione a essere sospettoso di ogni singolo elemento che hai menzionato.)
D'accordo con whuber. L'obiettivo è stimare lo 0,135 ° e il 99,865 ° percentile della distribuzione delle chiamate per settimana? (Se la dist'n fosse normale, e tu intendevi std dev, e non hanno buttato fuori i dati, allora questa sembra essere la stima del target.) Con <1000 osservazioni (dalla stessa dist'n), è difficile, ma possibile, ad es [Dekkers & de Haan (1989)] (http://www.jstor.org/pss/2241666). Quindi: sono d'accordo w / whuber che il metodo corrente non è giustificato; chiedendoti se stavi chiedendo anche suggerimenti positivi o solo una conferma dei tuoi pensieri critici (corretti).
Sto davvero cercando di capire se le carte di controllo sono appropriate per queste misurazioni e se lo sono, allora come dovrebbero essere implementate.
Per quanto riguarda la domanda sulla deviazione standard rispetto alla stima standard, la chiamano deviazione standard ma il loro calcolo sembra errore standard (sd / sqrt (N)). Confesso di non aver compreso appieno ciò che è però.
La deviazione standard ci dice quanto i valori differiranno tipicamente dalla loro media. L'errore standard ci dice quanto è probabile che la media campionaria differisca dalla media vera. Notare $ 1 / \ sqrt (N) $: questo implica che i limiti di controllo si restringeranno man mano che vengono usati periodi storici più grandi, dimostrando che i limiti dipendono da questa scelta * arbitraria *. La stima della SD, d'altra parte, si stabilizzerà (rispetto alla SD della popolazione) all'aumentare di $ N $.
Oltre agli altri commenti e risposte, la tua azienda potrebbe rilasciare nuovi prodotti di tanto in tanto, avere richiami di prodotti, ecc., Che potrebbero anche comportare variazioni temporali.
Due risposte:
#1
+12
whuber
2011-09-09 22:19:20 UTC
view on stackexchange narkive permalink

Lo scopo di un grafico di controllo è identificare, il più rapidamente possibile, quando qualcosa di risolvibile sta andando storto. Affinché funzioni correttamente, non deve identificare modifiche casuali o incontrollabili come "fuori controllo".

I problemi con la procedura descritta sono collettore. Includono

  • La sezione "stabile" del grafico non è tipica. Per definizione, è meno variabile del solito. Sottovalutando la variabilità della situazione sotto controllo, il grafico identificherà erroneamente molti cambiamenti come fuori controllo.

  • Usare errori standard è semplicemente sbagliato. Un errore standard stima la variabilità campionaria della media percentuale di chiamate settimanali, non la variabilità delle tariffe stesse.

  • Impostazione dei limiti a $ \ pm 3 $ deviazioni standard potrebbero o non potrebbero essere efficaci. Si basa su una regola pratica applicabile per dati distribuiti normalmente che non sono correlati in serie. Le tariffe di chiamata non verranno normalmente distribuite a meno che non siano moderatamente elevate (circa 100+ a settimana, circa). Potrebbero o meno essere correlati in serie.

  • La procedura presume che il processo sottostante abbia una velocità invariabile nel tempo. Ma non stai creando widget; stai rispondendo a un mercato che - si spera - sta (a) aumentando di dimensioni ma (b) diminuendo il suo tasso di chiamata nel tempo. Le tendenze temporali sono previste . Prima o poi qualsiasi tendenza farà apparire i dati costantemente fuori controllo.

  • Le persone tendono a sottoporsi a cicli annuali di attività corrispondente alle stagioni, al calendario accademico, alle vacanze e così via. Questi cicli agiscono come tendenze per causare eventi fuori controllo prevedibili (ma privi di significato).

Un set di dati simulato illustra questi principi e problemi.

Control chart

La procedura di simulazione crea una serie realistica di dati che sono sotto controllo: rispetto a un modello sottostante prevedibile, include nessuna escursione fuori controllo che può essere assegnato una causa. Questo grafico è un tipico risultato della simulazione.

Questi dati sono tratti dalle distribuzioni di Poisson, un modello ragionevole per i tassi di chiamata. Partono da una linea di base di 100 a settimana, con un trend lineare verso l'alto di 13 a settimana all'anno. Sovrapposto a questo andamento è un ciclo annuale sinusoidale con ampiezza di otto richiami settimanali (tracciati dalla curva grigia tratteggiata). Si tratta di una tendenza modesta e di una stagionalità relativamente bassa, credo.

I punti rossi (intorno alle settimane 12-37) sono stati identificati come il periodo di 26 settimane di deviazione standard più bassa riscontrato durante i primi 1,5 anni di questo grafico biennale. Le sottili linee rosse e blu sono impostate su $ \ pm 3 $ errori standard intorno alla media di questo periodo. (Ovviamente sono inutili.) Le linee spesse oro e verde sono fissate a $ \ pm 3 $ deviazioni standard intorno alla media.

(Di solito non si proiettano linee di controllo all'indietro nel tempo, ma l'ho fatto qui per riferimento visivo. Di solito non ha senso applicare i controlli retroattivamente: hanno lo scopo di identificare i cambiamenti futuri .

Nota come il secolare tendenza e le variazioni stagionali portano il sistema in condizioni apparenti di fuori controllo tra le settimane 40-65 (un massimo annuale) e dopo la settimana 85 (un massimo annuale più il trend cumulativo di un anno). Chiunque tenti di usarlo come carta di controllo sarebbe erroneamente alla ricerca di cause inesistenti la maggior parte delle volte. In pratica, questo sistema sarebbe odiato e presto ignorato da tutti. (Ho visto aziende in cui tutte le porte degli uffici e tutti i muri dei corridoi erano ricoperti di carte di controllo che nessuno si è preoccupato di leggere, perché tutti sapevano meglio.)

Il modo giusto di procedere inizia ponendo le domande di base, ad esempio come misuri la qualità? Quali influenze puoi avere su di esso? In che modo, nonostante i tuoi migliori sforzi, queste misure possono fluttuare? Cosa ti direbbero le fluttuazioni estreme (quali potrebbero essere le loro cause controllabili)? Quindi, è necessario eseguire un'analisi statistica dei dati passati. Qual è la loro distribuzione? Sono temporalmente correlati? Ci sono tendenze? Componenti stagionali? Prova di escursioni passate che potrebbero aver indicato situazioni fuori controllo?

Dopo aver fatto tutto questo, potrebbe essere possibile creare un efficace sistema di carte di controllo (o altro monitoraggio statistico). La letteratura è ampia, quindi se questa azienda è seriamente intenzionata a utilizzare metodi quantitativi per migliorare la qualità, ci sono ampie informazioni su come farlo. Ma ignorare questi principi statistici (sia per mancanza di tempo che per mancanza di conoscenza) garantisce praticamente che lo sforzo fallirà.

+1: risposta sorprendente. Suppongo che tu non abbia riferimenti ad alcune delle pubblicazioni canoniche che hai citato?
@SnOrfus Vorrei poterti fornire riferimenti affidabili ma non sono aggiornato sulla letteratura. Questo post si basa su ciò che ho letto un quarto di secolo fa e ho imparato applicando queste informazioni. (All'epoca scrivevo e vendevo software specializzato per la creazione di grafici di controllo, e di conseguenza ho avuto l'opportunità di guardare - letteralmente - diversi milioni di carte di controllo dei dati dei clienti e pensare all'adeguatezza di quelle carte per i loro processi decisionali.)
Completamente comprensibile. Grazie mille in ogni caso.
#2
+6
Greg Snow
2011-09-09 21:38:40 UTC
view on stackexchange narkive permalink

L'idea generale delle carte di controllo è distinguere tra variazione per causa comune e variazione per causa speciale. L'idea è che il processo sia abbastanza stabile e generi dati da una data distribuzione (sebbene il Poisson abbia più senso per il numero di chiamate rispetto al normale). Un grande vantaggio delle carte di controllo è che limitano la reazione eccessiva alla variazione naturale pur consentendo di trovare quando il processo è cambiato.

La scelta di una serie di osservazioni perché hanno piccole variazioni garantirebbe quasi che anche i limiti siano restringere e quindi aumentare le reazioni inappropriate alla variazione normale. L'utilizzo di tutti i dati ha molto più senso e l'utilizzo di un grafico Poisson C potrebbe essere migliore di un grafico a barre x. Ma sembra anche che un call center si aspetterebbe differenze dovute alle festività o alla stagione (a seconda di ciò che viene supportato), quindi le ipotesi di base potrebbero non essere nemmeno appropriate qui.

Sembra che lo stiano facendo qualcosa perché possono piuttosto che perché risponde a una domanda significativa.



Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...