Domanda:
Qual è lo strumento migliore per la segmentazione dei clienti?
jschwa
2011-08-26 02:15:58 UTC
view on stackexchange narkive permalink

Dispongo di un set di dati del cliente con i seguenti dati:

  • Il numero di acquisti effettuati da ciascun cliente
  • La data in cui ha effettuato ciascun acquisto
  • La data in cui si sono registrati
  • L'importo speso per ogni acquisto

Desidero segmentare i miei utenti in tre gruppi:

  • Grandi clienti
  • Ok clienti
  • Cattivi clienti

Esiste uno strumento che posso utilizzare (metodo statistico O strumento software) che esaminerà tutte le variabili e creerà le segmentazioni? Ho Stata ed Excel, ma la tua risposta non deve essere limitata a questi.

Per segmentare i clienti, non i loro dati, una ghigliottina
Sei risposte:
#1
+8
rolando2
2011-08-26 02:42:37 UTC
view on stackexchange narkive permalink

Temo che tu stia scambiando programmi software e algoritmi statistici per pensare, giudicare gli esseri. Nessuno strumento può darti il ​​buono, il brutto e il cattivo. Dovrai esercitare il tuo giudizio lungo la strada! Quello di cui hai bisogno non è tanto uno strumento ma criteri ben congegnati per classificare ogni cliente. Quindi il resto è una questione di meccanica o follow-through.

#2
+8
Brandon Bertelsen
2011-08-26 04:53:05 UTC
view on stackexchange narkive permalink

L'analisi di sopravvivenza di LTV (lifetime value) è un buon punto di partenza. È piuttosto semplice, ma porta a termine il lavoro. Ma c'è molto lavoro di business intelligence che potresti fare con quello che hai. Se hai tassi di risposta agli annunci pubblicitari e simili, potrebbe anche fornirti un buon modo per esaminare l'efficacia.

Sono d'accordo con rolando2, il buono il brutto e il cattivo - essendo matematicamente definito, è impegnativo. Soprattutto senza alcun elemento comportamentale o secondario nei tuoi dati diversi dagli acquisti, anche qualcosa di semplice come il codice postale potrebbe aggiungere informazioni fantastiche ai tuoi dati per comprendere cose come il luogo di acquisto (è un negozio). Immagino che potresti segmentare per percentili LTV ... 30%, 50%, 80% (seguendo la regola aziendale 80/20 ...).

In termini di software, non ho idea di come fallo in Excel o STATA. Ma per R c'è un'introduzione mista ed un esempio di analisi di sopravvivenza usando il pacchetto survival qui: http://www.stats.uwo.ca/faculty/jones/survival_talk.pdf di Bruce Jones presso l'Università dell'Ontario occidentale. Sono canadese, fammi causa.

Nel suo esempio, Morte, sarebbe qualcosa di simile al tempo medio tra gli acquisti identificato nei dati come 0 o 1 se l'osservazione avesse effettuato un acquisto nell'ultimo tempo medio tra gli acquisti . Ad alcune persone piace impostarlo come Acquistato negli ultimi 3 mesi ... ma ovviamente è diverso per ogni tipo di attività. Non andresti in macchina ogni mese, vero? Quindi è un giudizio da parte tua.

Altrimenti, ci sono molte cose interessanti che puoi fare con i tuoi dati da una prospettiva di business intelligence. Prezzo medio di acquisto, numero di articoli acquistati in base agli stack out in un negozio o banner su un sito Web se si conosce l'ora in cui è stato inserito l'annuncio o lo stack out ... questi sono solo alcuni esempi.

In che modo l'analisi di sopravvivenza è correlata a LTV? L'analisi di sopravvivenza implica un evento discreto (possibilmente ricorrente), non un valore continuo (valore del tempo di vita = $).
http://www2.sas.com/proceedings/sugi28/120-28.pdf è un esempio.
Grazie, esaminerò l'analisi della sopravvivenza. Quando dici che ci sono molte cose che posso fare da un potenziale cliente di business intelligence, in che modo è diverso dalla segmentazione dei dati dei clienti?
Molte aziende gestiscono cose di interesse che non hanno necessariamente un elemento statistico complicato. Come il prezzo medio di acquisto, la media degli articoli acquistati, il tempo medio tra gli acquisti, la creazione di una scorecard di queste metriche a volte può essere più interessante per gli uomini d'affari di qualsiasi segmentazione statistica.
#3
+6
B_Miner
2011-08-26 05:42:50 UTC
view on stackexchange narkive permalink

Suggerirei con i tuoi dati limitati (e forse la limitata esperienza con il clustering), di creare semplicemente una codifica RFM e separare nei tre contenitori che desideri. In caso contrario, l'analisi dei cluster sui dati è un metodo di base per la segmentazione dei clienti basato su variabili transazionali (ovviamente le date devono diventare misure come la distanza tra gli acquisti, la permanenza in carica e l'attualità dell'acquisto).

Ho perso la tua risposta in qualche modo (+1) cancellato il mio duplicato.
Grazie per questo. RFM sembra interessante, ma avevo domande sul modo migliore per trovare interruzioni significative per le sottocategorie. L'articolo di wikipedia menzionava CHAID, che esaminerò.
#4
+2
Ranon
2011-08-26 04:44:32 UTC
view on stackexchange narkive permalink

In generale sono d'accordo con rolando2. Tuttavia, se sei interessato alla categorizzazione senza supervisione, esistono metodi che possono fornirti gruppi di dati senza etichetta. Uno di questi metodi è il processo di dirichlet latente (LDA) che è stato utilizzato per la scoperta automatica degli argomenti. K-Means potrebbe essere più adatto alle tue esigenze, soprattutto perché conosci il numero di categorie che ti aspetti.

#5
+1
aaronjg
2011-08-26 07:18:36 UTC
view on stackexchange narkive permalink

Un modo per affrontare questo problema è costruire un modello di probabilità dei dati del cliente. Se hai una certa comprensione del comportamento a livello di cliente, puoi modellarlo e fare previsioni su chi sono i tuoi clienti più preziosi.

Ad esempio, potresti presumere che i clienti effettuino acquisti a una velocità costante fino a quando " morire.' Questo è il tipo di analisi di sopravvivenza menzionata da Brandon. Potresti anche costruire modelli più sofisticati che consentano eterogeneità negli acquisti e nei tassi di mortalità.

Dato che chiedi informazioni sugli strumenti software, vorrei anche suggerirti di dare un'occhiata alla mia azienda, Custora. Usiamo alcune versioni più sofisticate dei modelli che ho descritto sopra per prevedere il Lifetime Value del cliente in base ai log delle transazioni. Una delle analisi che forniamo è la segmentazione dei clienti.

(-1): Vorrei evitare che crossvalidated.com degeneri in una piattaforma dove ad ogni domanda qualcuno suggerisce lo strumento commerciale della sua azienda. In questo caso è meglio inserire annunci tra le risposte -, -
C'è un rischio minimo di tale degenerazione, @steffen, perché questa comunità ha forti difese incorporate attraverso l'auto-controllo e le attività di moderatore del regolatore. In questo caso la risposta è legittima, perché include la divulgazione e spiega il motivo per cui viene offerta (anche se molto brevemente). A proposito, se hai una tale preoccupazione su una risposta, segnalala all'attenzione del moderatore (usa il link "flag" immediatamente sotto la risposta). Ci occuperemo rapidamente del problema.
Ho chiesto strumenti software, quindi segnalarne uno è giusto. Qual è il modello più sofisticato che stai utilizzando?
#6
  0
Prometheus
2017-01-12 17:29:33 UTC
view on stackexchange narkive permalink

Puoi considerare il problema come un problema con più obiettivi, diciamo che un buon cliente è colui che:

  1. Spende un importo medio elevato per acquisto (porta denaro)
  2. Fa molti acquisti (mostra fiducia)
  3. Fa acquisti per un lungo periodo di tempo (mostra fedeltà)

Gli obiettivi corrispondenti sono quindi:

  1. Massimizza $ importo medio speso per acquisto $
  2. Massimizza $ TotalNumberOfPurchases $
  3. Massimizza $ AverageTimeIntervalBetweenAcquisti $

Tratta tutti i clientisono soluzioni e ordinale utilizzando l ' ordinamento non dominato.Nota che non è necessario eseguire l'algoritmo genetico, basta ordinare le soluzioni una volta.

Supponiamo che l'ordinamento non dominato ti dia 5 gradi.Puoi assegnare i ranghi 1 e 2 come buoni clienti, il rango 3 come clienti ok e rimanere come cattivi clienti.



Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...