Caricamento...
OEC027

Previsione del churn clienti per Telecom e banche con il Machine Learning

e-learn

Prezzo

€ 1,190.00
(Iva esclusa)

Scheda tecnica

Scarica

Giorni

1 gg

Alcune aziende, in particolare nei mercati Telecom e Finance, sono strutturalmente afflitte dal problema del churn, ovvero della frequente, indesiderata e spesso inaspettata rotazione della base cliente.

Oggi esistono tecniche mature di Machine Learning predittivo per prevedere tale fenomeno in anticipo, in modo probabilistico, e poter così indirizzare preventivamente azioni di recupero/incentivo ai clienti a rischio abbandono, od ad una parte prioritaria di essi (quale parte?), avendo dei vincoli di spesa (budget per incentivazione) da rispettare. Il problema della previsione del churn è noto da tempo ed esistono da anni alcune soluzioni tecniche; la novità è che oggi sono disponibili tecniche previsionali molto migliori rispetto al passato, anche nella comprensione delle ragioni dell’abbandono. Il corso tratta anche la questione di quanti dati di churn servano per una previsione precisa. 

Il corso affronta inoltre il fondamentale tema dell’analisi costi-benefici (economici) del churn e delle eventuali azioni di rimedio (ad es. l’incentivazione mirata), aiutando a selezionare con criteri economici la platea clienti da preservare con azioni di recupero.

Il corso è completamente hands-on sul codice, senza slide. Tutte le tecniche saranno esemplificate su dataset reali o simulati di crescente dimensione e difficoltà previsionale, ovviamente anonimizzati (vedi più avanti).


Una conoscenza di base del linguaggio R o del linguaggio Python.

Esame completo di un caso Telecom (DSfB-file rouge):

tecniche esplicative del churn;

l’analisi dei dati storici di churn per estrarne dei pattern predittivi;

tecniche previsionali del churn a confronto:

o partizionamento dei dati disponibili;

o tecniche tradizionali (migliorate): regressione logistica, albero di classificazione, knn e naive bayes;

o tecniche innovative: reti neurali (ANN con keras), metodi ensemble;

o visualizzazione delle capacità predittive delle tecniche.


Tuning dei modelli:

fine tuning dei parametri;

quali sono i migliori predittori? 

prevedere il churn o la sua probabilità? pro e contro;

quanti dati servono? le capacità predittive all’aumentare dei dati disponibili (le  curve di apprendimento); 


La valutazione del modello:

l’accuratezza vs. il tasso di errore (AER e APER);

i falsi positivi ed i falsi negativi;

le matrici di confusione;

la “specificità” e la “sensitività”.


Le classi sbilanciate:

la previsione del churn con dataset molto sbilanciati (pochi o troppi churn sul totale);

l’accuratezza è fuorviante?

aggiustare le proporzioni tra classi? come?


Analisi economiche cost-effective: (DSfB, ch. 7 e poi 11, vedi footnote p. 195)

costi differenti dei falsi positivi e dei falsi negativi;

una framework economica unificante (Expected Value Framework) per la previsione di churn:

o previsione del churn del singolo cliente; (DSfB, pp. 195-196)

o costo vs. beneficio;

o le matrici costi-benefici: come stimarle ed organizzarle;

o gli errori tipici nelle matrici costi-benefici;

o previsione del churn del modello (cioè, aggregato sul dataset), per confrontare modelli;

o il ruolo delle prior;

o confronto di tecniche che hanno utilizzato dataset bilanciati in modo differente;

le baseline di riferimento: a cosa servono;

confrontare le previsioni di modelli “condizionati”; (DSfB, p. 206)

confrontare le previsioni di differenti sorgenti dati (singole o multiple). (DSfB, p. 206)


La previsione del churn con scenari multipli:

i cutoff;

ordinare anziché classificare;

le curve di profitto;

valutazione della capacità predittiva dei modelli con curve ROC, AUC ed evidence lift;

costi non conosciuti;


Analizzare l’impatto degli incentivi sui costi-benefici della gestione del churn;

come massimizzare il ritorno dell’investimento del churn management;


Presentare i risultati economici del churn management agli stakeholder: 

Viste ad alto livello, intuitive e multi-scenario.


Dataset utilizzati nel corso per gli esempi:

dati simulati di un’azienda telefonica fittizia (20.000 record con 11 predittori, anche categorici) [nb. I dati “simulati” (da esperti del settore) si rivelano spesso superiori a quelli reali perché creati ad hoc e quindi con un più ampio ventaglio di “problemi”];

dati reali dell’azienda telefonica francese Orange (50.000 record con 250 predittori);

dataset IBM Watson (70.000 x21)


Sede Data P