Caricamento...
OEC033

Machine Learning per la Social Network Analysis

e-learn

Prezzo

€ 1,190.00
(Iva esclusa)

Scheda tecnica

Scarica

Giorni

2 gg

Le nuove tecniche di Machine Learning per la Social Network Analysis (SNA)  permettono di sfruttare la diffusione pervasiva dei social network (Facebook, Linkedin, Twitter, Instagram, Google+, ecc), di analizzarne i contenuti in modo nuovo ed analitico e di ricavarne importanti insight commerciali o legali. In tempo reale.

La Social Network Analysis (SNA), anche detta social media mining oppure social media intelligence, è oggi utilizzata in modo crescente nel marketing per individuare gli influencer nell’Internet pubblico (i social veri e propri) od in una comunità di recensori di prodotti (nei siti di e-commerce aziendali) allo scopo di mirare il marketing (targeted marketing). Tipiche domande alle quali la SNA può dare una risposta oggettiva e numerica sono: chi sono gli influencer principali della rete/sottorete? che impatto hanno sugli altri? quanto “valgono”? che relazioni hanno con gli altri? Oppure: a quali persone della rete fare pubblicità di un prodotto? Oppure ancora: quali clienti del sito e-commerce sono “leali” (cioè fedeli)? La SNA è anche usata per individuare ed analizzare le comunità informali e di pratica dentro un’azienda, allo scopo di migliorare la comunicazione e l’integrazione delle persone, anche dopo fusioni ed acquisizioni aziendali (ONA=Organizational Network Analysis). La SNA, poi, è usata anche in altri ambiti quali il rilevamento frodi e riciclaggio (money lendering), la scelta della pubblicità da mostrare agli utenti (targeted advertising), la selezione del personale da assumere (optimized recruiting), l’ottimizzazione logistica, l’analisi del traffico telefonico e la prevenzione del cyber-crime. La SNA è utilizzata massivamente dietro le quinte da Google Maps e da molti altri siti importanti ed è una competenza oggi irrinunciabile per un’azienda moderna. Si veda al fondo la lista dei Casi d’Uso illustrati nel corso.

Il corso è di tipo “hands-on” con il linguaggio R, il linguaggio di riferimento nel Machine Learning.

NB. I principali social network rendono disponibili i loro dati pubblici previa iscrizione individuale gratuita come “developer” alle rispettive API: il corso illustrerà le modalità operative per farlo per i principali social network. Per seguire il corso, comunque, non è richiesto l’accesso e l’iscrizione ai suddetti social network, perché saranno utilizzati dataset precedentemente scaricati.


Una conoscenza di base del linguaggio R oppure di Python.

La SNA oggi:

  • Motivazioni;
  • Driver;
  • Diffusione;
  • Ambiti di utilizzo tipici della SNA;
  • Differenti modelli di rete, confronto grafico;
  • Esempi “storici” di successo della SNA.


Preliminari:

  • I dati social non-strutturati (unstructured): connessioni tra persone, tweet, raccomandazioni, recensioni, persone seguite, ecc;
  • La tipica architettura di accesso ai dati social;
  • La tecnica di base: la Graph Analysis, applicata ai social network: nodi, connessioni (edge), liste di connessioni (edge list) e matrici di adiacenza;
  • Tipi di Graph Analysis: analisi dei cammini, analisi della connettività, analisi della comunità, analisi della centralità;
  • Costruire “reti di prova” per impratichirsi con gli strumenti di SNA: come fare;
  • Esercizi con reti di prova. 


Accesso ai dati dei social (di dettaglio):

  • Le “social media API”;
  • Pre-elaborare il file reso disponibile dal social (es. JSON, HTML, XML, CSV);
  • Tre-elaborazione testuale? (tokenizzazione, rimozione stop word, stemming, lemmatizzazione);
  • Iscriversi come “developer” a Facebook, Linkedin, Instagram e Twitter per accedere ai dati pubblici: cosa fare;
  • Estrarre i dati da Facebook, Linkedin, Instagram e Twitter e caricarli in R: come fare.


Analisi base sui dati social:

  • Individuare la comunità da analizzare;
  • Individuare i nodi centrali ed i ponti;
  • Misurare la centralità e “l’influenza” di una persona: varie tecniche;
  • Misurare la “distanza” business tra le persone della rete/comunità;
  • La centralità di una persona in base all’importanza dei suoi vicini (eigen centrality) e come visualizzarla.


Visualizzazione delle reti e dei dati social:

  • Visualizzare la nuvola dei nodi e connessioni;
  • Selezionare un nodo (persona) dalla lista delle connessioni e vedere le sue connessioni evidenziate graficamente;
  • Selezionare un nodo sul grafico e vederlo evidenziato nella lista delle connessioni;
  • Visualizzare la direzione delle connessioni (chi segue chi);
  • Grafici social avanzati ed interattivi;
  • Grafici social a 2 e 3 dimensioni;
  • Pattern grafici di connessione.


Analisi avanzate:

  • Ordinare gli influencer della comunità per impatto;
  • Individuare le sotto-comunità coese, cioè fortemente connesse (network clustering);
  • Analizzare come le reti evolvono nel tempo (temporal SNA) e la fedeltà degli utenti;
  • Misurare le caratteristiche di una sotto-comunità;
  • Individuare i “ponti” tra sotto-comunità;
  • Individuare le persone “compatibili” con un’altra (matching).


Conclusioni:

  • Limiti e sfide della SNA oggi;
  • Altre tecnologie/tool di SNA oltre ad R? uno sguardo veloce.


Alcuni dei case study illustrati nel corso:

  • Determinare la probabilità che un follower sia influenzato da un influencer nei suoi comportamenti (per il marketing mirato);
  • Customizzare una campagna di marketing (in base al clustering di persone simili);
  • Identificare gli utenti del sito e-commerce fedeli nel tempo;
  • Individuare ed analizzare una comunità informale od una comunità di pratica dentro un’azienda (tramite quick poll & survey, intranet, email, blog, ecc);
  • Costruire e visualizzare reti di tweet per argomento (per il recruiting);
  • Scoprire le reti “egocentriche”, cioè formate da persone connesse e con lo stesso job title (per il recruiting);
  • Rilevare le frodi nel mondo Telecom e Finance tramite la rete di contatti abituali dei clienti (i cosiddetti guilt-by-associations); si mostrerà come informazioni non-strutturate dei social network possano essere trasformati in caratteristiche utili di una persona (cliente).


Dataset utilizzati nel corso, tra gli altri: i Social circles di Facebook, Twitter e Google+ dallo SNAP della Stanford University.



Sede Data P