R è il linguaggio per eccellenza della Data Science, il più usato al mondo. E’ completamente open-source, ricco di prodotti collaterali anch’essi tutti gratuiti, incluso un ambiente di sviluppo (R Studio) ed un’interfaccia per il Machine Learning (rattle).
Due grandi punti di forza di R, inoltre, sono: la disponibilità di una grande e sempre crescente quantità di pacchetti e funzioni sviluppate in continuo in tutto il mondo, per praticamente qualsiasi ambito della Data Science; e la disponibilità di pacchetti grafici avanzati, per qualsiasi tipo di grafico ed in generale per qualsiasi necessità di Data Visualization. Il tutto affidabile e ben testato.
Altrettanto grande, infine, è la disponibilità di risorse per l’apprendimento e la formazione su R: libri, siti, riviste, forum, ecc.
R è un linguaggio di programmazione object-oriented.
Il corso introduce il partecipante all’uso di R per la Data Science.
Corso pratico
Introduzione ad R
- Storia e filosofia del software R
- Caratteristiche principali
- Punti di forza
- I fondamentali
- Gli obiettivi
- La documentazione (help e risorse varie)
Le mani su R
- Partire: scaricare, installare e aggiornare R ed R Studio
- Entrare ed uscire da R Studio
- Muoversi in R Studio: tour dell’interfaccia e dei 4 pannelli Installare e caricare i package
- I repository dei package R: CRAN e GITHub
- Personalizzare le sessioni R Studio con .Rprofile
- Salvare ed esportare dati e risultati
- L'ambiente di R ed i default
- Esercizi
Le basi di R
- Classi, oggetti e metodi
- La matematica con R (manipolazioni di base)
- I tipi di dati
- Gli scalari
- I vettori
- Le matrici
- Le liste
- I fattori
- Le array
- I dataframe
- Creazione degli oggetti
- Indicizzazione (metodi)
- Cammini di ricerca
- Mascheramento degli errori
- Operatori di assegnazione
- Esercizi
Input / Output dei dati
- Lettura dei dati da file o DB
- Scrittura dei dati su file o DB
- Importazione dei dati (vari formati)
- Esportazione dei dati (vari formati)
- Funzioni di esame dei dati
- Esercizi
Elaborazione dei dati
- Vettorizzazione
- Sequenze regolari
- Date
- Trasformazioni numeriche
- Stringhe e loro manipolazione
- Booleani e confronti
- Gli insiemi vuoti
- I dati mancanti
- Sort & order
- Manipolazione di matrici
- Esercizi
Le funzioni
- Cosa sono
- La struttura
- Come crearle
- Esercizi
Le GUI di R