La data science è una materia in rapida evoluzione le cui applicazioni spaziano in ambiti diversi della nostra vita.
Questo corso insegna a trasformare database disordinati e dati non strutturati in dataset omogenei e ordinati attraverso l'impiego degli strumenti essenziali del linguaggio Python per il machine learning.
Questo corso vuole offrire una panoramica globale delle basi e dei casi d’uso più diffusi nel data science con Python, uno dei linguaggi più importanti nell’analisi dati.
Questo corso è dedicato a chi vuole acquisire i concetti introduttivi e fondamentali del Python per dedicarsi allo studio del data science.
Conoscenza base di un linguaggio di programmazione o Scripting.
Giorno 1
- Introduzione a Python: approcci di programmazione, particolarità del linguaggio, ambiente Python
- Introduzione a Python: Cenni delle componenti a disposizione nel'environment Anaconda
- Introduzione a Python: Introduzione all'ambiente jupiter semplici esempi di linguaggio
- Introduzione a Python: Introduzione all'ambiente spyder semplici esempi di linguaggio
- Il linguaggio Python:
- strutture di dati semplici
- strutture di controllo
- Formattatori e gestione delle stringhe
- tuple, liste, stringhe
- Il linguaggio Python: wrap up exercises
Giorno 2
- Il linguaggio Python: dizionari, slicing
- Il linguaggio Python: enumeratori statici e dinamici
- Il linguaggio Python: Elementi per il debug e la rapprentazione nell'ambiente Spyder
- Il linguaggio Python: Classi
- definizioni
- namespaces
- istanze
- metodi
- Inheritance
- Esercitazione sulle classi
Giorno 3
- ll linguaggio Python: Funzioni
- Argomenti di default
- forma lambda
- Metodi sulle liste
- Variabili private
- Programmazione funzionale map e reduce
- Moduli
- Moduli standard
- Lista dei moduli
- Uso dei moduli
- Esempio il modulo sistema
- Namespaces
- Eccezioni
- Organizzazione del codice
- Compilare Python Cython
- Python e l’interfaccia verso altri linguaggi
- Wrap up exercises
Giorno 4
- Accesso ai dati
- Accesso a dati su XLS,CSV
- PyODBC e SQL
- Accesso a dati Oracle
- Accesso a SQL Server
- Accesso a MySQL e Postgres
- Numpy
- Uso e gestione dgli array
- Operazioni fondamentali
- Broadcasting
- Aggregazione e concatenazione
Giorno 5
- Pandas
- Dataframe, Timeseries
- Operazioni sui dataframe
- DataFrame e SQL (Accesso ai Dati
- Normalizzazione dei dati
- Rappresentazione dei dati
- MatPlot, Images, PyPlot
- Plotting 2 D e 3D
- Wrap Up Exercise