In questo corso, apprenderai nozioni fondamentali, strategie e best practice per la progettazione di una soluzione di data warehousing basata su cloud che impieghi Amazon Redshift, il servizio di data warehousing con scalabilità a livello di petabyte di AWS.
Verrà illustrato come raccogliere, memorizzare e preparare i dati per il data warehousing utilizzando servizi di AWS quali Amazon DynamoDB, Amazon EMR, Amazon Kinesis Firehose e Amazon Simple Storage Service (Amazon S3). Verrà approfondito, inoltre, l'utilizzo di strumenti di business intelligence (BI) per eseguire analisi sui vostri dati.
Questo corso è rivolto a:
- Progettisti di database
- Amministratori di database
- Sviluppatori di databaseAnalisti di dati
- Data scientist
In questo corso, scoprirai come:
- Valutare le relazioni tra Amazon Redshift e gli altri sistemi per Big Data
- Esaminare casi d'uso per carichi di lavoro di data warehousing e analizzare implementazioni reali di servizi di analisi e di gestione dei dati di AWS all'interno di una soluzione di data warehousing
- Scegliere il tipo di nodo Amazon Redshift più adatto alle esigenze specifiche
- Comprendere quali caratteristiche di sicurezza sono più adatte per Amazon Redshift, come la crittografia, le autorizzazioni IAM e quelle per il database
- Lanciare un cluster Amazon Redshift e utilizzarne componenti, caratteristiche e funzionalità per implementare una soluzione di data warehousing nel cloud
- Utilizzare altri servizi di analisi e gestione dei dati di AWS, quali Amazon DynamoDB, Amazon EMR, Amazon Kinesis Firehose e Amazon S3, come complemento alla soluzione di data warehousing
- Valutare approcci e metodologie di progettazione dei data warehouse
- Identificare origini dati e stabilire requisiti su cui basare la progettazione del data warehouse
- Progettare un data warehouse che utilizzi in modo efficace compressione, distribuzione dei dati e metodi di ordinamento
- Caricare e scaricare dati ed eseguire attività di manutenzione sui dati
- Scrivere query e valutare piani di query per ottimizzarne le prestazioni
- Configurare il database in modo che le risorse (ad esempio la memoria) siano assegnate alle code di query e definire criteri che consentano l'instradamento di alcuni tipi di query alle code di query preconfigurate per migliorarne l'elaborazione
- Controllare, monitorare e ricevere notifiche di eventi sulle attività di data warehousing utilizzando funzionalità e servizi quali la registrazione di audit del database Amazon Redshift, Amazon CloudTrail, Amazon CloudWatch e Amazon Simple Notification Service (Amazon SNS)
- Preparare attività quali il ridimensionamento dei cluster Amazon Redshift e l'uso di snapshot per effettuarne backup e ripristino
- Utilizzare un'applicazione di BI per eseguire analisi sui dati e attività di visualizzazione sui dati