Fonaments de Spark
Formació Cognitive Class, MOOC (2020). Aquesta ruta d'aprenentatge aborda els fonaments d'Apache Spark, un motor de codi obert per al processament de dades a gran escala que està revolucionant el món de l'analítica i del big data. Aquesta formació és una oportunitat per aprendre dels líders de la indústria sobre Spark, que es basa en la velocitat, la facilitat d'ús i l'anàlisi, i brinda oportunitats i projectes pràctics per generar confiança amb el conjunt d'eines de Spark.
Curs 1: Fonaments de Spark I
Temes principals:
- Introducció a Spark;
- Resilient Distributed Dataset (RDD) i DataFrames;
- Programació d'aplicacions Spark;
- Introducció a les biblioteques de Spark;
- Configuració, seguiment i posada a punt de Spark.
Curs 2: Fonaments de Spark II
Temes principals:
- Introducció als notebooks;
- Arquitectura RDD;
- Optimització de transformacions i accions;
- Memòria cau i serialització;
- Desenvolupament i proves.
Curs 3: Spark MLlib
Temes principals:
- Tipus de dades Spark MLlib;
- Revisió d'algoritmes;
- Arbres de decisió i boscos aleatoris;
- Agrupament Spark MLlib.
Curs 4: Exploració de GraphX
Temes principals:
- Introducció a Graph-Parallel;
- Exploració dels operadors de gràfics;
- Visualització i modificació de GraphX;
- Agregació i emmagatzematge en memòria cau.
Curs 5: Big data en R amb Spark
Temes principals:
- Introducció a SparkR;
- Manipulació de dades amb SparkR;
- Aprenentatge automàtic amb SparkR.
Referències
Formació
Spark fundamentals I (Fonaments de Spark I, certificat del curs)
Spark – Level 1 (insígnia de certificació)
Spark fundamentals II (Fonaments de Spark II, certificat del curs)
Spark MLlib (certificat del curs)
Exploring GraphX (Exploració de GraphX, certificat del curs)
Big data in R using Spark (Big data en R amb Spark, certificat del curs)
Spark - Level 2 (insígnia de certificació)
Articles relacionats
Fonaments de Hadoop (formació Cognitive Class)
Especialització en ciència de dades (formació Coursera)