François Chung, Ph.D.
Fonaments de Spark

Fonaments de Spark

Formació Cognitive Class, MOOC (2020). Aquesta ruta d'aprenentatge aborda els fonaments d'Apache Spark, un motor de codi obert per al processament de dades a gran escala que està revolucionant el món de l'analítica i del big data. Aquesta formació és una oportunitat per aprendre dels líders de la indústria sobre Spark, que es basa en la velocitat, la facilitat d'ús i l'anàlisi, i brinda oportunitats i projectes pràctics per generar confiança amb el conjunt d'eines de Spark.

Curs 1: Fonaments de Spark I

Temes principals:

  • Introducció a Spark;
  • Resilient Distributed Dataset (RDD) i DataFrames;
  • Programació d'aplicacions Spark;
  • Introducció a les biblioteques de Spark;
  • Configuració, seguiment i posada a punt de Spark.

Curs 2: Fonaments de Spark II

Temes principals:

  • Introducció als notebooks;
  • Arquitectura RDD;
  • Optimització de transformacions i accions;
  • Memòria cau i serialització;
  • Desenvolupament i proves.

Curs 3: Spark MLlib

Temes principals:

  • Tipus de dades Spark MLlib;
  • Revisió d'algoritmes;
  • Arbres de decisió i boscos aleatoris;
  • Agrupament Spark MLlib.

Curs 4: Exploració de GraphX

Temes principals:

  • Introducció a Graph-Parallel;
  • Exploració dels operadors de gràfics;
  • Visualització i modificació de GraphX;
  • Agregació i emmagatzematge en memòria cau.

Curs 5: Big data en R amb Spark

Temes principals:

  • Introducció a SparkR;
  • Manipulació de dades amb SparkR;
  • Aprenentatge automàtic amb SparkR.

Referències

Formació

Spark fundamentals I (Fonaments de Spark I, certificat del curs)
Spark – Level 1 (insígnia de certificació)
Spark fundamentals II (Fonaments de Spark II, certificat del curs)
Spark MLlib (certificat del curs)
Exploring GraphX (Exploració de GraphX, certificat del curs)
Big data in R using Spark (Big data en R amb Spark, certificat del curs)
Spark - Level 2 (insígnia de certificació)

Articles relacionats

Fonaments de Hadoop (formació Cognitive Class)
Especialització en ciència de dades (formació Coursera)

Més informació