François Chung, Ph.D.

Tag: spark

Fonaments de Spark

Fonaments de Spark

Formació Cognitive Class, MOOC (2020). Aquesta ruta d'aprenentatge aborda els fonaments d'Apache Spark, un motor de codi obert per al processament de dades a gran escala que està revolucionant el món de l'analítica i del big data. Aquesta formació és una oportunitat per aprendre dels líders de la indústria sobre Spark, que es basa en la velocitat, la facilitat d'ús i l'anàlisi, i brinda oportunitats i projectes pràctics per generar confiança amb el conjunt d'eines de Spark.

Curs 1: Fonaments de Spark I

Temes principals:

  • Introducció a Spark;
  • Resilient Distributed Dataset (RDD) i DataFrames;
  • Programació d'aplicacions Spark;
  • Introducció a les biblioteques de Spark;
  • Configuració, seguiment i posada a punt de Spark.

Curs 2: Fonaments de Spark II

Temes principals:

  • Introducció als notebooks;
  • Arquitectura RDD;
  • Optimització de transformacions i accions;
  • Memòria cau i serialització;
  • Desenvolupament i proves.

Curs 3: Spark MLlib

Temes principals:

  • Tipus de dades Spark MLlib;
  • Revisió d'algoritmes;
  • Arbres de decisió i boscos aleatoris;
  • Agrupament Spark MLlib.

Curs 4: Exploració de GraphX

Temes principals:

  • Introducció a Graph-Parallel;
  • Exploració dels operadors de gràfics;
  • Visualització i modificació de GraphX;
  • Agregació i emmagatzematge en memòria cau.

Curs 5: Big data en R amb Spark

Temes principals:

  • Introducció a SparkR;
  • Manipulació de dades amb SparkR;
  • Aprenentatge automàtic amb SparkR.

Referències

Formació

Spark fundamentals I (Fonaments de Spark I, certificat del curs)
Spark – Level 1 (insígnia de certificació)
Spark fundamentals II (Fonaments de Spark II, certificat del curs)
Spark MLlib (certificat del curs)
Exploring GraphX (Exploració de GraphX, certificat del curs)
Big data in R using Spark (Big data en R amb Spark, certificat del curs)
Spark - Level 2 (insígnia de certificació)

Articles relacionats

Fonaments de Hadoop (formació Cognitive Class)
Especialització en ciència de dades (formació Coursera)

Més informació