François Chung, Ph.D.

Tag: spark

Fundamentos de Spark

Fundamentos de Spark

Formación Cognitive Class, MOOC (2020). Esta ruta de aprendizaje aborda los fundamentos de Apache Spark, un motor de código abierto para el procesamiento de datos a gran escala que está revolucionando el mundo de la analítica y del big data. Esta formación es una oportunidad para aprender de los líderes de la industria sobre Spark, que se basa en la velocidad, la facilidad de uso y el análisis, y brinda oportunidades y proyectos prácticos para generar confianza con el conjunto de herramientas de Spark.

Curso 1: Fundamentos de Spark I

Temas principales:

  • Introducción a Spark;
  • Resilient Distributed Dataset (RDD) y DataFrames;
  • Programación de aplicaciones Spark;
  • Introducción a las bibliotecas de Spark;
  • Configuración, seguimiento y puesta a punto de Spark.

Curso 2: Fundamentos de Spark II

Temas principales:

  • Introducción a los notebooks;
  • Arquitectura RDD;
  • Optimización de transformaciones y acciones;
  • Caché y serialización;
  • Desarrollo y pruebas.

Curso 3: Spark MLlib

Temas principales:

  • Tipos de datos Spark MLlib;
  • Revisión de algoritmos;
  • Árboles de decisión y bosques aleatorios;
  • Agrupamiento Spark MLlib.

Curso 4: Exploración de GraphX

Temas principales:

  • Introducción a Graph-Parallel;
  • Exploración de los operadores de gráficos;
  • Visualización y modificación de GraphX;
  • Agregación y almacenamiento en caché.

Curso 5: Big data en R con Spark

Temas principales:

  • Introducción a SparkR;
  • Manipulación de datos con SparkR;
  • Aprendizaje automático con SparkR.

Referencias

Formación

Spark fundamentals I (Fundamentos de Spark I, certificado del curso)
Spark – Level 1 (insignia de certificación)
Spark fundamentals II (Fundamentos de Spark II, certificado del curso)
Spark MLlib (certificado del curso)
Exploring GraphX (Exploración de GraphX, certificado del curso)
Big data in R using Spark (Big data en R con Spark, certificado del curso)
Spark - Level 2 (insignia de certificación)

Artículos relacionados

Fundamentos de Hadoop (formación Cognitive Class)
Especialización en ciencia de datos (formación Coursera)

Más información