Fundamentos de Spark
Formación Cognitive Class, MOOC (2020). Esta ruta de aprendizaje aborda los fundamentos de Apache Spark, un motor de código abierto para el procesamiento de datos a gran escala que está revolucionando el mundo de la analítica y del big data. Esta formación es una oportunidad para aprender de los líderes de la industria sobre Spark, que se basa en la velocidad, la facilidad de uso y el análisis, y brinda oportunidades y proyectos prácticos para generar confianza con el conjunto de herramientas de Spark.
Curso 1: Fundamentos de Spark I
Temas principales:
- Introducción a Spark;
- Resilient Distributed Dataset (RDD) y DataFrames;
- Programación de aplicaciones Spark;
- Introducción a las bibliotecas de Spark;
- Configuración, seguimiento y puesta a punto de Spark.
Curso 2: Fundamentos de Spark II
Temas principales:
- Introducción a los notebooks;
- Arquitectura RDD;
- Optimización de transformaciones y acciones;
- Caché y serialización;
- Desarrollo y pruebas.
Curso 3: Spark MLlib
Temas principales:
- Tipos de datos Spark MLlib;
- Revisión de algoritmos;
- Árboles de decisión y bosques aleatorios;
- Agrupamiento Spark MLlib.
Curso 4: Exploración de GraphX
Temas principales:
- Introducción a Graph-Parallel;
- Exploración de los operadores de gráficos;
- Visualización y modificación de GraphX;
- Agregación y almacenamiento en caché.
Curso 5: Big data en R con Spark
Temas principales:
- Introducción a SparkR;
- Manipulación de datos con SparkR;
- Aprendizaje automático con SparkR.
Referencias
Formación
Spark fundamentals I (Fundamentos de Spark I, certificado del curso)
Spark – Level 1 (insignia de certificación)
Spark fundamentals II (Fundamentos de Spark II, certificado del curso)
Spark MLlib (certificado del curso)
Exploring GraphX (Exploración de GraphX, certificado del curso)
Big data in R using Spark (Big data en R con Spark, certificado del curso)
Spark - Level 2 (insignia de certificación)
Artículos relacionados
Fundamentos de Hadoop (formación Cognitive Class)
Especialización en ciencia de datos (formación Coursera)