Fundamentos de Hadoop
Formación Cognitive Class, MOOC (2020). Esta ruta de aprendizaje presenta Hadoop, que es un marco de código abierto para el almacenamiento distribuido y el procesamiento de big data. La formación cubre contenido que es fundamental para el éxito de cualquier persona en este ámbito al explicar el diseño conceptual de Hadoop, presentar MapReduce, YARN (Yet Another Resource Negotiator) y Hive, y luego explicar cómo usar Hadoop y manipular datos sin el uso de codificación compleja.
Curso 1: Hadoop 101
Temas principales:
- Introducción a Hadoop;
- Arquitectura de Hadoop y HDFS;
- Administración de Hadoop;
- Componentes de Hadoop.
Curso 2: MapReduce y YARN
Temas principales:
- Introducción a MapReduce y YARN;
- Limitaciones de Hadoop v1 y MapReduce v1;
- Arquitectura de YARN.
Curso 3: Movimiento de datos en Hadoop
Temas principales:
- Escenarios de carga;
- Uso de Sqoop;
- Descripción general de Flume;
- Uso de Data Click.
Curso 4: Acceso a datos de Hadoop usando Hive
Temas principales:
- Introducción a Hive;
- Hive DDL - Lenguaje de definición de datos;
- Hive DML - Lenguaje de manipulación de datos;
- Operadores y funciones de Hive.
Referencias
Formación
Hadoop 101 (certificado del curso)
Hadoop Foundations – Level 1 (insignia de certificación)
MapReduce and YARN (MapReduce y YARN, certificado del curso)
Hadoop Programming – Level 1 (insignia de certificación)
Moving data into Hadoop (Movimiento de datos en Hadoop, certificado del curso)
Hadoop Administration – Level 1 (insignia de certificación)
Accessing Hadoop data using Hive (Acceso a datos de Hadoop usando Hive, certificado del curso)
Hadoop Data Access – Level 1 (insignia de certificación)
Hadoop Foundations – Level 2 (insignia de certificación)
Artículos relacionados
Fundamentos de Spark (formación Cognitive Class)
Especialización en ciencia de datos (formación Coursera)