François Chung, Ph.D.

Tag: yarn

Fundamentos de Hadoop

Fundamentos de Hadoop

Formación Cognitive Class, MOOC (2020). Esta ruta de aprendizaje presenta Hadoop, que es un marco de código abierto para el almacenamiento distribuido y el procesamiento de big data. La formación cubre contenido que es fundamental para el éxito de cualquier persona en este ámbito al explicar el diseño conceptual de Hadoop, presentar MapReduce, YARN (Yet Another Resource Negotiator) y Hive, y luego explicar cómo usar Hadoop y manipular datos sin el uso de codificación compleja.

Curso 1: Hadoop 101

Temas principales:

  • Introducción a Hadoop;
  • Arquitectura de Hadoop y HDFS;
  • Administración de Hadoop;
  • Componentes de Hadoop.

Curso 2: MapReduce y YARN

Temas principales:

  • Introducción a MapReduce y YARN;
  • Limitaciones de Hadoop v1 y MapReduce v1;
  • Arquitectura de YARN.

Curso 3: Movimiento de datos en Hadoop

Temas principales:

  • Escenarios de carga;
  • Uso de Sqoop;
  • Descripción general de Flume;
  • Uso de Data Click.

Curso 4: Acceso a datos de Hadoop usando Hive

Temas principales:

  • Introducción a Hive;
  • Hive DDL - Lenguaje de definición de datos;
  • Hive DML - Lenguaje de manipulación de datos;
  • Operadores y funciones de Hive.

Referencias

Formación

Hadoop 101 (certificado del curso)
Hadoop Foundations – Level 1 (insignia de certificación)
MapReduce and YARN (MapReduce y YARN, certificado del curso)
Hadoop Programming – Level 1 (insignia de certificación)
Moving data into Hadoop (Movimiento de datos en Hadoop, certificado del curso)
Hadoop Administration – Level 1 (insignia de certificación)
Accessing Hadoop data using Hive (Acceso a datos de Hadoop usando Hive, certificado del curso)
Hadoop Data Access – Level 1 (insignia de certificación)
Hadoop Foundations – Level 2 (insignia de certificación)

Artículos relacionados

Fundamentos de Spark (formación Cognitive Class)
Especialización en ciencia de datos (formación Coursera)

Más información