Fondamentaux de Hadoop
Formation Cognitive Class, MOOC (2020). Ce parcours d'apprentissage présente Hadoop, qui est un framework open source pour le stockage distribué et le traitement de big data. La formation couvre le contenu essentiel à la réussite de quiconque dans ce domaine en expliquant la conception de Hadoop, en présentant MapReduce, YARN (Yet Another Resource Negotiator) et Hive, puis en expliquant comment utiliser Hadoop et manipuler des données sans utiliser de codage complexe.
Cours 1: Hadoop 101
Sujets principaux:
- Introduction à Hadoop;
- Architecture de Hadoop et HDFS;
- Administration de Hadoop;
- Composants Hadoop.
Cours 2: MapReduce et YARN
Sujets principaux:
- Introduction à MapReduce et YARN;
- Limitations de Hadoop v1 et MapReduce v1;
- Architecture de YARN.
Cours 3: Déplacer des données dans Hadoop
Sujets principaux:
- Chargement de scénarios;
- Utilisation de Sqoop;
- Vue d'ensemble de Flume;
- Utilisation de données Click.
Cours 4: Accéder aux données Hadoop à l'aide de Hive
Sujets principaux:
- Introduction à Hive;
- Hive DDL - Data Definition Language;
- Hive DML - Data Manipulation Language;
- Opérateurs et fonctions de Hive.
Références
Formation
Hadoop 101 (certificat de cours)
Hadoop Foundations – Level 1 (badge de certification)
MapReduce and YARN (MapReduce et YARN, certificat de cours)
Hadoop Programming – Level 1 (badge de certification)
Moving data into Hadoop (Déplacer des données dans Hadoop, certificat de cours)
Hadoop Administration – Level 1 (badge de certification)
Accessing Hadoop data using Hive (Accéder aux données Hadoop à l'aide de Hive, certificat de cours)
Hadoop Data Access – Level 1 (badge de certification)
Hadoop Foundations – Level 2 (badge de certification)
Articles associés
Fondamentaux de Spark (formation Cognitive Class)
Spécialisation en science des données (formation Coursera)