François Chung, Ph.D.

Tag: modèle statistique

Spécialisation en science des données

Spécialisation en science des données

Formation Coursera, MOOC (2020). Cette spécialisation couvre les concepts et les outils nécessaires à la science des données, de la formulation des bonnes questions à la réalisation d'inférences et la publication des résultats. Les sujets abordés incluent l'utilisation de R pour nettoyer, analyser et visualiser les données, utiliser GitHub pour gérer des projets en science des données et effectuer une analyse de régression, des moindres carrés et des inférences à l'aide de modèles de régression.

Cours 1: Boîte à outils du data scientist

Sujets principaux:

  • Fondamentaux de la science des données;
  • R et Rstudio;
  • Contrôle de version et GitHub;
  • R Markdown, raisonnement scientifique et big data.

Cours 2: Programmation en R

Sujets principaux:

  • Contexte et mise en route;
  • Programmation avec R;
  • Fonctions de boucle et débogage;
  • Simulation et profilage de code.

Cours 3: Obtenir et nettoyer les données

Sujets principaux:

  • Recherche de données et lecture de différents types de fichiers;
  • Systèmes de stockage de données;
  • Organisation, fusion et gestion des données;
  • Manipulation de texte et de données en R.

Cours 4: Analyse exploratoire des données

Sujets principaux:

  • Graphiques analytiques et représentation graphique en R;
  • Lattice et ggplot2;
  • Réduction dimensionnelle des données;
  • Techniques d'analyse de cluster.

Cours 5: Recherche reproductible

Sujets principaux:

  • Concepts, idées et structure;
  • Markdown et knitr;
  • Check-list de la recherche reproductible;
  • Analyse de données factuelles.

Cours 6: Inférence statistique

Sujets principaux:

  • Probabilité et espérance mathématique;
  • Variabilité, distribution et asymptote;
  • Intervalles, tests et valeur-p;
  • Tests de puissance, bootstrap et permutation.

Cours 7: Modèles de régression

Sujets principaux:

  • Moindres carrés et régression linéaire;
  • Régression linéaire et multivariée;
  • Résidus et diagnostics;
  • Régression logistique et de Poisson.

Cours 8: Apprentissage automatique

Sujets principaux:

  • Prédiction, erreurs et validation croisée;
  • Paquet caret;
  • Arbres de décision et forêts aléatoires;
  • Régression régularisée et combinaison de prédicteurs.

Cours 9: Développement de produits de données

Sujets principaux:

  • Shiny, GoogleVis et Plotly;
  • R Markdown et Leaflet;
  • Paquets R et Swirl.

Références

Articles associés

Conférence ODSC APAC 2023 (conférence ODSC)
Fondamentaux de Spark (formation Cognitive Class)
Fondamentaux de Hadoop (formation Cognitive Class)
AWS: fondations et apprentissage automatique (formation AWS)

En savoir plus

Introduction au management d'opérations

Introduction au management d’opérations

Formation Coursera, MOOC (2015). Donnée en ligne par la Wharton School de l'University of Pennsylvania (US), cette formation présente les compétences de management nécessaires pour exécuter des opérations (p. ex. pour faire fonctionner un restaurant ou un hôpital). Plus précisément, la formation explique comment améliorer la productivité, augmenter la réactivité, fournir plus de choix au client et offrir des normes de qualité élevées.

Module 1: Analyse de procédés

Principaux thèmes:

  • Trouver un goulot d'étranglement;
  • Calculer le throughput;
  • Appliquer la théorie des files d'attente;
  • Calculer la rotation de stocks;
  • Travailler avec de multiples unités de flux.

Module 2: Productivité

Principaux thèmes:

  • Comprendre les sources de déchets;
  • Équilibrer une ligne et calculer le takt time;
  • Analyse du taux de rendement global (TRG);
  • Arbre KPI (Key Performance Indicator).

Module 3: Variété

Principaux thèmes:

  • Déterminer l'impact des set-ups sur la capacité;
  • Analyser les set-ups;
  • Méthode SMED (Single-Minute Exchange of Die);
  • Stratégies pour faire face à la variété;
  • Limites à la variété.

Module 4: Réactivité

Principaux thèmes:

  • Analyse du temps d’attente;
  • Planifier le parcours du client;
  • Prédire les taux de perte de clients.

Module 5: Qualité

Principaux thèmes:

  • Analyser les procédures avec pertes de rendement;
  • Système de production de Toyota;
  • Six Sigma;
  • Maîtrise statistique des procédés (MSP).

Référence

En savoir plus