François Chung, Ph.D.

Tag: ciencia de datos

Conferencia ODSC APAC 2023

Conferencia ODSC APAC 2023

Conferencia ODSC, en línea (2023). Hemos llegado a un punto de inflexión tanto en la industria de la inteligencia artificial (IA) como en la sociedad en general, y la región APAC está en el epicentro de este cambio. Es por eso que la Open Data Science Conference Asia-Pacific (ODSC APAC) reúne a destacados expertos de todo el mundo para compartir conocimientos, herramientas y técnicas sobre las últimas tendencias en ciencia de datos e IA, como modelos de lenguajes grandes (LLM), análisis de datos, aprendizaje automático e IA responsable.

Día 1

Temas principales:

  • La revolución de la IA;
  • Datos espaciales en la nube;
  • Panorama de la IA generativa;
  • La IA en funciones de RRHH;
  • La IA generativa y el derecho.

Dia 2

Temas principales:

  • La frontera de la IA generativa (GenAI);
  • La IA responsable en la práctica;
  • Creación de una aplicación GenAI;
  • La IA generativa en la educación;
  • Los LLMs no son necesariamente de la GenAI.

Referencias

Artículos relacionados

Más información

ODSC - Open Data Science Conference
ODSC APAC Conference (conferencia ODSC APAC)

Google Cloud big data y aprendizaje automático

Google Cloud: big data y aprendizaje automático

Formación Coursera, MOOC (2020). Esta formación en línea presenta las capacidades de big data y aprendizaje automático (ML) de Google Cloud Platform (CGP). Mediante una combinación de presentaciones, demostraciones y laboratorios prácticos, la formación brinda una descripción general de Google Cloud y una vista detallada de las soluciones de procesamiento de datos y de ML, como BigQuery, Cloud SQL, Dataproc, Pub/Sub, Dataflow y Data Studio.

Semana 1: Big data y fundamentos de ML

Temas principales:

  • Explorar un conjunto de datos públicos BigQuery;
  • Elegir el enfoque de solución adecuado;
  • Recomendar productos con Cloud SQL y Spark;
  • Predecir las compras de visitantes con BigQuery ML.

Semana 2: Desafíos de la canalización de datos moderna

Temas principales:

  • Paneles de control IoT en tiempo real;
  • Crear una canalización de datos de transmisión;
  • ML en conjuntos de datos no estructurados;
  • Clasificación de imágenes con modelos ML prediseñados.

Referencias

Formación

Artículos relacionados

Más información

Fundamentos de Spark

Fundamentos de Spark

Formación Cognitive Class, MOOC (2020). Esta ruta de aprendizaje aborda los fundamentos de Apache Spark, un motor de código abierto para el procesamiento de datos a gran escala que está revolucionando el mundo de la analítica y del big data. Esta formación es una oportunidad para aprender de los líderes de la industria sobre Spark, que se basa en la velocidad, la facilidad de uso y el análisis, y brinda oportunidades y proyectos prácticos para generar confianza con el conjunto de herramientas de Spark.

Curso 1: Fundamentos de Spark I

Temas principales:

  • Introducción a Spark;
  • Resilient Distributed Dataset (RDD) y DataFrames;
  • Programación de aplicaciones Spark;
  • Introducción a las bibliotecas de Spark;
  • Configuración, seguimiento y puesta a punto de Spark.

Curso 2: Fundamentos de Spark II

Temas principales:

  • Introducción a los notebooks;
  • Arquitectura RDD;
  • Optimización de transformaciones y acciones;
  • Caché y serialización;
  • Desarrollo y pruebas.

Curso 3: Spark MLlib

Temas principales:

  • Tipos de datos Spark MLlib;
  • Revisión de algoritmos;
  • Árboles de decisión y bosques aleatorios;
  • Agrupamiento Spark MLlib.

Curso 4: Exploración de GraphX

Temas principales:

  • Introducción a Graph-Parallel;
  • Exploración de los operadores de gráficos;
  • Visualización y modificación de GraphX;
  • Agregación y almacenamiento en caché.

Curso 5: Big data en R con Spark

Temas principales:

  • Introducción a SparkR;
  • Manipulación de datos con SparkR;
  • Aprendizaje automático con SparkR.

Referencias

Formación

Spark fundamentals I (Fundamentos de Spark I, certificado del curso)
Spark – Level 1 (insignia de certificación)
Spark fundamentals II (Fundamentos de Spark II, certificado del curso)
Spark MLlib (certificado del curso)
Exploring GraphX (Exploración de GraphX, certificado del curso)
Big data in R using Spark (Big data en R con Spark, certificado del curso)
Spark - Level 2 (insignia de certificación)

Artículos relacionados

Fundamentos de Hadoop (formación Cognitive Class)
Especialización en ciencia de datos (formación Coursera)

Más información

Fundamentos de Hadoop

Fundamentos de Hadoop

Formación Cognitive Class, MOOC (2020). Esta ruta de aprendizaje presenta Hadoop, que es un marco de código abierto para el almacenamiento distribuido y el procesamiento de big data. La formación cubre contenido que es fundamental para el éxito de cualquier persona en este ámbito al explicar el diseño conceptual de Hadoop, presentar MapReduce, YARN (Yet Another Resource Negotiator) y Hive, y luego explicar cómo usar Hadoop y manipular datos sin el uso de codificación compleja.

Curso 1: Hadoop 101

Temas principales:

  • Introducción a Hadoop;
  • Arquitectura de Hadoop y HDFS;
  • Administración de Hadoop;
  • Componentes de Hadoop.

Curso 2: MapReduce y YARN

Temas principales:

  • Introducción a MapReduce y YARN;
  • Limitaciones de Hadoop v1 y MapReduce v1;
  • Arquitectura de YARN.

Curso 3: Movimiento de datos en Hadoop

Temas principales:

  • Escenarios de carga;
  • Uso de Sqoop;
  • Descripción general de Flume;
  • Uso de Data Click.

Curso 4: Acceso a datos de Hadoop usando Hive

Temas principales:

  • Introducción a Hive;
  • Hive DDL - Lenguaje de definición de datos;
  • Hive DML - Lenguaje de manipulación de datos;
  • Operadores y funciones de Hive.

Referencias

Formación

Hadoop 101 (certificado del curso)
Hadoop Foundations – Level 1 (insignia de certificación)
MapReduce and YARN (MapReduce y YARN, certificado del curso)
Hadoop Programming – Level 1 (insignia de certificación)
Moving data into Hadoop (Movimiento de datos en Hadoop, certificado del curso)
Hadoop Administration – Level 1 (insignia de certificación)
Accessing Hadoop data using Hive (Acceso a datos de Hadoop usando Hive, certificado del curso)
Hadoop Data Access – Level 1 (insignia de certificación)
Hadoop Foundations – Level 2 (insignia de certificación)

Artículos relacionados

Fundamentos de Spark (formación Cognitive Class)
Especialización en ciencia de datos (formación Coursera)

Más información

Azure: fundamentos, aprendizaje automático y Power BI

Azure: fundamentos, aprendizaje automático y Power BI

Formación Microsoft Docs, MOOC (2020). Estos 3 cursos en línea presentan Microsoft Azure y Power BI. La formación enseña los conceptos básicos de la nube, junto con ejercicios prácticos, y brinda una descripción general de los servicios de Azure, como Azure Machine Learning (ML), que es una plataforma en la nube para entrenar, desplegar, gestionar y monitorear modelos ML. Además, la formación explica cómo utilizar Power BI y crear informes de inteligencia empresarial.

Curso 1: Fundamentos de Azure

Temas principales:

  • Principios de la computación en la nube;
  • Arquitectura de Azure y garantías de servicio;
  • Computación, almacenamiento de datos y redes;
  • Seguridad, responsabilidad y confianza;
  • Estándares de infraestructura con Azure Policy;
  • Recursos de Azure con Azure Resource Manager.

Curso 2: Aprendizaje automático de Azure

Temas principales:

  • Trabajar con datos;
  • Orquestar ML con pipelines;
  • Implementar modelos ML;
  • Automatizar la selección del modelo;
  • Ajustar hiperparámetros;
  • Monitorear modelos y la deriva de datos.

Curso 3: Power BI

Temas principales:

  • Empezar a crear con Power BI;
  • Obtener datos con Power BI Desktop;
  • Modelar y explorar datos;
  • Utilizar elementos visuales, publicar y compartir.

Referencias

Formación

Microsoft Docs (insignias y trofeos)

Artículos relacionados

Más información

Microsoft Docs (Fundamentos de Azure)
Microsoft Docs (Aprendizaje automático de Azure)
Microsoft Docs (Power BI)