Facultad de Ingeniería

Programa especializado en Data Science - Decisiones basadas en datos (Online)

  • Inicio
  • Ingeniería
  • Programa especializado en Data Science – Decisiones basadas en datos (Online)

Introducción: Introducción (3 horas)

Objetivo

Proporcionar a los participantes de un entendimiento sobre la aplicación estratégica de la ciencia de datos en contextos empresariales. Enfatizando la importancia de identificar necesidades de negocio, desarrollar casos de uso pertinentes y emplear diferentes tipos de analíticas.

  1. Necesidades del negocio
  2. Casos de Usos
  3. Analítica: descriptiva, diagnóstica, predictiva y prescriptiva
  4. Entendimiento de los datos
  5. Planificación de proyectos
  6. Comunicación de resultados
  7. Data Business Transformation

Módulo I. Programación para Ciencia de Datos (15 horas)

Objetivo

Introducir a los participantes en los conceptos de programación con Python. Comprensión de sintaxis, estructuras de datos, control de flujos, operaciones de Python, así como diferentes librerías necesarias para modelar, analizar y visualizar información obtenida de los datos.

  1. Conceptos fundamentales de la Ciencia de Datos
    • Definición y avances de Ciencia de Datos
    • Python y lenguajes de programación para la Ciencia de Datos
    • IDEs actuales para el desarrollo de la Ciencia de Datos
    • Python y Colab
  2. Fundamentos de Python
    • Syntaxis, tipos de datos, variables
    • Creación de funciones
    • Funciones repetitivas
    • Estructuras de control: Condicionales, bucle
  3. Librerías en Python
    • Librería Matplotlib
    • Librería Pandas
    • Librería Seaborn
    • Librería Scikit-learn
    • Otras Librerías
  4. Preparación de datos
    • Definición de variables
    • Listas y estructuras
    • Gestión de datos con librerías Numpy y Pandas
  5. Modelado y visualización de datos
    • Selección del tipo de modelo (librerías)
    • Librerías para diferentes tipos de análisis: NumPy, Matplotlib, Seaborn, SciPy
    • Librerías para Machine Learning: Scikit-learn, Tensorflow
    • Análisis de datos
    • Visualización de datos y gráficos estadísticos con Matplotlib y Seaborn

Caso práctico
Utilizar Python y sus librerías para realizar un análisis exploratorio de datos que incluye carga de datos, inspección inicial, manipulación de datos y finalmente la visualización.

Módulo II: Estadística para Ciencia de Datos (12 horas)

Objetivo

Desarrollar un entendimiento profundo de los conceptos estadísticos fundamentales y su aplicación en la ciencia de datos. Este módulo está diseñado para enseñar a los participantes cómo preparar, analizar y interpretar datos utilizando métodos estadísticos, con el objetivo de apoyar la toma de decisiones empresariales efectivas. Se enfocará en técnicas descriptivas e inferenciales, con ejemplos prácticos usando Python.

  1. Estadística descriptiva
    • Introducción a la estadística: Población y Muestra
    • Tipos de variables y escalas de medición
    • Datos agrupados y tabla de frecuencias
  2. Preparación de datos
    • Transformación de datos y discretización
    • Limpieza de datos
    • Identificación de Outliers
  3. Análisis descriptivo
    • Medidas de tendencia central: Media, Mediana y Moda
    • Medidas de dispersion: Rango , Cuantiles , Varianza y desviación estándar
    • Elaboracion de histogramas, gráficos de caja.
    • ¿Cuándo usar? ¿Qué preguntas responde?
  4. Inferencia estadística
    • Relación entre variables cuantitativas: coeficiente de correlación
    • Relación entre variables cualitativas: Prueba chi cuadrado
    • Pruebas de hipótesis y su aplicación en la toma de decisiones.
    • ¿Cuándo usar? ¿Qué preguntas responde?

Caso práctico
Desarrollo de análisis estadístico completo desde la recolección de datos hasta las conclusiones, utilizando Python para manejar datos reales y simular decisiones basadas en análisis estadísticos.

Título del spoiler

Objetivo

Desarrollar habilidades en la selección, implementación y evaluación de modelos analíticos avanzados, con un enfoque en cómo estos modelos pueden ser aplicados para resolver problemas reales de negocio y mejorar la toma de decisiones basada en datos.
Los participantes aprenderán a equilibrar la complejidad del modelo con la interpretabilidad y la relevancia para los objetivos comerciales.

  1. Introducción a las metodologías para el desarrollo de modelos
    • ¿Qué son las metodologías para el desarrollo de modelos?
    • Ventajas y desventajas de cada metodología
    • Ejemplo de metodologías: CRISP-DM
  2. Regresión lineal simple
    • Definición y supuestos de la regresión lineal simple
    • Interpretación de los coeficientes de regresión
    • Evaluación de la bondad de ajuste del modelo
  3. Regresión lineal múltiple
    • Definición y supuestos de la regresión lineal múltiple
    • Selección de variables y ajuste del modelo
    • Evaluación de la bondad de ajuste del modelo
  4. Estimación de modelos
    • Selección de variables explicativas
    • Estimación del modelo de regresión
    • Análisis de Residuos
  5. Validación de modelos
    • Validación cruzada y particionamiento de datos
    • Métricas de evaluación de modelos: R2, MAE, RMSE, etc.
    • Interpretación de las métricas de evaluación de modelos
  6. Regularización en modelos de regresión
    • Regresión ridge y lasso
    • Selección del parámetro de regularización
    • Efectos de la regularización en los coeficientes del modelo
  7. Modelos de regresión no lineal
    • Definición y ejemplos de modelos de regresión no lineal
    • Métodos de ajuste de modelos no lineales
    • Evaluación de la bondad de ajuste en modelos no lineales
  8. Selección de modelos
    • Métodos de selección de modelos: MSE, MAPE, AIC, BIC, etc.
    • Comparación de modelos y selección del mejor modelo
    • Interpretabilidad vs. complejidad del modelo
  9. Implementación de modelos
    • Implementación de modelos
    • Integración de modelos en los proceso de negocio
    • Consideraciones prácticas para la implementación de modelos
  10. Monitoreo de modelos
    • Monitoreo del rendimiento de modelos en producción
    • Detección y diagnóstico de problemas en modelos
    • Actualización y reentrenamiento de modelos en producción

Caso Práctico
Desarrollo de un caso que abarca el proceso de modelado, desde la recopilación de datos hasta la implementación y monitoreo del modelo en un contexto de negocio realista.

Módulo IV: Machine Learning e introducción a la Inteligencia Artificial (20 horas)

Objetivo

Capacitar a los participantes en los principios y técnicas de Machine Learning e Inteligencia Artificial, con un enfoque en la aplicación práctica y la integración de estos modelos para mejorar la toma de decisiones en entornos empresariales.
Los participantes aprenderán a elegir, implementar y evaluar modelos de Machine Learning usando Python, con especial atención en cómo estos modelos pueden ser definidos para lograr objetivos de negocio específicos.

  1. Definición de Inteligencia Artificial y Machine Learning
    • Introducción
    • Definiciones
    • Conceptos
    • Procesos y Aplicaciones
    • Tipos de Aprendizaje
  2. Aprendizaje Supervisado
    • Regresión logística
    • Introducción y Definición
    • Supuestos del modelo
    • Formulación del modelo
    • Estimación de parámetros
    • Aplicación
  3. Validación de modelos de Aprendizaje Supervisado
    • Matriz de Confusión
    • GINI
    • K-S
    • ROC
    • Sensibilidad
    • Especificidad
  4. Aprendizaje Supervisado
    • Arboles de Clasificación
    • Random forest
    • SVM ( Máquinas de Soporte Vectorial)
    • Naive Bayes
    • Aplicaciones
  5. Aprendizaje Supervisado
    • La Neurona
    • Funcionanamiento
    • Arquitectura
    • Perceptron
    • Funciones de Activacion
    • Aplicación
  6. Aprendizaje No Supervisado
    • Agrupamiento K-means
    • Componentes Principales
    • Aplicaciones
  7. Fundamentos de Deep Learning
    • Perceptron Multicapa
  8. Aplicación Global del Mejor Modelo

Caso Práctico

Desarrollo de un proyecto de Machine Learning desde el análisis de datos hasta la implementación y evaluación de un modelo seleccionado, utilizando los conceptos aprendidos.

 

Caso Práctico

Desarrollo de un proyecto de Machine Learning desde el análisis de datos hasta la implementación y evaluación de un modelo seleccionado, utilizando los conceptos aprendidos.