Objetivo
Proporcionar a los participantes de un entendimiento sobre la aplicación estratégica de la ciencia de datos en contextos empresariales. Enfatizando la importancia de identificar necesidades de negocio, desarrollar casos de uso pertinentes y emplear diferentes tipos de analíticas.
- Necesidades del negocio
- Casos de Usos
- Analítica: descriptiva, diagnóstica, predictiva y prescriptiva
- Entendimiento de los datos
- Planificación de proyectos
- Comunicación de resultados
- Data Business Transformation
Objetivo
Introducir a los participantes en los conceptos de programación con Python. Comprensión de sintaxis, estructuras de datos, control de flujos, operaciones de Python, así como diferentes librerías necesarias para modelar, analizar y visualizar información obtenida de los datos.
- Conceptos fundamentales de la Ciencia de Datos
- Definición y avances de Ciencia de Datos
- Python y lenguajes de programación para la Ciencia de Datos
- IDEs actuales para el desarrollo de la Ciencia de Datos
- Python y Colab
- Fundamentos de Python
- Syntaxis, tipos de datos, variables
- Creación de funciones
- Funciones repetitivas
- Estructuras de control: Condicionales, bucle
- Librerías en Python
- Librería Matplotlib
- Librería Pandas
- Librería Seaborn
- Librería Scikit-learn
- Otras Librerías
- Preparación de datos
- Definición de variables
- Listas y estructuras
- Gestión de datos con librerías Numpy y Pandas
- Modelado y visualización de datos
- Selección del tipo de modelo (librerías)
- Librerías para diferentes tipos de análisis: NumPy, Matplotlib, Seaborn, SciPy
- Librerías para Machine Learning: Scikit-learn, Tensorflow
- Análisis de datos
- Visualización de datos y gráficos estadísticos con Matplotlib y Seaborn
Caso práctico
Utilizar Python y sus librerías para realizar un análisis exploratorio de datos que incluye carga de datos, inspección inicial, manipulación de datos y finalmente la visualización.
Objetivo
Desarrollar un entendimiento profundo de los conceptos estadísticos fundamentales y su aplicación en la ciencia de datos. Este módulo está diseñado para enseñar a los participantes cómo preparar, analizar y interpretar datos utilizando métodos estadísticos, con el objetivo de apoyar la toma de decisiones empresariales efectivas. Se enfocará en técnicas descriptivas e inferenciales, con ejemplos prácticos usando Python.
- Estadística descriptiva
- Introducción a la estadística: Población y Muestra
- Tipos de variables y escalas de medición
- Datos agrupados y tabla de frecuencias
- Preparación de datos
- Transformación de datos y discretización
- Limpieza de datos
- Identificación de Outliers
- Análisis descriptivo
- Medidas de tendencia central: Media, Mediana y Moda
- Medidas de dispersion: Rango , Cuantiles , Varianza y desviación estándar
- Elaboracion de histogramas, gráficos de caja.
- ¿Cuándo usar? ¿Qué preguntas responde?
- Inferencia estadística
- Relación entre variables cuantitativas: coeficiente de correlación
- Relación entre variables cualitativas: Prueba chi cuadrado
- Pruebas de hipótesis y su aplicación en la toma de decisiones.
- ¿Cuándo usar? ¿Qué preguntas responde?
Caso práctico
Desarrollo de análisis estadístico completo desde la recolección de datos hasta las conclusiones, utilizando Python para manejar datos reales y simular decisiones basadas en análisis estadísticos.
Objetivo
Desarrollar habilidades en la selección, implementación y evaluación de modelos analíticos avanzados, con un enfoque en cómo estos modelos pueden ser aplicados para resolver problemas reales de negocio y mejorar la toma de decisiones basada en datos.
Los participantes aprenderán a equilibrar la complejidad del modelo con la interpretabilidad y la relevancia para los objetivos comerciales.
- Introducción a las metodologías para el desarrollo de modelos
- ¿Qué son las metodologías para el desarrollo de modelos?
- Ventajas y desventajas de cada metodología
- Ejemplo de metodologías: CRISP-DM
- Regresión lineal simple
- Definición y supuestos de la regresión lineal simple
- Interpretación de los coeficientes de regresión
- Evaluación de la bondad de ajuste del modelo
- Regresión lineal múltiple
- Definición y supuestos de la regresión lineal múltiple
- Selección de variables y ajuste del modelo
- Evaluación de la bondad de ajuste del modelo
- Estimación de modelos
- Selección de variables explicativas
- Estimación del modelo de regresión
- Análisis de Residuos
- Validación de modelos
- Validación cruzada y particionamiento de datos
- Métricas de evaluación de modelos: R2, MAE, RMSE, etc.
- Interpretación de las métricas de evaluación de modelos
- Regularización en modelos de regresión
- Regresión ridge y lasso
- Selección del parámetro de regularización
- Efectos de la regularización en los coeficientes del modelo
- Modelos de regresión no lineal
- Definición y ejemplos de modelos de regresión no lineal
- Métodos de ajuste de modelos no lineales
- Evaluación de la bondad de ajuste en modelos no lineales
- Selección de modelos
- Métodos de selección de modelos: MSE, MAPE, AIC, BIC, etc.
- Comparación de modelos y selección del mejor modelo
- Interpretabilidad vs. complejidad del modelo
- Implementación de modelos
- Implementación de modelos
- Integración de modelos en los proceso de negocio
- Consideraciones prácticas para la implementación de modelos
- Monitoreo de modelos
- Monitoreo del rendimiento de modelos en producción
- Detección y diagnóstico de problemas en modelos
- Actualización y reentrenamiento de modelos en producción
Caso Práctico
Desarrollo de un caso que abarca el proceso de modelado, desde la recopilación de datos hasta la implementación y monitoreo del modelo en un contexto de negocio realista.
Objetivo
Capacitar a los participantes en los principios y técnicas de Machine Learning e Inteligencia Artificial, con un enfoque en la aplicación práctica y la integración de estos modelos para mejorar la toma de decisiones en entornos empresariales.
Los participantes aprenderán a elegir, implementar y evaluar modelos de Machine Learning usando Python, con especial atención en cómo estos modelos pueden ser definidos para lograr objetivos de negocio específicos.
- Definición de Inteligencia Artificial y Machine Learning
- Introducción
- Definiciones
- Conceptos
- Procesos y Aplicaciones
- Tipos de Aprendizaje
- Aprendizaje Supervisado
- Regresión logística
- Introducción y Definición
- Supuestos del modelo
- Formulación del modelo
- Estimación de parámetros
- Aplicación
- Validación de modelos de Aprendizaje Supervisado
- Matriz de Confusión
- GINI
- K-S
- ROC
- Sensibilidad
- Especificidad
- Aprendizaje Supervisado
- Arboles de Clasificación
- Random forest
- SVM ( Máquinas de Soporte Vectorial)
- Naive Bayes
- Aplicaciones
- Aprendizaje Supervisado
- La Neurona
- Funcionanamiento
- Arquitectura
- Perceptron
- Funciones de Activacion
- Aplicación
- Aprendizaje No Supervisado
- Agrupamiento K-means
- Componentes Principales
- Aplicaciones
- Fundamentos de Deep Learning
- Perceptron Multicapa
- Aplicación Global del Mejor Modelo
Caso Práctico
Desarrollo de un proyecto de Machine Learning desde el análisis de datos hasta la implementación y evaluación de un modelo seleccionado, utilizando los conceptos aprendidos.
Caso Práctico
Desarrollo de un proyecto de Machine Learning desde el análisis de datos hasta la implementación y evaluación de un modelo seleccionado, utilizando los conceptos aprendidos.