# 📊 Estadística y Machine Learning G9 - ONE

## 📖 Descripción

Formación completa e integral en **Estadística y Machine Learning** que te capacitará para dominar el análisis de datos y la construcción de modelos predictivos. Desde fundamentos estadísticos hasta algoritmos avanzados de Machine Learning, esta ruta te llevará a ser un científico de datos competente.

Esta formación es parte del programa **Oracle Next Education (ONE)** en colaboración con **Alura LATAM**, diseñada para usuarios que desean incursionar en el campo del Data Science.

---

## 🎯 ¿Qué vas a aprender?

✅ **Fundamentos de Estadística:**
- Medidas de tendencia central y dispersión
- Distribuciones de probabilidad
- Inferencia estadística
- Análisis de datos

✅ **Modelado Predictivo:**
- Regresión lineal
- Técnicas avanzadas de modelado
- Interpretación de coeficientes
- Evaluación de modelos

✅ **Machine Learning:**
- Algoritmos de clasificación
- Validación de modelos
- Métricas de evaluación
- Optimización de hiperparámetros

✅ **Aplicación Práctica:**
- Análisis exploratorio de datos (EDA)
- Ingeniería de features
- Pipelines de procesamiento
- Proyectos reales completos

---

## 👨‍🏫 Instructores Principales

- **Erika Bellido Alarcón**
- **Álvaro Hernando Camacho Díaz**
- **Wilfredo Antonio Rojas Camejo**
- **Alia Garrudo Guirado**

---

## 📚 Estructura de la Formación

### 1. 📊 Estadística Fundamental

**Estadística con Python: Frecuencias y Medidas**
- Interpretación de estadísticas
- Medidas de tendencia central
- Organización de datos
- Dispersión y variabilidad

**Estadística con Python: Probabilidad y Muestreo**
- Distribuciones de probabilidad
- Niveles e intervalos de confianza
- Técnicas de muestreo
- Cálculo de tamaño de muestra

---

### 2. 📈 Regresión Lineal

**Data Science: Probando Relaciones con Regresión Lineal**
- Identificación de relaciones
- Construcción de modelos
- Interpretación de coeficientes
- Evaluación con R²

**Regresión Lineal: Técnicas Avanzadas de Modelado**
- Transformaciones de datos
- Statsmodels vs Scikit-learn
- Regresión polinomial
- Análisis gráfico de resultados

---

### 3. 🤖 Machine Learning: Clasificación

**Clasificación: Aprendiendo a Clasificar Datos**
- Análisis exploratorio de datos
- Transformación de variables categóricas
- Entrenamiento de modelos
- Predicciones y almacenamiento

**Clasificación: Validación de Modelos y Métricas**
- Hold-out y validación cruzada
- Matriz de confusión
- Métricas de desempeño
- Balanceo de datos
- Pipelines correctos

---

### 4. ✈️ Proyecto Aplicado: Predicción de Atrasos de Vuelos

**IA Aumentada: Previsión de Atrasos de Vuelos**
- Visualización de datos profesional
- Codificación de variables
- Modelos DummyRegressor y RandomForest
- Análisis de métricas
- Selección de features
- Optimización de hiperparámetros

---

## 🛠️ Tecnologías Principales

- **Python 3.x** - Lenguaje principal
- **Pandas** - Manipulación de datos
- **NumPy** - Cálculos numéricos
- **Scikit-learn** - Machine Learning
- **Statsmodels** - Análisis estadístico
- **Matplotlib/Seaborn** - Visualización
- **Jupyter Notebook** - Entorno interactivo
- **SciPy** - Funciones científicas

---

## 📋 Plan de Estudio Recomendado

1. **Semana 1-2:** Estadística Fundamental
   - Frecuencias y medidas
   - Probabilidad y muestreo

2. **Semana 3-4:** Regresión Lineal
   - Identificación de relaciones
   - Técnicas avanzadas

3. **Semana 5-6:** Clasificación Básica
   - Algoritmos de clasificación
   - Primeras predicciones

4. **Semana 7-8:** Validación y Evaluación
   - Métricas correctas
   - Validación rigurosa

5. **Semana 9-10:** Proyecto Práctico
   - Predicción de atrasos
   - Optimización final

---

## 📖 Estructura de Carpetas

```
formacion-estadisticas-y-machine-learning-grupo9-one/
├── README.md (este archivo)
├── 01-estadistica-python-frecuencias-medidas/
├── 02-estadistica-python-probabilidad-muestreo/
├── 03-data-science-probando-relaciones-regresion-lineal/
├── 04-regresion-lineal-tecnicas-avanzadas-de-modelado/
├── 05-clasificacion-aprendiendo-clasificar-datos-machine-learning/
├── 06-clasificacion-validacion-modelos-metricas-evaluacion/
└── 07-ia-aumentada-prevision-atrasos-vuelos/
```

---

## 📝 Requisitos Previos

- ✓ Python 3.7+
- ✓ Conocimientos básicos de programación
- ✓ Conceptos matemáticos básicos
- ✓ Motivación para aprender Data Science

---

## 💡 Recursos Adicionales

📌 **Plan de Estudio oficial:** [Tablero Trello](https://trello.com/b/0WN5oLyo/formacion-estatistica-y-machine-learning)

📌 **Documentación útil:**
- [Pandas Documentation](https://pandas.pydata.org/)
- [Scikit-learn Guide](https://scikit-learn.org/)
- [NumPy Manual](https://numpy.org/)

---

## 🎓 Certificación

Al completar esta formación, habrás desarrollado:
- ✅ Sólidos fundamentos en estadística
- ✅ Capacidad para construir modelos predictivos
- ✅ Experiencia en Machine Learning práctico
- ✅ Portfolio con proyectos reales

---

## 👨‍💻 Autor

**MiyoBran** - Proyecto desarrollado como parte de la formación en Estadística y Machine Learning de Oracle Next Education (ONE) en colaboración con Alura LATAM.

---

## 📄 Licencia

Este proyecto está bajo la licencia MIT. Ver `LICENSE` para más detalles.

---

**Última actualización:** Febrero 2026