Ingeniería de Datos - Portfolio de Prácticas¶
Bienvenido a mi portfolio de Ingeniería de Datos. Este sitio documenta mi aprendizaje y desarrollo de habilidades en ciencia de datos, machine learning y análisis de datos. Aquí encontrarás prácticas organizadas por unidades temáticas, cubriendo desde análisis exploratorio hasta técnicas avanzadas de feature engineering.
📋 Estructura del Portfolio¶
El contenido está organizado en tres unidades progresivas:
Unidad 1: Análisis Exploratorio de Datos (EDA)¶
Fundamentos del análisis de datos, visualización y exploración de datasets. Incluye prácticas con Iris Dataset, Netflix y análisis multi-fuentes.
Unidad 2: Preprocesamiento y Transformación de Datos¶
Técnicas de limpieza, normalización y detección de sesgos. Aprende a manejar datos faltantes, escalar features y garantizar equidad en modelos.
Unidad 3: Feature Engineering Avanzado¶
Ingeniería de características, encoding, reducción de dimensionalidad y feature engineering temporal. Técnicas avanzadas para optimizar modelos de ML.
🛠️ Tecnologías Utilizadas¶
- Python: Lenguaje principal
- Pandas & NumPy: Manipulación de datos
- Scikit-learn: Machine Learning y preprocesamiento
- Matplotlib & Seaborn: Visualización
- Fairlearn: Análisis de equidad
- Category Encoders: Encoding avanzado
🎯 Objetivo¶
Este portfolio refleja mi camino de aprendizaje en ingeniería de datos, documentando el desarrollo de habilidades técnicas y la aplicación práctica de conceptos teóricos en proyectos reales.