Jupyter Notebooks
Colección de análisis de datos, experimentos de machine learning y proyectos de ciencia de datos desarrollados en Jupyter Notebooks. Cada notebook incluye código, visualizaciones y explicaciones detalladas.
Proyectos Destacados
Pump it Up: Data Mining the Water Table
DestacadoModelo predictivo de Machine Learning desarrollado para la competencia de DrivenData. El objetivo es predecir qué bombas de agua están funcionales, necesitan reparación o no funcionan en Tanzania. El modelo Random Forest obtuvo un score de 0.7974, utilizando técnicas de feature engineering, oversampling (SMOTE) y análisis exploratorio de datos.
Clasificación de Cyberbullying en Tweets
DestacadoProyecto de clasificación de texto para detectar contenido de odio en tweets. Incluye análisis exploratorio, preprocesado de texto (normalización, lematización, eliminación de stopwords), vectorización con TF-IDF y embeddings, y entrenamiento de múltiples modelos de clasificación.
Análisis de Redes Sociales con NetworkX
DestacadoAnálisis completo de una red social de Twitter extraída de cuentas de salud. Incluye análisis topológico (nodos, aristas, usuarios más influyentes), análisis de conectividad, métricas de centralidad (cercanía, intermediación, PageRank) y visualización de la red.
Práctica de Minería de Datos
DestacadoPráctica completa de Minería de Datos trabajando con el dataset FEV (Forced Expiratory Volume). Incluye análisis exploratorio, preprocesado de datos, análisis de asociación entre variables, y construcción de modelos predictivos.