Volver al inicio

Jupyter Notebooks

Colección de análisis de datos, experimentos de machine learning y proyectos de ciencia de datos desarrollados en Jupyter Notebooks. Cada notebook incluye código, visualizaciones y explicaciones detalladas.

Proyectos Destacados

Pump it Up: Data Mining the Water Table

Destacado

Modelo predictivo de Machine Learning desarrollado para la competencia de DrivenData. El objetivo es predecir qué bombas de agua están funcionales, necesitan reparación o no funcionan en Tanzania. El modelo Random Forest obtuvo un score de 0.7974, utilizando técnicas de feature engineering, oversampling (SMOTE) y análisis exploratorio de datos.

1 de mayo de 2024
Machine LearningRandom ForestClasificaciónSMOTEFeature EngineeringCompetitionDrivenData
PythonScikit-learnRandom ForestXGBoostSMOTEPandasMatplotlibSeabornPyCaret

Clasificación de Cyberbullying en Tweets

Destacado

Proyecto de clasificación de texto para detectar contenido de odio en tweets. Incluye análisis exploratorio, preprocesado de texto (normalización, lematización, eliminación de stopwords), vectorización con TF-IDF y embeddings, y entrenamiento de múltiples modelos de clasificación.

1 de marzo de 2024
NLPClasificación de TextoCyberbullyingTF-IDFWord EmbeddingsAnálisis de Sentimiento
PythonPandasScikit-learnNLTKTF-IDFWord EmbeddingsNLPClasificación de Texto

Análisis de Redes Sociales con NetworkX

Destacado

Análisis completo de una red social de Twitter extraída de cuentas de salud. Incluye análisis topológico (nodos, aristas, usuarios más influyentes), análisis de conectividad, métricas de centralidad (cercanía, intermediación, PageRank) y visualización de la red.

1 de abril de 2024
Análisis de RedesNetworkXGrafosPageRankCentralidadRedes Sociales
PythonNetworkXMatplotlibPandasAnálisis de RedesGrafosPageRankCentralidad

Práctica de Minería de Datos

Destacado

Práctica completa de Minería de Datos trabajando con el dataset FEV (Forced Expiratory Volume). Incluye análisis exploratorio, preprocesado de datos, análisis de asociación entre variables, y construcción de modelos predictivos.

1 de febrero de 2024
Minería de DatosAnálisis ExploratorioModelado PredictivoAnálisis EstadísticoFEV
PythonPandasScikit-learnMatplotlibSeabornScipyMinería de DatosAnálisis Estadístico