Jupyter Notebooks

Colección de análisis de datos, experimentos de machine learning y proyectos de ciencia de datos desarrollados en Jupyter Notebooks. Cada notebook incluye código, visualizaciones y explicaciones detalladas.

Proyectos Destacados

Pump it Up: Data Mining the Water Table

Destacado

Modelo predictivo de Machine Learning desarrollado para la competencia de DrivenData. El objetivo es predecir qué bombas de agua están funcionales, necesitan reparación o no funcionan en Tanzania. El modelo Random Forest obtuvo un score de 0.7974, utilizando técnicas de feature engineering, oversampling (SMOTE) y análisis exploratorio de datos.

1 de mayo de 2024

Machine LearningRandom ForestClasificaciónSMOTEFeature EngineeringCompetitionDrivenData

PythonScikit-learnRandom ForestXGBoostSMOTEPandasMatplotlibSeabornPyCaret

Ver Notebook Interactivo GitHub GitHub

Clasificación de Cyberbullying en Tweets

Destacado

Proyecto de clasificación de texto para detectar contenido de odio en tweets. Incluye análisis exploratorio, preprocesado de texto (normalización, lematización, eliminación de stopwords), vectorización con TF-IDF y embeddings, y entrenamiento de múltiples modelos de clasificación.

1 de marzo de 2024

NLPClasificación de TextoCyberbullyingTF-IDFWord EmbeddingsAnálisis de Sentimiento

PythonPandasScikit-learnNLTKTF-IDFWord EmbeddingsNLPClasificación de Texto

Ver Notebook Interactivo GitHub GitHub

Análisis de Redes Sociales con NetworkX

Destacado

Análisis completo de una red social de Twitter extraída de cuentas de salud. Incluye análisis topológico (nodos, aristas, usuarios más influyentes), análisis de conectividad, métricas de centralidad (cercanía, intermediación, PageRank) y visualización de la red.

1 de abril de 2024

Análisis de RedesNetworkXGrafosPageRankCentralidadRedes Sociales

PythonNetworkXMatplotlibPandasAnálisis de RedesGrafosPageRankCentralidad

Ver Notebook Interactivo GitHub GitHub

Práctica de Minería de Datos

Destacado

Práctica completa de Minería de Datos trabajando con el dataset FEV (Forced Expiratory Volume). Incluye análisis exploratorio, preprocesado de datos, análisis de asociación entre variables, y construcción de modelos predictivos.

1 de febrero de 2024

Minería de DatosAnálisis ExploratorioModelado PredictivoAnálisis EstadísticoFEV

PythonPandasScikit-learnMatplotlibSeabornScipyMinería de DatosAnálisis Estadístico

Ver Notebook Interactivo GitHub GitHub