Nuestro universo de datos

Bienvenido a mi galería de proyectos, donde cada desafío se transforma en una oportunidad para innovar. Aquí verás cómo convertí datos complejos en soluciones claras y decisiones estratégicas. Descubre el impacto de mi trabajo y cómo contribuí al éxito empresarial.

Proyecto 1: Limpieza y resumen de datos en hojas de cálculo

En este proyecto trabajé como analista de datos junior para la empresa ficticia VentaExpress, una plataforma de comercio electrónico especializada en productos tecnológicos como laptops, smartphones, auriculares y tablets.

El objetivo fue analizar los datos de ventas del cuarto trimestre de 2024 (octubre–diciembre) en México y Colombia para generar un informe que ayudara al equipo directivo a comprender el desempeño comercial y tomar decisiones estratégicas.

El dataset inicial (ventas_q4_2024_raw.csv) contenía información sin procesar, con problemas comunes en datos reales como formatos inconsistentes, valores duplicados, datos faltantes y columnas desorganizadas.

Descripción, objetivo del análisis y Resultado

En este proyecto realicé un proceso completo de limpieza, transformación y análisis de datos de ventas para identificar insights relevantes que apoyaran la toma de decisiones del negocio.

Primero realicé la preparación del dataset, eliminando registros duplicados, corrigiendo formatos inconsistentes y gestionando valores faltantes para garantizar la calidad de los datos. Posteriormente transformé la información mediante la estandarización de fechas y categorías, creación de nuevas variables y reorganización de columnas para facilitar el análisis.

A través del análisis exploratorio, calculé métricas clave como ventas totales, volumen por producto y distribución por ciudad. Esto permitió detectar patrones de demanda, productos más vendidos y mercados con mayor actividad comercial durante el trimestre.

Finalmente desarrollé visualizaciones claras y accionables que resumen los hallazgos principales y facilitan su interpretación para stakeholders.

Resultado: un dataset limpio y estructurado junto con un reporte visual que permite identificar oportunidades para optimizar inventario, mejorar estrategias de marketing y priorizar los mercados más rentables.

Herramientas: Google Sheets · Limpieza de datos · Análisis exploratorio · Visualización de métricas de negocio.

Evidencia 

Proyecto 2: Análisis Financiero y KPIs de Rentabilidad por País

En este proyecto desarrollé un análisis financiero para evaluar el desempeño de ventas internacionales, integrando ingresos, costos operativos e inversión en marketing con el objetivo de medir la rentabilidad real por país.

El desafío consistía en transformar datos transaccionales en indicadores financieros estratégicos que permitieran entender no solo cuánto se vende, sino qué tan rentable es cada mercado.

Proceso Analítico

Consolidación financiera por país
Agrupé los datos para calcular el total de ingresos y costos por territorio, permitiendo visualizar el tamaño comercial de cada mercado y ordenar los países según su volumen de ventas.

Integración del gasto en marketing
Incorporé la inversión en campañas mediante un proceso de unión de datos (LEFT JOIN), logrando analizar ventas, costos y gasto publicitario de forma comparativa.

Cálculo de KPIs clave
Transformé los datos en métricas que hablan el lenguaje financiero:

  • Beneficio Bruto → Ganancia antes de marketing.

  • Margen % → Eficiencia de ventas por país.

  • ROI % → Rentabilidad de la inversión en campañas.

Herramientas y habilidades aplicadas

 

  • SQL / Análisis en hojas de cálculo

  • Agrupación y agregación de datos

  • Cálculo de KPIs financieros

  • Integración de datasets (JOIN)

  • Análisis de rentabilidad y ROI

  • Business Analytics


 

Principales Hallazgos

El análisis permitió identificar:
• Países con alto volumen de ventas pero bajo margen, revelando oportunidades de optimización de costos.
• Mercados con ROI positivo en campañas, indicando eficiencia en inversión publicitaria.
• Territorios donde la inversión en marketing no se traducía proporcionalmente en rentabilidad.

Impacto del Proyecto

Este análisis permitió pasar de métricas básicas de ventas a una visión financiera integral, ayudando a responder preguntas estratégicas como:

  • ¿Qué países generan mayor rentabilidad real?

  • ¿Dónde es más eficiente invertir en marketing?

  • ¿Qué mercados requieren ajustes en costos o estrategia comercial?

El resultado fue un dashboard financiero estructurado que facilita la toma de decisiones basadas en datos.

Proyecto 5: Movilidad urbana y productividad económica en ciudades de LATAM

Contexto del proyecto

En este proyecto trabajé como analista de datos para el Latin American Development Bank, con el objetivo de evaluar cómo la congestión urbana y los tiempos de viaje se relacionan con la productividad económica en las principales ciudades de América Latina.

El propósito era identificar qué ciudades deberían priorizar inversión en infraestructura de transporte para mejorar su competitividad y bienestar social.

Para ello, integré dos fuentes de datos reales:

  • TomTom Traffic Index → indicadores de congestión, retrasos y tiempos de viaje.

  • OECD Cities → PIB per cápita, desempleo, contaminación y población.

Objetivo del análisis

Construir un dataset unificado y limpio para el año 2024 que permitiera responder preguntas clave de negocio:

  • ¿Qué ciudades presentan alta congestión y baja productividad económica?

  • ¿Cuáles combinan movilidad eficiente con economías sólidas?

  • ¿Qué variables muestran mayor relación con el desarrollo urbano?

Proceso Analítico

El proyecto siguió un flujo estructurado de análisis de datos:

Limpieza y estandarización

  • Corrección de formatos de fecha y tipos de datos.

  • Estandarización de nombres de ciudades y países.

  • Validación de consistencia entre ambas fuentes.

Agregación de datos de tráfico

  • Consolidación de múltiples registros diarios por ciudad.

  • Cálculo de promedios anuales de congestión y retrasos.

  • Extracción del año y filtrado para 2024.

Integración de datasets

  • Unión de tráfico y economía mediante claves ciudad–año.

  • Construcción de una tabla final con una fila por ciudad.

Análisis exploratorio y visualización

  • Comparación entre PIB per cápita y niveles de congestión.

  • Evaluación de relación entre desempleo y movilidad.

  • Identificación de patrones y posibles correlaciones.

Herramientas utilizadas

Python
Pandas
NumPy
Seaborn
Matplotlib
Jupyter Notebook

Principales Hallazgos

El análisis permitió identificar:

• Ciudades con alta congestión y menor productividad, que podrían beneficiarse de inversión en transporte.
• Ciudades con movilidad más eficiente y economías más sólidas, mostrando posibles modelos de referencia regional.
• Una relación observable entre mayores niveles de congestión y menores indicadores económicos en ciertos casos, aunque no uniforme en toda la región.

Impacto del Proyecto

Este proyecto demuestra la capacidad de:

  • Integrar múltiples fuentes de datos reales.

  • Construir datasets analíticos desde cero.

  • Traducir variables técnicas en insights estratégicos.

  • Conectar análisis de datos con decisiones de política pública e inversión.

El resultado final fue un dataset limpio y documentado, listo para análisis futuros, acompañado de visualizaciones que facilitan la interpretación ejecutiva.

Proyecto 4: Análisis de embudo y retención para MercadoLibre - Resumen ejecutivo

Este proyecto analiza el comportamiento de los usuarios dentro del embudo de conversión y su retención a lo largo del tiempo en la plataforma de MercadoLibre.
El análisis abarca cohortes de usuarios durante distintos periodos de 2025, evaluando tanto el desempeño global como segmentado por país.

Objetivo del análisis

Proceso analítico

Identificar los puntos críticos de abandono dentro del embudo de conversión y evaluar la retención de usuarios por cohortes y países, con el fin de proponer acciones que mejoren la conversión y la fidelización.

Impacto del proyecto

Este análisis permite identificar oportunidades claras de mejora en dos áreas clave:

  • Optimización del funnel
    • Reducir fricciones en etapas finales del proceso de compra.
  • Mejora en retención
    • Diseñar estrategias enfocadas en mantener el engagement después de la primera semana.

Las recomendaciones derivadas pueden contribuir directamente a:

  • Incrementar la tasa de conversión.
  • Aumentar el valor de vida del cliente (LTV).
  • Mejorar la experiencia del usuario.
  1. Análisis del embudo de conversión
    • Evaluación de cada etapa del funnel desde la selección de producto hasta la compra.
    • Cálculo de tasas de conversión generales y por país.
  2. Segmentación geográfica
    • Comparación del desempeño del embudo en distintos países para detectar variaciones.
  3. Análisis de retención
    • Medición de retención en distintos periodos (D7, D14, D21, D28).
    • Evaluación por país y por cohortes de adquisición.
  4. Identificación de patrones
    • Detección de cohortes con mejor y peor desempeño en retención.
    • Relación entre comportamiento inicial y retención a largo plazo.

Principales hallazgos

  • Embudo de conversión
    • La conversión final a compra es baja (~1.25%), lo que indica una caída significativa en las últimas etapas.
    • Existe una fricción importante en la etapa previa a la compra (posiblemente en la página de producto o checkout).
  • Desempeño por país
    • Países como Uruguay y Bolivia presentan mejores tasas de conversión a compra.
    • Argentina muestra uno de los niveles más bajos de conversión.
  • Retención de usuarios
    • La retención en los primeros 7 días es alta (superior al 80% en varios países).
    • Sin embargo, hay una caída considerable hacia el día 28 (alrededor de 2–3%).
  • Análisis por cohortes
    • Las cohortes de marzo y mayo presentan mejor retención en el día 21 (~26%).
    • La cohorte de abril muestra una caída más pronunciada en comparación con otras.

Herramientas utilizadas

  • Excel (análisis de datos, tablas dinámicas, cohortes)
  • Análisis de embudos (funnel analysis)
  • Análisis de cohortes y retención
  • Pensamiento analítico orientado a negocio

Informe Ejecutivo (C → F → I)

Contexto:

Se analizó el embudo de conversión y la retención de usuarios en MercadoLibre durante distintos cohortes de 2025, incluyendo segmentación por país.

Implicaciones (acciones concretas)

 

  • Optimizar la experiencia en la página de producto y checkout para reducir fricción.
  • Implementar estrategias de onboarding más efectivas en los primeros días.
  • Activar notificaciones y recordatorios para mantener el engagement.
  • Diseñar incentivos o recompensas tempranas para mejorar la retención después de la primera semana.

 

Hallazgos

  • Las cohortes con mejor retención fueron las de marzo y mayo, con mayor retención hacia el día 21.
  • La cohorte con peor desempeño fue abril, mostrando una caída más acelerada.
  • La retención inicial es alta, pero disminuye significativamente después de la primera semana.
  • Existe una caída crítica en el embudo antes de la compra final.

Reflexión personal

  • ¿Qué etapa mejoraría primero?
    Mejoraría la etapa final del embudo (previo a la compra), ya que es donde se observa la mayor caída en la conversión.
  • ¿Qué aprendiste sobre el comportamiento del usuario?
    Que los usuarios muestran alto interés inicial, pero si no encuentran suficiente valor o facilidad en la experiencia, abandonan rápidamente después de la primera semana. Esto resalta la importancia de una buena primera experiencia y de mantener el engagement continuo.

Proyecto 7 - Análisis de una empresa de telecomunicaciones

Contexto del proyecto

En este proyecto trabajé como analista de datos para ConnectaTel, una empresa de telecomunicaciones con operaciones en México y Colombia.
El objetivo fue entender cómo los clientes utilizan los servicios móviles (llamadas y mensajes), identificar patrones de comportamiento, detectar anomalías y segmentar usuarios para mejorar la oferta comercial.

El análisis se realizó utilizando tres fuentes de datos:

  • Planes (precio, beneficios, costos adicionales)
  • Usuarios (edad, ubicación, fecha de registro, plan contratado)
  • Uso real (llamadas y mensajes generados por cada cliente)

Objetivo del análisis

Construir una visión clara y accionable del comportamiento de los usuarios, identificando:

  • Diferencias de uso entre segmentos de clientes
  • Comportamientos atípicos o inconsistentes
  • Relación entre edad, plan contratado y consumo
  • Oportunidades para optimizar planes y mejorar la experiencia del cliente

Proceso analítico

 

  • Carga y exploración de datos
    • Integración de los tres datasets principales
    • Revisión de estructura, tipos de datos y relaciones entre tablas
  • Validación de calidad de datos
    • Identificación de valores nulos, sentinels (ej. -999, “NA”)
    • Detección de inconsistencias (fechas fuera de rango, valores imposibles)
  • Limpieza y preparación
    • Conversión de tipos de datos (fechas, numéricos)
    • Tratamiento de valores faltantes según reglas de negocio
    • Estandarización de variables
  • Análisis estadístico descriptivo
    • Cálculo de métricas clave (media, mediana, percentiles)
    • Evaluación del comportamiento típico vs extremos
  • Visualización y detección de outliers
    • Uso de histogramas y boxplots
    • Identificación de distribuciones sesgadas y valores atípicos mediante IQR
  • Segmentación de clientes
    • Agrupación por edad, país y tipo de plan
    • Comparación de patrones de uso entre segmentos
  • Generación de insights
    • Interpretación de patrones de consumo
    • Identificación de oportunidades comerciales
  • Documentación y publicación
    • Desarrollo de análisis en Jupyter Notebook
    • Creación de README reproducible y publicación en GitHub

 

Principales hallazgos

  • Existen diferencias claras en el comportamiento de uso dependiendo del tipo de plan y características del usuario.
  • Se identificaron usuarios con consumos atípicos, lo que puede indicar:
    • Uso intensivo (usuarios premium o power users)
    • Posibles errores de registro
    • Casos potenciales de fraude
  • El uso de servicios (llamadas y mensajes) presenta distribuciones no uniformes, con presencia de sesgos y outliers.
  • La segmentación permitió observar que:
    • No todos los clientes utilizan los beneficios incluidos en sus planes
    • Algunos segmentos podrían estar sobredimensionados o subatendidos

Impacto del proyecto

Este análisis proporciona una base sólida para la toma de decisiones estratégicas en ConnectaTel:

  • Optimización de planes
    Ajustar beneficios según patrones reales de uso
  • Segmentación comercial
    Crear ofertas más personalizadas por tipo de cliente
  • Detección temprana de anomalías
    Identificar posibles fraudes o errores operativos
  • Mejora en experiencia del usuario
    Alinear el servicio con las necesidades reales de consumo

Herramientas utilizadas

  • Python (análisis de datos)
  • pandas (manipulación y limpieza de datos)
  • numpy (operaciones numéricas)
  • matplotlib & seaborn (visualización de datos)
  • Jupyter Notebook (documentación del análisis)
  • GitHub (publicación y versionado del proyecto)