Análisis de datos de eventos deportivos con Pandas en Python

Proyecto de programación
Experto
Pandas
Curso de Pandas
40 min
500 XP
Actualizado: 25/09/2024

¡Programa y certifícate!

Asistente de IA
Solución de código
Certificado
Empezar ejercicio

Descripción

En este reto, métete en la piel de un analista de datos que trabaja para una empresa de eventos deportivos. La empresa ha recopilado datos de sus eventos, los aficionados que asistieron y las promociones publicitarias realizadas para atraer a más asistentes. Tu tarea será procesar y analizar estos datos utilizando Python y la librería Pandas, combinando la información para extraer 'insights' clave que ayuden a mejorar la planificación de futuros eventos y promociones.

Deberás trabajar con tres conjuntos de datos que contienen información sobre los siguienters puntos:

  1. Eventos deportivos: datos como el nombre del evento, la fecha, ubicación y el número total de asistentes.
  2. Aficionados: datos demográficos como la edad, género y lugar de residencia de los aficionados que asistieron a los eventos.
  3. Promociones publicitarias: información sobre las promociones realizadas, incluyendo el medio publicitario utilizado, el presupuesto y la duración de la promoción.

Tu misión será realizar la limpieza de datos, combinarlos y responder a preguntas críticas de negocio como cuál fue el evento más exitoso en términos de asistencia, qué medio publicitario fue el más efectivo y qué grupo de edad es el más frecuente en los eventos. Además, deberás realizar algunas transformaciones adicionales para medir el impacto de las promociones y la duración de las mismas. 

Guarda tu progreso

Inicia sesión para no perder tu progreso y accede a miles de tutoriales, ejercicios prácticos y nuestro asistente de IA.

Progreso guardado
Asistente IA
Ejercicios
Iniciar sesión gratis

Más de 25.000 desarrolladores ya confían en CertiDevs

A continuación te ofrecemos las pautas que debes seguir, ¡toma nota!

1. Preparar el entorno de trabajo

  • Crea un nuevo archivo Jupyter Notebook llamado analisis_eventos.ipynb.

2. Importar las librerías necesarias

  • Importa las librerías Pandas que necesitarás para realizar el análisis.

3. Cargar los datos (lectura y procesamiento de datos con Pandas)

  • Utiliza Pandas para cargar los archivos CSV: eventos.csv, aficionados.csv y promociones.csv. Guarda los datos en tres DataFrames distintos.

4. Limpieza de datos

  • Elimina las filas con valores nulos en los DataFrames para asegurarte de trabajar con datos completos. Utiliza el método dropna().

5. Combinación de los DataFrames

  • Para poder analizar los datos en conjunto, deberás combinarlos. Utiliza merge() o join() para combinar los DataFrames de eventos, aficionados y promociones. Elige la columna id_evento para relacionar las tablas.

6. Responde las siguientes preguntas de negocio

  • ¿Cuál es el evento con mayor asistencia total?
    • Usa max() en la columna asistentes_totales para identificar el evento con mayor número de asistentes.
  • ¿Qué rango de edad asiste más frecuentemente a los eventos?
    • Utiliza pd.cut() para agrupar a los aficionados en rangos de edad y luego cuenta cuántos aficionados hay en cada grupo.
  • ¿Qué medio publicitario ha generado mayor impacto en términos de asistencia?
    • Crea una columna impacto_promoción que divida el número de asistentes totales por el presupuesto de la promoción y agrupa por medio_publicitario.
  • ¿Cuál es la ubicación de residencia que más aficionados aporta a los eventos?
    • Usa groupby() para sumar los aficionados por ubicación de residencia.

7. Exportación de los resultados:

  • Guarda el DataFrame resultante con todas las transformaciones y análisis en un archivo CSV llamado reporte_eventos.csv utilizando la función df.to_csv().

Solución al ejercicio de programación en Pandas

Contenido bloqueado

¡Desbloquea la solución completa!

Completa el ejercicio de programación en Pandas para acceder a la solución paso a paso, explicaciones detalladas y mejores prácticas.

solution.js
JavaScript
1 function solveChallenge ( input ) {
2 // Algoritmo optimizado O(n log n)
3 const data = parseInput ( input );
4 const sorted = data . sort (( a , b ) => a - b );
5
6 // Aplicar técnica de dos punteros
7 let left = 0 , right = sorted . length - 1 ;
8 const result = [];
9
10 while ( left < right ) {
11 const sum = sorted [ left ] + sorted [ right ];
12 if ( sum === target ) {
13 result . push ([ sorted [ left ], sorted [ right ]]);
14 left ++; right --;
15 } else if ( sum < target ) {
16 left ++;
17 } else {
18 right --;
19 }
20 }
21
22 return result ;
23 }
Código completo
Explicaciones
Mejores prácticas
+1.200 developers han resuelto este ejercicio de programación

Practica con ejercicios de programación en Pandas

Mejora tus habilidades con cientos de ejercicios de práctica, recibe retroalimentación instantánea y obtén tu certificación cuando estés listo.

Asistente de IA

Aprende de tus errores

Progreso

Mide tu avance

Certificación

Valida tus habilidades

Únete a miles de desarrolladores mejorando sus habilidades en Pandas

⭐⭐⭐⭐⭐
4.9/5 valoración