Ejercicio de programación con Pandas: Análisis de datos de eventos deportivos con Pandas en Python
Proyecto
0h 40m
Ejercicio proyecto de Pandas sobre análisis de datos de eventos y asistencias para practicar con Python y certificarse en Pandas.
Deberás trabajar con tres conjuntos de datos que contienen información sobre los siguienters puntos:
- Eventos deportivos: datos como el nombre del evento, la fecha, ubicación y el número total de asistentes.
- Aficionados: datos demográficos como la edad, género y lugar de residencia de los aficionados que asistieron a los eventos.
- Promociones publicitarias: información sobre las promociones realizadas, incluyendo el medio publicitario utilizado, el presupuesto y la duración de la promoción.
Tu misión será realizar la limpieza de datos, combinarlos y responder a preguntas críticas de negocio como cuál fue el evento más exitoso en términos de asistencia, qué medio publicitario fue el más efectivo y qué grupo de edad es el más frecuente en los eventos. Además, deberás realizar algunas transformaciones adicionales para medir el impacto de las promociones y la duración de las mismas.
A continuación te ofrecemos las pautas que debes seguir, ¡toma nota!
1. Preparar el entorno de trabajo
- Crea un nuevo archivo Jupyter Notebook llamado
analisis_eventos.ipynb
.
2. Importar las librerías necesarias
- Importa las librerías Pandas que necesitarás para realizar el análisis.
3. Cargar los datos (lectura y procesamiento de datos con Pandas)
- Utiliza Pandas para cargar los archivos CSV:
eventos.csv
,aficionados.csv
ypromociones.csv
. Guarda los datos en tres DataFrames distintos.
4. Limpieza de datos
- Elimina las filas con valores nulos en los DataFrames para asegurarte de trabajar con datos completos. Utiliza el método
dropna()
.
5. Combinación de los DataFrames
- Para poder analizar los datos en conjunto, deberás combinarlos. Utiliza
merge()
ojoin()
para combinar los DataFrames de eventos, aficionados y promociones. Elige la columnaid_evento
para relacionar las tablas.
6. Responde las siguientes preguntas de negocio
- ¿Cuál es el evento con mayor asistencia total?
- Usa
max()
en la columnaasistentes_totales
para identificar el evento con mayor número de asistentes.
- Usa
- ¿Qué rango de edad asiste más frecuentemente a los eventos?
- Utiliza
pd.cut()
para agrupar a los aficionados en rangos de edad y luego cuenta cuántos aficionados hay en cada grupo.
- Utiliza
- ¿Qué medio publicitario ha generado mayor impacto en términos de asistencia?
- Crea una columna
impacto_promoción
que divida el número de asistentes totales por el presupuesto de la promoción y agrupa pormedio_publicitario
.
- Crea una columna
- ¿Cuál es la ubicación de residencia que más aficionados aporta a los eventos?
- Usa
groupby()
para sumar los aficionados por ubicación de residencia.
- Usa
7. Exportación de los resultados:
- Guarda el DataFrame resultante con todas las transformaciones y análisis en un archivo CSV llamado
reporte_eventos.csv
utilizando la funcióndf.to_csv()
.
Más ejercicios de programación con Pandas
Evalúa tus conocimientos en Pandas con más ejercicios de programación de tipo Test, Puzzle, Código y Proyecto con VSCode.
Introducción e instalación de pandas
Test
Operaciones de filtrado, búsqueda y ordenación
Código
Operaciones de cadena de texto y categóricas
Puzzle
Tratamiento de valores faltantes
Código
Manipulación de DataFrames
Test
Codificación de variables categóricas a numéricas
Código
Tipos de datos en DataFrames
Test
Identificar y corregir errores y duplicados
Código
Operaciones matemáticas y estadísticas
Código
Evaluación código conocimiento general de Pandas
Código
Evaluación multirespuesta Conocimiento general de Pandas
Test
Integración de Pandas con Matplotlib
Código
Operaciones con fechas
Test
Entrada de datos externos y salida de datos con Pandas
Puzzle
Identificar y corregir outliers
Código
Series
Puzzle
Integración de Pandas con Seaborn
Código
Operaciones de conjuntos
Puzzle
Identificación de valores faltantes
Código
Tecnologías de este ejercicio de programación
Entornos de desarrollo para este ejercicio

Visual Studio Code

GitHub