Descripción
El ejercicio consiste en realizar un análisis de datos de ventas y clientes en R utilizando las librerías dplyr y tidyr. Se trabajará con dos conjuntos de datos, uno de ventas y otro de clientes, para combinarlos mediante una unión (inner join), calcular el total de ventas por ciudad y producto, identificar a los cinco clientes con mayor cantidad de compras y realizar un análisis temporal de las ventas por mes y producto. El objetivo es aplicar técnicas de manipulación de datos para extraer información relevante y útil.
1. Cargar las librerías
- Asegúrate de estar trabajando en RStudio en tu ordenador local.
- Verifica si tienes instaladas las librerías
dplyr
ytidyr
. Si no las tienes, instálalas y luego cárgalas.
2. Crear los dataframes de ventas y clientes
- Descarga los archivos CSV:
- Descarga aquí el archivo de “Ventas”: Ventas.csv
- Descarga aquí el archivo de “Clientes”: Clientes.csv
- Luego, carga los dataframes en R.
3. Convertir la columna fecha
en tipo Date
- Es importante que la columna
fecha
en el dataframeventas
esté en formato de fecha (Date
), ya que se necesitará para el análisis temporal. Usa el siguiente código para convertirla:
# Convertir la columna fecha en tipo Date (importante para el análisis temporal)
ventas$fecha <- as.Date(ventas$fecha, format="%Y-%m-%d")
4. Unión de los dataframes
- Realiza una unión (inner join) entre los dataframes
ventas
yclientes
usando la columnaid_cliente
como clave común.
5. Análisis de ventas por ciudad
- Agrupa los datos resultantes por ciudad y producto, y calcula el total de ventas (cantidad) para cada combinación de ciudad y producto.
- Transforma los resultados en un formato "wide", donde cada fila representa una ciudad y cada columna corresponde a un producto, mostrando el total de ventas para cada producto en cada ciudad.
6. Análisis de los clientes con mayores compras
- Agrupa los datos por cliente y calcula el total de productos comprados por cada cliente.
- Ordena los resultados en función de la cantidad total comprada y selecciona a los cinco clientes con mayor cantidad total de compras, mostrando su nombre, edad y la cantidad total.
7. Análisis temporal de las ventas
- Extrae el mes de la fecha de la venta y añádelo como una nueva columna en el dataframe de ventas.
- Agrupa los datos por mes y producto, calcula el total de ventas para cada combinación de mes y producto y ordena los resultados de mayor a menor cantidad vendida.
8. Visualización de los resultados
- Imprime los resultados de cada una de las operaciones: la unión de ventas y clientes, el total de ventas por ciudad y producto, el formato wide de las ventas por ciudad, los clientes con mayores compras y las ventas totales por mes y producto.
Solución al ejercicio de programación en
¡Desbloquea la solución completa!
Completa el ejercicio de programación en para acceder a la solución paso a paso, explicaciones detalladas y mejores prácticas.
Practica con ejercicios de programación en
Mejora tus habilidades con cientos de ejercicios de práctica, recibe retroalimentación instantánea y obtén tu certificación cuando estés listo.
Asistente de IA
Aprende de tus errores
Progreso
Mide tu avance
Certificación
Valida tus habilidades
Únete a miles de desarrolladores mejorando sus habilidades en