Ejercicio de programación con Pandas: Análisis de datos de ventas con Numpy y Pandas
0h 40m
Ejercicio de Pandas con Python proyecto con jupyter notebook para el análisis de datos de ventas y manipulación de datos.
La empresa ficticia RetailNow, que gestiona una cadena de tiendas minoristas, desea realizar un análisis detallado del rendimiento de sus diferentes sucursales en varias ciudades. Para ello, han recopilado datos de las ventas, los inventarios y la satisfacción del cliente en archivos CSV. Tu misión será procesar, explorar y analizar estos datos usando Pandas y Numpy para ayudar a la dirección a tomar decisiones estratégicas sobre la optimización del rendimiento de las tiendas.
1. Preparar el entorno de trabajo:
- Abre Visual Studio Code y asegúrate de tener instalado el plugin de Jupyter.
- Crea un nuevo archivo Jupyter Notebook llamado
analisis_red_tiendas.ipynb
.
2. Importar las librerías necesarias:
- Importa las librerías Pandas y Numpy que necesitarás para realizar el análisis.
3. Cargar los datos (lectura y procesamiento de datos - Pandas):
- Utiliza Pandas para cargar los archivos CSV:
ventas.csv
,inventarios.csv
ysatisfaccion.csv
. - Guarda los datos en tres DataFrames distintos.
- Limpia los datos eliminando filas con valores nulos utilizando el método
dropna()
. Esto te permitirá trabajar solo con datos válidos.
4. Exploración de datos (Pandas)
- Calcula las ventas totales por producto y por tienda.
- Calcula los ingresos totales por tienda, multiplicando la cantidad vendida por el precio unitario.
- Genera un resumen estadístico de las ventas utilizando el método
describe()
para obtener la media, mediana y otras métricas clave. - Si los productos están clasificados por categorías, calcula el promedio de ventas por tienda y categoría de productos.
- Utiliza
groupby()
en Pandas para calcular las ventas totales por tienda o por categoría.
5. Análisis de inventarios (Pandas)
- Calcula la rotación de inventarios para cada tienda. Esto se hace dividiendo las ventas totales por el stock disponible de cada producto.
- Almacena los resultados en una nueva columna dentro del DataFrame de inventarios.
- Filtra y muestra las tiendas con niveles críticos de inventario, es decir, aquellas tiendas donde el porcentaje de productos vendidos sea menor al 10% del stock disponible.
- Utiliza
groupby()
y operaciones matemáticas para calcular la rotación de inventarios. - Aplica filtros con
Pandas
para identificar las tiendas con niveles críticos.
6. Satisfacción del cliente (Pandas)
- Realiza un análisis de la satisfacción de los clientes en cada tienda. Relaciona estos datos con el rendimiento de las ventas.
- Filtra las tiendas con niveles bajos de satisfacción (< 60%) y haz recomendaciones para mejorar el rendimiento de estas tiendas.
7. Operaciones con Numpy
- Usar Numpy para realizar los siguientes cálculos sobre las ventas:
- Mediana de las ventas totales.
- Desviación estándar de las ventas totales.
- Para los cálculos, convierte la columna
Total_Ventas
del DataFrame de Pandas a un array de Numpy usando.to_numpy
(o.values
si lo prefieres). - Genera arrays aleatorios utilizando la biblioteca Numpy para simular proyecciones de ventas futuras.
- Usa el módulo de aleatoriedad de Numpy y asegúrate de establecer una semilla (
seed
) para obtener resultados reproducibles.
Estructura del proyecto
Archivo principal: analisis_red_tiendas.ipynb
Este notebook será el archivo donde se importan y procesan los datos, se realizan los análisis solicitados, y se muestran los resultados. Incluirá el procesamiento con Pandas y cálculos con Numpy.
Archivos CSV:
ventas.csv
: datos de ventas.inventarios.csv
: datos de inventarios.satisfaccion.csv
: datos de satisfacción de clientes.
Más ejercicios de programación con Pandas
Evalúa tus conocimientos en Pandas con más ejercicios de programación de tipo Test, Puzzle, Código y Proyecto con VSCode.
Introducción e instalación de pandas
Operaciones de filtrado, búsqueda y ordenación
Operaciones de cadena de texto y categóricas
Tratamiento de valores faltantes
Manipulación de DataFrames
Codificación de variables categóricas a numéricas
Tipos de datos en DataFrames
Identificar y corregir errores y duplicados
Operaciones matemáticas y estadísticas
Evaluación código conocimiento general de Pandas
Evaluación multirespuesta Conocimiento general de Pandas
Integración de Pandas con Matplotlib
Operaciones con fechas
Entrada de datos externos y salida de datos con Pandas
Análisis de datos de eventos deportivos con Pandas en Python
Identificar y corregir outliers
Series
Integración de Pandas con Seaborn
Operaciones de conjuntos
Identificación de valores faltantes
Certificados de superación de Pandas
Supera todos los retos de Pandas y obtén certificados de superación para mejorar tu currículum y empleabilidad.
Tecnologías de este ejercicio de programación
Entornos de desarrollo para este ejercicio
Visual Studio Code
GitHub