Ejercicio de programación con Matplotlib: Visualización de datos dataset iris
Proyecto
0h 30m
Aprende a visualizar datos demográficos del famoso conjunto de datos Iris usando Python y Matplotlib. Crea histogramas, scatter plots, gráficos de líneas y box plots.
1.- Configurar el entorno de trabajo:
- Abre Visual Studio Code y crea un proyecto nuevo.
- Importa las bibliotecas necesarias como:
pandas
,matplotlib
, etc. Ya están instaladas por lo que no necesitas instalarlas. - Crea un nuevo archivo
data_analysis.ipynb
donde desarrollarás el proyecto.
2.- Carga y exploración inicial del conjunto de datos:
- Importa el archivo
dataset.csv
utilizando pandas. - Dado que estás trabajando en Visual Studio Code en un entorno web, es necesario utilizar rutas absolutas para cargar los archivos. Asegúrate de que la ruta absoluta a tu archivo de datos sea correcta, tal como se muestra en el siguiente ejemplo:
/workspace/dataset.csv
- Realiza una vista rápida de los datos con métodos como
.head()
,.info()
, y.describe()
para familiarizarte con la estructura del dataset y su contenido. - Asegúrate de que el conjunto de datos no tiene valores nulos o inconsistencias.
3.- Análisis exploratorio de los datos:
- Calcula las estadísticas descriptivas (media, mediana, desviación estándar, etc.) de cada variable presente en el conjunto de datos.
- Divide el análisis por categorías, como las especies de flores (
setosa
,versicolor
,virginica
) y las características como el largo y ancho de sépalo y pétalo.
4.-Visualización de datos:
- Utiliza matplotlib para crear gráficos que representen las relaciones entre las características del conjunto de datos. Los gráficos requeridos son:
- Histograma: Mostrar la distribución del largo del pétalo (
petal_length
). - Diagrama de dispersión (scatter plot): Mostrar la relación entre largo del pétalo (
petal_length
) y ancho del pétalo (petal_width
). - Gráfico de líneas: Representar la tendencia del largo del sépalo (
sepal_length
) por cada clase de flor. - Box plot: Visualizar la distribución del ancho del pétalo (
petal_width
) por clase de flor (Iris-setosa
,Iris-versicolor
,Iris-virginica
).
- Histograma: Mostrar la distribución del largo del pétalo (
Más ejercicios de programación con Matplotlib
Evalúa tus conocimientos en Matplotlib con más ejercicios de programación de tipo Test, Puzzle, Código y Proyecto con VSCode.
Evaluación código global
Código
Integración de Matplotlib con Numpy
Test
Evaluación test global
Test
Análisis mercado de criptomonedas
Proyecto
Gráficos univariantes
Código
Gráficos multivariantes
Código
Conceptos básicos de Matplotlib
Puzzle
Análisis de ventas de videojuegos
Proyecto
Temas predefinidos, colores y estilos
Código
Subplots y grillas
Código
Gráficos bivariantes
Código
Integración de Matplotlib con Pandas
Test
Introducción e instalación de Matplotlib
Test
Ajuste de ejes en matplotlib
Puzzle
Integración de Matplotlib con Seaborn
Test
Títulos, etiquetas y leyenda y límites
Test
Certificados de superación de Matplotlib
Supera todos los retos de Matplotlib y obtén certificados de superación para mejorar tu currículum y empleabilidad.
Tecnologías de este ejercicio de programación
Entornos de desarrollo para este ejercicio
Visual Studio Code
GitHub