Visualización de datos dataset iris

Proyecto
Intermedio
Matplotlib
Matplotlib
30 min
400 XP
Actualizado: 08/10/2024

¡Practica y certifícate!

Retroalimentación
Soluciones
Certificado
Comenzar

Descripción

En este ejercicio, deberás realizar un análisis exploratorio y visualización de datos utilizando el famoso conjunto de datos Iris. Usarás pandas para cargar los datos y matplotlib para generar gráficos que te permitan explorar patrones y relaciones entre las variables del conjunto de datos. Este proyecto te ayudará a desarrollar tus habilidades en análisis de datos y visualización en Python.

1.- Configurar el entorno de trabajo:

  • Abre Visual Studio Code y crea un proyecto nuevo.
  • Importa las bibliotecas necesarias como: pandas, matplotlib, etc. Ya están instaladas por lo que no necesitas instalarlas.
  • Crea un nuevo archivo data_analysis.ipynb donde desarrollarás el proyecto.

2.- Carga y exploración inicial del conjunto de datos:

  • Importa el archivo dataset.csv utilizando pandas.
  • Dado que estás trabajando en Visual Studio Code en un entorno web, es necesario utilizar rutas absolutas para cargar los archivos. Asegúrate de que la ruta absoluta a tu archivo de datos sea correcta, tal como se muestra en el siguiente ejemplo: /workspace/dataset.csv
  • Realiza una vista rápida de los datos con métodos como .head(), .info(), y .describe() para familiarizarte con la estructura del dataset y su contenido.
  • Asegúrate de que el conjunto de datos no tiene valores nulos o inconsistencias.

3.- Análisis exploratorio de los datos:

Guarda tu progreso

Inicia sesión para no perder tu progreso y accede a miles de tutoriales, ejercicios prácticos y nuestro asistente de IA.

Progreso guardado
Asistente IA
Ejercicios
Iniciar sesión gratis

Más de 25.000 desarrolladores ya confían en CertiDevs

  • Calcula las estadísticas descriptivas (media, mediana, desviación estándar, etc.) de cada variable presente en el conjunto de datos.
  • Divide el análisis por categorías, como las especies de flores (setosa, versicolor, virginica) y las características como el largo y ancho de sépalo y pétalo.

4.-Visualización de datos:

  • Utiliza matplotlib para crear gráficos que representen las relaciones entre las características del conjunto de datos. Los gráficos requeridos son:
    • Histograma: Mostrar la distribución del largo del pétalo (petal_length).
    • Diagrama de dispersión (scatter plot): Mostrar la relación entre largo del pétalo (petal_length) y ancho del pétalo (petal_width).
    • Gráfico de líneas: Representar la tendencia del largo del sépalo (sepal_length) por cada clase de flor.
    • Box plot: Visualizar la distribución del ancho del pétalo (petal_width) por clase de flor (Iris-setosa, Iris-versicolor, Iris-virginica).

Solución al ejercicio

Contenido bloqueado

¡Desbloquea la solución completa!

Completa el examen para acceder a la solución paso a paso, explicaciones detalladas y mejores prácticas.

solution.js
JavaScript
1 function solveChallenge ( input ) {
2 // Algoritmo optimizado O(n log n)
3 const data = parseInput ( input );
4 const sorted = data . sort (( a , b ) => a - b );
5
6 // Aplicar técnica de dos punteros
7 let left = 0 , right = sorted . length - 1 ;
8 const result = [];
9
10 while ( left < right ) {
11 const sum = sorted [ left ] + sorted [ right ];
12 if ( sum === target ) {
13 result . push ([ sorted [ left ], sorted [ right ]]);
14 left ++; right --;
15 } else if ( sum < target ) {
16 left ++;
17 } else {
18 right --;
19 }
20 }
21
22 return result ;
23 }
Código completo
Explicaciones
Mejores prácticas
+1.200 developers han resuelto este ejercicio de programación

Practica con exámenes de Matplotlib

Mejora tus habilidades con cientos de exámenes de práctica, recibe retroalimentación instantánea y obtén tu certificación cuando estés listo.

Retroalimentación

Aprende de tus errores

Progreso

Mide tu avance

Certificación

Valida tus habilidades

Únete a miles de desarrolladores mejorando sus habilidades

⭐⭐⭐⭐⭐
4.9/5 valoración