Ejercicio de programación con R: Reto dataframes en R

Proyecto
Puntuación
0h 30m

Practica la manipulación de dataframes en R usando dplyr y tidyr: selección, filtrado, agrupación y transformación de datos con mtcars.

1. Cargar las librerías y los datos

  • Asegúrate de estar trabajando en RStudio en tu ordenador local.
  • Verifica si tienes instaladas las librerías dplyr y tidyr. Si no las tienes, instálalas y cárgalas.
  • Utiliza la función data() para cargar el dataset mtcars y conviértelo en un dataframe si es necesario:
data(mtcars)
df <- as.data.frame(mtcars)

2. Selección de columnas y filtrado de filas

  • Emplea la función select() para escoger las columnas mpg, cyl, hp y gear.
  • Aplica filter() para conservar únicamente las filas donde el número de cilindros (cyl) sea mayor que 4.

3. Ordenación y renombrado de columnas

  • Usa la función arrange() para ordenar los datos de forma descendente según la columna hp (potencia).
  • Renombra las columnas mpg y hp a consumo y potencia respectivamente utilizando rename().

4. Creación de nuevas columnas y agregación de datos

  • Con mutate(), crea una nueva columna llamada eficiencia, calculada como el cociente entre consumo y potencia.
  • Usa group_by() y summarise() para agrupar los datos por el número de cilindros (cyl) y calcular el consumo medio y la potencia máxima por cilindro.

5. Creación del segundo dataframe y unión de dataframes

  • Genera un nuevo dataframe con la siguiente información sobre gear (número de marchas) y tipo_transmision (tipo de transmisión).
gear          tipo_transmision
3Manual
4Automática
5Semiautomática
  • Realiza un left_join() para combinar el dataframe principal con este segundo dataframe, añadiendo la columna tipo_transmision.

6. Transformación de formatos

  • Transforma el dataframe a formato largo utilizando pivot_longer() para las columnas consumo, potencia y eficiencia.
  • Identifica las combinaciones duplicadas: Agrupa por las columnas clave (cyl, gear, tipo_transmision, medida) para identificar posibles duplicados antes de transformar nuevamente a formato ancho.
  • Transforma de nuevo a formato ancho con pivot_wider(), aplicando una función de agregación como mean() para manejar los duplicados.

7. Verificación

  • Imprime el dataframe después de cada operación para asegurarte de que cada paso se ha realizado correctamente.
Empezar ejercicio de programación

Más ejercicios de programación con R

Evalúa tus conocimientos en R con más ejercicios de programación de tipo Test, Puzzle, Código y Proyecto con VSCode.

Tecnologías de este ejercicio de programación

Entornos de desarrollo para este ejercicio

Image

Visual Studio Code

Image

GitHub