Ejercicio de programación con R: Reto dataframes en R
Proyecto
0h 30m
Practica la manipulación de dataframes en R usando dplyr y tidyr: selección, filtrado, agrupación y transformación de datos con mtcars.
1. Cargar las librerías y los datos
- Asegúrate de estar trabajando en RStudio en tu ordenador local.
- Verifica si tienes instaladas las librerías
dplyr
ytidyr
. Si no las tienes, instálalas y cárgalas. - Utiliza la función
data()
para cargar el datasetmtcars
y conviértelo en un dataframe si es necesario:
data(mtcars)
df <- as.data.frame(mtcars)
2. Selección de columnas y filtrado de filas
- Emplea la función
select()
para escoger las columnasmpg
,cyl
,hp
ygear
. - Aplica
filter()
para conservar únicamente las filas donde el número de cilindros (cyl
) sea mayor que 4.
3. Ordenación y renombrado de columnas
- Usa la función
arrange()
para ordenar los datos de forma descendente según la columnahp
(potencia). - Renombra las columnas
mpg
yhp
aconsumo
ypotencia
respectivamente utilizandorename()
.
4. Creación de nuevas columnas y agregación de datos
- Con
mutate()
, crea una nueva columna llamadaeficiencia
, calculada como el cociente entreconsumo
ypotencia
. - Usa
group_by()
ysummarise()
para agrupar los datos por el número de cilindros (cyl
) y calcular el consumo medio y la potencia máxima por cilindro.
5. Creación del segundo dataframe y unión de dataframes
- Genera un nuevo dataframe con la siguiente información sobre
gear
(número de marchas) ytipo_transmision
(tipo de transmisión).
gear | tipo_transmision |
3 | Manual |
4 | Automática |
5 | Semiautomática |
- Realiza un
left_join()
para combinar el dataframe principal con este segundo dataframe, añadiendo la columnatipo_transmision
.
6. Transformación de formatos
- Transforma el dataframe a formato largo utilizando
pivot_longer()
para las columnasconsumo
,potencia
yeficiencia
. - Identifica las combinaciones duplicadas: Agrupa por las columnas clave (
cyl
,gear
,tipo_transmision
,medida
) para identificar posibles duplicados antes de transformar nuevamente a formato ancho. - Transforma de nuevo a formato ancho con
pivot_wider()
, aplicando una función de agregación comomean()
para manejar los duplicados.
7. Verificación
- Imprime el dataframe después de cada operación para asegurarte de que cada paso se ha realizado correctamente.
Más ejercicios de programación con R
Evalúa tus conocimientos en R con más ejercicios de programación de tipo Test, Puzzle, Código y Proyecto con VSCode.
Tecnologías de este ejercicio de programación
Entornos de desarrollo para este ejercicio

Visual Studio Code

GitHub