Ejercicio de programación: Reto dataframes en R
Este ejercicio de programación está diseñado para poner a prueba tus conocimientos en R. Es un ejercicio avanzado que pondrá a prueba tus conocimientos expertos.
Información adicional del ejercicio
En este proyecto, deberás manipular el dataset mtcars
utilizando R, específicamente con las librerías dplyr
y tidyr
. Se te pedirá seleccionar y filtrar columnas, ordenar y renombrar datos, crear nuevas columnas, agrupar información, unir dataframes y transformar el formato de los datos, manejando duplicados cuando sea necesario. Al final de cada operación, deberás imprimir los resultados para verificar el correcto funcionamiento.
Contenido del ejercicio
1. Cargar las librerías y los datos
- Asegúrate de estar trabajando en RStudio en tu ordenador local.
- Verifica si tienes instaladas las librerías
dplyr
ytidyr
. Si no las tienes, instálalas y cárgalas. - Utiliza la función
data()
para cargar el datasetmtcars
y conviértelo en un dataframe si es necesario:
data(mtcars)
df <- as.data.frame(mtcars)
2. Selección de columnas y filtrado de filas
- Emplea la función
select()
para escoger las columnasmpg
,cyl
,hp
ygear
. - Aplica
filter()
para conservar únicamente las filas donde el número de cilindros (cyl
) sea mayor que 4.
3. Ordenación y renombrado de columnas
- Usa la función
arrange()
para ordenar los datos de forma descendente según la columnahp
(potencia). - Renombra las columnas
mpg
yhp
aconsumo
ypotencia
respectivamente utilizandorename()
.
4. Creación de nuevas columnas y agregación de datos
- Con
mutate()
, crea una nueva columna llamadaeficiencia
, calculada como el cociente entreconsumo
ypotencia
. - Usa
group_by()
ysummarise()
para agrupar los datos por el número de cilindros (cyl
) y calcular el consumo medio y la potencia máxima por cilindro.
5. Creación del segundo dataframe y unión de dataframes
- Genera un nuevo dataframe con la siguiente información sobre
gear
(número de marchas) ytipo_transmision
(tipo de transmisión).
gear | tipo_transmision |
3 | Manual |
4 | Automática |
5 | Semiautomática |
- Realiza un
left_join()
para combinar el dataframe principal con este segundo dataframe, añadiendo la columnatipo_transmision
.
6. Transformación de formatos
- Transforma el dataframe a formato largo utilizando
pivot_longer()
para las columnasconsumo
,potencia
yeficiencia
. - Identifica las combinaciones duplicadas: Agrupa por las columnas clave (
cyl
,gear
,tipo_transmision
,medida
) para identificar posibles duplicados antes de transformar nuevamente a formato ancho. - Transforma de nuevo a formato ancho con
pivot_wider()
, aplicando una función de agregación comomean()
para manejar los duplicados.
7. Verificación
- Imprime el dataframe después de cada operación para asegurarte de que cada paso se ha realizado correctamente.
Más ejercicios de R
Explora más ejercicios de programación en R para mejorar tus habilidades y obtener tu certificación.
Ver más ejercicios de RSolución al ejercicio de programación en R
¡Desbloquea la solución completa!
Completa el ejercicio de programación en R para acceder a la solución paso a paso, explicaciones detalladas y mejores prácticas.
Practica con ejercicios de programación en R
Mejora tus habilidades con cientos de ejercicios de práctica, recibe retroalimentación instantánea y obtén tu certificación cuando estés listo.
Asistente de IA
Aprende de tus errores
Progreso
Mide tu avance
Certificación
Valida tus habilidades
Únete a miles de desarrolladores mejorando sus habilidades en R