R: Introducción y entorno

Descubre el entorno y conceptos básicos de R para análisis estadístico y visualización de datos. Aprende a configurar y usar R eficazmente.

Aprende R GRATIS y certifícate

Introducción y entorno

R es un lenguaje de programación especializado en análisis estadístico y visualización de datos que se ha convertido en una herramienta fundamental en ciencia de datos, investigación académica y análisis empresarial. Su diseño está orientado específicamente para trabajar con datos numéricos, realizar cálculos estadísticos y generar gráficos de alta calidad.

¿Qué hace especial a R?

A diferencia de otros lenguajes de programación generalistas, R está diseñado desde sus cimientos para el análisis de datos. Cada elemento del lenguaje está pensado para facilitar la manipulación, transformación y análisis de conjuntos de datos, desde pequeñas muestras hasta grandes volúmenes de información.

La sintaxis de R es intuitiva para quienes trabajan con matemáticas y estadística. Por ejemplo, crear un vector de números es tan simple como:

numeros <- c(1, 2, 3, 4, 5)

Esta simplicidad se extiende a operaciones más complejas. Calcular la media aritmética de estos números requiere únicamente:

mean(numeros)

El ecosistema R

Una de las fortalezas principales de R es su ecosistema de paquetes. La comunidad ha desarrollado miles de paquetes especializados que extienden las capacidades básicas del lenguaje. Estos paquetes cubren desde técnicas estadísticas avanzadas hasta herramientas de visualización interactiva.

El CRAN (Comprehensive R Archive Network) es el repositorio oficial donde se almacenan estos paquetes. Instalar un paquete es un proceso directo:

install.packages("ggplot2")

Una vez instalado, se puede cargar en la sesión actual:

library(ggplot2)

Configuración del entorno de trabajo

Para comenzar a trabajar con R, necesitas configurar un entorno de desarrollo adecuado. Aunque R puede ejecutarse desde la línea de comandos, la mayoría de usuarios prefieren utilizar RStudio, un entorno de desarrollo integrado (IDE) que facilita enormemente el trabajo con R.

Componentes esenciales del entorno

El entorno típico de R incluye varios componentes clave:

  • Console: donde se ejecutan los comandos de R directamente
  • Script editor: para escribir y guardar código R en archivos
  • Environment: muestra las variables y objetos creados en la sesión actual
  • Plots: área donde se visualizan los gráficos generados

Directorio de trabajo

R siempre opera desde un directorio de trabajo específico. Este directorio es donde R buscará archivos para leer y donde guardará los archivos que generes. Puedes verificar tu directorio actual con:

getwd()

Para cambiar el directorio de trabajo:

setwd("/ruta/a/tu/directorio")

Primeros pasos con R

Al iniciar una sesión de R, el sistema está listo para recibir comandos. La consola interactiva permite experimentar con código de forma inmediata. El símbolo > indica que R está esperando un comando.

Variables y asignación

En R, crear variables utiliza el operador de asignación <-, aunque también funciona el símbolo =:

edad <- 25
nombre <- "Ana"
activo <- TRUE

Tipos de datos básicos

R maneja varios tipos de datos fundamentales:

  • Numeric: números decimales (3.14, 2.5)
  • Integer: números enteros (1L, 10L)
  • Character: texto ("Hola", "R")
  • Logical: valores lógicos (TRUE, FALSE)

Estructuras de datos

Las estructuras de datos en R están diseñadas para el análisis estadístico:

Vectores - la estructura más básica:

temperaturas <- c(22.5, 24.1, 19.8, 26.3)
ciudades <- c("Madrid", "Barcelona", "Valencia", "Sevilla")

Data frames - similares a tablas de datos:

datos <- data.frame(
  ciudad = ciudades,
  temperatura = temperaturas
)

Operaciones básicas

R facilita las operaciones matemáticas comunes:

# Operaciones aritméticas básicas
suma <- 10 + 5
producto <- 4 * 7
division <- 20 / 4

# Operaciones con vectores
vector1 <- c(1, 2, 3)
vector2 <- c(4, 5, 6)
suma_vectores <- vector1 + vector2

Funciones estadísticas integradas

R incluye numerosas funciones estadísticas listas para usar:

datos_ejemplo <- c(12, 15, 18, 22, 25, 28, 30)

# Estadísticas descriptivas
media <- mean(datos_ejemplo)
mediana <- median(datos_ejemplo)
desviacion <- sd(datos_ejemplo)

Gestión de paquetes

La gestión de paquetes es fundamental para aprovechar todo el potencial de R. Además de instalar paquetes, es importante mantenerlos actualizados:

# Actualizar todos los paquetes instalados
update.packages()

# Ver paquetes cargados actualmente
search()

Paquetes esenciales para principiantes

Algunos paquetes fundamentales que todo usuario de R debería conocer:

  • dplyr: manipulación eficiente de datos
  • ggplot2: creación de gráficos elegantes
  • readr: lectura de archivos de datos
  • tidyr: organización y limpieza de datos

Ayuda y documentación

R incluye un sistema de ayuda completo. Para obtener información sobre cualquier función:

# Ayuda sobre una función específica
help(mean)
?mean

# Buscar ayuda por tema
help.search("regression")

La documentación de R es exhaustiva y incluye ejemplos prácticos que puedes ejecutar directamente. Esto convierte el aprendizaje en un proceso interactivo donde puedes experimentar con el código mientras lees la documentación.

Empezar curso de R

Lecciones de este módulo de R

Lecciones de programación del módulo Introducción y entorno del curso de R.