R: Sintaxis

Descubre la sintaxis básica de R para programación y análisis estadístico con ejemplos claros y operadores esenciales.

Aprende R GRATIS y certifícate

Sintaxis de R

R es un lenguaje de programación especializado en análisis estadístico y ciencia de datos que se caracteriza por su sintaxis intuitiva y expresiva. A diferencia de otros lenguajes de programación, R fue diseñado específicamente para trabajar con datos, lo que se refleja en su estructura sintáctica orientada a operaciones matemáticas y estadísticas.

Características fundamentales de la sintaxis

La sintaxis de R se basa en algunos principios fundamentales que la hacen única. El lenguaje utiliza el símbolo <- como operador de asignación principal, aunque también acepta el símbolo =. Esta característica distintiva refleja la filosofía de R de ser explícito en las operaciones.

# Asignación con <-
nombre <- "Juan"
edad <- 25

# También válido con =
altura = 1.75

Los comentarios en R se indican con el símbolo #, y todo lo que aparece después de este símbolo en una línea se considera comentario. Esta práctica es esencial para documentar el código y hacerlo más comprensible.

Estructura básica de comandos

En R, cada instrucción puede escribirse en una línea separada o múltiples instrucciones pueden separarse con punto y coma en la misma línea. Sin embargo, la práctica recomendada es escribir una instrucción por línea para mejorar la legibilidad.

# Una instrucción por línea (recomendado)
x <- 10
y <- 20
resultado <- x + y

# Múltiples instrucciones en una línea (menos legible)
a <- 5; b <- 3; suma <- a + b

La sensibilidad a mayúsculas y minúsculas es una característica importante de R. Las variables Nombre, nombre y NOMBRE son completamente diferentes para el intérprete.

Edad <- 30
edad <- 25
EDAD <- 35

# Estas son tres variables distintas
print(Edad)  # 30
print(edad)  # 25
print(EDAD)  # 35

Nombres de variables y objetos

Los nombres de variables en R deben seguir reglas específicas. Pueden comenzar con una letra o un punto (seguido de una letra), y pueden contener letras, números, puntos y guiones bajos. No pueden comenzar con números ni contener espacios.

# Nombres válidos
mi_variable <- 100
datos.2023 <- "información"
.variable_oculta <- TRUE
temperatura_maxima <- 35.5

# Nombres no válidos (generarían error)
# 2variable <- 10
# mi variable <- 20
# variable-especial <- 30

La convención de nomenclatura más común en R utiliza puntos para separar palabras, aunque también se acepta el uso de guiones bajos. La consistencia en el estilo es más importante que la convención específica elegida.

Operadores básicos

R incluye un conjunto completo de operadores aritméticos que permiten realizar cálculos matemáticos de forma intuitiva. Estos operadores siguen las reglas de precedencia matemática estándar.

# Operadores aritméticos básicos
suma <- 5 + 3        # 8
resta <- 10 - 4      # 6
multiplicacion <- 6 * 7    # 42
division <- 15 / 3   # 5
potencia <- 2^3      # 8
modulo <- 17 %% 5    # 2 (resto de la división)

Los operadores de comparación son fundamentales para crear condiciones y filtros en el análisis de datos. Estos operadores devuelven valores lógicos (TRUE o FALSE).

# Operadores de comparación
a <- 10
b <- 5

mayor <- a > b           # TRUE
menor <- a < b           # FALSE
igual <- a == b          # FALSE
diferente <- a != b      # TRUE
mayor_igual <- a >= b    # TRUE
menor_igual <- a <= b    # FALSE

Tipos de datos básicos

R maneja varios tipos de datos fundamentales que son esenciales para cualquier análisis. Los tipos más comunes incluyen números, texto, valores lógicos y factores.

# Tipos de datos básicos
numero_entero <- 42L          # integer
numero_decimal <- 3.14        # numeric
texto <- "Hola mundo"         # character
logico <- TRUE                # logical

La función class() permite identificar el tipo de dato de cualquier variable, lo cual es útil para verificar que los datos tienen el formato esperado.

# Verificar tipos de datos
class(numero_entero)    # "integer"
class(numero_decimal)   # "numeric"
class(texto)           # "character"
class(logico)          # "logical"

Estructuras de control básicas

Las estructuras condicionales en R utilizan la sintaxis if, else if y else para controlar el flujo de ejecución del programa. La condición debe estar entre paréntesis y el código a ejecutar entre llaves.

# Estructura condicional básica
temperatura <- 25

if (temperatura > 30) {
  mensaje <- "Hace calor"
} else if (temperatura > 20) {
  mensaje <- "Temperatura agradable"
} else {
  mensaje <- "Hace frío"
}

print(mensaje)  # "Temperatura agradable"

Los bucles permiten repetir operaciones de forma eficiente. El bucle for es especialmente útil para iterar sobre secuencias de datos.

# Bucle for básico
for (i in 1:5) {
  print(paste("Iteración:", i))
}

# Bucle sobre un vector de nombres
nombres <- c("Ana", "Luis", "María")
for (nombre in nombres) {
  print(paste("Hola,", nombre))
}

La sintaxis de R proporciona una base sólida para el análisis de datos, combinando simplicidad con flexibilidad. Estos elementos fundamentales forman la base sobre la cual se construyen análisis más complejos y especializados.

Empezar curso de R

Lecciones de este módulo de R

Lecciones de programación del módulo Sintaxis del curso de R.