R: Sintaxis
Descubre la sintaxis básica de R para programación y análisis estadístico con ejemplos claros y operadores esenciales.
Aprende R GRATIS y certifícateSintaxis de R
R es un lenguaje de programación especializado en análisis estadístico y ciencia de datos que se caracteriza por su sintaxis intuitiva y expresiva. A diferencia de otros lenguajes de programación, R fue diseñado específicamente para trabajar con datos, lo que se refleja en su estructura sintáctica orientada a operaciones matemáticas y estadísticas.
Características fundamentales de la sintaxis
La sintaxis de R se basa en algunos principios fundamentales que la hacen única. El lenguaje utiliza el símbolo <-
como operador de asignación principal, aunque también acepta el símbolo =
. Esta característica distintiva refleja la filosofía de R de ser explícito en las operaciones.
# Asignación con <-
nombre <- "Juan"
edad <- 25
# También válido con =
altura = 1.75
Los comentarios en R se indican con el símbolo #
, y todo lo que aparece después de este símbolo en una línea se considera comentario. Esta práctica es esencial para documentar el código y hacerlo más comprensible.
Estructura básica de comandos
En R, cada instrucción puede escribirse en una línea separada o múltiples instrucciones pueden separarse con punto y coma en la misma línea. Sin embargo, la práctica recomendada es escribir una instrucción por línea para mejorar la legibilidad.
# Una instrucción por línea (recomendado)
x <- 10
y <- 20
resultado <- x + y
# Múltiples instrucciones en una línea (menos legible)
a <- 5; b <- 3; suma <- a + b
La sensibilidad a mayúsculas y minúsculas es una característica importante de R. Las variables Nombre
, nombre
y NOMBRE
son completamente diferentes para el intérprete.
Edad <- 30
edad <- 25
EDAD <- 35
# Estas son tres variables distintas
print(Edad) # 30
print(edad) # 25
print(EDAD) # 35
Nombres de variables y objetos
Los nombres de variables en R deben seguir reglas específicas. Pueden comenzar con una letra o un punto (seguido de una letra), y pueden contener letras, números, puntos y guiones bajos. No pueden comenzar con números ni contener espacios.
# Nombres válidos
mi_variable <- 100
datos.2023 <- "información"
.variable_oculta <- TRUE
temperatura_maxima <- 35.5
# Nombres no válidos (generarían error)
# 2variable <- 10
# mi variable <- 20
# variable-especial <- 30
La convención de nomenclatura más común en R utiliza puntos para separar palabras, aunque también se acepta el uso de guiones bajos. La consistencia en el estilo es más importante que la convención específica elegida.
Operadores básicos
R incluye un conjunto completo de operadores aritméticos que permiten realizar cálculos matemáticos de forma intuitiva. Estos operadores siguen las reglas de precedencia matemática estándar.
# Operadores aritméticos básicos
suma <- 5 + 3 # 8
resta <- 10 - 4 # 6
multiplicacion <- 6 * 7 # 42
division <- 15 / 3 # 5
potencia <- 2^3 # 8
modulo <- 17 %% 5 # 2 (resto de la división)
Los operadores de comparación son fundamentales para crear condiciones y filtros en el análisis de datos. Estos operadores devuelven valores lógicos (TRUE
o FALSE
).
# Operadores de comparación
a <- 10
b <- 5
mayor <- a > b # TRUE
menor <- a < b # FALSE
igual <- a == b # FALSE
diferente <- a != b # TRUE
mayor_igual <- a >= b # TRUE
menor_igual <- a <= b # FALSE
Tipos de datos básicos
R maneja varios tipos de datos fundamentales que son esenciales para cualquier análisis. Los tipos más comunes incluyen números, texto, valores lógicos y factores.
# Tipos de datos básicos
numero_entero <- 42L # integer
numero_decimal <- 3.14 # numeric
texto <- "Hola mundo" # character
logico <- TRUE # logical
La función class()
permite identificar el tipo de dato de cualquier variable, lo cual es útil para verificar que los datos tienen el formato esperado.
# Verificar tipos de datos
class(numero_entero) # "integer"
class(numero_decimal) # "numeric"
class(texto) # "character"
class(logico) # "logical"
Estructuras de control básicas
Las estructuras condicionales en R utilizan la sintaxis if
, else if
y else
para controlar el flujo de ejecución del programa. La condición debe estar entre paréntesis y el código a ejecutar entre llaves.
# Estructura condicional básica
temperatura <- 25
if (temperatura > 30) {
mensaje <- "Hace calor"
} else if (temperatura > 20) {
mensaje <- "Temperatura agradable"
} else {
mensaje <- "Hace frío"
}
print(mensaje) # "Temperatura agradable"
Los bucles permiten repetir operaciones de forma eficiente. El bucle for
es especialmente útil para iterar sobre secuencias de datos.
# Bucle for básico
for (i in 1:5) {
print(paste("Iteración:", i))
}
# Bucle sobre un vector de nombres
nombres <- c("Ana", "Luis", "María")
for (nombre in nombres) {
print(paste("Hola,", nombre))
}
La sintaxis de R proporciona una base sólida para el análisis de datos, combinando simplicidad con flexibilidad. Estos elementos fundamentales forman la base sobre la cual se construyen análisis más complejos y especializados.
Lecciones de este módulo de R
Lecciones de programación del módulo Sintaxis del curso de R.