NumPy define cómo se representan y procesan los datos numéricos en gran parte del ecosistema Python. Proporciona el objeto ndarray, homogéneo y optimizado para operaciones vectorizadas en código nativo. Es la base sobre la que se construyen Pandas, Scikit-learn, Matplotlib, SciPy y TensorFlow; la mayor parte de los flujos de datos y ML en Python dependen de NumPy directa o indirectamente.
La serie 2.x moderniza tipos, copias y el API público frente a módulos internos. Este itinerario sigue la documentación oficial y la guía de migración a NumPy 2: np.asarray, vistas frente a copias, Generator (default_rng) para aleatoriedad reproducible, np.linalg.matrix_norm y np.linalg.vector_norm alineadas con el Array API standard, e interoperabilidad con PyArrow y el resto del ecosistema científico.
Qué incluye este itinerario
- Introducción e instalación: contexto en el ecosistema científico, instalación con pip o uv y comprobación del entorno.
- Arrays: creación (
array,zeros,ones,arange,linspace), atributos (shape,dtype,ndim), indexación básica y avanzada, cambios de forma (reshape,transpose,concatenate), y memoria en NumPy 2 (vistas,copy, APIs públicas). - Operaciones: aritmética elemento a elemento, broadcasting, ufuncs y reducciones por eje (
sum,mean,max,min). - Estadística y aleatoriedad: descriptivos, correlación, covarianza, Generator y test de consolidación.
- Álgebra lineal: producto matricial, determinante, inversa, autovalores, SVD, sistemas
Ax = by mínimos cuadrados connumpy.linalg. - Integración: Series/DataFrames y gráficos con Matplotlib, con retos de código dedicados.
- NumPy avanzado: persistencia de arrays con
.npy/.npz/CSV, arrays estructurados condtypecompuesto ynp.recarray, vectorización connp.einsum, orden de memoria C/F y técnicas de profiling. - Evaluación final: reto de código, orientación al examen y test de síntesis.
Público objetivo
- Desarrolladores Python que necesitan rendimiento numérico y claridad sobre memoria y vistas.
- Perfiles de datos y ML que requieren una base sólida antes de Pandas o frameworks de modelado.
- Cualquier persona que trabaje con datos tabulares o matrices y quiera entender la capa bajo Pandas y Scikit-learn.