Módulo: Optimización y despliegue de modelos
Este módulo forma parte del curso de TensorFlow. .
Desplegar modelos de deep learning en producción requiere optimizar para tamaño, velocidad y compatibilidad con el entorno de destino. TensorFlow ofrece un ecosistema completo de herramientas para cada caso de uso.
Formatos de guardado
El formato SavedModel es el estándar para producción: guarda arquitectura, pesos y funciones computacionales en un directorio portable. El formato .keras es el recomendado para uso general durante el desarrollo.
TensorFlow Lite
TFLite es el runtime optimizado para dispositivos móviles, IoT y edge. La cuantización reduce el modelo de float32 a int8 o float16, disminuyendo el tamaño ~75% y acelerando la inferencia 3-4× en hardware compatible. La cuantización full int8 requiere datos de calibración para determinar los rangos de activación.
TensorFlow Serving
TF Serving es un servidor de producción con API REST y gRPC que gestiona automáticamente el versionado de modelos. Se despliega fácilmente con Docker y es la solución estándar para inferencia a escala en la nube.
TensorFlow.js
TFjs permite ejecutar modelos directamente en el navegador usando WebGL/WebGPU, sin necesidad de servidor backend. Los datos del usuario nunca abandonan su dispositivo, lo que garantiza privacidad. tf.tidy() gestiona automáticamente la memoria de tensores intermedios.
Cuantización y poda
QAT (Quantization-Aware Training) simula la cuantización durante el entrenamiento para mayor precisión. La poda de pesos (pruning) con TF Model Optimization elimina los pesos menos importantes, creando modelos esparcidos que se comprimen mejor.
Otros módulos de este curso
Optimización y despliegue de modelos
Todos los módulos del curso
Navega entre los módulos de TensorFlow
Optimización y despliegue de modelos
Estás aquíExplora más sobre TensorFlow
Descubre más recursos de TensorFlow
Alan Sastre
Ingeniero de Software y formador, CEO en CertiDevs
Ingeniero de software especializado en Full Stack y en Inteligencia Artificial. Como CEO de CertiDevs, TensorFlow es una de sus áreas de expertise. Con más de 15 años programando, 6K seguidores en LinkedIn y experiencia como formador, Alan se dedica a crear contenido educativo de calidad para desarrolladores de todos los niveles.