Ver qué modelos están en ejecución: ollama ps
Cuando ejecutas un modelo con ollama run o cuando una aplicación usa la API, el servidor de Ollama carga el modelo en memoria (RAM y, si hay GPU, VRAM) para responder a las peticiones. Varios modelos pueden estar cargados a la vez si has usado distintos en poco tiempo o si hay varias peticiones concurrentes.
Para ver qué modelos están actualmente cargados en el servidor usa:
ollama ps
La salida muestra una tabla con el nombre del modelo, el tamaño que ocupa en memoria, el tiempo que lleva cargado y, en su caso, el tiempo restante estimado hasta que se descargue por inactividad. Así puedes comprobar si un modelo que ya no usas sigue ocupando recursos y decidir si conviene detenerlo con ollama stop.

El servidor suele descargar modelos de memoria tras un periodo de inactividad para liberar recursos. Si quieres liberar de inmediato, usa
ollama stop.
flowchart LR
A["ollama pull<br/>Descargar"] --> B["Modelo en disco"]
B --> C["ollama run<br/>Cargar en memoria"]
C --> D["ollama ps<br/>Ver modelos activos"]
D --> E["ollama stop<br/>Liberar memoria"]
E --> B
B --> F["ollama rm<br/>Eliminar del disco"]
B --> G["ollama copy<br/>Duplicar modelo"]
Liberar memoria: ollama stop
Si quieres descargar un modelo de la memoria sin eliminarlo del disco (por ejemplo para liberar RAM o VRAM y usar otro modelo), usa:
ollama stop nombre-modelo
El modelo deja de estar cargado en el servidor y los recursos quedan disponibles. El archivo del modelo sigue en disco, así que la próxima vez que hagas ollama run nombre-modelo o que la API lo solicite, se volverá a cargar. Útil cuando cambias de tarea y no necesitas tener varios modelos residentes a la vez.
Para detener todos los modelos cargados:
ollama stop --all
En versiones recientes el flag puede ser -a o --all, consulta ollama stop --help en tu instalación para el nombre exacto.
Eliminar un modelo del disco: ollama rm
Cuando ya no necesitas un modelo y quieres liberar espacio en disco, elimínalo con:
ollama rm nombre-modelo
Debes indicar el nombre exacto tal como aparece en ollama list, incluyendo el tag si lo tiene (por ejemplo llama3.2:3b o llama3.2:latest). El modelo se borra del almacenamiento local. Si en ese momento estaba cargado en memoria, también se descargará.
Antes de eliminar, comprueba con
ollama listel nombre completo del modelo. Si solo escribesollama rm llama3.2puede que Ollama elimine la variante por defecto (por ejemplolatest) según la versión. Para evitar equivocaciones usa el nombre que muestraollama list.
No puedes recuperar un modelo eliminado más que volviendo a descargarlo con ollama pull.
Duplicar o renombrar un modelo: ollama copy
A veces quieres tener una copia de un modelo con otro nombre o tag: por ejemplo, para crear una variante personalizada sin tocar el original, o para "congelar" una versión con un tag distinto. El comando ollama copy (en la documentación puede aparecer como ollama cp) crea una copia en disco sin volver a descargar nada:
ollama copy origen destino
Ejemplo: copiar el modelo llama3.2:latest a un nombre personalizado mi-llama:
ollama copy llama3.2:latest mi-llama
Tras el comando tendrás dos entradas en ollama list: la original y mi-llama. La copia ocupa espacio en disco (es un duplicado de los archivos del modelo). A partir de ahí puedes usar ollama run mi-llama o modificar esa copia con un Modelfile si más adelante creas modelos personalizados basados en ella.
No elimina el modelo origen, solo añade uno nuevo con el nombre destino. Si el nombre destino ya existe, la operación puede fallar o sobrescribir según la versión de Ollama, así que conviene comprobar antes con ollama list.
Resumen de comandos de gestión
| Acción | Comando |
|---------------------------|----------------------------|
| Listar modelos en memoria | ollama ps |
| Descargar modelo de memoria | ollama stop nombre-modelo |
| Descargar todos de memoria | ollama stop --all (o -a) |
| Eliminar modelo del disco | ollama rm nombre-modelo |
| Copiar modelo (otro nombre) | ollama copy origen destino |
Estos comandos cubren el ciclo de vida de los modelos en la CLI: ver qué está en uso, liberar memoria cuando convenga, eliminar lo que ya no necesitas y duplicar modelos cuando quieras conservar una variante con otro nombre. Junto con ollama pull y ollama list tienes el control completo del catálogo local y de los recursos del servidor desde la terminal.
Alan Sastre
Ingeniero de Software y formador, CEO en CertiDevs
Ingeniero de software especializado en Full Stack y en Inteligencia Artificial. Como CEO de CertiDevs, Ollama es una de sus áreas de expertise. Con más de 15 años programando, 6K seguidores en LinkedIn y experiencia como formador, Alan se dedica a crear contenido educativo de calidad para desarrolladores de todos los niveles.
Más tutoriales de Ollama
Explora más contenido relacionado con Ollama y continúa aprendiendo con nuestros tutoriales gratuitos.
Aprendizajes de esta lección
Usar ollama ps para ver modelos en ejecución, ollama stop para liberar memoria, ollama rm para eliminar modelos y ollama copy para duplicar o renombrar modelos.
Cursos que incluyen esta lección
Esta lección forma parte de los siguientes cursos estructurados con rutas de aprendizaje