Módulo: Vision y modelos multimodales
Este módulo forma parte del curso de Transformers. .
En este modulo exploraras los Vision Transformers (ViT) para clasificacion de imagenes, modelos de deteccion de objetos como DETR, y modelos multimodales como CLIP para image-text...
Explora más sobre Transformers
Descubre más recursos de Transformers
Alan Sastre
Ingeniero de Software y formador, CEO en CertiDevs
Ingeniero de software especializado en Full Stack y en Inteligencia Artificial. Como CEO de CertiDevs, Transformers es una de sus áreas de expertise. Con más de 15 años programando, 6K seguidores en LinkedIn y experiencia como formador, Alan se dedica a crear contenido educativo de calidad para desarrolladores de todos los niveles.