Saltar al contenido principal
147 € 300h Itinerario profesional

IA para Ciencia de Datos

Carrera profesional de ciencia de datos e IA para equipos que construyen modelos predictivos, sistemas de ML y pipelines de deep learning en producción: Python, SQL, análisis con NumPy y pandas, visualización, machine learning con scikit-learn, deep learning con TensorFlow y PyTorch, Transformers de Hugging Face, PySpark y MLOps.

Cursos incluidos

Cada curso comprado por separado cuesta 19 €. La carrera completa por 147 € incluye todos los cursos del itinerario más certificado de carrera con QR verificable y acceso permanente.

Certificado incluido Acceso permanente Varios cursos incluidos

La carrera IA para Ciencia de Datos está dirigida a equipos que construyen modelos predictivos, sistemas de recomendación, motores de procesamiento de lenguaje natural y pipelines de deep learning en producción. A lo largo de varios cursos certificados, la carrera cubre todo el recorrido desde los fundamentos de programación y consulta de datos hasta el deep learning, los Transformers y el despliegue con MLOps.

La ciencia de datos y el machine learning continúan siendo pilares de la transformación digital en banca, seguros, retail, salud y sector público. Esta carrera proporciona una formación progresiva: se parte de Python y SQL como herramientas base, se avanza por las bibliotecas esenciales de manipulación y visualización de datos (NumPy, pandas, Matplotlib, Seaborn), se profundiza en machine learning clásico con scikit-learn, se explora el deep learning con los dos grandes frameworks (TensorFlow y PyTorch), se incorporan los Transformers de Hugging Face para procesamiento de lenguaje y visión, se escala el procesamiento de datos con PySpark y se cierra con MLOps para llevar modelos a producción con monitorización y gobernanza.

Cada curso está diseñado para construir sobre el anterior, de modo que adquieres competencias de forma gradual y coherente. El precio de la carrera completa es de 147 EUR.

Público objetivo

  • Equipos de ciencia de datos y analítica avanzada de banca, seguros, telecomunicaciones, retail, salud y sector público que construyen modelos de ML y pipelines de deep learning en producción.
  • Aspirantes a data scientist que quieren una formación completa y estructurada desde cero hasta un nivel profesional en ciencia de datos y machine learning.
  • Analistas de datos que desean evolucionar hacia el machine learning y el deep learning para ampliar sus capacidades analíticas.
  • Desarrolladores de software que buscan pivotar hacia la ciencia de datos y la inteligencia artificial con una base técnica sólida.
  • Investigadores y académicos que necesitan dominar las herramientas del ecosistema Python para análisis de datos y modelado estadístico.
  • Ingenieros de datos que quieren comprender el machine learning y el deep learning para colaborar mejor con los equipos de data science.

Estructura

1. Certificado completo de Python

Lenguaje base de toda la carrera y del ecosistema de ciencia de datos. Se cubren todos los fundamentos: sintaxis, estructuras de datos, OOP, programación funcional, sistema de tipos, biblioteca estándar y testing. Una base robusta en Python es imprescindible para aprovechar el resto de la carrera.

2. Certificado completo de SQL

Lenguaje estándar de consulta de datos y segunda herramienta fundamental del data scientist. Se aprende a realizar consultas complejas con joins, subqueries, funciones de ventana y agregaciones. SQL es esencial para acceder a las bases de datos corporativas donde residen la mayoría de los datos de negocio.

3. Certificado completo de NumPy

Biblioteca de computación numérica que es la base de todo el stack científico de Python. Se domina la creación y manipulación de arrays multidimensionales, operaciones vectorizadas, broadcasting, álgebra lineal y generación de números aleatorios. NumPy es el cimiento sobre el que se construyen Pandas, scikit-learn, TensorFlow y PyTorch.

4. Certificado completo de Pandas

Biblioteca de manipulación y análisis de datos tabulares. Se aprende a trabajar con DataFrames y Series para cargar, limpiar, transformar, agregar y exportar datos de múltiples formatos (CSV, Excel, JSON, SQL). Pandas es la herramienta central del flujo de trabajo diario de cualquier data scientist.

5. Certificado completo de Matplotlib

Biblioteca de visualización de datos de bajo nivel y referencia del ecosistema Python. Se aprende a crear gráficos de líneas, barras, dispersión, histogramas, mapas de calor y visualizaciones personalizadas con control total sobre cada elemento del gráfico. Matplotlib es la base sobre la que se construyen bibliotecas de más alto nivel como Seaborn.

6. Certificado completo de Seaborn

Biblioteca de visualización estadística de alto nivel construida sobre Matplotlib. Se aprende a crear gráficos estadísticos sofisticados con pocas líneas de código: distribuciones, relaciones entre variables, categorías, series temporales y matrices de correlación. Seaborn es la herramienta ideal para el análisis exploratorio de datos.

7. Certificado completo de scikit-learn

Biblioteca de machine learning clásico de referencia. Se cubren los principales algoritmos de clasificación, regresión, clustering y reducción de dimensionalidad, así como pipelines de preprocesamiento, selección de características, validación cruzada, ajuste de hiperparámetros y métricas de evaluación. scikit-learn es la herramienta estándar para el ML tradicional.

8. Certificado completo de TensorFlow

Primer framework de deep learning de la carrera. Se aprende a construir, entrenar y evaluar redes neuronales con Keras y TensorFlow: redes densas, convolucionales (CNN), recurrentes (RNN/LSTM), autoencoders, modelos generativos y transformers. TensorFlow es ampliamente utilizado en la industria y cuenta con un ecosistema maduro de herramientas para producción.

9. Certificado completo de PyTorch

Segundo framework de deep learning, preferido en investigación y cada vez más en producción. Se cubren tensores, autograd, construcción de modelos con nn.Module, entrenamiento personalizado, redes convolucionales, recurrentes y arquitecturas modernas. PyTorch destaca por su flexibilidad y su estilo imperativo que facilita la depuración y la experimentación.

10. Certificado completo de Transformers de Hugging Face

Biblioteca de referencia para el trabajo con modelos Transformers. Se aprende a cargar y ajustar modelos preentrenados para procesamiento de lenguaje, visión por computador y audio, utilizar el hub de Hugging Face, trabajar con datasets, pipelines y tokenizadores, y aplicar fine-tuning y destilación para crear modelos propios adaptados a las necesidades de la organización.

11. Certificado completo de PySpark (Apache Spark)

Framework de procesamiento de datos a gran escala. Se aprende a utilizar PySpark para manipular y analizar conjuntos de datos que exceden la capacidad de pandas, aplicar transformaciones distribuidas, ejecutar consultas SQL sobre datos masivos y construir pipelines de MLlib para machine learning a escala. PySpark prepara al alumno para escenarios de big data reales.

12. Certificado completo de MLOps

Prácticas de operación para modelos de machine learning y deep learning en producción. Se cubren pipelines de CI/CD para modelos, versionado de datos y modelos, gestión de experimentos, servicio de modelos, monitorización de drift y rendimiento, e infraestructura como código. MLOps cierra el ciclo de vida del modelo y es lo que diferencia un prototipo de un sistema fiable que genera valor de negocio.

Objetivos de aprendizaje

Al completar esta carrera, serás capaz de:

  • Programar en Python con nivel profesional y utilizar el lenguaje como herramienta principal de análisis y modelado de datos.
  • Consultar bases de datos relacionales con SQL, incluyendo joins complejos, subqueries y funciones de ventana.
  • Realizar computación numérica eficiente con NumPy: arrays multidimensionales, operaciones vectorizadas y álgebra lineal.
  • Manipular, limpiar, transformar y analizar datos tabulares con Pandas desde múltiples fuentes.
  • Crear visualizaciones de datos profesionales con Matplotlib y Seaborn para comunicar hallazgos de forma efectiva.
  • Aplicar algoritmos de machine learning clásico con scikit-learn: clasificación, regresión, clustering y reducción de dimensionalidad.
  • Diseñar pipelines completos de ML: preprocesamiento, selección de características, entrenamiento, validación cruzada y evaluación.
  • Construir y entrenar redes neuronales con TensorFlow y Keras para tareas de clasificación, visión por computador y procesamiento de secuencias.
  • Implementar modelos de deep learning con PyTorch, incluyendo redes convolucionales, recurrentes y arquitecturas personalizadas.
  • Procesar datos a gran escala con PySpark, aplicando transformaciones distribuidas y machine learning con MLlib.
  • Abordar proyectos completos de ciencia de datos de extremo a extremo: desde la adquisición y preparación de los datos hasta el modelado y la comunicación de resultados.

Tecnologías principales

  • Python: lenguaje base de toda la carrera y del ecosistema de ciencia de datos.
  • SQL: lenguaje estándar de consulta de bases de datos relacionales.
  • NumPy: computación numérica con arrays multidimensionales y operaciones vectorizadas.
  • pandas: manipulación y análisis de datos tabulares con DataFrames.
  • Matplotlib: visualización de datos de bajo nivel con control total sobre los gráficos.
  • Seaborn: visualización estadística de alto nivel para análisis exploratorio.
  • scikit-learn: machine learning clásico con clasificación, regresión, clustering y pipelines.
  • TensorFlow y Keras: deep learning con redes neuronales, CNN, RNN y modelos generativos.
  • PyTorch: deep learning flexible con estilo imperativo para investigación y producción.
  • Transformers de Hugging Face: modelos preentrenados y fine-tuning para NLP, visión y audio.
  • PySpark (Apache Spark): procesamiento de datos a gran escala y machine learning distribuido.
  • MLOps: prácticas de despliegue, monitorización y gobernanza de modelos en producción.

Antes de comprar

¿Cuánto dura el acceso?

Acceso permanente. La carrera queda asociada a tu cuenta para siempre, con todas las lecciones, ejercicios y certificado.

¿Incluye certificado?

Sí. Al superar los cursos del itinerario obtienes un certificado de carrera con QR público verificable. La URL del certificado es pública: puedes compartirla en LinkedIn o con un empleador sin que necesiten una cuenta CertiDevs.

¿Puedo pedir factura con NIF?

Sí. En el proceso de compra puedes indicar datos de facturación con NIF español o europeo. Stripe emite la factura electrónica automáticamente.

¿Hay devolución?

Sí. Devolución íntegra dentro de los 14 días naturales desde la compra siempre que no se haya consumido el contenido. Escríbenos a hola@certidevs.com con el correo de tu cuenta y procesamos el reembolso.

¿Te lo paga tu empresa o lo quieres para tu equipo? Tenemos modelos corporativos sin permanencia.

Ver propuesta para empresas