Scikit Learn: Proyecto - Regresión con dataset Tips

Proyecto de programación
Intermedio
Scikit Learn
Curso de Scikit Learn
30 min
Actualizado: 25/04/2026

Ejercicio de programación: Proyecto - Regresión con dataset Tips

Este ejercicio de programación está diseñado para poner a prueba tus conocimientos en Scikit Learn. Es un ejercicio de nivel intermedio que requiere conocimientos sólidos de la tecnología.

Tipo: Proyecto 30 minutos estimados

Información adicional del ejercicio

Proyecto integrador de regresión con Scikit-learn usando el dataset tips de Seaborn. El alumno aplica el flujo completo de preprocesado, entrena cuatro modelos distintos (LinearRegression, Ridge, KNeighborsRegressor, DecisionTreeRegressor), compara métricas MAE, MSE y R2, y entrega un pipeline reproducible con ColumnTransformer.

Contenido del ejercicio

En este proyecto integrador aplicarás el flujo completo de aprendizaje automático para resolver un problema de regresión sobre el dataset tips de Seaborn. El objetivo es predecir el importe total de la cuenta (total_bill) a partir de las características disponibles.

Contexto del proyecto

El dataset tips contiene 244 registros de propinas en un restaurante con las siguientes variables:

  • total_bill: importe total de la cuenta (variable objetivo)
  • tip: propina dejada por el cliente
  • sex: sexo del cliente
  • smoker: si el cliente es fumador
  • day: día de la semana
  • time: momento del día (comida o cena)
  • size: tamaño del grupo

Partes del proyecto

Parte 1: Exploración y preprocesado (25%)

  1. Carga el dataset tips con sns.load_dataset("tips").
  2. Realiza un análisis exploratorio básico: estadísticas descriptivas y detección de valores nulos.
  3. Separa las características (tip, sex, smoker, day, time, size) de la variable objetivo (total_bill).
  4. Aplica OneHotEncoder a las variables categóricas (sex, smoker, day, time) y mantén las numéricas sin transformar.
  5. Divide los datos en entrenamiento (80 %) y prueba (20 %) con random_state=42.

Parte 2: Entrenamiento de modelos (25%)

Entrena al menos cuatro modelos de regresión sobre los datos de entrenamiento:

  1. LinearRegressión
  2. Ridge con alpha=1.0
  3. KNeighborsRegressor con n_neighbors=5
  4. DecisionTreeRegressor con random_state=42

Parte 3: Evaluación y comparación (25%)

  1. Calcula para cada modelo las métricas MAE, MSE y R² sobre el conjunto de prueba.
  2. Presenta los resultados en un DataFrame comparativo.
  3. Identifica el modelo con mejor R² y menor MAE.

Parte 4: Pipeline (25%)

Construye un Pipeline de Scikit-learn que encadene:

  1. Un ColumnTransformer con OneHotEncoder para las variables categóricas y StandardScaler para las numéricas.
  2. El mejor modelo identificado en la parte anterior.
  3. Evalúa el pipeline completo sobre el conjunto de prueba e imprime las métricas finales.

Más ejercicios de Scikit Learn

Explora más ejercicios de programación en Scikit Learn para mejorar tus habilidades y obtener tu certificación.

Ver más ejercicios de Scikit Learn
Alan Sastre - Autor del ejercicio

Alan Sastre

Ingeniero de Software y formador, CEO en CertiDevs

Ingeniero de software especializado en Full Stack y en Inteligencia Artificial. Como CEO de CertiDevs, Scikit Learn es una de sus áreas de expertise. Con más de 15 años programando, 6K seguidores en LinkedIn y experiencia como formador, Alan se dedica a crear ejercicios prácticos y contenido educativo de calidad para desarrolladores de todos los niveles.

Solución al ejercicio de programación en Scikit Learn

Contenido bloqueado

¡Desbloquea la solución completa!

Completa el ejercicio de programación en Scikit Learn para acceder a la solución paso a paso, explicaciones detalladas y mejores prácticas.

solution.js
JavaScript
1 function solveChallenge ( input ) {
2 // Algoritmo optimizado O(n log n)
3 const data = parseInput ( input );
4 const sorted = data . sort (( a , b ) => a - b );
5
6 // Aplicar técnica de dos punteros
7 let left = 0 , right = sorted . length - 1 ;
8 const result = [];
9
10 while ( left < right ) {
11 const sum = sorted [ left ] + sorted [ right ];
12 if ( sum === target ) {
13 result . push ([ sorted [ left ], sorted [ right ]]);
14 left ++; right --;
15 } else if ( sum < target ) {
16 left ++;
17 } else {
18 right --;
19 }
20 }
21
22 return result ;
23 }
Código completo
Explicaciones
Mejores prácticas
+1.200 developers han resuelto este ejercicio de programación

Practica con ejercicios de programación en Scikit Learn

Mejora tus habilidades con cientos de ejercicios de práctica, recibe retroalimentación instantánea y obtén tu certificación cuando estés listo.

Asistente de IA

Aprende de tus errores

Progreso

Mide tu avance

Certificación

Valida tus habilidades

Ejercicios de programación en Scikit Learn: Práctica y Certificación

Los ejercicios de programación son fundamentales para dominar Scikit Learn. Este ejercicio está diseñado para poner a prueba tus conocimientos prácticos y ayudarte a consolidar lo aprendido en las lecciones teóricas. La práctica constante con ejercicios de programación es la clave para convertirte en un desarrollador experto.

¿Por qué resolver ejercicios de programación?

Resolver ejercicios de programación en Scikit Learn te permite:

  • Aplicar conocimientos teóricos: Poner en práctica los conceptos aprendidos en las lecciones de Scikit Learn.
  • Identificar áreas de mejora: Descubrir qué conceptos necesitas reforzar en tu aprendizaje de Scikit Learn.
  • Prepararte para certificaciones: Los ejercicios te preparan para obtener certificados profesionales en Scikit Learn.
  • Mejorar tu perfil profesional: Demostrar tus habilidades prácticas en Scikit Learn.

Metodología de aprendizaje

Nuestros ejercicios de programación están diseñados siguiendo una metodología probada de aprendizaje progresivo. Cada ejercicio en Scikit Learn está cuidadosamente estructurado para llevar tus habilidades al siguiente nivel. Comenzamos con conceptos fundamentales y avanzamos gradualmente hacia desafíos más complejos que reflejan situaciones reales del desarrollo de software profesional.

Certificación y validación de conocimientos

Al completar ejercicios de programación, no solo mejoras tus habilidades técnicas, sino que también puedes obtener certificados que validan tu expertise en Scikit Learn. Estos certificados son reconocidos por empresas y pueden ser una gran adición a tu perfil profesional de LinkedIn o tu CV como desarrollador.

Los ejercicios están alineados con los estándares de la industria y cubren desde conceptos básicos hasta técnicas avanzadas de programación en Scikit Learn. Cada ejercicio incluye casos de prueba y ejemplos prácticos que te ayudarán a comprender mejor cómo aplicar lo aprendido en proyectos reales.

Nota: Para obtener el máximo beneficio de este ejercicio de programación, te recomendamos revisar primero las lecciones relacionadas de Scikit Learn y asegurarte de comprender los conceptos básicos antes de intentar resolver el ejercicio.