Ejercicio de programación con ScikitLearn: Regresión lineal
Código
0h 20m
Scikit-Learn: Regresión lineal con datos 'tips' de Seaborn para predecir 'total_bill' desde 'tip', demostrando el uso básico de modelos de aprendizaje.
En este reto, utilizarás el dataset 'tips' de la librería Seaborn para implementar una regresión lineal simple usando Scikit-Learn. Tu tarea será predecir el valor de la variable tip
basado en el valor de la variable total_bill
. Sigue los pasos detallados a continuación para completar el ejercicio.
Carga de datos:
- Utiliza Seaborn para cargar el conjunto de datos ‘tips’ usando
df = sns.load_dataset('tips')
. - Crea un DataFrame con estos datos para su manipulación.
Exploración de datos:
- Inspecciona las primeras filas del dataset para entender la estructura de los datos.
- Asegúrate de que las columnas
total_bill
ytip
están presentes en el DataFrame.
Preparación de datos:
- Selecciona
total_bill
como la variable independiente (X) ytip
como la variable dependiente (y). - Asegúrate de que
tip
esté en forma de matriz columna (utilizareshape(-1, 1)
).
Implementación del modelo:
- Importa la clase
LinearRegression
desklearn.linear_model
. - Crea una instancia del modelo de regresión lineal.
- Ajusta el modelo a los datos utilizando el método
fit()
.
Extracción de coeficientes:
- Al finalizar el ajuste del modelo, imprime los coeficientes e intercepto obtenidos. Al ser regresión lineal simple habrá solo un coeficiente.
Visualización de resultados:
- Genera un gráfico de dispersión de los datos reales (
tip
vs.total_bill
). - Superpone la línea de regresión obtenida.
Evaluación del modelo:
- Utiliza el modelo para predecir valores de tip.
- Calcula el coeficiente de determinación ( R^2 ) para medir el desempeño del modelo.
Todos los ejercicios de programación de ScikitLearn
Evalúa tus conocimientos con ejercicios de programación en ScikitLearn de tipo Test, Puzzle, Código y Proyecto con VSCode.
Regresión SVM con SVR
Código
Ajuste de hiperparámetros
Código
Pipelines y Validación Cruzada
Código
Preprocesamiento de datos desbalanceados
Código
Pipelines con ColumnTransformer
Código
Validación y evaluación de modelos
Código
Preprocesamiento de datos de series temporales
Código
Identificación y tratamiento de valores faltantes
Código
Ingeniería de características para series temporales
Código
Introducción a la clasificación
Código
Transformación y escalado de series temporales
Código
Extracción de características
Código
Clasificación KNN KNeighborsClassifier
Código
Regresión con algoritmos de conjunto
Código
Reducción de la dimensionalidad con PCA
Código
Clasificación con algoritmos de conjunto
Código
Clasificación SVM con SVC
Código
Escalado de datos
Código
Clustering jerárquico
Código
Análisis de sentimiento
Código
Validación y evaluación de modelos en series temporales
Código
Regresión KNN KNeighborsRegressor
Código
Técnicas de validación cruzada
Código
Introducción al preprocesamiento de datos
Código
Exportar e importar Pipelines
Código
Preprocesamiento de textos para NLP
Código
Clasificación con árboles DecisionTreeClassifier
Código
Selección de Características
Código
Introducción a la regresión
Código
Clasificación con regresión logística en Scikit Learn
Código
Ingeniería de Características
Código
Clustering con KMeans
Código
Introducción al análisis de series temporales
Código
Codificación de variables categóricas
Código
Clasificación de Texto con Scikit Learn
Código
Métricas de Regresión
Código
Aprendizaje automático
Puzzle
Clustering de densidad con DBSCAN
Código
Métricas de clasificación
Código
Técnicas avanzadas de extracción de características
Código
Creación de pipelines básicos
Código
Particionamiento de datos
Código
Normalización de datos
Código
Regresión con árboles DecisionTreeRegressor
Código
Introducción e instalación de Scikit Learn
Código
Preprocesamiento de datos con pipelines
Código
Representación de texto y extracción de características
Código
Introducción a pipelines
Código
Tutorial para resolver este ejercicio de programación
ScikitLearn
Regresión lineal
Regresión