Ejercicio de programación con ScikitLearn: Regresión lineal

Código
Práctica
0h 20m

Scikit-Learn: Regresión lineal con datos 'tips' de Seaborn para predecir 'total_bill' desde 'tip', demostrando el uso básico de modelos de aprendizaje.

En este reto, utilizarás el dataset 'tips' de la librería Seaborn para implementar una regresión lineal simple usando Scikit-Learn. Tu tarea será predecir el valor de la variable tip basado en el valor de la variable total_bill. Sigue los pasos detallados a continuación para completar el ejercicio.

Carga de datos:

  • Utiliza Seaborn para cargar el conjunto de datos ‘tips’ usando df = sns.load_dataset('tips').
  • Crea un DataFrame con estos datos para su manipulación.

Exploración de datos:

  • Inspecciona las primeras filas del dataset para entender la estructura de los datos.
  • Asegúrate de que las columnas total_bill y tip están presentes en el DataFrame.

Preparación de datos:

  • Selecciona total_bill como la variable independiente (X) y tip como la variable dependiente (y).
  • Asegúrate de que tip esté en forma de matriz columna (utiliza reshape(-1, 1)).

Implementación del modelo:

  • Importa la clase LinearRegression de sklearn.linear_model.
  • Crea una instancia del modelo de regresión lineal.
  • Ajusta el modelo a los datos utilizando el método fit().

Extracción de coeficientes:

  • Al finalizar el ajuste del modelo, imprime los coeficientes e intercepto obtenidos. Al ser regresión lineal simple habrá solo un coeficiente.

Visualización de resultados:

  • Genera un gráfico de dispersión de los datos reales (tip vs. total_bill).
  • Superpone la línea de regresión obtenida.

Evaluación del modelo:

  • Utiliza el modelo para predecir valores de tip.
  • Calcula el coeficiente de determinación ( R^2 ) para medir el desempeño del modelo.
Empezar ejercicio de programación

Todos los ejercicios de programación de ScikitLearn

Evalúa tus conocimientos con ejercicios de programación en ScikitLearn de tipo Test, Puzzle, Código y Proyecto con VSCode.

Pipelines y Validación Cruzada

Código

Transformación y escalado de series temporales

Código

Clasificación SVM con SVC

Código

Creación de pipelines básicos

Código

Clasificación de Texto con Scikit Learn

Código

Aprendizaje automático

Puzzle

Validación y evaluación de modelos

Código

Validación y evaluación de modelos en series temporales

Código

Exportar e importar Pipelines

Código

Introducción a la regresión

Código

Clasificación con algoritmos de conjunto

Código

Introducción a la clasificación

Código

Técnicas de validación cruzada

Código

Ingeniería de Características

Código

Análisis de sentimiento

Código

Preprocesamiento de textos para NLP

Código

Clustering con KMeans

Código

Introducción al preprocesamiento de datos

Código

Regresión KNN KNeighborsRegressor

Código

Introducción al análisis de series temporales

Código

Ingeniería de características para series temporales

Código

Preprocesamiento de datos de series temporales

Código

Clustering jerárquico

Código

Regresión con árboles DecisionTreeRegressor

Código

Técnicas avanzadas de extracción de características

Código

Clasificación KNN KNeighborsClassifier

Código

Reducción de la dimensionalidad con PCA

Código

Introducción a pipelines

Código

Regresión SVM con SVR

Código

Particionamiento de datos

Código

Pipelines con ColumnTransformer

Código

Selección de Características

Código

Métricas de clasificación

Código

Regresión con algoritmos de conjunto

Código

Escalado de datos

Código

Extracción de características

Código

Métricas de Regresión

Código

Ajuste de hiperparámetros

Código

Introducción e instalación de Scikit Learn

Código

Normalización de datos

Código

Clasificación con árboles DecisionTreeClassifier

Código

Preprocesamiento de datos desbalanceados

Código

Codificación de variables categóricas

Código

Clasificación con regresión logística en Scikit Learn

Código

Preprocesamiento de datos con pipelines

Código

Identificación y tratamiento de valores faltantes

Código

Clustering de densidad con DBSCAN

Código

Representación de texto y extracción de características

Código

Tutorial para resolver este ejercicio de programación

ScikitLearn

Regresión lineal

Regresión

Otros tutoriales de programación con ScikitLearn

Aprendizaje Automático

Introducción Y Entorno

Introducción E Instalación

Introducción Y Entorno

Introducción Al Preprocesamiento De Datos

Preprocesamiento De Datos

Identificación Y Tratamiento De Valores Faltantes

Preprocesamiento De Datos

Escalado De Datos

Preprocesamiento De Datos

Normalización De Datos

Preprocesamiento De Datos

Codificación De Variables Categóricas

Preprocesamiento De Datos

Ingeniería De Características

Preprocesamiento De Datos

Selección De Características

Preprocesamiento De Datos

Extracción De Características

Preprocesamiento De Datos

Particionamiento De Datos

Preprocesamiento De Datos

Preprocesamiento De Datos Desbalanceados

Preprocesamiento De Datos

Introducción A La Regresión

Regresión

Regresión Knn Kneighborsregressor

Regresión

Regresión Svm Con Svr

Regresión

Regresión Con Árboles Decisiontreeregressor

Regresión

Regresión Con Algoritmos De Conjunto

Regresión

Introducción A La Clasificación

Clasificación

Clasificación Con Regresión Logística

Clasificación

Clasificación Knn Kneighborsclassifier

Clasificación

Clasificación Svm Con Svc

Clasificación

Clasificación Con Árboles Decisiontreeclassifier

Clasificación

Clasificación Con Algoritmos De Conjunto

Clasificación

Reducción De La Dimensionalidad Con Pca

Aprendizaje No Supervisado

Clustering Con Kmeans

Aprendizaje No Supervisado

Clustering Jerárquico

Aprendizaje No Supervisado

Clustering De Densidad Con Dbscan

Aprendizaje No Supervisado

Preprocesamiento De Textos Para Nlp

Nlp

Representación De Texto Y Extracción De Características

Nlp

Clasificación De Texto Con Scikit Learn

Nlp

Análisis De Sentimiento

Nlp

Técnicas Avanzadas De Extracción De Características

Nlp

Introducción Al Análisis De Series Temporales

Series Temporales

Preprocesamiento De Datos De Series Temporales

Series Temporales

Ingeniería De Características Para Series Temporales

Series Temporales

Transformación Y Escalado De Series Temporales

Series Temporales

Validación Y Evaluación De Modelos En Series Temporales

Series Temporales

Validación Y Evaluación De Modelos

Validación De Modelos

Técnicas De Validación Cruzada

Validación De Modelos

Métricas De Regresión

Validación De Modelos

Métricas De Clasificación

Validación De Modelos

Ajuste De Hiperparámetros

Validación De Modelos

Introducción A Pipelines

Pipelines Y Despliegue

Creación De Pipelines Básicos

Pipelines Y Despliegue

Preprocesamiento De Datos Con Pipelines

Pipelines Y Despliegue

Pipelines Y Validación Cruzada

Pipelines Y Despliegue

Pipelines Con Columntransformer

Pipelines Y Despliegue

Exportar E Importar Pipelines

Pipelines Y Despliegue