Descripción
Analiza el dataset de propiedades de Madrid realizando cálculos estadísticos, visualizaciones, detección de outliers y contrastes de hipótesis usando Python, NumPy, Matplotlib y Seaborn.
-
Preparación del entorno:
- Asegúrate de tener instalado Python y las librerías NumPy, Matplotlib y Seaborn.
- Descarga el dataset desde Kaggle y descomprímelo si es necesario.
- Configura tu entorno de trabajo en Visual Studio Code y crea un nuevo Jupyter Notebook.
-
Carga de datos:
- Utiliza
np.genfromtxt
para cargar los datos en un array NumPy. - Verifica que los datos se hayan cargado correctamente examinando algunas filas.
- Utiliza
-
Preprocesamiento de datos:
- Elimina la cadena ", Madrid" de la columna
address
utilizando funciones de NumPy. - Maneja los valores faltantes o anomalías en los datos si existen.
- Elimina la cadena ", Madrid" de la columna
-
Análisis estadístico y visualización:
- Calcula la media, mediana, máximo y mínimo de las columnas numéricas.
- Genera histogramas y curvas de densidad para visualizar las distribuciones.
- Identifica posibles sesgos o patrones en los datos.
-
Análisis de cuartiles y dispersión:
- Calcula los cuartiles y el IQR de las columnas numéricas.
- Filtra el 20% de las propiedades más caras y más baratas; analiza sus características.
- Opcional: Filtra los barrios del 20% de las propiedades más baratas y analiza la moda.
- Calcula la varianza y la desviación estándar.
-
Detección y visualización de outliers:
Guarda tu progreso
Inicia sesión para no perder tu progreso y accede a miles de tutoriales, ejercicios prácticos y nuestro asistente de IA.
Más de 25.000 desarrolladores ya confían en CertiDevs
- Aplica los métodos de Tukey y z-score para detectar outliers.
- Visualiza los outliers en gráficos, señalando los límites en rojo y azul.
-
Análisis de correlación y estandarización:
- Calcula la matriz de correlación entre las variables numéricas.
- Representa la matriz de correlación usando un mapa de calor (heatmap).
- Estandariza las columnas numéricas y observa los efectos en las correlaciones.
-
Análisis de asimetría y curtosis:
- Calcula la asimetría y curtosis de las distribuciones.
- Aplica transformaciones a las distribuciones (logarítmica, raíz cuadrada) y analiza los resultados.
-
Contraste de hipótesis:
- Selecciona dos barrios (X e Y) e hipótesis a contrastar sobre sus precios.
- Realiza pruebas estadísticas (e.g., t-test) para contrastar las hipótesis planteadas.
- Interpreta los resultados y concluye sobre las hipótesis.
Solución al ejercicio de programación en Numpy
¡Desbloquea la solución completa!
Completa el ejercicio de programación en Numpy para acceder a la solución paso a paso, explicaciones detalladas y mejores prácticas.
Practica con ejercicios de programación en Numpy
Mejora tus habilidades con cientos de ejercicios de práctica, recibe retroalimentación instantánea y obtén tu certificación cuando estés listo.
Asistente de IA
Aprende de tus errores
Progreso
Mide tu avance
Certificación
Valida tus habilidades
Únete a miles de desarrolladores mejorando sus habilidades en Numpy