Ejercicio de programación con Numpy: Numpy estadísticas sobre dataset inmuebles Madrid
Proyecto
0h 50m
Media, mediana, mínimo, máximo, cuartiles, rango intercuartílico, asimetría, curtosis, transformaciones de datos, contraste de hipótesis con Numpy en Python para ciencia de datos.
Preparación del entorno:
- Asegúrate de tener instalado Python y las librerías NumPy, Matplotlib y Seaborn.
- Descarga el dataset desde Kaggle y descomprímelo si es necesario.
- Configura tu entorno de trabajo en Visual Studio Code y crea un nuevo Jupyter Notebook.
Carga de datos:
- Utiliza
np.genfromtxt
para cargar los datos en un array NumPy. - Verifica que los datos se hayan cargado correctamente examinando algunas filas.
- Utiliza
Preprocesamiento de datos:
- Elimina la cadena ", Madrid" de la columna
address
utilizando funciones de NumPy. - Maneja los valores faltantes o anomalías en los datos si existen.
- Elimina la cadena ", Madrid" de la columna
Análisis estadístico y visualización:
- Calcula la media, mediana, máximo y mínimo de las columnas numéricas.
- Genera histogramas y curvas de densidad para visualizar las distribuciones.
- Identifica posibles sesgos o patrones en los datos.
Análisis de cuartiles y dispersión:
- Calcula los cuartiles y el IQR de las columnas numéricas.
- Filtra el 20% de las propiedades más caras y más baratas; analiza sus características.
- Opcional: Filtra los barrios del 20% de las propiedades más baratas y analiza la moda.
- Calcula la varianza y la desviación estándar.
Detección y visualización de outliers:
- Aplica los métodos de Tukey y z-score para detectar outliers.
- Visualiza los outliers en gráficos, señalando los límites en rojo y azul.
Análisis de correlación y estandarización:
- Calcula la matriz de correlación entre las variables numéricas.
- Representa la matriz de correlación usando un mapa de calor (heatmap).
- Estandariza las columnas numéricas y observa los efectos en las correlaciones.
Análisis de asimetría y curtosis:
- Calcula la asimetría y curtosis de las distribuciones.
- Aplica transformaciones a las distribuciones (logarítmica, raíz cuadrada) y analiza los resultados.
Contraste de hipótesis:
- Selecciona dos barrios (X e Y) e hipótesis a contrastar sobre sus precios.
- Realiza pruebas estadísticas (e.g., t-test) para contrastar las hipótesis planteadas.
- Interpreta los resultados y concluye sobre las hipótesis.
Más ejercicios de programación con Numpy
Evalúa tus conocimientos en Numpy con más ejercicios de programación de tipo Test, Puzzle, Código y Proyecto con VSCode.
Funciones estadísticas
Test
Integración con Pandas
Código
Instalación de Numpy
Test
Conocimiento general de Numpy
Test
Creación de arrays en Numpy
Código
Operaciones matemáticas con Arrays de Numpy
Código
Cálculo de estadísticas de Numpy sobre estudiantes
Proyecto
Modificación de arrays en Numpy
Test
Propiedades y atributos de arrays de Numpy
Puzzle
Indexación y segmentación
Código
Operaciones de álgebra lineal
Código
Conocimiento general de Numpy
Código
Integración de Numpy con Matplotlib
Puzzle
Certificados de superación de Numpy
Supera todos los retos de Numpy y obtén certificados de superación para mejorar tu currículum y empleabilidad.
Tecnologías de este ejercicio de programación
Entornos de desarrollo para este ejercicio
Visual Studio Code
GitHub