Ejercicio de programación con Numpy: Numpy estadísticas sobre dataset inmuebles Madrid

Proyecto
Puntuación
0h 50m

Media, mediana, mínimo, máximo, cuartiles, rango intercuartílico, asimetría, curtosis, transformaciones de datos, contraste de hipótesis con Numpy en Python para ciencia de datos.

  1. Preparación del entorno:

    • Asegúrate de tener instalado Python y las librerías NumPy, Matplotlib y Seaborn.
    • Descarga el dataset desde Kaggle y descomprímelo si es necesario.
    • Configura tu entorno de trabajo en Visual Studio Code y crea un nuevo Jupyter Notebook.
  2. Carga de datos:

    • Utiliza np.genfromtxt para cargar los datos en un array NumPy.
    • Verifica que los datos se hayan cargado correctamente examinando algunas filas.
  3. Preprocesamiento de datos:

    • Elimina la cadena ", Madrid" de la columna address utilizando funciones de NumPy.
    • Maneja los valores faltantes o anomalías en los datos si existen.
  4. Análisis estadístico y visualización:

    • Calcula la media, mediana, máximo y mínimo de las columnas numéricas.
    • Genera histogramas y curvas de densidad para visualizar las distribuciones.
    • Identifica posibles sesgos o patrones en los datos.
  5. Análisis de cuartiles y dispersión:

    • Calcula los cuartiles y el IQR de las columnas numéricas.
    • Filtra el 20% de las propiedades más caras y más baratas; analiza sus características.
    • Opcional: Filtra los barrios del 20% de las propiedades más baratas y analiza la moda.
    • Calcula la varianza y la desviación estándar.
  6. Detección y visualización de outliers:

    • Aplica los métodos de Tukey y z-score para detectar outliers.
    • Visualiza los outliers en gráficos, señalando los límites en rojo y azul.
  7. Análisis de correlación y estandarización:

    • Calcula la matriz de correlación entre las variables numéricas.
    • Representa la matriz de correlación usando un mapa de calor (heatmap).
    • Estandariza las columnas numéricas y observa los efectos en las correlaciones.
  8. Análisis de asimetría y curtosis:

    • Calcula la asimetría y curtosis de las distribuciones.
    • Aplica transformaciones a las distribuciones (logarítmica, raíz cuadrada) y analiza los resultados.
  9. Contraste de hipótesis:

    • Selecciona dos barrios (X e Y) e hipótesis a contrastar sobre sus precios.
    • Realiza pruebas estadísticas (e.g., t-test) para contrastar las hipótesis planteadas.
    • Interpreta los resultados y concluye sobre las hipótesis.
Empezar ejercicio de programación

Más ejercicios de programación con Numpy

Evalúa tus conocimientos en Numpy con más ejercicios de programación de tipo Test, Puzzle, Código y Proyecto con VSCode.

Certificados de superación de Numpy

Supera todos los retos de Numpy y obtén certificados de superación para mejorar tu currículum y empleabilidad.

Tecnologías de este ejercicio de programación

Entornos de desarrollo para este ejercicio

Image

Visual Studio Code

Image

GitHub