Elaboración de una base del proyecto

Utilizo como guía un modelo de lenguage (e.g., Chatgpt; Geminis, etc.).

Pregunta a Chatgpt: ¿Cómo hacer un estudio de brecha salarial con microdatos españoles?


Respuesta

Realizar un estudio de la brecha salarial con microdatos españoles implica un análisis sistemático de las diferencias salariales entre hombres y mujeres. Aquí tienes una guía detallada para llevarlo a cabo:


1. Definir el Objetivo del Estudio

El objetivo principal es cuantificar la brecha salarial entre hombres y mujeres y entender los factores que explican dicha brecha.

  1. Brecha cruda: Diferencia promedio entre los salarios de hombres y mujeres.
  2. Brecha ajustada: Diferencia salarial controlando por factores como nivel educativo, experiencia, ocupación, sector y otros.

2. Selección y Descarga de Microdatos

Utiliza microdatos oficiales que contengan información relevante sobre salarios y características laborales. Algunas fuentes españolas recomendadas:

  1. Encuesta de Estructura Salarial (EES) del Instituto Nacional de Estadística (INE):
    • Contiene información detallada sobre los salarios, ocupación, sector y características demográficas.
    • Descarga desde: INE Microdatos.
  2. Encuesta de Población Activa (EPA):
    • Incluye información sobre empleo, nivel educativo y características sociodemográficas.
  3. Datos complementarios:
    • Otros microdatos relacionados con características de empresas o sectores.

3. Variables Clave

Define las variables necesarias para el análisis

  1. Variable dependiente:

    • Salario bruto por hora: Calculado como \(\frac{\text{Salario Bruto}}{\text{Horas Trabajadas}}\).
  2. Variables independientes:

    • Demográficas: Género, edad, estado civil, hijos.

    • Educativas: Nivel educativo, tipo de formación.

    • Laborales: Sector, ocupación, jornada laboral (completa o parcial), antigüedad en la empresa, tipo de contrato.

    • Contextuales: Región, tamaño de la empresa.


4. Preprocesamiento de los Datos

  1. Limpieza de datos:
    • Eliminar valores faltantes o inconsistentes (e.g., salarios nulos, horas trabajadas = 0).
    • Convertir variables categóricas (e.g., género, nivel educativo) en variables dummies.
  2. Cálculo de variables:
    • Salario por hora: Divide el salario bruto entre las horas trabajadas.
    • Crear variables artificiales como universitario (1 si es diplomado o superior) o jornada_completa (1 si jornada completa, 0 si parcial).
  3. Exploración inicial:
    • Generar estadísticas descriptivas por género (salarios promedio, nivel educativo, etc.).

5. Análisis Estadístico

A. Brecha Salarial Cruda

Calcular la diferencia promedio de salarios por género: \[ \text{Brecha cruda} = \frac{\text{Salario promedio hombres} - \text{Salario promedio mujeres}}{\text{Salario promedio hombres}} \times 100 \]


B. Modelos de Regresión

Usa modelos de regresión para ajustar el salario por factores explicativos y cuantificar la brecha ajustada: 1. Modelo básico: \[ \text{Salario por hora} = \beta_0 + \beta_1 \cdot \text{Género} + \epsilon \] - \(\beta_1\) captura la brecha salarial cruda.

  1. Modelo ajustado: \[ \text{Salario por hora} = \beta_0 + \beta_1 \cdot \text{Género} + \beta_2 \cdot \text{Educación} + \beta_3 \cdot \text{Experiencia} + \dots + \epsilon \]
    • Incluye variables control como educación, experiencia, sector, etc.
    • Compara los coeficientes de \(\beta_1\) entre el modelo básico y el ajustado para interpretar cuánto de la brecha se explica por las variables control.

C. Descomposición de Oaxaca-Blinder

Descomponer la brecha salarial en dos partes:

  1. Parte explicada: Atribuible a diferencias en características observables (e.g., educación, experiencia, sector).

  2. Parte no explicada: Asociada a factores no observables o discriminación.

Usa el método Oaxaca-Blinder: \[ \text{Brecha} = (\bar{X}_h - \bar{X}_m) \cdot \beta + \bar{X}_m \cdot (\beta_h - \beta_m) \]


6. Visualización de Resultados

  1. Distribución Salarial por Género:
    • Gráficos de densidad de salarios por hora para hombres y mujeres.
    • Distribuciones acumulativas (CDFs).
  2. Comparación de salarios:
    • Gráficos de cajas y bigotes (boxplots) por género y nivel educativo.
  3. Brecha salarial:
    • Gráficos de barras con la brecha cruda y ajustada.

7. Interpretación de Resultados

  1. Cuantificar la brecha salarial:
    • Diferencia entre la brecha cruda y ajustada.
  2. Identificar factores explicativos clave:
    • ¿Qué variables tienen mayor impacto en la brecha salarial? (e.g., educación, jornada parcial).
  3. Diferencias no explicadas:
    • Parte atribuible a discriminación u otros factores no observables.

8. Limitaciones del Estudio

  1. Datos disponibles:
    • Algunas variables importantes pueden no estar disponibles (e.g., negociaciones salariales, habilidades específicas).
  2. Representatividad:
    • Asegurarse de que los datos son representativos del mercado laboral español.
  3. Suposiciones del modelo:
    • Los modelos lineales asumen relaciones lineales entre variables.

9. Herramientas Recomendadas

  1. Python:
    • Análisis de datos con pandas, numpy, statsmodels.
    • Visualización con matplotlib y seaborn.
  2. R:
    • Uso de lm() para regresiones y paquetes como oaxaca para descomposición.

10. Informe Final

Estructura los resultados en un informe o presentación con:

  1. Introducción y objetivo del estudio.
  2. Descripción de los datos y variables.
  3. Metodología analítica.
  4. Resultados principales (brecha cruda, ajustada, descomposición).
  5. Conclusiones y recomendaciones.