Elaboración de una base del proyecto
Utilizo como guía un modelo de lenguage (e.g., Chatgpt; Geminis,
etc.).
Pregunta a Chatgpt: ¿Cómo hacer un estudio de brecha salarial con
microdatos españoles?
Respuesta
Realizar un estudio de la brecha salarial con
microdatos españoles implica un análisis sistemático de
las diferencias salariales entre hombres y mujeres. Aquí tienes una guía
detallada para llevarlo a cabo:
1. Definir el Objetivo del Estudio
El objetivo principal es cuantificar la brecha salarial entre hombres
y mujeres y entender los factores que explican dicha brecha.
- Brecha cruda: Diferencia promedio entre los
salarios de hombres y mujeres.
- Brecha ajustada: Diferencia salarial controlando
por factores como nivel educativo, experiencia, ocupación, sector y
otros.
2. Selección y Descarga de Microdatos
Utiliza microdatos oficiales que contengan información relevante
sobre salarios y características laborales. Algunas fuentes españolas
recomendadas:
- Encuesta de Estructura Salarial (EES) del Instituto
Nacional de Estadística (INE):
- Contiene información detallada sobre los salarios, ocupación, sector
y características demográficas.
- Descarga desde: INE
Microdatos.
- Encuesta de Población Activa (EPA):
- Incluye información sobre empleo, nivel educativo y características
sociodemográficas.
- Datos complementarios:
- Otros microdatos relacionados con características de empresas o
sectores.
3. Variables Clave
Define las variables necesarias para el análisis
Variable dependiente:
- Salario bruto por hora: Calculado como \(\frac{\text{Salario Bruto}}{\text{Horas
Trabajadas}}\).
Variables independientes:
Demográficas: Género, edad, estado civil,
hijos.
Educativas: Nivel educativo, tipo de
formación.
Laborales: Sector, ocupación, jornada laboral
(completa o parcial), antigüedad en la empresa, tipo de
contrato.
Contextuales: Región, tamaño de la
empresa.
4. Preprocesamiento de los Datos
- Limpieza de datos:
- Eliminar valores faltantes o inconsistentes (e.g., salarios nulos,
horas trabajadas = 0).
- Convertir variables categóricas (e.g., género, nivel educativo) en
variables dummies.
- Cálculo de variables:
- Salario por hora: Divide el salario bruto entre las horas
trabajadas.
- Crear variables artificiales como
universitario
(1 si
es diplomado o superior) o jornada_completa
(1 si jornada
completa, 0 si parcial).
- Exploración inicial:
- Generar estadísticas descriptivas por género (salarios promedio,
nivel educativo, etc.).
5. Análisis Estadístico
A. Brecha Salarial Cruda
Calcular la diferencia promedio de salarios por género: \[
\text{Brecha cruda} = \frac{\text{Salario promedio hombres} -
\text{Salario promedio mujeres}}{\text{Salario promedio hombres}} \times
100
\]
B. Modelos de Regresión
Usa modelos de regresión para ajustar el salario por factores
explicativos y cuantificar la brecha ajustada: 1. Modelo
básico: \[
\text{Salario por hora} = \beta_0 + \beta_1 \cdot \text{Género} +
\epsilon
\] - \(\beta_1\) captura la brecha
salarial cruda.
- Modelo ajustado: \[
\text{Salario por hora} = \beta_0 + \beta_1 \cdot \text{Género} +
\beta_2 \cdot \text{Educación} + \beta_3 \cdot \text{Experiencia} +
\dots + \epsilon
\]
- Incluye variables control como educación, experiencia, sector,
etc.
- Compara los coeficientes de \(\beta_1\) entre el modelo básico y
el ajustado para interpretar cuánto de la brecha se explica por las
variables control.
C. Descomposición de Oaxaca-Blinder
Descomponer la brecha salarial en dos partes:
Parte explicada: Atribuible a diferencias en
características observables (e.g., educación, experiencia,
sector).
Parte no explicada: Asociada a factores no
observables o discriminación.
Usa el método Oaxaca-Blinder: \[
\text{Brecha} = (\bar{X}_h - \bar{X}_m) \cdot \beta + \bar{X}_m \cdot
(\beta_h - \beta_m)
\]
6. Visualización de Resultados
- Distribución Salarial por Género:
- Gráficos de densidad de salarios por hora para hombres y
mujeres.
- Distribuciones acumulativas (CDFs).
- Comparación de salarios:
- Gráficos de cajas y bigotes (boxplots) por género y nivel
educativo.
- Brecha salarial:
- Gráficos de barras con la brecha cruda y ajustada.
7. Interpretación de Resultados
- Cuantificar la brecha salarial:
- Diferencia entre la brecha cruda y ajustada.
- Identificar factores explicativos clave:
- ¿Qué variables tienen mayor impacto en la brecha salarial? (e.g.,
educación, jornada parcial).
- Diferencias no explicadas:
- Parte atribuible a discriminación u otros factores no
observables.
8. Limitaciones del Estudio
- Datos disponibles:
- Algunas variables importantes pueden no estar disponibles (e.g.,
negociaciones salariales, habilidades específicas).
- Representatividad:
- Asegurarse de que los datos son representativos del mercado laboral
español.
- Suposiciones del modelo:
- Los modelos lineales asumen relaciones lineales entre
variables.
9. Herramientas Recomendadas
- Python:
- Análisis de datos con
pandas
, numpy
,
statsmodels
.
- Visualización con
matplotlib
y
seaborn
.
- R:
- Uso de
lm()
para regresiones y paquetes como
oaxaca
para descomposición.