Contraste de Hipótesis

En este laboratorio discutimos contrastes, errores tipo I y II, potencia, y errores de signo y exageración del efecto

Un esquema de contraste de hipótesis para \(X \sim N(\mu, \sigma^2)\) con hipótesis:

\[ H_0: \mu = \mu_0 \quad \text{vs} \quad H_A: \mu \ne \mu_0 \]


Hipótesis

  1. Hipótesis nula (\(H_0\)):
    • \(\mu = \mu_0\), donde \(\mu_0\) es el valor medio asumido bajo la hipótesis nula.
  2. Hipótesis alternativa (\(H_a\)):
    • \(\mu = \mu_1\), donde \(\mu_1 \neq \mu_0\).

    • Consideraremos \(\mu_1 > \mu_0\) (prueba unilateral) o \(\mu_1 = \mu_0 + d\), donde \(d\) es el efecto.

El objetivo es calcular la potencia, es decir, la probabilidad de rechazar \(H_0\) cuando \(H_a\) es verdadera.


Estadístico de contraste

El estadístico de prueba está basado en la media muestral \(\bar{X}\). Dado que la población es normal con desviación estándar conocida \(\sigma\), podemos usar el estadístico \(Z\): \[ Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}}, \] donde: - \(\bar{X}\) es la media muestral, - \(\mu_0\) es la media bajo \(H_0\), - \(\sigma\) es la desviación estándar de la población, - \(n\) es el tamaño de la muestra.

Bajo \(H_0\), el estadístico \(Z\) sigue una distribución normal estándar: \[ Z \sim N(0, 1). \]


Región de rechazo para \(H_0\)

Para un nivel de significancia \(\alpha = 0.05\), necesitamos encontrar el valor crítico que delimita la región de rechazo bajo \(H_0\). Consideraremos dos casos:

Prueba bilateral: dos colas

La región de rechazo está en ambos extremos de la distribución. Los valores críticos son: \[ z_c = \pm \Phi^{-1}(1 - \alpha/2), \] donde: - \(\Phi^{-1}(p)\) es el percentil \(p\) de la distribución normal estándar.

Para \(\alpha = 0.05\): \[ z_c = \pm \Phi^{-1}(0.975) \approx \pm 1.96. \]

Esto significa que rechazamos \(H_0\) si: \[ Z < -1.96 \quad \text{o} \quad Z > 1.96. \]


Prueba unilateral: una cola:

Si estamos interesados en \(H_a: \mu > \mu_0\), la región de rechazo está solo en la cola superior. El valor crítico es: \[ z_c = \Phi^{-1}(1 - \alpha). \]

Para \(\alpha = 0.05\): \[ z_c = \Phi^{-1}(0.95) \approx 1.645. \]

Esto significa que rechazamos \(H_0\) si: \[ Z > 1.645. \]


Distribución bajo \(H_a\)

Bajo la hipótesis alternativa \(H_a: \mu = \mu_1\), el estadístico de prueba \(Z\) sigue una distribución normal centrada en: \[ Z \sim N\left(\frac{\mu_1 - \mu_0}{\sigma / \sqrt{n}}, 1\right). \]

Definimos el tamaño del efecto estandarizado: \[ \Delta = \frac{\mu_1 - \mu_0}{\sigma / \sqrt{n}}. \]

Por lo tanto, bajo \(H_a\), el estadístico \(Z\) sigue: \[ Z \sim N(\Delta, 1). \]


Potencia de un contraste

La potencia es la probabilidad de rechazar \(H_0\) cuando \(H_a\) es verdadera. Esto implica calcular: \[ \text{potencia} = P(Z > z_c \, | \, H_a), \] donde \(z_c\) es el valor crítico que define la región de rechazo bajo \(H_0\).

Para una prueba bilateral, el potencia se divide en dos partes: 1. Probabilidad en la cola inferior (\(Z < -z_c\)): \[ P(Z < -z_c \, | \, H_a) = \Phi\left(\frac{-z_c - \Delta}{1}\right). \]

  1. Probabilidad en la cola superior (\(Z > z_c\)): \[ P(Z > z_c \, | \, H_a) = 1 - \Phi\left(\frac{z_c - \Delta}{1}\right). \]

El potencia total es: \[ \text{potencia} = \Phi\left(\frac{-z_c - \Delta}{1}\right) + \left[1 - \Phi\left(\frac{z_c - \Delta}{1}\right)\right]. \]


Ejemplo con \(\mu_1 = \mu_0 + 2\sigma\)**

Supongamos que: - \(\mu_1 = \mu_0 + 2\sigma\), - Nivel de significancia \(\alpha = 0.05\), - Tamaño de muestra \(n\).

Calculamos el tamaño del efecto estandarizado: \[ \Delta = \frac{\mu_1 - \mu_0}{\sigma / \sqrt{n}} = \frac{2\sigma}{\sigma / \sqrt{n}} = 2\sqrt{n}. \]

Sustituimos \(\Delta = 2\sqrt{n}\) en la fórmula del potencia:

  1. Cola inferior: \[ P(Z < -z_c \, | \, H_a) = \Phi\left(\frac{-1.96 - 2\sqrt{n}}{1}\right). \]

  2. Cola superior: \[ P(Z > z_c \, | \, H_a) = 1 - \Phi\left(\frac{1.96 - 2\sqrt{n}}{1}\right). \]

El potencia total es: \[ \text{potencia} = \Phi\left(-1.96 - 2\sqrt{n}\right) + \left[1 - \Phi\left(1.96 - 2\sqrt{n}\right)\right]. \]


Interpretación

Para un tamaño de muestra dado (\(n\)), podemos calcular numéricamente el potencia. Por ejemplo: - Si \(n = 10\): \[ \Delta = 2\sqrt{10} \approx 6.32. \] Sustituyendo en las fórmulas de potencia, obtendremos valores específicos.

A medida que \(n\) aumenta, \(\Delta\) crece, desplazando la distribución bajo \(H_a\) y aumentando el potencia de la prueba.

Ejemplo Gráfico en Python (opcional):

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

def contrast_test(mu_0, mu_1, sigma, n, alpha=0.05):
    # Parámetros iniciales
    std_error = sigma / np.sqrt(n)  # Error estándar

    # Valor crítico (una cola, alpha = 0.05)
    z_crit = norm.ppf(1 - alpha)
    x_crit = mu_0 + z_crit * std_error  # Valor crítico en términos de X

    # Estadístico de contraste bajo H_a
    delta = (mu_1 - mu_0) / std_error  # Desplazamiento estándar

    # Potencia de la prueba
    power = 1 - norm.cdf(z_crit - delta)

    # Dibujar las distribuciones
    x = np.linspace(mu_0 - 4 * sigma, mu_1 + 4 * sigma, 1000)
    pdf_h0 = norm.pdf(x, loc=mu_0, scale=std_error)
    pdf_h1 = norm.pdf(x, loc=mu_1, scale=std_error)

    plt.figure(figsize=(10, 6))

    # Distribución bajo H_0
    plt.plot(x, pdf_h0, label='$H_0: \mu = \mu_0$', color='blue')

    # Distribución bajo H_1
    plt.plot(x, pdf_h1, label='$H_a: \mu = \mu_1$', color='orange')

    # Región de rechazo
    plt.axvline(x_crit, color='red', linestyle='--', label=f'Región de rechazo: X > {x_crit:.2f}')

    # Área de la potencia
    x_power = np.linspace(x_crit, mu_1 + 4 * sigma, 1000)
    plt.fill_between(x_power, norm.pdf(x_power, loc=mu_1, scale=std_error), color='orange', alpha=0.3, label='Potencia')

    # Leyendas y detalles
    plt.title('Distribuciones bajo $H_0$ y $H_a$ con Región de Rechazo y Potencia')
    plt.xlabel('X (Estadístico de prueba)')
    plt.ylabel('Densidad de probabilidad')
    plt.legend()
    plt.grid()
    plt.show()

    # Resultados
    print("Resultados del contraste:")
    print(f"Valor crítico (Z): {z_crit:.2f}")
    print(f"Valor crítico (X): {x_crit:.2f}")
    print(f"Desplazamiento estándar bajo H_a (Delta): {delta:.2f}")
    print(f"Potencia de la prueba: {power:.2f}")

# Ejemplo de uso
mu_0 = 0
mu_1 = .15
sigma = 1
n = 10
contrast_test(mu_0, mu_1, sigma, n)