En este laboratorio discutimos contrastes, errores tipo I y II, potencia, y errores de signo y exageración del efecto
Un esquema de contraste de hipótesis para \(X \sim N(\mu, \sigma^2)\) con hipótesis:
\[ H_0: \mu = \mu_0 \quad \text{vs} \quad H_A: \mu \ne \mu_0 \]
\(\mu = \mu_1\), donde \(\mu_1 \neq \mu_0\).
Consideraremos \(\mu_1 > \mu_0\) (prueba unilateral) o \(\mu_1 = \mu_0 + d\), donde \(d\) es el efecto.
El objetivo es calcular la potencia, es decir, la probabilidad de rechazar \(H_0\) cuando \(H_a\) es verdadera.
El estadístico de prueba está basado en la media muestral \(\bar{X}\). Dado que la población es normal con desviación estándar conocida \(\sigma\), podemos usar el estadístico \(Z\): \[ Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}}, \] donde: - \(\bar{X}\) es la media muestral, - \(\mu_0\) es la media bajo \(H_0\), - \(\sigma\) es la desviación estándar de la población, - \(n\) es el tamaño de la muestra.
Bajo \(H_0\), el estadístico \(Z\) sigue una distribución normal estándar: \[ Z \sim N(0, 1). \]
Para un nivel de significancia \(\alpha = 0.05\), necesitamos encontrar el valor crítico que delimita la región de rechazo bajo \(H_0\). Consideraremos dos casos:
La región de rechazo está en ambos extremos de la distribución. Los valores críticos son: \[ z_c = \pm \Phi^{-1}(1 - \alpha/2), \] donde: - \(\Phi^{-1}(p)\) es el percentil \(p\) de la distribución normal estándar.
Para \(\alpha = 0.05\): \[ z_c = \pm \Phi^{-1}(0.975) \approx \pm 1.96. \]
Esto significa que rechazamos \(H_0\) si: \[ Z < -1.96 \quad \text{o} \quad Z > 1.96. \]
Si estamos interesados en \(H_a: \mu > \mu_0\), la región de rechazo está solo en la cola superior. El valor crítico es: \[ z_c = \Phi^{-1}(1 - \alpha). \]
Para \(\alpha = 0.05\): \[ z_c = \Phi^{-1}(0.95) \approx 1.645. \]
Esto significa que rechazamos \(H_0\) si: \[ Z > 1.645. \]
Bajo la hipótesis alternativa \(H_a: \mu = \mu_1\), el estadístico de prueba \(Z\) sigue una distribución normal centrada en: \[ Z \sim N\left(\frac{\mu_1 - \mu_0}{\sigma / \sqrt{n}}, 1\right). \]
Definimos el tamaño del efecto estandarizado: \[ \Delta = \frac{\mu_1 - \mu_0}{\sigma / \sqrt{n}}. \]
Por lo tanto, bajo \(H_a\), el estadístico \(Z\) sigue: \[ Z \sim N(\Delta, 1). \]
La potencia es la probabilidad de rechazar \(H_0\) cuando \(H_a\) es verdadera. Esto implica calcular: \[ \text{potencia} = P(Z > z_c \, | \, H_a), \] donde \(z_c\) es el valor crítico que define la región de rechazo bajo \(H_0\).
Para una prueba bilateral, el potencia se divide en dos partes: 1. Probabilidad en la cola inferior (\(Z < -z_c\)): \[ P(Z < -z_c \, | \, H_a) = \Phi\left(\frac{-z_c - \Delta}{1}\right). \]
El potencia total es: \[ \text{potencia} = \Phi\left(\frac{-z_c - \Delta}{1}\right) + \left[1 - \Phi\left(\frac{z_c - \Delta}{1}\right)\right]. \]
Supongamos que: - \(\mu_1 = \mu_0 + 2\sigma\), - Nivel de significancia \(\alpha = 0.05\), - Tamaño de muestra \(n\).
Calculamos el tamaño del efecto estandarizado: \[ \Delta = \frac{\mu_1 - \mu_0}{\sigma / \sqrt{n}} = \frac{2\sigma}{\sigma / \sqrt{n}} = 2\sqrt{n}. \]
Sustituimos \(\Delta = 2\sqrt{n}\) en la fórmula del potencia:
Cola inferior: \[ P(Z < -z_c \, | \, H_a) = \Phi\left(\frac{-1.96 - 2\sqrt{n}}{1}\right). \]
Cola superior: \[ P(Z > z_c \, | \, H_a) = 1 - \Phi\left(\frac{1.96 - 2\sqrt{n}}{1}\right). \]
El potencia total es: \[ \text{potencia} = \Phi\left(-1.96 - 2\sqrt{n}\right) + \left[1 - \Phi\left(1.96 - 2\sqrt{n}\right)\right]. \]
Para un tamaño de muestra dado (\(n\)), podemos calcular numéricamente el potencia. Por ejemplo: - Si \(n = 10\): \[ \Delta = 2\sqrt{10} \approx 6.32. \] Sustituyendo en las fórmulas de potencia, obtendremos valores específicos.
A medida que \(n\) aumenta, \(\Delta\) crece, desplazando la distribución bajo \(H_a\) y aumentando el potencia de la prueba.
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
def contrast_test(mu_0, mu_1, sigma, n, alpha=0.05):
# Parámetros iniciales
= sigma / np.sqrt(n) # Error estándar
std_error
# Valor crítico (una cola, alpha = 0.05)
= norm.ppf(1 - alpha)
z_crit = mu_0 + z_crit * std_error # Valor crítico en términos de X
x_crit
# Estadístico de contraste bajo H_a
= (mu_1 - mu_0) / std_error # Desplazamiento estándar
delta
# Potencia de la prueba
= 1 - norm.cdf(z_crit - delta)
power
# Dibujar las distribuciones
= np.linspace(mu_0 - 4 * sigma, mu_1 + 4 * sigma, 1000)
x = norm.pdf(x, loc=mu_0, scale=std_error)
pdf_h0 = norm.pdf(x, loc=mu_1, scale=std_error)
pdf_h1
=(10, 6))
plt.figure(figsize
# Distribución bajo H_0
='$H_0: \mu = \mu_0$', color='blue')
plt.plot(x, pdf_h0, label
# Distribución bajo H_1
='$H_a: \mu = \mu_1$', color='orange')
plt.plot(x, pdf_h1, label
# Región de rechazo
='red', linestyle='--', label=f'Región de rechazo: X > {x_crit:.2f}')
plt.axvline(x_crit, color
# Área de la potencia
= np.linspace(x_crit, mu_1 + 4 * sigma, 1000)
x_power =mu_1, scale=std_error), color='orange', alpha=0.3, label='Potencia')
plt.fill_between(x_power, norm.pdf(x_power, loc
# Leyendas y detalles
'Distribuciones bajo $H_0$ y $H_a$ con Región de Rechazo y Potencia')
plt.title('X (Estadístico de prueba)')
plt.xlabel('Densidad de probabilidad')
plt.ylabel(
plt.legend()
plt.grid()
plt.show()
# Resultados
print("Resultados del contraste:")
print(f"Valor crítico (Z): {z_crit:.2f}")
print(f"Valor crítico (X): {x_crit:.2f}")
print(f"Desplazamiento estándar bajo H_a (Delta): {delta:.2f}")
print(f"Potencia de la prueba: {power:.2f}")
# Ejemplo de uso
= 0
mu_0 = .15
mu_1 = 1
sigma = 10
n contrast_test(mu_0, mu_1, sigma, n)