Qué tan correcto es usar la aproximación normal frente a la binomial exacta en inter
#1
Estoy analizando los resultados de una encuesta de satisfacción en mi trabajo y me ha surgido una duda práctica. Al calcular el intervalo de confianza para la proporción de clientes satisfechos, no estoy seguro de cuándo es realmente apropiado usar la aproximación normal frente a la binomial exacta, porque mi muestra no es muy grande y la proporción estimada está cerca del ochenta por ciento. He leído explicaciones contradictorias sobre el umbral de n*p y n*(1-p) y me confunde un poco.
Responder
#2
Hay un criterio práctico: la aproximación normal para intervalos de proporción suele exigir np ≥ 5 y n(1−p) ≥ 5. Con p cercano a 0.8 eso significa que n debe ser al menos 25 para satisfacer ambas condiciones (porque n(1−p) = 0.2 n ≥ 5 → n ≥ 25). Si tu muestra es menor que eso, la estimación basada en Wald puede sesgar el intervalo hacia p hat. En ese caso conviene mirar métodos más robustos como el intervalo de Wilson (score) o el binomial exacto (Clopper–Pearson).
Responder
#3
Tal vez el umbral no es el único punto a mirar. En satisfacción del cliente hay sesgos de muestreo y diseño que pesan más que la frontera entre métodos. Si la muestra es pequeña o hay respuesta sesgada, cambiar de método cambia poco menos que la interpretación. ¿Vale la pena depender tanto de ese umbral cuando la realidad es compleja?
Responder
#4
Para alguien que lee rápido, la recomendación práctica es: usa intervalos Wilson cuando p hat está cerca de 0.8 y el tamaño de muestra no es grande; evita el Wald si n es pequeño o si p está muy cerca de 0 o 1. En tu caso, si n no es grande, intentar binomial exacto o Wilson te da un intervalo más confiable.
Responder
#5
Si tomas un ejemplo concreto: digamos n = 30 y p hat = 0.8 (24 de 30 satisfechos). El intervalo de Wilson por 95% se aproxima a [0.63, 0.91]. Es una idea útil para entender por qué el normal a veces se comporta mal cerca de 0.8.
Responder
#6
En la práctica hay que ver la proporción como una variable de conteo y su incertidumbre no depende solo de n; es parte de la estadística inferencial y de cómo se comunica el resultado al equipo. La proximidad a 0.8 no salva el método si el objetivo es cobertura real.
Responder
#7
Quizá lo que te sirve es recordar que existen enfoques alternativos como el intervalo de puntuación o el exacto; algunos scripts pegan el cálculo tras bastidores y te dejan un rango razonable sin depender de supuestos demasiado fuertes.
Responder


[-]
Respuesta rápida
Mensaje
Escribe tu respuesta a este mensaje aquí.

Verificación de la imagen
Escribe el texto que aparece en la imagen, en el campo que está abajo. Este proceso se usa para evitar mensajes automáticos.
Verificación de la imagen
(no distingue MAYÚSC/minúsc)

Salto de foro: