Lección 101 — Muestreo: tipos, sesgos y distribución muestral
Muestreo aleatorio simple, estratificado y por conglomerados. Sesgos de selección. Distribución muestral de la media y el Teorema Central del Límite.
Used in: 3.º año de Bachillerato (17-18 años) · Equiv. Stochastik LK alemán · Equiv. Math B japonés · H2 Statistics singapurense
Rigorous notation, full derivation, hypotheses
Definición rigurosa
Estructura: población, muestra y parámetros
"Una muestra es un subconjunto de la población. Un estadístico es un número calculado a partir de una muestra. Los parámetros son números que resumen datos de una población entera." — OpenStax Statistics, §1.1
Tipos de muestreo
"En el muestreo estratificado, la población se divide en grupos llamados estratos. A continuación se selecciona una muestra aleatoria de cada estrato." — OpenStax Statistics, §1.3
Propiedades deseables de los estimadores
Distribución muestral de la media
Sesgos habituales
Cuatro fuentes clásicas de sesgo muestral. Cada una hace que la muestra no represente a la población objetivo.
Ejemplos resueltos
Exercise list
30 exercises · 7 with worked solution (25%)
- Ex. 101.1Application
Una fábrica produce tornillos con peso medio y desviación típica g. Se recoge una muestra de tornillos. Calcula el error estándar de la media muestral.
- Ex. 101.2Application
Una encuesta comienza con . ¿Cuántas veces hay que aumentar para reducir el error estándar a la mitad? Explícalo usando la fórmula.
- Ex. 101.3ApplicationAnswer key
El tiempo de espera en una sucursal bancaria tiene distribución normal con s y s. Se recoge una muestra de clientes. ¿Cuál es la probabilidad de que s?
- Ex. 101.4Application
Un hospital quiere estimar la satisfacción de los pacientes con la atención. La directora sabe que el género y la franja de edad influyen mucho en la percepción. ¿Qué tipo de muestreo es más adecuado? Justifica tu respuesta.
- Ex. 101.5Application
Una tienda online envía un correo electrónico pidiendo una valoración tras cada compra. Solo el 12% de los clientes responde. Identifica el tipo de sesgo más probable y explica su efecto sobre la estimación.
- Ex. 101.6Application
Una encuesta quiere estimar la proporción de hogares con acceso a internet en zona rural, con margen de error del 4% al 95% de confianza. ¿Cuál es el tamaño mínimo de muestra?
- Ex. 101.7Application
Un consultor analiza el crecimiento medio de 50 startups fundadas hace 5 años que aún están activas, concluyendo que "las startups crecen de media un 120% al año". ¿Qué sesgo está presente?
- Ex. 101.8Application
Muestra que la media muestral es (a) insesgada, (b) consistente y (c) eficiente para , en la clase de los estimadores lineales.
- Ex. 101.9Application
Un estudio sobre gasto en transporte público recoge registros. La desviación típica histórica es \sigma = R\,40$ (en reales). Calcula el error estándar e interpreta su significado.
- Ex. 101.10Application
El INE quiere estimar la renta media de las empresas. Describe cómo serían un MAS, un estratificado por sector y uno por conglomerado. ¿Cuál sería más eficiente? ¿Por qué?
- Ex. 101.11UnderstandingAnswer key
Para la media muestral con fijo y población iid, ¿cuál afirmación es correcta?
- Ex. 101.12UnderstandingAnswer key
¿Por qué, en muchas encuestas prácticas, la media muestral tiene distribución aproximadamente normal, aunque no se conozca la distribución exacta de la población?
- Ex. 101.13Understanding
Afirmación: "En el muestreo aleatorio simple, cada individuo tiene la misma probabilidad de ser elegido. Esto equivale a decir que cada conjunto de individuos tiene la misma probabilidad de ser la muestra." ¿Es correcta la afirmación?
- Ex. 101.14Application
La nota media histórica de un examen es con . Para un grupo de estudiantes, ¿cuál es la probabilidad de que la media del grupo sea menor que 3,2?
- Ex. 101.15Application
El INE necesita estimar el acceso al saneamiento básico en municipios de toda España, con presupuesto limitado. La lista de hogares no está disponible, pero sí la de municipios y calles. Propón un plan de muestreo.
- Ex. 101.16Application
Una encuesta con votantes encontró de aprobación al gobierno municipal. Calcula el error estándar y el margen de error al 95% de confianza.
- Ex. 101.17ApplicationAnswer key
Calcula los tamaños mínimos de muestra para estimar una proporción con margen de error del (a) 5% y (b) 2,5%, ambos con 95% de confianza. Explica la relación entre los resultados.
- Ex. 101.18Application
Una empresa tiene 3000 clientes registrados en orden de número de contrato. Quiere seleccionar 300 para una encuesta. Describe el procedimiento de muestreo sistemático y analiza cuándo puede introducir sesgo.
- Ex. 101.19Application
El peso de paquetes de arroz tiene kg y kg. Para una muestra de , calcula .
- Ex. 101.20Understanding
Una universidad hace una encuesta de satisfacción con alumnos actualmente matriculados. ¿Cuál es el sesgo más relevante en este enfoque?
- Ex. 101.21Application
Sin conocimiento previo de , ¿cuál es el tamaño mínimo de muestra para estimar una proporción con margen de error del 2% al 95%?
- Ex. 101.22Application
Un investigador entrevista a vecinos de una ciudad llamando a puertas entre las 9h y las 17h de días laborables. Quiere estimar la renta media familiar. Identifica el sesgo y describe su dirección (¿subestima o sobreestima la renta media?).
- Ex. 101.23ApplicationAnswer key
El tiempo de consulta médica tiene min. Calcula el error estándar de la media para y , y compáralos.
- Ex. 101.24Application
El consumo mensual de electricidad de una ciudad tiene kWh y kWh. Para hogares sorteados, calcula .
- Ex. 101.25Modeling
El INE usa unas 65 000 familias en la EPA. La tasa de desempleo nacional es de aproximadamente el 12%. (a) ¿Cuál sería el mínimo teórico para estimar el desempleo con margen de al 95%? (b) ¿Por qué el INE usa un mucho mayor?
- Ex. 101.26ModelingAnswer key
Un banco quiere estimar la morosidad media en su cartera de crédito de 500 000 clientes. La variabilidad de la morosidad varía mucho según el nivel de renta. Propón un plan de muestreo eficiente y justifica la asignación de entrevistas por estrato.
- Ex. 101.27Modeling
Un analista financiero compara el rendimiento medio histórico de fondos de inversión activos y concluye que los gestores activos superan al índice. Los datos incluyen únicamente fondos que aún existen hoy. Identifica el sesgo y explica cómo afecta a la conclusión.
- Ex. 101.28Modeling
Muestra algebraicamente que es insesgado para . ¿Por qué el divisor es y no ?
- Ex. 101.29ChallengeAnswer key
Aplica la desigualdad de Hoeffding para : . Para , calcula la cota para y . Interpreta el resultado.
- Ex. 101.30Proof
Prueba formalmente que la media muestral es (a) insesgada y (b) consistente para , usando la desigualdad de Chebyshev para la parte (b).
Fuentes
- OpenIntro Statistics (4.ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA. Secciones §1.3–1.4 (tipos de muestreo y sesgos) y §4.1–4.2 (distribución muestral).
- Statistics (OpenStax) — Illowsky, Dean · CC-BY. Capítulo 1 (introducción al muestreo) y Capítulo 7 (distribución muestral y TCL).
- Statistical Thinking for the 21st Century — Russell Poldrack · CC-BY-NC. Capítulos 3–4 (sesgo muestral y distribución muestral con simulaciones).