Math ClubMath Club
v1 · padrão canônico

Lección 101 — Muestreo: tipos, sesgos y distribución muestral

Muestreo aleatorio simple, estratificado y por conglomerados. Sesgos de selección. Distribución muestral de la media y el Teorema Central del Límite.

Used in: 3.º año de Bachillerato (17-18 años) · Equiv. Stochastik LK alemán · Equiv. Math B japonés · H2 Statistics singapurense

Xˉ=1ni=1nXi,E[Xˉ]=μ,Var(Xˉ)=σ2n\bar X = \frac{1}{n}\sum_{i=1}^{n} X_i, \quad \mathrm{E}[\bar X] = \mu, \quad \mathrm{Var}(\bar X) = \frac{\sigma^2}{n}
Choose your door

Rigorous notation, full derivation, hypotheses

Definición rigurosa

Estructura: población, muestra y parámetros

"Una muestra es un subconjunto de la población. Un estadístico es un número calculado a partir de una muestra. Los parámetros son números que resumen datos de una población entera." — OpenStax Statistics, §1.1

Tipos de muestreo

"En el muestreo estratificado, la población se divide en grupos llamados estratos. A continuación se selecciona una muestra aleatoria de cada estrato." — OpenStax Statistics, §1.3

Propiedades deseables de los estimadores

Distribución muestral de la media

Sesgos habituales

SelecciónNo-respuestaAutoselecciónSurvivorshipencuesta online:excluye sin internetquien respondedifiere de quien novoluntarios difierende la poblaciónsolo analiza a quiensobrevivióTodos producen estimaciones sistemáticamente erróneas

Cuatro fuentes clásicas de sesgo muestral. Cada una hace que la muestra no represente a la población objetivo.

Ejemplos resueltos

Exercise list

30 exercises · 7 with worked solution (25%)

Application 20Understanding 4Modeling 4Challenge 1Proof 1
  1. Ex. 101.1Application

    Una fábrica produce tornillos con peso medio μ\mu y desviación típica σ=50\sigma = 50 g. Se recoge una muestra de n=100n = 100 tornillos. Calcula el error estándar de la media muestral.

  2. Ex. 101.2Application

    Una encuesta comienza con n=25n = 25. ¿Cuántas veces hay que aumentar nn para reducir el error estándar a la mitad? Explícalo usando la fórmula.

  3. Ex. 101.3ApplicationAnswer key

    El tiempo de espera en una sucursal bancaria tiene distribución normal con μ=120\mu = 120 s y σ=15\sigma = 15 s. Se recoge una muestra de n=9n = 9 clientes. ¿Cuál es la probabilidad de que Xˉ>125\bar X > 125 s?

  4. Ex. 101.4Application

    Un hospital quiere estimar la satisfacción de los pacientes con la atención. La directora sabe que el género y la franja de edad influyen mucho en la percepción. ¿Qué tipo de muestreo es más adecuado? Justifica tu respuesta.

  5. Ex. 101.5Application

    Una tienda online envía un correo electrónico pidiendo una valoración tras cada compra. Solo el 12% de los clientes responde. Identifica el tipo de sesgo más probable y explica su efecto sobre la estimación.

  6. Ex. 101.6Application

    Una encuesta quiere estimar la proporción de hogares con acceso a internet en zona rural, con margen de error del 4% al 95% de confianza. ¿Cuál es el tamaño mínimo de muestra?

  7. Ex. 101.7Application

    Un consultor analiza el crecimiento medio de 50 startups fundadas hace 5 años que aún están activas, concluyendo que "las startups crecen de media un 120% al año". ¿Qué sesgo está presente?

  8. Ex. 101.8Application

    Muestra que la media muestral Xˉ\bar X es (a) insesgada, (b) consistente y (c) eficiente para μ\mu, en la clase de los estimadores lineales.

  9. Ex. 101.9Application

    Un estudio sobre gasto en transporte público recoge n=400n = 400 registros. La desviación típica histórica es \sigma = R\,40$ (en reales). Calcula el error estándar e interpreta su significado.

  10. Ex. 101.10Application

    El INE quiere estimar la renta media de las empresas. Describe cómo serían un MAS, un estratificado por sector y uno por conglomerado. ¿Cuál sería más eficiente? ¿Por qué?

  11. Ex. 101.11UnderstandingAnswer key

    Para la media muestral Xˉ\bar X con nn fijo y población iid, ¿cuál afirmación es correcta?

  12. Ex. 101.12UnderstandingAnswer key

    ¿Por qué, en muchas encuestas prácticas, la media muestral tiene distribución aproximadamente normal, aunque no se conozca la distribución exacta de la población?

  13. Ex. 101.13Understanding

    Afirmación: "En el muestreo aleatorio simple, cada individuo tiene la misma probabilidad de ser elegido. Esto equivale a decir que cada conjunto de nn individuos tiene la misma probabilidad de ser la muestra." ¿Es correcta la afirmación?

  14. Ex. 101.14Application

    La nota media histórica de un examen es μ=3,5\mu = 3{,}5 con σ=1,5\sigma = 1{,}5. Para un grupo de n=36n = 36 estudiantes, ¿cuál es la probabilidad de que la media del grupo sea menor que 3,2?

  15. Ex. 101.15Application

    El INE necesita estimar el acceso al saneamiento básico en municipios de toda España, con presupuesto limitado. La lista de hogares no está disponible, pero sí la de municipios y calles. Propón un plan de muestreo.

  16. Ex. 101.16Application

    Una encuesta con n=400n = 400 votantes encontró p^=60%\hat p = 60\% de aprobación al gobierno municipal. Calcula el error estándar y el margen de error al 95% de confianza.

  17. Ex. 101.17ApplicationAnswer key

    Calcula los tamaños mínimos de muestra para estimar una proporción con margen de error del (a) 5% y (b) 2,5%, ambos con 95% de confianza. Explica la relación entre los resultados.

  18. Ex. 101.18Application

    Una empresa tiene 3000 clientes registrados en orden de número de contrato. Quiere seleccionar 300 para una encuesta. Describe el procedimiento de muestreo sistemático y analiza cuándo puede introducir sesgo.

  19. Ex. 101.19Application

    El peso de paquetes de arroz tiene μ=70\mu = 70 kg y σ=10\sigma = 10 kg. Para una muestra de n=64n = 64, calcula P(68Xˉ72)P(68 \leq \bar X \leq 72).

  20. Ex. 101.20Understanding

    Una universidad hace una encuesta de satisfacción con alumnos actualmente matriculados. ¿Cuál es el sesgo más relevante en este enfoque?

  21. Ex. 101.21Application

    Sin conocimiento previo de pp, ¿cuál es el tamaño mínimo de muestra para estimar una proporción con margen de error del 2% al 95%?

  22. Ex. 101.22Application

    Un investigador entrevista a vecinos de una ciudad llamando a puertas entre las 9h y las 17h de días laborables. Quiere estimar la renta media familiar. Identifica el sesgo y describe su dirección (¿subestima o sobreestima la renta media?).

  23. Ex. 101.23ApplicationAnswer key

    El tiempo de consulta médica tiene σ=12\sigma = 12 min. Calcula el error estándar de la media para n=25n = 25 y n=100n = 100, y compáralos.

  24. Ex. 101.24Application

    El consumo mensual de electricidad de una ciudad tiene μ=500\mu = 500 kWh y σ=80\sigma = 80 kWh. Para n=100n = 100 hogares sorteados, calcula P(Xˉ>510)P(\bar X > 510).

  25. Ex. 101.25Modeling

    El INE usa unas 65 000 familias en la EPA. La tasa de desempleo nacional es de aproximadamente el 12%. (a) ¿Cuál sería el nn mínimo teórico para estimar el desempleo con margen de ±0,5%\pm 0{,}5\% al 95%? (b) ¿Por qué el INE usa un nn mucho mayor?

  26. Ex. 101.26ModelingAnswer key

    Un banco quiere estimar la morosidad media en su cartera de crédito de 500 000 clientes. La variabilidad de la morosidad varía mucho según el nivel de renta. Propón un plan de muestreo eficiente y justifica la asignación de entrevistas por estrato.

  27. Ex. 101.27Modeling

    Un analista financiero compara el rendimiento medio histórico de fondos de inversión activos y concluye que los gestores activos superan al índice. Los datos incluyen únicamente fondos que aún existen hoy. Identifica el sesgo y explica cómo afecta a la conclusión.

  28. Ex. 101.28Modeling

    Muestra algebraicamente que S2=1n1(XiXˉ)2S^2 = \frac{1}{n-1}\sum(X_i - \bar X)^2 es insesgado para σ2\sigma^2. ¿Por qué el divisor es n1n-1 y no nn?

  29. Ex. 101.29ChallengeAnswer key

    Aplica la desigualdad de Hoeffding para Xi[0,1]X_i \in [0, 1]: P(Xˉμ>t)2exp(2nt2)P(|\bar X - \mu| > t) \leq 2\exp(-2nt^2). Para t=0,05t = 0{,}05, calcula la cota para n=100n = 100 y n=1000n = 1000. Interpreta el resultado.

  30. Ex. 101.30Proof

    Prueba formalmente que la media muestral Xˉ=1nXi\bar X = \frac{1}{n}\sum X_i es (a) insesgada y (b) consistente para μ\mu, usando la desigualdad de Chebyshev para la parte (b).

Fuentes

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.