Lección 105 — Regresión lineal simple
Modelo OLS, estimadores de mínimos cuadrados, R², residuos, inferencia sobre la pendiente. Fundamento del aprendizaje supervisado y la econometría.
Used in: Stochastik LK alemán (Klasse 12) · H2 Mathematics Singapur (§14) · Math B japonés
Rigorous notation, full derivation, hypotheses
Definición rigurosa
Modelo de regresión lineal simple
"The regression equation is written as , where is the slope and is the -intercept." — OpenStax Statistics, §12.3
Descomposición de la varianza y R²
"The coefficient of determination is the square of the correlation coefficient . It tells you the fraction of total variability in the response that is explained by the least-squares line." — OpenIntro Statistics, §7.2, p. 331
Inferencia sobre la pendiente
Recta de mínimos cuadrados (dorada) minimizando la suma de los cuadrados de los residuos (naranjas). Cada residuo e es la distancia vertical del punto a la recta.
Ejemplos resueltos
Exercise list
30 exercises · 7 with worked solution (25%)
- Ex. 105.1Application
Datos: , , , , . Calcule y .
- Ex. 105.2Application
Pares : , , , , . Calcule la recta de mínimos cuadrados.
- Ex. 105.3Application
Usando (ejercicio anterior), prediga para y . Identifique cuál predicción es extrapolación.
- Ex. 105.4Application
Para los datos del Ejercicio 105.1: , , , , . Calcule e interprete.
- Ex. 105.5ApplicationAnswer key
El coeficiente de correlación de Pearson entre dos variables es . ¿Cuál es el de la regresión simple de en ?
- Ex. 105.6ApplicationAnswer key
Regresión de salario anual (en mil R$) en años de experiencia produjo . Interprete y .
- Ex. 105.7Application
Usando , un empleado con 14 años de experiencia gana R$ 72 mil/año. Calcule el residuo.
- Ex. 105.8ApplicationAnswer key
Cinco valores observados de : con . El SSE de la regresión es 3,2. Calcule SST, SSR y .
- Ex. 105.9Application
Una regresión con produjo . Calcule y e interprete.
- Ex. 105.10Application
, , . Calcule y la estadística .
- Ex. 105.11Application
, , . Construya IC 95% para e interprete.
- Ex. 105.12Application
, , . ¿Cuál es el signo de ? Calcule usando la relación .
- Ex. 105.13UnderstandingAnswer key
¿Cuál de las afirmaciones sobre la recta de mínimos cuadrados es CORRECTA?
- Ex. 105.14Understanding
¿Cuál es la interpretación correcta de en regresión lineal simple?
- Ex. 105.15Understanding
Una regresión produjo y . ¿Qué se puede concluir?
- Ex. 105.16Modeling
Un inmobiliario de Curitiba recopiló datos de 10 apartamentos: área (, en m²) y costo de alquiler (, en R$/mes). , , , . Ajuste la recta y prediga el alquiler para un apartamento de 95 m².
- Ex. 105.17Modeling
Niños de 10 a 25 años: años, kg, , , . Ajuste la recta usando y prediga el peso de un niño de 30 años.
- Ex. 105.18ModelingAnswer key
Regresión con , , . Monte la tabla ANOVA (SSR, SSE, MSR, MSE, F) y pruebe al nivel 5%.
- Ex. 105.19Modeling
Una regresión de consumo de agua (litros/día) en temperatura (°C) produjo con para puntos. El punto aparece muy lejos de los demás. ¿Qué procedimiento usar para evaluar su influencia?
- Ex. 105.20Modeling
Una transportista registró número de pedidos y costo logístico mensual (en R$ mil) para 5 filiales: , , , , . Ajuste la recta.
- Ex. 105.21Application
Usando , calcule la predicción y el residuo para una filial con pedidos y costo observado de R$ 310 mil.
- Ex. 105.22Application
Para la regresión del Ejercicio 105.20, calcule los 5 residuos, el SSE y la desviación estándar residual .
- Ex. 105.23Understanding
El gráfico de residuos vs. tiene forma de embudo (varianza creciente). ¿Qué indica esto?
- Ex. 105.24Application
Para la regresión del Ejercicio 105.20 (, , , , ), construya IC 95% para el costo medio de una filial con pedidos. Use .
- Ex. 105.25ChallengeAnswer key
Pruebe algebraicamente que, para regresión lineal simple, (cuadrado del coeficiente de correlación de Pearson).
- Ex. 105.26ChallengeAnswer key
Derive las fórmulas de y por minimización de vía cálculo diferencial (ecuaciones normales).
- Ex. 105.27Proof
Pruebe que, para cualquier recta de mínimos cuadrados, la suma de los residuos es cero: .
- Ex. 105.28Challenge
Datos resumidos: , , , , , . Calcule: recta ajustada, , pruebe al nivel 5%.
- Ex. 105.29Challenge
¿Por qué reducir la variabilidad de (estrechar el intervalo muestreado) perjudica la estimación de ? Relacione con la fórmula de .
- Ex. 105.30Proof
Pruebe que los estimadores OLS y son no sesgados, es decir, .
Fuentes
- Statistics — OpenStax — Illowsky, Dean · CC-BY · Capítulos 12 (Linear Regression and Correlation). Fuente primaria para ejemplos, ecuaciones y ejercicios de esta lección.
- OpenIntro Statistics (4ª ed.) — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA · Capítulo 7 (Introduction to linear regression). Fuente primaria para diagnóstico de residuos, inferencia y ejercicios con datos reales.
- Probabilidade e Estatística — Wikilivros — colaborativo · CC-BY-SA · Sección de regresión lineal. Referencia en PT-BR con notación compatible con el currículo nacional.