Math ClubMath Club
v1 · padrão canônico

Lição 78 — Correlação e regressão linear simples

Coeficiente de Pearson r, covariância, reta de mínimos quadrados, coeficiente de determinação r². Correlação não é causalidade — o teorema de Anscombe, o quarteto que todo cientista deve conhecer.

Used in: 2.º ano do EM (16-17 anos) · Stochastik LK alemão §12 · H2 Math singapurense §19 · AP Statistics USA §3

r=i=1n(xixˉ)(yiyˉ)i=1n(xixˉ)2i=1n(yiyˉ)2r = \frac{\displaystyle\sum_{i=1}^n (x_i - \bar x)(y_i - \bar y)}{\sqrt{\displaystyle\sum_{i=1}^n (x_i-\bar x)^2 \cdot \sum_{i=1}^n (y_i-\bar y)^2}}
Choose your door

Rigorous notation, full derivation, hypotheses

Définitions et propriétés rigoureuses

Covariance

"La covariance est une mesure de la variabilité conjointe de deux variables aléatoires. Si les valeurs plus grandes d'une variable correspondent principalement avec les valeurs plus grandes de l'autre variable, et de même pour les valeurs plus petites, la covariance est positive." — OpenStax Statistics, §12.1

Coefficient de corrélation de Pearson

r ≈ +1r ≈ −1r ≈ 0r ≈ 0.7

Quatre diagrammes de dispersion avec différentes valeurs de r. Le nuage de points se concentre davantage autour d'une droite quand |r| est proche de 1.

Droite des moindres carrés (OLS)

Coefficient de détermination

r2=1SQRSQT,SQT=(yiyˉ)2r^2 = 1 - \frac{\text{SQR}}{\text{SQT}}, \quad \text{SQT} = \sum(y_i - \bar y)^2
what this means · r² mesure la fraction de la variance de Y expliquée par le modèle linéaire en X.

Hypothèses LINE

Exemples résolus

Exercise list

32 exercises · 8 with worked solution (25%)

Application 18Understanding 3Modeling 8Challenge 2Proof 1
  1. Ex. 78.1ApplicationAnswer key

    X=(1,2,3,4)X = (1, 2, 3, 4), Y=(2,4,6,8)Y = (2, 4, 6, 8). Calculez rr sans calculatrice et justifiez le résultat.

  2. Ex. 78.2Application

    X=(1,2,3,4)X = (1, 2, 3, 4), Y=(8,6,4,2)Y = (8, 6, 4, 2). Calculez rr et identifiez le signe attendu avant le calcul.

  3. Ex. 78.3Application

    X=(1,2,3)X = (1, 2, 3), Y=(1,4,9)Y = (1, 4, 9). Calculez rr et discutez si la relation est linéaire.

  4. Ex. 78.4ApplicationAnswer key

    Si U=X+5U = X + 5 et V=2YV = 2Y, quelle est la relation entre r(U,V)r(U, V) et r(X,Y)r(X, Y) ? Justifiez par la définition.

  5. Ex. 78.5ApplicationAnswer key

    Données avec n=5n = 5 paires : x=(1,2,3,4,5)x = (1, 2, 3, 4, 5) et y=(10,7,5,4,3)y = (10, 7, 5, 4, 3). Calculez rr.

  6. Ex. 78.6ApplicationAnswer key

    X=(1,2,3,4,5)X = (1, 2, 3, 4, 5), Y=(1,4,5,9,10)Y = (1, 4, 5, 9, 10). Calculez rr et la covariance sxys_{xy}.

  7. Ex. 78.7Application

    r=0,85r = 0,85, xˉ=10\bar x = 10, yˉ=50\bar y = 50, sx=3s_x = 3, sy=12s_y = 12. Trouvez la droite des moindres carrés.

  8. Ex. 78.8Application

    En utilisant la droite de l'exercice 78.7 (y^=16+3,4x\hat y = 16 + 3,4x), prédisez YY pour x=15x = 15 et pour x=5x = 5.

  9. Ex. 78.9Application

    Avec r=0,85r = 0,85 (exercice 78.7), calculez r2r^2 et interprétez en termes de variance expliquée.

  10. Ex. 78.10Application

    En utilisant la droite de 78.7, calculez le résidu du point (10,55)(10, 55).

  11. Ex. 78.11Understanding

    Que signifie r=0r = 0 ?

  12. Ex. 78.12Understanding

    Les ventes de glace se corrèlent positivement avec les décès par noyade (r0,8r \approx 0,8). La meilleure explication est :

  13. Ex. 78.13Application

    Avec r=0,6r = 0,6, sx=2s_x = 2, sy=5s_y = 5, calculez les inclinaisons des deux droites de régression : YY en XX et XX en YY. Les droites coïncident-elles ?

  14. Ex. 78.14Application

    Un modèle de régression explique 64 % de la variance des dépenses en fonction du revenu. Quel est r|r| ?

  15. Ex. 78.15Application

    Si V=YV = -Y, quelle est la relation entre r(X,V)r(X, V) et r(X,Y)r(X, Y) ?

  16. Ex. 78.16Modeling

    Relation taille (XX) vs. poids (YY) : xˉ=170\bar x = 170 cm, yˉ=70\bar y = 70 kg, sx=8s_x = 8 cm, sy=12s_y = 12 kg, r=0,75r = 0,75. Équation de la droite et prédiction pour une personne de 175 cm.

  17. Ex. 78.17Modeling

    Un chercheur a trouvé r=0,82r = 0,82 entre Indice de Perception de la Corruption et PIB par habitant dans 120 pays. Interprétez r2r^2 et discutez les limitations causales.

  18. Ex. 78.18Modeling

    Un graphique de résidus vs. valeurs ajustées montre un motif en U (résidus d'abord négatifs, puis positifs). Qu'indique cela sur le modèle linéaire ?

  19. Ex. 78.19Application

    n=25n = 25, r=0,45r = 0,45. Testez H0:ρ=0H_0: \rho = 0 vs. H1:ρ0H_1: \rho \neq 0 au niveau 5 %.

  20. Ex. 78.20Application

    n=50n = 50, r=0,60r = 0,60. Construisez un IC de 95 % pour ρ\rho en utilisant la transformation de Fisher.

  21. Ex. 78.21Modeling

    Pour chaque paire, identifiez si c'est corrélation causale, factice, ou causalité inverse : (a) pluie et ventes de parapluies ; (b) nombre de policiers et criminalité par ville.

  22. Ex. 78.22ApplicationAnswer key

    Interprétez r2=0,25r^2 = 0,25 dans une étude reliant années d'étude et salaire.

  23. Ex. 78.23Application

    Expliquez le risque d'extrapoler la droite de régression pour les valeurs de xx hors de l'intervalle d'échantillonnage.

  24. Ex. 78.24Modeling

    En finance, le "bêta" d'une action est le coefficient de régression du rendement de l'action sur le rendement du marché. Exprimez bêta en termes de rr, sris_{r_i} et srms_{r_m}.

  25. Ex. 78.25Modeling

    Un distributeur d'énergie a des données mensuelles de température moyenne (°C) et consommation (MWh) des 5 dernières années. Décrivez le flux d'analyse de corrélation et régression pour prévoir consommation.

  26. Ex. 78.26Application

    Les quatre ensembles d'Anscombe ont r0,82r \approx 0,82 et même droite de régression. Pourquoi le modèle linéaire est adéquat pour l'ensemble I mais pas pour les trois autres ?

  27. Ex. 78.27ModelingAnswer key

    Pourquoi la corrélation de Spearman est plus adéquate que Pearson pour données ordinales (ex. : satisfaction de 1 à 5) ou avec valeurs aberrantes ?

  28. Ex. 78.28Modeling

    Différenciez confondeur, médiateur et modérateur dans une étude observationnelle.

  29. Ex. 78.29ChallengeAnswer key

    n=22n = 22 paires ; r2=0,64r^2 = 0,64 ; SQT = 500. Calculez la Somme des Carrés des Résidus (SQR) et le RMSE.

  30. Ex. 78.30Challenge

    Pourquoi R2R^2 ne décroît jamais quand on ajoute une variable au modèle, et comment R2R^2 ajusté résout ce problème ?

  31. Ex. 78.31Understanding

    Quelle propriété définit la droite des moindres carrés (OLS) ?

  32. Ex. 78.32ProofAnswer key

    Prouvez que 1r1-1 \leq r \leq 1 en utilisant l'inégalité de Cauchy-Schwarz.

Fontes

  • OpenStax Statistics — Illowsky, Dean · 2022 · CC-BY. Source primaire des exercices 78.1–2, 78.5–10, 78.14, 78.16, 78.19–20, 78.22–25, 78.29–31 et exemples 1–3, 5.
  • OpenIntro Statistics (4.ª ed) — Diez, Çetinkaya-Rundel, Barr · 2019 · CC-BY-SA. Source des exercices 78.3, 78.9, 78.11–12, 78.17–18, 78.21, 78.23, 78.26–28, 78.32 et exemple 4.
  • Introduction to Probability (Grinstead-Snell) — Grinstead, Snell · Dartmouth · GNU FDL. Source des exercices 78.4, 78.13, 78.15 et preuve de |r| ≤ 1.

Updated on 2026-05-06 · Author(s): Clube da Matemática

Found an error? Open an issue on GitHub or submit a PR — open source forever.