Lição 109 — Estatística bayesiana introdutória
Prior, verossimilhança, posterior. Regra de Bayes. Conjugados Beta-Bernoulli. MAP versus MLE. Intervalo credível. Introdução à inferência pelo paradigma bayesiano.
Used in: Stochastik LK (Alemanha, Klasse 12) · H2 Math Statistics (Singapura) · AP Statistics (EUA)
Rigorous notation, full derivation, hypotheses
Definicja rygorystyczna
Twierdzenie Bayesa
"Twierdzenie Bayesa to podstawowy wynik prawdopodobieństwa warunkowego, ale jego interpretacja zmienia wszystko: oferuje formalny przepis na aktualizowanie wiary w świetle dowodów." — OpenIntro Statistics §3.6
Priory sprzężone: przypadek Beta-Bernoulli
Estymatory punktowe
Przedział kredybilny
Czynnik Bayesa
Aby porównać hipotezy i :
Skala Jeffreysa: — silny dowód dla ; — silny dla ; — niekonkluzywnie.
Przepływ bayesowski: prior × wiarogodność → posterior. Posterior staje się nowym priorem gdy pojawiają się więcej danych.
Przykłady rozwiązane
Problem. Choroba dotyka 2% populacji. Test ma czułość 90% i swoistość 85%. Pacjent wynik testu pozytywny. Jakie jest prawdopodobieństwo, że ma chorobę?
Strategia. Zastosuj formułę Bayesa z partycją i oblicz .
Rozwiązanie.
, , , .
Dowód całkowity:
Posterior:
Weryfikacja. Z zaledwie 2% rozpowszechnieniem, nawet względnie dobry test generuje wiele fałszywych dodatnich. Odpowiedź ma sens: większość dodatnich pochodzi z ogromnej zdowej populacji.
Źródło. OpenIntro Statistics §3.6, przykład diagnozy medycznej — CC-BY-SA.
Problem. Urna ma nieznaną proporcję czerwonych kul. Prior: . Rysujemy ze zwrotem: 1. próba — 3 czerwone z 5 wylosowań; 2. próba — 4 czerwone z 6 wylosowań. Oblicz posterior po każdej próbie i średnią posterior końcową.
Strategia. Beta-Bernoulli: po sukcesach w próbach, . Zastosuj iteracyjnie.
Rozwiązanie.
Prior: , średnia .
Po 1. próbie (, ):
Po 2. próbie (, ):
Weryfikacja. Całkowite dane: 7 czerwonych z 11 wylosowań, proporcja próbki = . Średnia posterior 0,60 jest między priorem (0,50) a proporcją próbki — ma sens. Z słabym priorem, posterior zbiegać do MLE wraz ze wzrostem .
Źródło. Think Bayes §3 — Allen Downey — CC-BY-NC-SA.
Problem. Dla modelu Beta-Bernoulli z , , po 6 sukcesach w 10 próbach, oblicz MLE, MAP i średnią posterior. Zinterpretuj różnicę.
Strategia. MLE maksymalizuje wiarogodność; MAP maksymalizuje posterior; średnia posterior to .
Rozwiązanie.
MLE: .
Posterior: .
MAP (moda Beta z to ):
Średnia posterior:
Weryfikacja. Porządek: średnia między MAP a modą Beta(9,7). MLE jest największy — prior "ciągnie" w kierunku 0,5 (prior symetryczny wokół 0,5). Z dużym , wszystkie trzy zbiegają do MLE.
Źródło. Think Bayes §4, §6 — Allen Downey — CC-BY-NC-SA.
Problem. Po 12 sukcesach w 20 próbach z priorem (uniforme), oblicz centralny przedział kredybilny 95% dla .
Strategia. Posterior . Centralny przedział 95% jest podany przez percentyle 2,5% i 97,5% rozkładu Beta.
Rozwiązanie.
Posterior: .
Średnia posterior: .
Przez tabelę lub oprogramowanie (R: qbeta(c(0.025, 0.975), 13, 9)):
Percentyl 2,5%: . Percentyl 97,5%: .
Przedział kredybilny 95%: .
Weryfikacja. Interpretacja bezpośrednia: "biorąc pod uwagę uniforme prior i dane, prawdopodobieństwo, że jest między 0,376 a 0,779 wynosi 95%". Zauważ, że przedział nie jest wyśrodkowany w 0,6 — jest asymetryczny, ponieważ Beta jest asymetryczna w tym przypadku.
Źródło. Introduction to Probability §4.1 — Grinstead & Snell — GNU FDL.
Problem. Do testowania czy (uczciwa moneta) kontra (sfałszowana moneta), z equiprobabilnym priorem (), oblicz czynnik Bayesa i prawdopodobieństwo posterior po 8 orłach w 10 rzutach.
Strategia. Oblicz dla każdej hipotezy, następnie zastosuj Bayes.
Rozwiązanie.
Czynnik Bayesa:
Z priorem :
Weryfikacja. — dowód umiarkowany do mocny dla (skala Jeffreysa: między 3 i 10 to "umiarkowane"). Prawdopodobieństwo posterior sfałszowanej monety poszło z 50% do 84%. Spójne z danymi (8 z 10 faworyzuje ).
Źródło. OpenIntro Statistics §3.7 — Diez, Çetinkaya-Rundel, Barr — CC-BY-SA.
Exercise list
34 exercises · 8 with worked solution (25%)
- Ex. 109.1Application
Rozpowszechnienie choroby: 1%. Czułość testu: 95%. Wskaźnik fałszywych dodatnich: 10%. Pacjent ma wynik testu pozytywny. Oblicz prawdopodobieństwo posiadania choroby.
- Ex. 109.2Application
Monetę rzucono 10 razy i wypadły 4 orły. Prior: Beta(1,1) (uniforme). Oblicz posterior, średnią posterior i porównaj z MLE.
- Ex. 109.3Application
Prior: Beta(4, 6). Próba: 7 sukcesów w 10. Oblicz posterior, średnią posterior i MAP.
- Ex. 109.4Application
Prior: Beta(2, 2). Partia 1: 5 sukcesów w 10. Partia 2: 8 sukcesów w 10. Wykonaj aktualizację sekwencyjną i oblicz średnią posterior końcową.
- Ex. 109.5Application
Rozpowszechnienie: 0,5%. Czułość: 99%. Wskaźnik fałszywych dodatnich: 2%. Pacjent ma wynik testu pozytywny. Jakie jest prawdopodobieństwo posiadania choroby?
- Ex. 109.6Application
3 sukcesy w 10 próbach. Porównaj średnią posterior z priorami Beta(1,1) i Beta(5,5). Który prior ma większy wpływ na posterior?
- Ex. 109.7Application
Trzy fabryki produkują śruby: F1 (60% produkcji, 30% defektowych), F2 (30%, 50% defektowych), F3 (10%, 10% defektowych). Defektowa śruba jest wyjęta. Jakie jest prawdopodobieństwo, że pochodzi z F1?
- Ex. 109.8Application
Prior: Beta(3, 3) (lekka wiara w uczciwą monetę, średnia 0,5). Rzucono 5 razy i wypadły 0 orłów. Oblicz posterior i nową średnią.
- Ex. 109.9Application
Prior: Beta(1,1). Dane: 15 sukcesów w 20. Oblicz MAP i MLE. Czy są równe? Dlaczego?
- Ex. 109.10Application
Worek z dwiema monetami: jedna zawsze daje orły (H), druga jest uczciwa (J). Wybrana losowo. Rzucona dwa razy, oba orły. Jakie jest prawdopodobieństwo, że to moneta H?
- Ex. 109.11Understanding
Co oznacza przedział kredybilny bayesowski 95%?
- Ex. 109.12UnderstandingAnswer key
Które stwierdzenie o MAP i MLE jest NIEPOPRAWNE?
- Ex. 109.13Understanding
Jak rozmiar próbki n wpływa na związek między prior a posterior?
- Ex. 109.14Application
Student zdaje egzamin (). Wiadomo: (uczył się wiele, prawdopodobieństwo 60%), (nie uczył się, prawdopodobieństwo 40%). Biorąc pod uwagę, że zdał, jakie jest prawdopodobieństwo, że uczył się wiele?
- Ex. 109.15Application
Maszyna ma nieznaną stopę trafności. Prior: Beta(4, 2) (historia 4 trafnościach i 2 porażkach). Nowy test: 6 kolejnych trafnościach. Oblicz posterior, średnią i MAP.
- Ex. 109.16Application
Oblicz Czynnik Bayesa dla kontra po 8 orłach w 10 rzutach.
- Ex. 109.17ApplicationAnswer key
Trzy partie po 10 prób każda: 7 sukcesów, 6 sukcesów, 7 sukcesów. Prior: Beta(1,1). Wykonaj aktualizację sekwencyjną i oblicz średnią posterior końcową.
- Ex. 109.18Application
Rozpowszechnienie: 30%. Czułość: 95%. Wskaźnik fałszywych dodatnich: 20%. Pacjent ma wynik testu pozytywny. Oblicz prawdopodobieństwo posiadania choroby i porównaj z ćwiczeniem 109.1.
- Ex. 109.19ApplicationAnswer key
Pokaż, że średnia posterior modelu Beta-Bernoulli jest ważoną średnią między priorem a proporcją próbki. Zidentyfikuj wagi.
- Ex. 109.20Application
Prior: Beta(2, 2). Dane: 0 sukcesów w 3. Oblicz posterior, MAP i średnią posterior.
- Ex. 109.21
Prawdopodobieństwo deszczu we Fortalezi w danym dniu: 40%. Jeśli będzie deszcz, są 85% szanse chmur ładunkowych. Jeśli nie będzie deszczu, 30%. Są chmury ładunkowe. Jakie jest prawdopodobieństwo deszczu?
- Ex. 109.22Answer key
Historia produkcji: 10% defektów (równoważne 10 defektom na 100 sztuk = Beta(10,90)). Nowa inspekacja: 3 defekty na 20. Oblicz posterior i średnią posterior.
- Ex. 109.23
Worek z 3 monetami: 1 zawsze daje orły (H), 2 są uczciwe (J). Moneta jest losowo wyjęta i rzucona: wypadł orzeł. Jakie jest prawdopodobieństwo, że to moneta H?
- Ex. 109.24
Prior Beta(1,1). Dane: 10 sukcesów w 20. Opisz posterior i centralny przedział kredybilny 95% (użyj tego, że percentyl 2,5% Beta(11,11) ≈ 0,31).
- Ex. 109.25Modeling
Historyczne kursy zatwierdzają 70% uczniów na ENEM. Nowa grupa, 20 uczniów: 15 przeszło. Zaproponuj odpowiedni prior Beta, oblicz posterior i średnią posterior stopy zatwierdzenia.
- Ex. 109.26ModelingAnswer key
Rozpowszechnienie raka trzustki: 0,2%. Biopsja: czułość 92%, swoistość 97%. Pozytywny egzamin. Oblicz P(rak | pozytywny) i omów decyzję medyczną.
- Ex. 109.27Modeling
Przewoźnik zgłasza 20 dostaw z opóźnieniem spośród 50 monitorowanych dostaw. Przy użyciu prior Beta(1,1) szacuj stopę opóźnienia z przedziałem kredybilnym 90%.
- Ex. 109.28ModelingAnswer key
Fintech wie, że 1% transakcji to oszustwa. Algorytm wykrywa, że bieżąca transakcja ma wartość poza normą klienta. P(wartość nietypowa | oszustwo) = 85%, P(wartość nietypowa | legalna) = 2%. Oblicz prawdopodobieństwo oszustwa.
- Ex. 109.29Proof
Pokaż, że dla modelu Bernoulli z priorem Beta, posterior jest również Beta. Zidentyfikuj parametry.
- Ex. 109.30ProofAnswer key
Udowodnij, że z priorem Beta(1,1) (uniforme), estymator MAP pokrywa się z MLE dla modelu Bernoulli.
- Ex. 109.31Answer key
Filtr spamu: 20% emaili to spam. W emailach spamowych każde słowo-klucz podejrzane pojawia się z prawdopodobieństwem 60%; w legalnych emailach 5%. Email ma 3 słowa-klucze. Jakie jest prawdopodobieństwo, że to spam?
- Ex. 109.32
Dwie grupy szczurów: linia 1 (10 zwierząt, 8 rozwinęło guz po ekspozycji) i linia 2 (10 zwierząt, 3 rozwinęło). Prior Beta(1,1) dla obu stóp. Oblicz posterior i średnią posterior dla każdej linii.
- Ex. 109.33
Urna ma nieznaną proporcję pomarańczowych kul. Po 100 losowaniach ze zwrotem, 50 to pomarańcze. Prior Beta(1,1). Oblicz posterior, średnią i przedział kredybilny 95%.
- Ex. 109.34Challenge
Prior Jeffreysa dla Bernoulli to Beta(0,5; 0,5). Po 6 sukcesach w 10, oblicz posterior. Poszukaj, co oznacza, że ten prior jest "niezmienny pod względem parametryzacji" i porównaj średnią posterior z priorem Beta(1,1).
Fontes
- Think Bayes — Allen B. Downey · CC-BY-NC-SA · Greenteapress · Rozdziały 1–9.
- Introduction to Probability — Grinstead & Snell · GNU FDL · Dartmouth · §4.1.
- OpenIntro Statistics — Diez, Çetinkaya-Rundel, Barr · CC-BY-SA · OpenIntro · §3.6–3.7.