Start:Bayes!

Autor:in

Sebastian Sauer

Veröffentlichungsdatum

22. März 2024

Doi

1 Einführung

Bayes:Start! Bildquelle: Klara Schaumann

1.1 Ihr Lernerfolg

1.1.1 Lernziele

Nach diesem Kurs sollten Sie …

  • grundlegende Konzepte der Inferenzstatistik mit Bayes verstehen und mit R anwenden können
  • gängige einschlägige Forschungsfragen in statistische Modelle übersetzen und mit R auswerten können
  • kausale Forschungsfragen in statistische Modelle übersetzen und prüfen können
  • die Güte und Grenze von statistischen Modellen einschätzen können

1.1.2 Was lerne ich hier und wozu ist das gut?

Kurz gesagt, warum soll ich das lernen?

Statistische Analysen sind die Grundlage für Entscheidungen: Nehmen wir zum Beispiel an, Sie haben Sie 50 Frauen und Männer vor eine Einpark-Aufgabe gestellt (natürlich alles schön standardisiert und kontrolliert) - Wer am schnellsten ein Auto einparken kann. Das Ergebnis: Frauen können schneller einparken als Männer, im Durchschnitt. Das hätten wir also geklärt. Aber haben wir das ganz sicher geklärt? Mit welcher Sicherheit? Bekanntlich sind in dieser Welt nur Steuern und der Tod sicher; sonstige Aussagen leider nicht und damit unsere Einpark-Studie und sonstige statistische Analysen auch nicht. Ja, ich weiß, das ist jetzt ein harter Schlag für Sie… Aber die gute Nachricht ist: Wir können angeben, wie (un)sicher wir bei mit einer Aussage (“Frauen parken schneller…”) sind. Zum Beispiel könnten wir uns zu 99% oder zu 51% sicher sein - und wie sicher wir uns sind, macht schon einen Unterschied. Wenn Sie nächste Woche ei Fahri für Ihren neuen Rolls Royce anheuern, müssen Sie ja wissen, ob es besser eine Frau oder ein Mann sein soll.

Kurz gesagt: In diesem Kurs lernen Sie, wie Sie die Unsicherheit eines statistischen Ergebnisses beziffern.

Warum ist das wichtig?

Da fast keine Aussage auf dieser Welt 100% sicher ist, müssen wir wissen, wie sicher eine Aussage ist, wenn wir eine Entscheidung treffen wollen.

Wozu brauche ich das im Job?

Ihr Boss wird wissen wollen, wie sicher Sie sich sind, wenn Sie sagen “laut meiner Analyse sollten wir unser Werk in Ansbach/Peking/Timbuktu bauen”. Sind Sie sich zu 50%, 90% oder 99,9% sicher, dass Ihre Aussage richtig ist? Wichtige Frage im echten Leben.

Wozu brauche ich das im weiterem Studium?

In Forschungsarbeiten (wie in empirischen Forschungsprojekten, etwa in der Abschlussarbeit) ist es üblich, statistische Ergebnisse hinsichtlich ihrer Unsicherheit zu beziffern.

Gibt es auch gute Jobs, wenn man sich mit Daten auskennt?

Das Forum (2020) berichtet zu den “Top 20 job roles in increasing and decreasing demand across industries” (S. 30, Abb. 22):

  1. Data Analysts und Scientists
  2. AI and Machine Learning Specialists
  3. Big Data Specialists

1.1.3 Modulüberblick

Abbildung 1.1 gibt einen Überblick zu den Inhalten des Kurses.

flowchart LR
  subgraph Wskt[Wahrscheinlichkeit]
    Inferenz --> Ungewissheit --> Verteilungen
  end 
  subgraph Bayes
    Globus --> Post
  end 
  subgraph Regression
    Gauss --> Einfach --> Anwendung
  end 
  subgraph Kausalität
    Kausalstart
  end 
  Wskt --> Bayes --> Regression --> Kausalität
Abbildung 1.1: Modulverlauf im Überblick. Die einezlenn Schritte entsprechen in etwa den Kapiteln dieses Buchs.

1.1.4 Modulverlauf

Tabelle 1.1 gibt einen Überblick, welches Thema in welcher Woche bzw. wann behandelt wird. Pro Woche wird ein Thema behandelt.

Tipp

Es ist nützlich für Sie, die Tabelle Tabelle 1.1 immer mal wieder zu konsultieren, damit sie wissen, welche Themen als nächstes behandelt werden. \(\square\)

Tabelle 1.1: Themen des Moduls im Zeitverlauf
Nr Thema Datum Kommentar
1 Inferenz 2.-8. Okt. NA
2 Wahrscheinlichkeit 9.-15. Okt. NA
3 Verteilungen 16.-22. Okt. NA
4 Globusversuch 23.-29. Okt. NA
5 Aufhol-Woche 30.-5. Nov. NA
6 Die Post befragen 5.-12. Nov. NA
7 Gauss-Modelle 13.-19. Nov. NA
NA NA 20.-26. Nov. Blockwoche: Kein regulärer Unterricht
8 Lineare Modelle 27.-3. Dez. NA
9 Metrische AV 4.-10. Dez. NA
10 Konfundierung 11.-17. Dez NA
11 Kausalatome 18.-24. Dez. NA
NA NA NA Jahreswechsel: Kein Unterricht
12 Abschluss 8.-14. Jan. 24 NA

1.1.5 Voraussetzungen

Für dieses Kurs wird folgendes Wissen vorausgesetzt:

  • grundlegende Kenntnis im Umgang mit R, möglichst auch mit dem tidyverse
  • grundlegende Kenntnis der deskriptiven Statistik
  • grundlegende Kenntnis der Regressionsanalyse

Dieses Wissen wird z. B. im Online-Buch “Statistik1” vermittelt. Alle Inhalte daraus werden in diesem Kurs benötigt.

1.2 Lernhilfen

Hier finden Sie einen Überblick zu Lernhilfen.

1.3 Software

Sie benötigen R, RStudio und einige R-Pakete insbesondere rstanarm für diesen Kurs.

Hier finden Sie Installationshinweise.

1.4 Hinweise

1.5 Tutorium

Für dieses Modul wird ggf. ein Tutorium angeboten.

Der Besuch des Tutoriums ist zu empfehlen. Arbeiten Sie auch das Materials auf der Webseite des Tutoriums durch.

1.6 Prüfung

Das Prüfungsformat ist: Open-Book-Prüfung.

In Kapitel 13 finden sich weitere Hinweise auch mit Blick zu Aufgabensammlungen.

1.7 Zitation

Bitte zitieren Sie dieses Buch wie folgt:

Sauer, S. (2023). Start:Bayes!. https://start-bayes.netlify.app/

Hier sind die maschinenlesbaren Zitationsinfos (Bibtex-Format), die Sie in Ihre Literatursoftware importieren können:

@book{sauer_startbayes,
    title = {Start:Bayes},
    rights = {CC-BY-NC},
    url = {https://start-bayes.netlify.app/},
    author = {Sauer, Sebastian},
    date = {2023},
}

Hier ist die DOI:

DOI

DOI

1.8 Zum Autor

Nähere Hinweise zum Autor, Sebastian Sauer, finden Sie hier.

1.9 Reproduzierbarkeit

Hier sind einige technische Details zur Reproduzierbarkeit des Buchs.

Dieses Dokument wurde erzeugt am/um 2024-02-09 12:21:31.

## ─ Session info ───────────────────────────────────────────────────────────────
##  setting  value
##  version  R version 4.2.1 (2022-06-23)
##  os       macOS Big Sur ... 10.16
##  system   x86_64, darwin17.0
##  ui       X11
##  language (EN)
##  collate  en_US.UTF-8
##  ctype    en_US.UTF-8
##  tz       Europe/Berlin
##  date     2024-02-09
##  pandoc   3.1.1 @ /Applications/RStudio.app/Contents/Resources/app/quarto/bin/tools/ (via rmarkdown)
## 
## ─ Packages ───────────────────────────────────────────────────────────────────
##  ! package     * version date (UTC) lib source
##  P cli           3.6.1   2023-03-23 [?] CRAN (R 4.2.0)
##  P codetools     0.2-18  2020-11-04 [?] CRAN (R 4.2.1)
##  P digest        0.6.33  2023-07-07 [?] CRAN (R 4.2.0)
##    dplyr         1.1.4   2023-11-17 [1] RSPM (R 4.2.0)
##  P evaluate      0.21    2023-05-05 [?] CRAN (R 4.2.0)
##  P fansi         1.0.5   2023-10-08 [?] CRAN (R 4.2.0)
##  P fastmap       1.1.1   2023-02-24 [?] CRAN (R 4.2.0)
##  P generics      0.1.3   2022-07-05 [?] CRAN (R 4.2.0)
##  P glue          1.6.2   2022-02-24 [?] CRAN (R 4.2.0)
##  P gt            0.10.0  2023-10-07 [?] CRAN (R 4.2.0)
##  P htmltools     0.5.6.1 2023-10-06 [?] CRAN (R 4.2.0)
##  P htmlwidgets   1.6.2   2023-03-17 [?] CRAN (R 4.2.0)
##  P jsonlite      1.8.7   2023-06-29 [?] CRAN (R 4.2.0)
##  P knitr         1.45    2023-10-30 [?] CRAN (R 4.2.1)
##    lifecycle     1.0.4   2023-11-07 [1] RSPM (R 4.2.0)
##  P magrittr      2.0.3   2022-03-30 [?] CRAN (R 4.2.0)
##  P pillar        1.9.0   2023-03-22 [?] CRAN (R 4.2.0)
##  P pkgconfig     2.0.3   2019-09-22 [?] CRAN (R 4.2.0)
##  P R6            2.5.1   2021-08-19 [?] CRAN (R 4.2.0)
##    renv          1.0.2   2023-08-15 [1] CRAN (R 4.2.0)
##    rlang         1.1.2   2023-11-04 [1] RSPM (R 4.2.0)
##  P rmarkdown     2.25    2023-09-18 [?] CRAN (R 4.2.0)
##  P rstudioapi    0.15.0  2023-07-07 [?] CRAN (R 4.2.0)
##  P sass          0.4.7   2023-07-15 [?] CRAN (R 4.2.0)
##  P sessioninfo   1.2.2   2021-12-06 [?] CRAN (R 4.2.0)
##  P tibble        3.2.1   2023-03-20 [?] CRAN (R 4.2.0)
##  P tidyselect    1.2.0   2022-10-10 [?] CRAN (R 4.2.0)
##    utf8          1.2.4   2023-10-22 [1] RSPM (R 4.2.0)
##    vctrs         0.6.5   2023-12-01 [1] RSPM (R 4.2.0)
##  P withr         2.5.2   2023-10-30 [?] CRAN (R 4.2.1)
##  P xfun          0.40    2023-08-09 [?] CRAN (R 4.2.0)
##  P xml2          1.3.4   2023-04-27 [?] CRAN (R 4.2.0)
##  P yaml          2.3.7   2023-01-23 [?] CRAN (R 4.2.0)
## 
##  [1] /Users/sebastiansaueruser/github-repos/_other/start-bayes/renv/library/R-4.2/x86_64-apple-darwin17.0
##  [2] /Users/sebastiansaueruser/Library/Caches/org.R-project.R/R/renv/sandbox/R-4.2/x86_64-apple-darwin17.0/fb4b0a46
## 
##  P ── Loaded and on-disk path mismatch.
## 
## ──────────────────────────────────────────────────────────────────────────────