Start:Bayes!

Autor:in

Sebastian Sauer

Veröffentlichungsdatum

2. Dezember 2024

Doi

1 Einführung

Bayes:Start! Bildquelle: Klara Schaumann

1.1 Ihr Lernerfolg

1.1.1 Lernziele

Nach diesem Kurs sollten Sie …

  • grundlegende Konzepte der Inferenzstatistik mit Bayes verstehen und mit R anwenden können
  • gängige einschlägige Forschungsfragen in statistische Modelle übersetzen und mit R auswerten können
  • kausale Forschungsfragen in statistische Modelle übersetzen und prüfen können
  • die Güte und Grenze von statistischen Modellen einschätzen können

1.1.2 Was lerne ich hier und wozu ist das gut?

Kurz gesagt, warum soll ich das lernen?

Statistische Analysen sind die Grundlage für Entscheidungen: Nehmen wir zum Beispiel an, Sie haben Sie 50 Frauen und Männer vor eine Einpark-Aufgabe gestellt (natürlich alles schön standardisiert und kontrolliert) - Wer am schnellsten ein Auto einparken kann. Das Ergebnis: Frauen können schneller einparken als Männer, im Durchschnitt. Das hätten wir also geklärt. Aber haben wir das ganz sicher geklärt? Mit welcher Sicherheit? Bekanntlich sind in dieser Welt nur Steuern und der Tod sicher; sonstige Aussagen leider nicht und damit unsere Einpark-Studie und sonstige statistische Analysen auch nicht. Ja, ich weiß, das ist jetzt ein harter Schlag für Sie… Aber die gute Nachricht ist: Wir können angeben, wie (un)sicher wir bei mit einer Aussage (“Frauen parken schneller…”) sind. Zum Beispiel könnten wir uns zu 99% oder zu 51% sicher sein - und wie sicher wir uns sind, macht schon einen Unterschied. Wenn Sie nächste Woche ei Fahri für Ihren neuen Rolls Royce anheuern, müssen Sie ja wissen, ob es besser eine Frau oder ein Mann sein soll.

Kurz gesagt: In diesem Kurs lernen Sie, wie Sie die Unsicherheit eines statistischen Ergebnisses beziffern.

Warum ist das wichtig?

Da fast keine Aussage auf dieser Welt 100% sicher ist, müssen wir wissen, wie sicher eine Aussage ist, wenn wir eine Entscheidung treffen wollen.

Wozu brauche ich das im Job?

Ihr Boss wird wissen wollen, wie sicher Sie sich sind, wenn Sie sagen “laut meiner Analyse sollten wir unser Werk in Ansbach/Peking/Timbuktu bauen”. Sind Sie sich zu 50%, 90% oder 99,9% sicher, dass Ihre Aussage richtig ist? Wichtige Frage im echten Leben.

Wozu brauche ich das im weiterem Studium?

In Forschungsarbeiten (wie in empirischen Forschungsprojekten, etwa in der Abschlussarbeit) ist es üblich, statistische Ergebnisse hinsichtlich ihrer Unsicherheit zu beziffern.

Gibt es auch gute Jobs, wenn man sich mit Daten auskennt?

Das (world2020?) berichtet zu den “Top 20 job roles in increasing and decreasing demand across industries” (S. 30, Abb. 22):

  1. Data Analysts und Scientists
  2. AI and Machine Learning Specialists
  3. Big Data Specialists

1.1.3 Modulüberblick

Abbildung 1.1 gibt einen Überblick zu den Inhalten des Kurses.

flowchart LR
  subgraph Wskt[Wahrscheinlichkeit]
    Inferenz --> Ungewissheit --> Verteilungen
  end 
  subgraph Bayes
    Globus --> Post
  end 
  subgraph Regression
    Gauss --> Einfach --> Anwendung
  end 
  subgraph Kausalität
    Kausalstart
  end 
  Wskt --> Bayes --> Regression --> Kausalität
Abbildung 1.1: Modulverlauf im Überblick. Die einezlenn Schritte entsprechen in etwa den Kapiteln dieses Buchs.

1.1.4 Modulverlauf

Tabelle 1.1 gibt einen Überblick, welches Thema in welcher Woche bzw. wann behandelt wird. Pro Woche wird ein Thema behandelt.

Tipp

Es ist nützlich für Sie, die Tabelle Tabelle 1.1 immer mal wieder zu konsultieren, damit sie wissen, welche Themen als nächstes behandelt werden. \(\square\)

Tabelle 1.1: Themen des Moduls im Zeitverlauf
KW Jahr Wochenstart VL-frei Nr Thema Kommentar
40 2024 2024-09-30 teilweise 1 Einstieg VL-frei am Do.; Di frei NUR für Erstis
41 2024 2024-10-07 nein 2 Inferenz NA
42 2024 2024-10-14 nein 3 Wahrscheinlichkeit NA
43 2024 2024-10-21 nein 4 Verteilungen NA
44 2024 2024-10-28 teilweise 5 Aufholwoche VL-frei am Do und Fr
45 2024 2024-11-04 nein 7 Globusversuch NA
46 2024 2024-11-11 nein 7 Die Post befragen NA
47 2024 2024-11-18 ja NA - Blockwoche
48 2024 2024-11-25 nein 8 Gauss-Modelle NA
49 2024 2024-12-02 nein 9 Einfache lineare Modelle NA
50 2024 2024-12-09 nein 10 Schätzen vs. Testen NA
51 2024 2024-12-16 nein 11 Aufholwoche NA
52 2024 2024-12-23 ja NA - NA
1 2025 2024-12-30 ja NA - NA
2 2025 2025-01-06 teilweise 12 Fallbeispiele VL-frei am Mo
3 2025 2025-01-13 nein 13 Abschluss NA
4 2025 2025-01-20 ja NA - Prüfungszeit beginnt
5 2025 2025-01-27 ja NA - VL-freie Zeit beginnt

1.1.5 Voraussetzungen

Für dieses Kurs wird folgendes Wissen vorausgesetzt:

  • grundlegende Kenntnis im Umgang mit R, möglichst auch mit dem tidyverse
  • grundlegende Kenntnis der deskriptiven Statistik
  • grundlegende Kenntnis der Regressionsanalyse

Dieses Wissen wird z.B. im Online-Buch “Statistik1” vermittelt. Alle Inhalte daraus werden in diesem Kurs benötigt.

1.1.6 PDF-Version

Sie können die Druck-Funktion Ihres Broswers nutzen, um ein PDF-Dokument eines Kapitels dieses Buchs zu erstellen.

Alternativ finden Sie hier die Kapitel als PDF-Version. Achtung: Diese PDF-Versionen sind nicht unbedingt aktuell.

1.2 Lernhilfen

Hier finden Sie einen Überblick zu Lernhilfen.

1.3 Software

Sie benötigen R, RStudio und einige R-Pakete insbesondere rstanarm für diesen Kurs.

Hier finden Sie Installationshinweise.

1.4 Hinweise

Hinweis

Alle formalen Hinweise (Prüfung, Unterrichtsorganisation, …) sind auf der Seite https://hinweisbuch.netlify.app/ zu finden. \(\square\)

1.5 Tutorium

Für dieses Modul wird ggf. ein Tutorium angeboten.

Der Besuch des Tutoriums ist zu empfehlen. Arbeiten Sie auch das Materials auf der Webseite des Tutoriums durch.

1.6 Prüfung

Das aktuelle Prüfungsformat ist: Klausur im Mehrfachwahlverfahren (Multiple Choice).

Hilfsmittel wie Skripte oder Notizen sind nicht zulässig. Die Prüfung findet (ausschließlich) in Präsenz statt.

In Kapitel 13 finden sich weitere Hinweise auch mit Blick zu Aufgabensammlungen.

1.7 Zitation

Bitte zitieren Sie dieses Buch wie folgt:

Sauer, S. (2023). Start:Bayes!. https://start-bayes.netlify.app/

Hier sind die maschinenlesbaren Zitationsinfos (Bibtex-Format), die Sie in Ihre Literatursoftware importieren können:

@book{sauer_startbayes,
    title = {Start:Bayes},
    rights = {CC-BY-NC},
    url = {https://start-bayes.netlify.app/},
    author = {Sauer, Sebastian},
    date = {2023},
}

Hier ist die DOI:

DOI

DOI

1.8 Zum Autor

Nähere Hinweise zum Autor, Sebastian Sauer, finden Sie hier.