1. 2.1. Fachsimpelei als Einstieg
    1. Grundgesamtheit
      1. Erfordert eindeutige Definition: sachlich (wer und was soll untersucht werden) räumlich (wo soll die Untersuchung stattfinden) zeitlich (wann soll das stattfinden)
    2. Stichprobe
      1. beschränkte Auswahl aus der Grundgesamtheit
      2. muss repräsentativ sein, damit sie wirklich Rückschlüsse auf ein Ganzes erlaubt
    3. Teil- und Vollerhebung
      1. Teilerhebung = Stichprobe, Vollerhebung ist die Untersuchung der Gesamtheit
      2. Vollerhebung bei realsitischem Aufwand, z.B. innerhalb einer kleinen Gruppe oder erzwungener Teilnahme (z.B. Volkszählung)
    4. Verzerrung, Bias
      1. sytematischer Fehler im Datenauswahlverfahren oder in den Daten selbst
      2. einseitige, irreführende Ergebnisse
      3. Fragestellung / Auswahl der Fragen kann beeinflussen
    5. Einzelobjekte und Merkmale
      1. Einzelobjekt = 1 statistische Einheit = Merkmalsträger
      2. Merkmal = Variable (z.B. Geschlecht, Einkommen, Automarke, Pulloverfarbe, Schulnoten)
      3. Merkmalsausprägung = mögliche Werte der Merkmale (z.B. Schulnoten 1-6 oder Studiennoten bestanden / nicht bestanden) = statistische Daten (Urliste)
    6. Primär- und Sekundärstatistik
      1. Primärstatistik = Field Research Man bestimmt selbst über: den Erhebungszweck die Aktualität Erfordernisse der Datenerfassung (elektronisch, schriftlich) Nachteil: Befragung → Widerstand / Kosten & Aufwand
      2. Sekundärstatistik = Desk Research basiert auf Daten die nicht primär für statistische Zwecke gesammelt wurden (z.B. administrativ). Spart Zeit & Kosten, jedoch kein Einfluss auf die Art und Durchführung der Erhebung
    7. Erhebungsarten
      1. Ergebnisse müssen objektiv / valide / reliebal sein
      2. Beobachtung
        1. UUU: Untersuchungsobjekte ungestört in natürlicher Umgebung
        2. Untersuchungsobjekte werden nicht oder kaum durch die Art der Datensammlung beeinflusst
      3. Experiment
        1. Untersuchung von zwei oder mehr Testgruppen, davon eine Kontrollgruppe)
        2. Faktoren wie Geschlecht, Alter etc. der Gruppen können kontrolliert werden
      4. Befragung
        1. sorgfältig formulieren - Verzerrungen vermeiden
        2. Fragen auf Objektivität / Validität / Reliabilität prüfen
        3. Antworten können trotzdem verzerrt sein (z.B. soziale Erwünschtheit)
  2. 2.2. Ohne Daten geht es nicht
    1. Gültigkeit der Statistik immer abhängig von Gültigkeit und Güte der Daten
    2. Statistische Datenerhebung
      1. Planung
        1. exakte Formulierung des Untersuchungszieles bzw. Problems inklusive eindeutiger Definition der Grundgesamtheit Festlegung des Erhebungsprogramms zur Datenbeschaffung Klärung organisatorischer Fragen Berücksichtigung ähnlicher Studien
      2. Erhebung
        1. Primär-/Sekundärdaten? Am wichtigsten: repräsentative Daten
      3. Datenaufbereitung
        1. Aussortieren ungültiger, unsinniger Antworten NICHT Entfernen „upassender“ Daten Verdichtung des Urmaterials in Tabellen / Schaubildern
      4. Analyse
        1. Ermittlung von Mittelwerten, Streuungen, Vertrauensintervallen mathematisch-statistische Methoden (geht weiter als die anfängliche Verdichtung in der Aufbereitung)
      5. Interpretation
        1. Welche Aussagen kann man treffen? Welche nicht? Ursprüngliche Zielsetzung beachten Erfahrung und Verstand einsetzen
    3. Charakterisierung von Datentypen und Merkmalen
      1. Qualitative und quantitative Merkmale
        1. Qualitative Daten: - verwenden beschreibende Werte zum Messen / Klassifizieren eines Merkmales - nur Benennung von Merkmalsausprägungen möglich - keine zahlenmäßige Erfassung - Beispiele: Staatsangehörigkeit, Augenfarbe, Wohnort, Blutgruppe quantitative Daten: - Zahlenwerte durch Messen / Wägen / Zählen - Beispiele Merkmalsausprägungen: Alter, Gewicht, Menge an getrunkenem Prosecco
      2. Skalenniveau
        1. Nominalskala
          1. - Merkmale können nicht geordnet werden - z.B. Augenfarbe, Wohnort - der Untersuchungseinheit für das Merkmal wird (genau) ein Name / (genau) eine Kategorie zugeordnet
          2. niedrigstes Skalenniveau
        2. Ordinal- oder Rangskala
          1. - Ausprägungen können geordnet werden - z.B. Schulnoten (1, 2, 3,... ) - Test auf Gleichheit - Interpretation der Rangordnung möglich
        3. Metrische Skala
          1. außer der Rangordnung können auch Abstände gemessen und interpretiert werden
          2. Intervallskala: es können Abstände bestimmt werden aber Multiplikation / Division sind nicht sinnvoll. Beispiel: Jahreszahlen
          3. Verhältnisskala: Vergleiche auf Identität & Größe, Addition, Subtraktion, Multiplikation, Division sinnvoll durchführbar. Beispiele: Körpergewicht, Einkommen
      3. Diskrete und stetige Merkmale
        1. Diskrete Merkmale: - abzählbar viele Ausprägungen - z.B. Kinderzahl, PKWs pro Haushalt, Steuerklassen Stetige Merkmale: - können überabzählbare Ausprägungen annehmen - müssen (in einem Intervall) jede reelle Zahl annehmen können - nahezu alle physikalischen Größen sind stetig, z.B. Körpergewicht, Entfernungen, Zeit
        2. jede emprirische Messung resultiert in diskrete Merkmale (teilweise mit vielen unterscheidlichen Messwerten)