-
2.1. Fachsimpelei als Einstieg
-
Grundgesamtheit
- Erfordert eindeutige Definition:
sachlich (wer und was soll untersucht werden)
räumlich (wo soll die Untersuchung stattfinden)
zeitlich (wann soll das stattfinden)
-
Stichprobe
- beschränkte Auswahl aus der Grundgesamtheit
- muss repräsentativ sein, damit sie wirklich Rückschlüsse auf ein Ganzes erlaubt
-
Teil- und Vollerhebung
- Teilerhebung = Stichprobe, Vollerhebung ist die Untersuchung der Gesamtheit
- Vollerhebung bei realsitischem Aufwand, z.B. innerhalb einer kleinen Gruppe oder erzwungener Teilnahme (z.B. Volkszählung)
-
Verzerrung, Bias
- sytematischer Fehler im Datenauswahlverfahren oder in den Daten selbst
- einseitige, irreführende Ergebnisse
- Fragestellung / Auswahl der Fragen kann beeinflussen
-
Einzelobjekte und Merkmale
- Einzelobjekt = 1 statistische Einheit = Merkmalsträger
- Merkmal = Variable (z.B. Geschlecht, Einkommen, Automarke, Pulloverfarbe, Schulnoten)
- Merkmalsausprägung = mögliche Werte der Merkmale (z.B. Schulnoten 1-6 oder Studiennoten bestanden / nicht bestanden) = statistische Daten (Urliste)
-
Primär- und Sekundärstatistik
- Primärstatistik = Field Research
Man bestimmt selbst über:
den Erhebungszweck
die Aktualität
Erfordernisse der Datenerfassung (elektronisch, schriftlich)
Nachteil: Befragung → Widerstand / Kosten & Aufwand
- Sekundärstatistik = Desk Research
basiert auf Daten die nicht primär für statistische Zwecke gesammelt wurden (z.B. administrativ).
Spart Zeit & Kosten, jedoch kein Einfluss auf die Art und Durchführung der Erhebung
-
Erhebungsarten
- Ergebnisse müssen objektiv / valide / reliebal sein
-
Beobachtung
- UUU: Untersuchungsobjekte ungestört in natürlicher Umgebung
- Untersuchungsobjekte werden nicht oder kaum durch die Art der Datensammlung beeinflusst
-
Experiment
- Untersuchung von zwei oder mehr Testgruppen, davon eine Kontrollgruppe)
- Faktoren wie Geschlecht, Alter etc. der Gruppen können kontrolliert werden
-
Befragung
- sorgfältig formulieren - Verzerrungen vermeiden
- Fragen auf Objektivität / Validität / Reliabilität prüfen
- Antworten können trotzdem verzerrt sein (z.B. soziale Erwünschtheit)
-
2.2. Ohne Daten geht es nicht
- Gültigkeit der Statistik immer abhängig von Gültigkeit und Güte der Daten
-
Statistische Datenerhebung
-
Planung
- exakte Formulierung des Untersuchungszieles bzw. Problems
inklusive eindeutiger Definition der Grundgesamtheit
Festlegung des Erhebungsprogramms zur Datenbeschaffung
Klärung organisatorischer Fragen
Berücksichtigung ähnlicher Studien
-
Erhebung
- Primär-/Sekundärdaten?
Am wichtigsten: repräsentative Daten
-
Datenaufbereitung
- Aussortieren ungültiger, unsinniger Antworten
NICHT Entfernen „upassender“ Daten
Verdichtung des Urmaterials in Tabellen / Schaubildern
-
Analyse
-
Ermittlung von Mittelwerten, Streuungen, Vertrauensintervallen
mathematisch-statistische Methoden (geht weiter als die anfängliche Verdichtung in der Aufbereitung)
-
Interpretation
- Welche Aussagen kann man treffen?
Welche nicht?
Ursprüngliche Zielsetzung beachten
Erfahrung und Verstand einsetzen
-
Charakterisierung von Datentypen und Merkmalen
-
Qualitative und quantitative Merkmale
- Qualitative Daten:
- verwenden beschreibende Werte zum Messen / Klassifizieren eines Merkmales
- nur Benennung von Merkmalsausprägungen möglich
- keine zahlenmäßige Erfassung
- Beispiele: Staatsangehörigkeit, Augenfarbe, Wohnort, Blutgruppe
quantitative Daten:
- Zahlenwerte durch Messen / Wägen / Zählen
- Beispiele Merkmalsausprägungen: Alter, Gewicht, Menge an getrunkenem Prosecco
-
Skalenniveau
-
Nominalskala
- - Merkmale können nicht geordnet werden
- z.B. Augenfarbe, Wohnort
- der Untersuchungseinheit für das Merkmal wird (genau) ein Name / (genau) eine Kategorie zugeordnet
- niedrigstes Skalenniveau
-
Ordinal- oder Rangskala
- - Ausprägungen können geordnet werden
- z.B. Schulnoten (1, 2, 3,... )
- Test auf Gleichheit
- Interpretation der Rangordnung möglich
-
Metrische Skala
- außer der Rangordnung können auch Abstände gemessen und interpretiert werden
- Intervallskala: es können Abstände bestimmt werden aber Multiplikation / Division sind nicht sinnvoll. Beispiel: Jahreszahlen
- Verhältnisskala: Vergleiche auf Identität & Größe, Addition, Subtraktion, Multiplikation, Division sinnvoll durchführbar. Beispiele: Körpergewicht, Einkommen
-
Diskrete und stetige Merkmale
- Diskrete Merkmale:
- abzählbar viele Ausprägungen
- z.B. Kinderzahl, PKWs pro Haushalt, Steuerklassen
Stetige Merkmale:
- können überabzählbare Ausprägungen annehmen
- müssen (in einem Intervall) jede reelle Zahl annehmen können
- nahezu alle physikalischen Größen sind stetig, z.B. Körpergewicht, Entfernungen, Zeit
- jede emprirische Messung resultiert in diskrete Merkmale (teilweise mit vielen unterscheidlichen Messwerten)