Hypothesentest
Einführung
Basiswissen
In der Statistik ist ein Hypothesentest, auch Signifikanztest genannt, ein Entscheidungskriterium. Es geht immer um die Frage: soll man bei einre alten, bisherigen Hypothese bleiben oder zu einer neuen möglicherweise besseren Hypothese wechseln. Die Grundidee ist es: wie wahrscheinlich ist es, dass der bloß Zufall mit der alten Hypothese Effekte produziert, die man eigentlich mit den neuen Hypothese erklären will. Das ist hier ausführlich erklärt.
Fachworte
- Die alte Hypothese, von der man im Moment ausgeht Nullhypothese ↗
- Die neue Hypothese, zu der man wechseln könnte Alternativhypothese ↗
- Fälschliches Verbleiben bei der Nullhypothese Fehler erster Art ↗
- Fälschliches Wechseln zur Alternativhypothese Fehler zweiter Art ↗
- Maximal akzeptabler Fehler erster Art Signifikanzniveau ↗
- Werte für k, für die man bei der Nullhypothese bleibt Annahmebereich ↗
- Werte für k, für die man zu Alternativhypothese wechselt Ablehnungsbereich ↗
Hypothesen
Forscher haben oft Ideen oder Vermutungen. Bei einer Vermutung weiß man noch nicht sicher, ob sie stimmt. Deshalb überlegen sich Forscher oft, wie man die Vermutung überprüfen kann. Eine Vermutung, die man wissenschaftlich überprüfen will, nennt man eine Hypothese. Eine Möglichkeit das zu tun ist ist ein statistischer Hypothesentest. Dieser wird hier kurz am Beispiel eines Tests für Allgemeinwissen erklärt.
1. Schritt
Forschungsfrage beschreiben: Nehmen wir an, man will herausfinden, ob Erwachsene in Deutschland ein vernünftiges Allgemeinwissen haben. Man könnte einen Mini-Test dazu entwerfen:
- Kommt Pfingsten immer nach Ostern? ja/nein
- War im Jahr 1700 noch Mittelalter? ja/nein
- Ist Quecksilber ein Metall? ja/nein
- Ist der Mond ein Planet? ja/nein
2. Schritt
Forschungshypothese formulieren: Man nimmt an, dass die Deutschen ein vernünftiges Allgemeinwissen haben. Um es statistisch überprüfbar zu machen, müssen man es "messbar" machen. Man legt (willkürlich) fest: Wer mindestens die Hälfte der Fragen im Test oben richtig beantwortet, hat ein vernünftiges Allgemeinwissen. Die Forschungshypothese wäre dann zum Beispiel: "Mehr als die Hälfte der Erwachsenen Deutschen würden den Test oben bestehen und hat damit ein vernünftiges Allgemeinwissen".
3. Schritt
Null- und Alternativhypothese festlegen: In der Sprache des statistischen Hypothesentests ist die eigentliche Forschungshypothese (um die es ja geht) die "Alternativhypothese". Ihr Gegenteil nennt man die Nullhypothese. Man schreibt am besten immer beide in ganzen Sätzen erst einmal hin:
Nullhypothese: "Die Hälfte der erwachsenen Deutschen würde den Test nicht bestehen."
Alternativhypothese: "Die Hälfte der erwachsenen Deutschen würde den Test bestehen."
4. Signifikanzniveau festlegen
Das Signifikanzniveau sagt mir, mit welcher Wahrscheinlichkeit man eine Alternativhypothese für richtig hält, obwohl sie in Wirklichkeit falsch ist. Falsch meint hier, dass das Ergebnis durch bloßen Zufall, also oben durch bloßes Raten, zustande kam. Das Signifikanzniveau wird dabei nicht irgendwie berechnet. Man legt es willkürlich fest. Je mehr Gewissheit man will, dass die Alternativhypothese wirklich stimmt, desto kleiner sollte das Signifikanzniveau sein. Es wird oft auch Irrtumswahrscheinlichkeit genannt. Oft nimmt man 5 Prozent. Am Beispiel oben: Wenn mein Signifikanzniveau 5 % ist, dann heißt das, dass ich in etwa 5 % der durchgeführten Tests jemandem Allgemeinwissen bescheinige, obwohl er gar keines hat.
5. Fehlerarten formulieren
- Man entscheidet sich für die Alternativhypothese obwohl sie tatsächlich falsch ist Fehler erster Art ↗
- Man entscheidet sich für die Nullhypothese, obwohl sie tastsächlich falsch ist Fehler zweiter Art ↗
Der Fehler erster Art entspricht dabei dem Signifikanzniveau. Will man den Fehler erster Art klein halten, macht man sein Signifikanzniveau niedrig. Dadurch aber wird die Wahrscheinlichkeit für einen Fehler zweiter Art größer. Aus diesem Dilemma gibt es keinen Ausweg. Die Wahrscheinlichkeit für einen Fehler zweiter Art kann man nur berechnen, wenn man die echten Werte aus der Wirklichkeit kennt. Im Beispiel mit dem Allgemeinwissen, würde das heißen, dass man für alle erwachsenen Deutschen sicher weiß, ob sie den Test oben bestehen würden oder nicht. Die Wahrscheinlichkeit für einen Fehler erster Art kann man durch Wahrscheinlichkeitsrechnungen bestimmen.
Motivation
Angenommen man redet zuhause über einen verstopften Abfluss. Das Internet wurde während des Redens nicht benutzt. Auch hat man keine Internetrecherche zu Abflüssen oder Verstopfungen durchgeführt. Verblüffenderweise erhält man am nächsten Morgen eine Werbemaile mit "Abflussreiniger-Stäbchen". Solche sinntragenden Zeitgleichheiten nennt man Synchronizitäten. Unmittelbar stellt sich die Vermutung ein, dass irgendwo im Haus die eigenen Gespräche mitgehört werden. Denkbar wäre aber auch, dass alles im Rahmen normaler Zufallschwankungen liegt: Angenommen ein Spammer hat 5 Millionen solcher Mails in Deutschland verschickt. Gleichzeitig gab es an den Tagen davor vielleicht etwa 50 Tausend Leute, die sich über Verstopfungen unterhielten. Jede dieser 50 Tausend Personen würde sich dann über die passende Spam-Mail wundern, obwohl alles nur reiner Zufall war. Hypothesentests helfen abzuschätzen, inwiefern etwas noch rein zufällig war oder eine tiefere Ursache hat. Siehe auch Kausalität ↗
Was ist ein Experimentum crucis?
Rotiert die Erde um sich selbst? Gibt es im Vakuum des Weltalls einen Äther? Macht ein bedingungsloses Grundeinkommen Menschen kreativer und wertvoller für die Gemeinschaft? Ein Experiment, dass zwischen zwei Varianten unterscheiden kann nennt man ein Experimentum crucis. Ein statistischer Hypothesentest ist eine Möglichkeit für ein solches Experimentum crucis ↗
Hypothesentests als Dilemma-Strategie
Als Dilemma bezeichnet man eine Situation mit genau zwei Möglichkeiten einer Entscheidung. Die Ergebisse beider Entscheidungen sind jedoch gleich angenehm oder gleich unangenehm. Ist die Wirkung einer der Entscheidung durch den Zufall (mit)beeinflusst, kann man das Risiko für eine Fehlentscheidung abschätzen. Das löst zwar nicht das Dilemma, aber es macht die Risiken kalkulierbar. Siehe auch Dilemma ↗