R


Hypothesentest


Einführung


Basiswissen


In der Statistik ist ein Hypothesentest, auch Signifikanztest genannt, ein Entscheidungskriterium. Es geht immer um die Frage: soll man bei einre alten, bisherigen Hypothese bleiben oder zu einer neuen möglicherweise besseren Hypothese wechseln. Die Grundidee ist es: wie wahrscheinlich ist es, dass der bloß Zufall mit der alten Hypothese Effekte produziert, die man eigentlich mit den neuen Hypothese erklären will. Das ist hier ausführlich erklärt.

Fachworte



Hypothesen


Forscher haben oft Ideen oder Vermutungen. Bei einer Vermutung weiß man noch nicht sicher, ob sie stimmt. Deshalb überlegen sich Forscher oft, wie man die Vermutung überprüfen kann. Eine Vermutung, die man wissenschaftlich überprüfen will, nennt man eine Hypothese. Eine Möglichkeit das zu tun ist ist ein statistischer Hypothesentest. Dieser wird hier kurz am Beispiel eines Tests für Allgemeinwissen erklärt.

1. Schritt


Forschungsfrage beschreiben: Nehmen wir an, man will herausfinden, ob Erwachsene in Deutschland ein vernünftiges Allgemeinwissen haben. Man könnte einen Mini-Test dazu entwerfen:


2. Schritt


Forschungshypothese formulieren: Man nimmt an, dass die Deutschen ein vernünftiges Allgemeinwissen haben. Um es statistisch überprüfbar zu machen, müssen man es "messbar" machen. Man legt (willkürlich) fest: Wer mindestens die Hälfte der Fragen im Test oben richtig beantwortet, hat ein vernünftiges Allgemeinwissen. Die Forschungshypothese wäre dann zum Beispiel: "Mehr als die Hälfte der Erwachsenen Deutschen würden den Test oben bestehen und hat damit ein vernünftiges Allgemeinwissen".

3. Schritt


Null- und Alternativhypothese festlegen: In der Sprache des statistischen Hypothesentests ist die eigentliche Forschungshypothese (um die es ja geht) die "Alternativhypothese". Ihr Gegenteil nennt man die Nullhypothese. Man schreibt am besten immer beide in ganzen Sätzen erst einmal hin:

Nullhypothese: "Die Hälfte der erwachsenen Deutschen würde den Test nicht bestehen."
Alternativhypothese: "Die Hälfte der erwachsenen Deutschen würde den Test bestehen."

4. Signifikanzniveau festlegen


Das Signifikanzniveau sagt mir, mit welcher Wahrscheinlichkeit man eine Alternativhypothese für richtig hält, obwohl sie in Wirklichkeit falsch ist. Falsch meint hier, dass das Ergebnis durch bloßen Zufall, also oben durch bloßes Raten, zustande kam. Das Signifikanzniveau wird dabei nicht irgendwie berechnet. Man legt es willkürlich fest. Je mehr Gewissheit man will, dass die Alternativhypothese wirklich stimmt, desto kleiner sollte das Signifikanzniveau sein. Es wird oft auch Irrtumswahrscheinlichkeit genannt. Oft nimmt man 5 Prozent. Am Beispiel oben: Wenn mein Signifikanzniveau 5 % ist, dann heißt das, dass ich in etwa 5 % der durchgeführten Tests jemandem Allgemeinwissen bescheinige, obwohl er gar keines hat.

5. Fehlerarten formulieren



Der Fehler erster Art entspricht dabei dem Signifikanzniveau. Will man den Fehler erster Art klein halten, macht man sein Signifikanzniveau niedrig. Dadurch aber wird die Wahrscheinlichkeit für einen Fehler zweiter Art größer. Aus diesem Dilemma gibt es keinen Ausweg. Die Wahrscheinlichkeit für einen Fehler zweiter Art kann man nur berechnen, wenn man die echten Werte aus der Wirklichkeit kennt. Im Beispiel mit dem Allgemeinwissen, würde das heißen, dass man für alle erwachsenen Deutschen sicher weiß, ob sie den Test oben bestehen würden oder nicht. Die Wahrscheinlichkeit für einen Fehler erster Art kann man durch Wahrscheinlichkeitsrechnungen bestimmen.

Motivation


Angenommen man redet zuhause über einen verstopften Abfluss. Das Internet wurde während des Redens nicht benutzt. Auch hat man keine Internetrecherche zu Abflüssen oder Verstopfungen durchgeführt. Verblüffenderweise erhält man am nächsten Morgen eine Werbemaile mit "Abflussreiniger-Stäbchen". Solche sinntragenden Zeitgleichheiten nennt man Synchronizitäten. Unmittelbar stellt sich die Vermutung ein, dass irgendwo im Haus die eigenen Gespräche mitgehört werden. Denkbar wäre aber auch, dass alles im Rahmen normaler Zufallschwankungen liegt: Angenommen ein Spammer hat 5 Millionen solcher Mails in Deutschland verschickt. Gleichzeitig gab es an den Tagen davor vielleicht etwa 50 Tausend Leute, die sich über Verstopfungen unterhielten. Jede dieser 50 Tausend Personen würde sich dann über die passende Spam-Mail wundern, obwohl alles nur reiner Zufall war. Hypothesentests helfen abzuschätzen, inwiefern etwas noch rein zufällig war oder eine tiefere Ursache hat. Siehe auch Kausalität ↗

Was ist ein Experimentum crucis?


Rotiert die Erde um sich selbst? Gibt es im Vakuum des Weltalls einen Äther? Macht ein bedingungsloses Grundeinkommen Menschen kreativer und wertvoller für die Gemeinschaft? Ein Experiment, dass zwischen zwei Varianten unterscheiden kann nennt man ein Experimentum crucis. Ein statistischer Hypothesentest ist eine Möglichkeit für ein solches Experimentum crucis ↗

Hypothesentests als Dilemma-Strategie


Als Dilemma bezeichnet man eine Situation mit genau zwei Möglichkeiten einer Entscheidung. Die Ergebisse beider Entscheidungen sind jedoch gleich angenehm oder gleich unangenehm. Ist die Wirkung einer der Entscheidung durch den Zufall (mit)beeinflusst, kann man das Risiko für eine Fehlentscheidung abschätzen. Das löst zwar nicht das Dilemma, aber es macht die Risiken kalkulierbar. Siehe auch Dilemma ↗