R


Vierfeldertafel


Aufbau


Basiswissen


In der Statistik und Stochastik werden sogenannte Vierfeldertafeln, auch Kreuz- oder Kontingenztabelle genannt, genutzt, um Beziehungen von Objekten mit zwei Merkmalen mit je zwei Ausprägungen übersichtlich darzustellen. Das ist hier ausführlich erklärt.

Wie sieht eine Vierfeldertafel aus?



Was sind Merkmale und Ausprägungen?


Bei einer Vierfeldertafel geht es immer um irgendwelche Dinge oder Objekte, die man in der Statistik Merkmalsträger nennt. Merkmalsträger können zum Beispiel Menschen, Tiere, Planeten, Münzen oder sonst irgendetwas sein. Diese Dinge haben Eigenschaften, die man dann Merkmale nennt. Eigenschaften wären zum Beispiel: Gewicht, Farbe, Alter, Preis, Durchmesser udn so weiter. Jedes Merkmal kann verschiedene Ausprägungen haben. Merkmalsausprägungen von Gewicht könnten zum Beispiel sein: 200 g, 5 kg, eine Tonne. Aber auch einfach "leicht" oder "schwer" wären Merkmalsausprägungen von Gewicht. Diese Merkmalsausprägungen werden oft mit Großbuchstaben wie A und B abgekürzt. Ein Buchstabe ohne Querstrich darüber meint dann, dass ein Ding die Merkmalsausprägung hat. Mit Querstrich meint man, dass es die Ausprägungen nicht hat. Für das Gewicht "leicht" könnte man also zum Beispiel L und für das Gewicht "schwer" das L mit dem Querstrich (meint: nicht schwer) nehmen. Bei einer Vierfeldertafel betrachtet man ausschließlich Merkmale mit genau zwei Ausprägungen (leicht/schwer, grün/nicht-grün). Siehe auch unter dichotomes Merkmal ↗

Wie ist die Vierfeldertafel aufgebaut?



Was ist der Unterschied zwischen absoluter und relativer Häufigkeit?


Vierfeldertafeln kann man mit absoluten Häufigkeiten H oder mit relativen Häufigkeiten h erstellen. Bei den absoluten Häufigkeiten nimmt man für die Felder immer das, was direkt beim Zählen herauskommt. Statt absoluter Häufigkeit kann man auch kurz "Anzahl" sagen. Man kann zum Beispiel 100 Haselnüsse auf die Merkmalsausprägungen "leicht/schwer" und "groß/klein" hin untersuchen. Wenn dann zum Beispiel 20 Nüsse sowohl groß als auch leicht sind, dann wäre die absolute Häufigkeit großer leichter Nüsse "20". Die relative Häufigkeit aber wäre 0,2 oder in Prozenten 20 %. Man kann die VFT entweder nur mit absoluten oder nur mit relativen Häufigkeiten ausfüllen. Man darf die Häufigkeitsarten aber nicht in einer Tabelle mischen.


Welche Summenregeln gelten immer?



Was gilt speziell für relative Häufigkeiten?



Was gilt für statistisch (un)abhängige Merkmale?



Ein Versuch zur bedingten Wahrscheinlichkeit


Die Themen statistische Abhängigkeit (Statistik) und bedingte Wahrscheinlichkeit (Stochastik) sind sehr eng verwandt. Ein stochastischer Versuch zur bedingten Wahrscheinlichkeit mit einer Vierfeldertafel als Auswertung steht unter Bayes-Schüssel-Versuch (Vierfeldertafel) ↗