Chi Square Test in R

Chi Square Test in R
„Der Chi-Quadrat-Test ist ein arithmetischer Test, der einen Vergleich zwischen beobachteten und erwarteten Ergebnissen erzeugt. Das Ziel dieses Tests ist es, herauszufinden, ob eine Diskrepanz zwischen tatsächlichen und vorhergesagten Daten das Ergebnis des Zufalls ist oder ob dies auf eine Verbindung zwischen den Variablen liegt, an denen Sie arbeiten. Infolgedessen ist ein Chi-Quadrat-Test eine herausragende Alternative, um uns beim besseren Verständnis zu unterstützen.

Daher ist ein Chi-Quadrat-Test eine herausragende Alternative, um uns beim besseren Verständnis zu unterstützen und den Zusammenhang zwischen den beiden kategorialen Variablen zu bewerten. Beide Variablen müssen aus einer ähnlichen Bevölkerung stammen und kategorisch sein. Diese Variablen werden dann als Ja/Nein, männlich/weiblich, rot/grün usw. klassifiziert.

Bei der Bewertung der Tallies und Anzahl der kategorisierten Antworten zwischen mehreren unabhängigen Gruppen ist der Chi-Quadrat-Test vorteilhaft.”

Chi-Quadrat-Test in r

Wenn der Test abgeschlossen ist, ist das Ergebnis ein „P“ -Wert, mit dem Sie feststellen, ob Ihre Hypothese der Unabhängigkeit korrekt ist oder nicht. Die „P“ -Frielnummer repräsentiert einfach die Wahrscheinlichkeit, dass Ihre Variablen unabhängig sind.

Wenn der Wert "P" mehr als 0 beträgt.05 ist die Wahrscheinlichkeit der Unabhängigkeit ziemlich stark und ausreichend, um festzustellen, dass die Faktoren nicht miteinander verbunden sind. Andererseits etwas weniger als 0.05 Andererseits bezeichnet eine vernachlässigbare Chance auf Unabhängigkeit, und es besteht ein hoher Zusammenhang zwischen den Faktoren.

Sie könnten sich fragen, warum 0.05 und keine andere Menge. Diese Zahl wurde von statistischen Forschern entwickelt und wird ausführlich angewendet, nur weil 0.05 wird üblicherweise als definierender Ort verwendet.

Fassen Sie zusammen, was oben gesagt wurde:

H0: Die Variablen sind nicht miteinander verbunden, und es besteht keine Korrelation zwischen ihnen.

H1: Die Variablen sind miteinander verbunden.

R -Programmierung bietet uns a „Meißel.prüfen()" Funktion zur Durchführung von Chi-Quadrat-Tests und bewertet, ob eine Beziehung zwischen beiden Variablen der bereitgestellten Daten besteht.

Die Chi-Quadrat-Tests arbeiten in R unter Verwendung der folgenden Syntax:

# Chisq.Test (v1, v2)

In diesem Artikel werden Sie vermittelt, wie Sie den Chi-Quadrat-Test in R mit den unten angegebenen Beispielen leiten und verstehen.

Beispiel 1

Wir beginnen die Implementierung des Chi-Quadrat-Tests mit dem einfachsten und grundlegenden Beispiel.

Im ersten Schritt haben wir die Funktion „RM ()“ verwendet, um alle unnötigen Objekte zu entfernen, falls sie bereits existieren. Jetzt beginnt der Hauptcode. Wir haben zwei Objektvariablen erstellt; "X_actual" und "x_Predict."Zuweisen Sie" x_actual "eine Liste der tatsächlichen Werte unter Verwendung der Funktion" c () "in r. Während der Zuweisung von "x_PREDICT" eine Liste der vorhergesagten Werte zugewiesen. Nun den „Meißel anrufen.test () ”Funktion und übergeben sowohl tatsächliche als auch vorhergesagte Werte als Parameter davon. Durch die Verwendung des gespeicherten Chi-Objekts die Werte des Chi-Quadrat-Tests. Die Anweisung „Print ()“ druckt einfach das Chi-Quadrat-Testergebnis aus.

Bevor wir das Ergebnis des Chi-Quadrat-Tests interpretieren, lassen Sie uns Ihnen einige Terminologien vorstellen, die im Chi-Quadrat-Testergebnis verwendet werden.

"DF" sind die Werte, die frei von den bereitgestellten Variablen ändern können.

"X-Quadrat" ist die willkürliche Variable im Chi-Quadrat-Test, der den Durchschnitt der beobachteten VS-Variablen verzeichnet. Erwartete Frequenzzahlen.

"P-Wert" drückt die Aussicht der Stichprobe aus.

Wenn der p-Wert kleiner als der Signifikanzwert ist, der 0 ist.05 Normalerweise können wir den Chi-Quadrat-Test interpretieren. Wenn ja, eliminieren wir die Nullhypothese und erklären, dass es eine Beziehung zwischen den beiden Variablen gibt. Mit anderen Worten kann eine Variable die andere aufklären.

Der p-Wert in unserem Szenario ist größer als der angegebene Signifikanzwert (0.05). Letztendlich akzeptieren wir die Nullhypothese und gehen davon aus, dass die Variablen autonom voneinander sind.

Beispiel # 2

In diesem Beispiel werden wir einen integrierten Datensatz von R Base verwenden und einen Chi-Quadrat-Test darauf durchführen. Der Datensatz, den wir verwenden werden, ist „Chichweight.Es liefert uns Daten zum Gewicht von Küken, die auf ihrer Ernährung und dem Zeitraum nach der Geburt basieren.

Wir führen diesen Test durch, um festzustellen, ob zwischen der Ernährung der Küken und dem Gewicht des Kükens eine Beziehung besteht. R integrierte Funktion “Chisq.test () ”bietet Ihnen elegant alles, was Sie über die Unabhängigkeit von Variablen in einem Datensatz wissen müssen, um festzustellen, ob sie zugeordnet sind oder nicht.

Wir werden zunächst den Datensatz in r importieren.

Das Ergebnis der Chi-Quadrat-Tests im folgenden Bild zeigt, dass der Wert „p-Wert“ dieses Tests größer ist als der signifikante „p-Wert“, der 0 ist.05, was darauf hinweist, dass das Gewicht der Küken unabhängig von ihrer Ernährung ist. Auch wenn dies zunächst seltsam erscheint, da das Gewicht jedes Kükens durch das bestimmt werden sollte, was das Küken verbraucht. Dies ist jedoch möglicherweise nicht der Fall in dieser Abbildung.

Jetzt werden wir das Gewicht mit einer anderen Variablen vergleichen, die „Zeit ist.“Diese Variable berechnet, wie lange es seit dem Geboren des Kükens ist.

In diesem Codesegment haben wir gerade die Spalte "Diät" durch die Spalte "Zeit" ersetzt, da wir jetzt die Brutzeit des Kükens mit ihrem Gewicht für den Chi-Quadrat-Test vergleichen.

Im resultierenden Chi-Quadrat-Test ist der Wert von „P“ zu sehen, der sehr klein ist. Dies bedeutet, dass es einen starken Zusammenhang zwischen der Zeit, als die Küken geboren wurden, und dem Gewicht der Küken. Dies bedeutet, dass sie zunehmen, wenn sie älter werden.

Abschluss

Unser heutiger Artikel dreht sich um das Thema des Chi-Quadrat-Tests in R. Im Einführungsabschnitt haben wir den Chi-Quadrat-Test erläutert, warum er durchgeführt wird und wie er durchgeführt wird. Wir haben die gesamten bloßen Konzepte besprochen, die in diesem Thema enthalten sind. Danach haben wir 2 praktische Codierungsbeispiele in Rstudio in Ubuntu 20 durchgeführt.04. Unser erstes Beispiel hilft Ihnen dabei, einen Chi-Quadrat-Test für benutzerdefinierte Variablen durchzuführen, während die 2nd Beispiel wird mit dem integrierten Datenrahmen von der R-Basis ausgeführt. Wir gehen davon aus.