Scipy Chi-Quadrat

Scipy Chi-Quadrat
Python ist eine bekannte Programmiersprache mit Hochleistungsebene, die verschiedene technische, technische, objektorientierte und mathematische Funktionen und Operationen ermöglicht. Python stellt zahlreiche Bibliotheken für seine Benutzer zur Verfügung, und eine der bekanntesten und open-Source-Programmiersprachen ist „scipy“. Die Scipy -Bibliothek enthält Informationen und wendet ihre Vorgänge auf verschiedene Methoden für maschinelles Lernen an e an e.G., Algorithmen für maschinelles Lernen und die Optimierer, die wir in künstlich intelligenten Systemen verwenden. Wir verwenden ein Modul-Chi-Quadrat aus der Scipy-Bibliothek, um den verschiedenen Test für die kategorialen Daten zu entfernen.

Verfahren

In dem Artikel werden wir die Chi-Quadrat-Funktion aus der Scipy-Bibliothek verwenden und mehrere Tests für die Daten durchführen. Die Informationen zur Verwendung dieser Funktion im Python -Skript werden ebenfalls erörtert und auf verschiedene Beispiele in diesem Artikel angewendet.

Syntax

Da wir die beiden Tests durchführen werden, um die Beziehung zwischen den Variablen unter Verwendung der Chi-Quadrat-Methode zu überprüfen, werden wir die beiden verschiedenen Syntaxen für diese Funktion diskutieren.

Chi Square Test -> $ Chisquare (f_obs, ddof = 1, f_exp = none, axis = 1)

Chi Square Independence Test -> $ CHI2_CONTINGENCY (beobachtet, lambda_ = Keine Korrektur = Falsch)

Rückgabewert

Diese Funktion gibt den statistischen Wert des p-Werts und den CHI-Quadrat-Teststatistikwert in seiner Ausgabe zurück.

Beispiel # 01

Wir werden den ersten Test mit dem Chi -Quadrat durchführen, den wir in der Syntax als Chi_Square -Test besprochen haben. Dieser Test erzählt uns über die Beziehung zwischen den kategorialen Variablen. Diese Funktion verwendet das Attribut "Statistics" -Modul aus der Skipy. Statistiken berechnen den Test, bei dem wir eine Nullhypothese annehmen müssen, und die Chi -Quadrat -Tests diese Nullhypothese, ob die Daten die angegebenen Frequenzen enthalten oder nicht. Es dauert die beobachteten und die erwarteten Frequenzen als Parameter. Wenn diese beiden Frequenzen weniger als oder nicht mindestens „fünf“ sind, wird der Test als ungültig angesehen.

Wir werden den gleichen Test im Beispiel ausführen, dem Compiler, den wir verwenden werden, um das Beispiel zu implementieren, ist "Google Collab. Es führt das Programm ohne Raten der Bibliothekspakete aus, da bereits die installierten Pakete enthalten sind. Erstellen Sie nach dem Öffnen des Compilers einfach ein Projekt mit einem eindeutigen Namen und wechseln Sie dann zum nächsten Schritt, in dem wir die Bibliothekspakete importieren, um den CHI -Quadrattest durchzuführen.

Der Chi Square -Test ist im Modul des Python Scipy -Statistiks angegeben, sodass wir die „Statistiken“ aus der Skipy in unser Projekt importieren werden. Sobald wir diese Bibliothek importiert haben, werden wir ein Array mit den Elementen als Frequenzen mindestens größer oder gleich fünf definieren. Wir werden das Array mit dem Namen „Array“ mit den beobachteten Frequenzen als „[3, 4, 6, 8, 10, 2] definieren“ definieren. Nachdem wir dieses Array erfolgreich erstellt haben, werden wir die CHI -Quadratfunktion mit dem Präfix „Statistiken“ als „Statistiken“ aufrufen. meißel () ”. An das Eingabargument dieser Funktion werden wir das Array übergeben, das die F_OBs (beobachtete Frequenz) der Parameter der CHI -Quadratfunktion ist.

Nachdem wir den im folgenden Snippet erwähnten Code ausgeführt haben, erhalten wir die Ausgabe als Chi Square-Statistik und den P-Wert. Dieser meißelnde Test ist gültig, da wir mindestens fünf beobachtete Frequenzen im Parameter dieser Funktion definiert haben.

aus Scipy -Importstatistiken
Array = [3,4,8,10,12]
Statistiken.Meißel (Array)

Beispiel # 02

Die CHI -Quadratfunktion hat einen weiteren Test für die kategorialen Variablen mit dem Namen „Chi_Square -Test für die Unabhängigkeit“. Jetzt unterscheidet sich dieser Test geringfügig vom Chi-Quadrat-Test, den wir im obigen Beispiel erörtert haben. Für diesen Test verwendet Chi_Square die Funktion des Statistikmoduls „Chisquare Contingency“ aus der Python Scipy. Der Test wird durchgeführt, um zu zeigen, ob die Variablen voneinander unabhängig sind oder nicht. Um mit dieser Funktion zu arbeiten, erstellen wir ein weiteres neues Array. Um dieses neue Array zu erstellen und zu definieren, müssen wir den Numpy mit dem Namen „NP“ importieren, damit wir später an Ort.

Ein weiteres wichtiges Bibliothekspaket, das für die ordnungsgemäße Arbeit des Chi Square Contingency -Tests importiert werden muss, ist die „Statistiken“. Wir werden das Statistikmodul aus der Scipy -Bibliothek aus der Python -Sprache importieren. Mit dem erfolgreichen Import der erforderlichen Bibliotheken für das Projekt oder den Chi Square Independence Test werden wir im nächsten Schritt ein Array mit dem Namen "Obs_array" definieren. Wir werden „NP verwenden. Array () ”Methode zum Erstellen dieses Arrays und die Abmessungen des Arrays werden auf 2-dimensionale und die Elemente, die dieses Array enthalten, so eingestellt werden, wie„ ([2, 2, 2], [8, 8, 8] ) ". Dieses Array wird als Beobachtung verwendet, die der Eingabeparameter für die Funktion chi_2 contingency () ist.

Um den Notfalltest für die Unabhängigkeit der beiden Variablen zu den kategorialen Klassen aufzurufen, verwenden wir die Präfix -Statistiken und nennen die Funktion chi_2Consincing als „Statistiken“.CHI2_CONTINGENCY (OBS_Array) “. Wir werden den folgenden Code ausführen, der in der Abbildung angezeigt wird, um die Ergebnisse für den Unabhängigkeitstest der CHI -Quadratungsfunktion zu erhalten.

Numph als NP importieren
aus Scipy -Importstatistiken
obs_array = np.Array ([[2, 2, 2], [8, 8, 8]])
Statistiken.CHI2_CONTINGENCY (OBS_Array)

Diese Funktion gibt den Wert der Chi Square Test Statistics, den p-Wert des Tests und die Werte dieser Frequenzen zurück, die für die Beobachtungen erwartet werden, die wir in den Parametern der Funktion übergeben. Die Ausgabe der Funktion wird in der folgenden Abbildung angezeigt.

Abschluss

Der Artikel enthält detaillierte Informationen zur Chi Square -Methode, die das Modul „Statistiken“ aus der Scipy -Bibliothek verwendet. Wir haben zwei Arten von Tests für die CHI -Quadratmethoden durchgeführt, indem wir die beiden verschiedenen Beispiele im Python -Skript implementiert haben, und haben gezeigt, wie die Ausgabe oder die Rückgaberwerte dieser Funktion aussehen und wie sie im Kontext des Scipy Chi -Quadrats ( ) Methode.