Scipy KS -Test

Scipy KS -Test

Python wird als Programmiersprache des Computers erkannt, mit der es die verschiedenen Arten von Computersoftware und Programmen schreiben kann. Diese Sprache hat unter allen anderen Sprachen leistungsstarke Kriterien auf Hochleistungsebene und ihr Paket ist nicht nur auf einige der spezifischen Programme oder die Softwareaufgaben beschränkt. Es ist vielmehr als Allzwecksprache bekannt, die zum Schreiben eines Programms verwendet werden kann, sei es ein mathematisches Programm, Matrizen und deren Betrieb, Implementierung der Differentialgleichungen oder Schulungen eines maschinellen Lernmodells und die Ausbildung eines künstlichen Neurales Netzwerk. Für jede Aufgabe stellt Ihr Python -Name ihn unter einer Plattform zur Verfügung. Scipy stammt aus Pythons Programmiersprache. Es verfügt über Module, die die erforderlichen Informationen in das Programm für die Funktionen importieren, die für maschinelles Lernen und Deep -Learning -Modelle erstellt wurden. Scipy bietet eine solche Funktion wie den Scipy „KS -Test“.

Der KS-Test wird als „Kolmogorov-Smirnov-Test“ anerkannt, unter dem wir herausfinden, welche Art von Verteilung die Probe unter dem Test ist. Es gibt zwei Methoden zur Durchführung solcher Tests, die auf der Anzahl der Stichproben basieren, die wir diesem Test als Eingabeparameter angeben.

Verfahren:

Der KS -Test mit seinen zwei Arten von Funktionen wird in diesem Artikel praktisch erklärt und demonstriert. Dieser Artikel gibt ein gutes Hintergrundwissen über die Einführung und die Funktionalität des KS -Tests. Anschließend erklärt es die Methode, um diese Funktionen in das Python -Skript mit der Diskussion über ihre Parameter zu schreiben, die zur Eingabe -Argument -Liste beider Funktionen gehören.

Syntax:

Da wir aus der vorherigen Erklärung bereits wissen, dass der KS -Test von zwei Arten von Natur aus ist, ist die Funktionalität dieser beiden Funktionen gleich, unterscheidet sich jedoch in ihrer Konfiguration leicht in Bezug auf ihre Argumentliste. Einer der beiden KS -Tests ist als einfacher „KS -Test“ bekannt. Es wird nur eine Datenprobe benötigt und führt den Test für diese Daten durch. Der zweite ist der "KS_2Sample -Test". Dieser Test führt den gleichen KS -Test durch, jedoch für die beiden verschiedenen Stichprobendaten. Die Syntax für den KS -Test () und den KS_2 -Test () ist jeweils angegeben:

$ scipy. Statistiken.kstest ()
$ scipy. Statistiken.ks_2samp ()

Rückgabewert:

Sowohl die zuvor erwähnten Funktionen geben den gleichen Ergebnistyp zurück. Beide geben zwei Werte zurück-einer ist der „statistische“ und der andere der „p-Wert“-bei dem der p-Wert die Hauptentscheidung ist, unabhängig davon, ob die Proben zur gleichen Verteilung gehören oder nicht.

Beispiel 1:

Angenommen, wir haben eine Datenprobe, die mit einer gewissen Verteilung gehört oder generiert wurde. Mit dem KS -Test möchten wir nun wissen, von welcher Verteilung diese Daten gehören. Wir nehmen eine Null -Art von Hypothese an, die besagt, dass die Stichprobendaten aus der Normalverteilung stammen, und wir sind zu 95 Prozent in unserer Hypothese zuversichtlich. In einem anderen Fall, dem alternativen Fall, haben wir die Möglichkeit, die Nullhypothese abzulehnen, wenn der p-Wert, den der KS-Test zurücksetzt.05 ”.

Die Nullhypothese wird abgelehnt, wenn das Ergebnis unter 0 fällt.05, was darauf hinweist, dass die Zufallsstichprobe nicht einmal aus einer Normalverteilung stammte. Führen Sie einen KS -Test für die Beispieldaten durch, die wir für dieses Beispiel eindeutig generieren werden. Denken Sie daran, dass die Python -Plattform, auf der wir das Programm für dieses Beispiel schreiben werden, die "Google Collaby" ist.Öffnen Sie das neue Notizbuch in der Zusammenarbeit und schreiben Sie dann das Programm. Wir importieren die „Numpy“ -Bibliothek, um das Modul zu verwenden, um die Daten mit einer Verteilung zu definieren.

Integrieren Sie dieses Numpy -Paket als „NP“ in das Programm. Die zweite Bibliothek, die dem Programm hinzufügt. Importieren Sie sie aus den Scipy Library -Statistiken, die dann die Module in das Programm hinzufügen. Zu einer Variablen unter der Annahme "x" zuweisen. Weisen Sie den Wert der Beispieldaten zu, indem Sie die Statistiken aufrufen, um sie als „Statistiken“ zuzuweisen.Norm.RVS (size = 100, random_state = rng) ”.

Mit diesem Aufruf definieren wir die Daten der Zufallsvariablen unter Verwendung der Statistiknorm.RVS -Funktion, um diese Daten normalerweise zu verteilen. Die Nullhypothese ist, dass diese Probe aus der Normalverteilung stammt. Die Größe dieser Daten wird als „200“ angegeben. Um die Ergebnisse der Funktion kstest () in diesen Daten zu überprüfen, geben wir diese Daten an den Parameter der Funktion kstest () als „Statistiken. KStest (x) ”. Die Ausgabe für das folgende Programm lautet wie folgt:

aus Scipy -Importstatistiken
a = Statistiken.Norm.Wohnmobile (Größe = 200)
RSLT = Statistiken.KStest (a, Statistiken.Norm.CDF)
Druck (RSLT)

Der p-Wert des KS-Tests ist größer als.05. Daher können wir die Hypothese nicht ablehnen, dass die Stichprobendaten zur normalen Standardverteilung gehört.

Beispiel 2:

Jetzt führen wir einen anderen Typ des KS -Tests durch, nämlich der „KS_2Test“. Es werden in den beiden Beispieldaten und Kommentaren stattfinden, wenn beide Stichproben zur gleichen Verteilung gehören oder nicht. Importieren Sie das Modul „Statistiken“ aus der Scipy -Bibliothek und deklarieren Sie zwei Beispieldaten mit den Statistiken. Norm. Wohnmobile (Größe = 115) und „Statistiken.Norm.Wohnmobile (Größe = 105) ”Methoden. Speichern Sie sie als "Data1" und "Data2". Dies generiert die beiden Daten mit den Größen von „115“ und „105“ mit einer Normalverteilung. Die Nullhypothese ist, dass beide Daten aus derselben Art der "normalen Standard" -Ververteilung stammen. Um dies zu überprüfen, füttern Sie diese beiden Daten in den „ks_2 test ()“ als „Statistiken.KS_2SAMP (Data1, Data2) “und überprüfen Sie den p-Wert. Das Programm und die Ausgaben sind im Folgenden erwähnt:

Der Wert des p beträgt mindestens 0.05. Die Nullhypothese, die wir für diese Daten angenommen haben, ist also richtig und wir haben kein Recht, sie abzulehnen.

Data1 = Statistiken.Norm.Wohnmobile (Größe = 115)
Data2 = Statistiken.Norm.Wohnmobile (Größe = 105)
RSLT = Statistiken.KS_2SAMP (Data1, Data2)
Druck (RSLT)

Abschluss

Wir haben die beiden KS -Tests mit den verschiedenen Funktionen durchgeführt, die der KS -Test für eine Probe als „Statistiken“ anbietet.ks test () ”und für die beiden Datenproben als„ ks_2samp () “. Basierend auf den Ergebnissen der Funktionen entschieden wir, welche Datenprobe zu welcher Art der Verteilung gehört. In beiden Fällen wurde die Standardnormaltypverteilung herausgestellt.