Scipy -Statistiken Funktionen

Scipy -Statistiken Funktionen

In Python gibt es ein Paket für statistische Funktionen in der Scipy -Bibliothek. Das scipy-Unterpackung heißt Scipy.Statistiken. Es wird hauptsächlich für statistische Verfahren und probabilistische Verteilungen eingesetzt. Die Arten von Wahrscheinlichkeitsfunktionen sind zahlreich. Die Open-Source-Natur der Bibliothek ermöglicht die Erweiterung ihrer statistischen Fähigkeiten. Wir können mit einer Vielzahl von Verteilungen arbeiten, einschließlich Binomial-, einheitlicher und kontinuierlicher Verteilungen. Wir haben Funktionen sowohl für kontinuierliche als auch für diskrete Variablen. Zusätzlich können wir den T-Test ausführen und den T-Score berechnen. Lassen Sie uns mit zahlreichen Beispielen mehr über Scipy -Statistiken erfahren.

SCIPY -Statistiken Erläuterung

Zahlreiche Wahrscheinlichkeitsverteilungen, Frequenz- und Zusammenfassungsstatistiken, Korrelationsfunktionen und statistische Tests, Schätzung der Kerneldichte, maskierte Statistiken, Quasi-monte-Carlo-Funktionalität und andere Merkmale sind in diesem Modul enthalten.

Es gibt viele Bereiche im riesigen Statistikbereich, die außerhalb von Scipy's Geltungsbereich liegen und von anderen Paketen behandelt werden. Zu den bedeutendsten gehören:

  • StatsModels
  • Pandas
  • Pymc
  • Scikit-Learn

Die Skipie.Das STATS-Unterverpackung enthält alle statistischen Routinen, und die Funktion (STATS) der Info (STATS) gibt eine ziemlich umfassende Liste dieser Funktionen zurück. Die STATS-Sub-Docstring-Pakete enthalten zusätzlich eine Liste der verfügbaren Zufallsvariablen. Dieses Modul enthält eine beträchtliche Sammlung von Wahrscheinlichkeitsverteilungen sowie eine wachsende Sammlung statistischer Funktionen.

Was ist eine normale kontinuierliche Zufallsverteilung in Scipy?

Um sowohl diskrete als auch kontinuierliche Zufallsvariablen zu erfassen, werden zwei allgemeine Verteilungsklassen entwickelt. Die normale kontinuierliche Zufallsverteilung ist eine der Arten, die wir hier diskutieren werden.

Die Variable kann einen Wert in dieser Art von Wahrscheinlichkeitsverteilung haben. Deshalb ist es als kontinuierliche Zufallsvariable bekannt.

Beispiel 1:

Das erste Beispiel hier zeigt, wie die in den vorherigen Abschnitten diskutierten Konzepte funktionieren. Wir importieren die Normfunktion, die aus der RV_Continuous -Klasse stammt, in diesem Beispielcode. Die Funktionen enthalten Ansätze und Informationen, um eine bestimmte kontinuierliche Verteilung anzugehen.

Um das CDF in einem Array zu berechnen, verwenden wir die Normfunktion. Lassen Sie uns versuchen, die Codezeile nach Zeile zu verstehen.

In der ersten Zeile des Codes importieren wir die Norm aus der Skipei.Statistikbibliothek. Anschließend wird die Numpy -Bibliothek für die Ausführung des Programms importiert. Eine Variable mit dem Namen "Check" wird anschließend erstellt, in dem das erstellte Numpy -Array gespeichert ist. Schließlich wird die Druckanweisung verwendet, in der die Norm.CDF () -Funktion wird im angegebenen Array ausgeführt. Lassen Sie uns den Code ausführen und sehen, welches Ergebnis er erzielt wird.

von Scipy.Statistiken importieren Norm
Numpy importieren
check = numpy.Array ([4, -2,3,2,5,0])
Druck (Norm.CDF (Check))

Hier sehen Sie das Ergebnis, das aus dem zuvor geschriebenen Code generiert wird.

Eine weitere Sache, die wir tun können, ist die Prozentpunktfunktion zu verwenden, um den Median der Verteilung zu bestimmen. Die Umkehrung von CDF ist PPF, das als PPF abgekürzt wird.

Hier sehen Sie den Median der CDF -Werte, die im vorherigen Code generiert werden.

Wie man eine einheitliche Verteilung in Scipy erzeugt

Einfach ausgedrückt, eine einheitliche Verteilung bezeichnet eine flache, konstante Wahrscheinlichkeit, dass ein Wert in einen bestimmten Bereich fällt. Eine einheitliche Verteilung zu erstellen ist möglich. Nach dem Import der einheitlichen Funktion müssen wir die CDF des Arrays erstellen.

Skalierende und LOC -Schlüsselwörter ermöglichen es uns, die Funktionalität zu erweitern. Das LOC -Schlüsselwort definiert den Mittelwert, während das Skala -Schlüsselwort die Standardabweichung definiert. Hier ist der Code:

Zuerst importieren wir das numpy und einheitliche Modul. Danach erstellen wir die Variable, in der wir das erstellte Numpy -Array speichern. Schließlich ist die Druckanweisung zu sehen, in der die Uniform.CDF -Funktion wird verwendet.

Numpy importieren
von Scipy.Statistiken importieren einheitlich
check_res = numpy.Array ([7,4,9,5,4])
Druck (Uniform.CDF (check_res, loc = 5, scale = 3))

Angehängt ist die Ausgabe für Ihre Hilfe.

So erzeugen Sie eine Binomialverteilung in Scipy

Darüber hinaus können wir durch den Import von Binom die Instanz der diskreten RV -Klasse eine Binomialverteilung erzeugen. Es besteht aus Klasseninformationen und Methoden. Der Code ist der gleiche wie im vorherigen Code, außer dass wir das Bunom verwenden.CDF () -Funktion hier, die drei Parameter enthält, die Sie in der letzten Zeile des Codes sehen können.

Numpy importieren
von Scipy.Statistiken importieren Binom
Ausgabe = Numpy.Array ([7,4,5,5,4])
drucken (binom.CDF (Ausgabe, n = 1, p = 3))

Hier ist das Ergebnis:

Was sind beschreibende Statistiken?

Die Ergebnisse grundlegender Statistiken wie Min, Max, Mittelwert und Varianz werden mit dem Numpy -Array als Eingabe zurückgegeben. Die folgende Tabelle listet eine Handvoll der grundlegenden statistischen Operationen auf, die in der Scipy enthalten sind.Statistikpaket.

Funktionsname Beschreibung
beschreiben() Die beschreibenden Statistiken des angegebenen Arrays werden über diese Option berechnet.
gmean () Der geometrische Mittel der angegebenen Achse wird mit dieser Option berechnet.
HMEAN () Entlang der gewählten Achse wird der harmonische Mittelwert durch die HMEAN () -Funktion berechnet.
Kurtosis () Diese Funktion berechnet Kurtosis.
Modus() Diese Methode gibt den modalen Wert zurück.
schief () Der SWEW () -Methode testet die Schiefe der angegebenen Daten.
f_oneway () Diese Methode führt eine 1-Wege-ANOVA durch.
iqr () Es bestimmt den Interquartilbereich der Daten entlang der gewählten Achse.
zscore () Es berechnet die Z -Punktzahl jedes Wertes der Probe. Es ist relativ zum Stichprobenmittelwert sowie zur Standardabweichung.
sem () Es bestimmt die Zahlen im Standardfehler des Eingangsarrays des Mittelwerts.

Was ist ein T-Test?

Der T-Test ist eine der besten Möglichkeiten, um zu beurteilen, ob sich zwei Durchschnittswerte voneinander unterscheiden oder nicht. Der T-Test ist auch ein wichtiges Diskussionsthema in Bezug auf Gruppenunterschiede.

T-Score

Der T-Score misst das Verhältnis von zwei Gruppen sowie die Varianz innerhalb der Gruppierungen. Der T-Score spiegelt wider, wie ähnlich oder unterschiedlich die Gruppen sind. Je kleiner der T-Score ist, desto wichtiger ist der T-Score und desto größer der Unterschied zwischen den Gruppen.

Hier erhalten wir zwei Stichproben, die aus derselben Verteilung oder zwei verschiedenen Verteilungen stammen können. Und wir möchten feststellen, ob sie die gleichen statistischen Eigenschaften haben. Siehe den folgenden Code, der hier beigefügt ist:

aus Scipy -Importstatistiken
RVS_RES = STATS.Norm.Wohnmobile (loc = 4, Skala = 8, Größe = (30,4))
Print ("Hier ist das Ergebnis des Vergleichs der beiden Proben:")
Druck (Statistiken.test_1samp (RVS_RES, 4.0))

Angehängt ist die Ausgabe:

Ein p-Wert in der vorherigen Ausgabe stellt die Wahrscheinlichkeit dar, dass die Ergebnisse Ihrer Stichprobendaten zufällig aufgetreten sind. Der Bereich der P-Werte beträgt 0% bis 100%.

Abschluss

Scipy -Statistiken Funktionen waren das Thema dieses Artikels. Das Statistikmodul von Scipy ist eine entscheidende Komponente. Es ist hilfreich, die probabilistischen Verteilungen zu erhalten. Unter Verwendung von Scipy -Statistiken können diskrete oder kontinuierliche Zufallszahlen erzeugt werden. Es enthält auch andere zusätzliche Funktionen, die beschreibende statistische Werte liefern. Wir haben in diesem Beitrag zufällige, kontinuierliche und zufällige Variablen diskutiert. Funktionen für die Interaktion mit verschiedenen Verteilungstypen werden diskutiert. Darüber hinaus haben wir beschrieben, wie Sie die Daten mit dem T-Test analysieren können, um den Mittelwert zu bestimmen.