Pandas Standardabweichung

Pandas Standardabweichung

"The" Pandas "ist eine großartige Sprache für die Ausführung der Datenanalyse aufgrund seines großen Ökosystems datenzentrierter Pythonpakete. Das erleichtert die Analyse und Import beider Faktoren. Die Standardabweichung ist eine „typische“ Abweichung, die vom Mittelwert abgeleitet ist. Es wird viel verwendet, da es die ursprünglichen Maßeinheiten des Datenrahmens zurückgibt. Die Pandas verwendeten STD () für die Berechnung der Standardabweichung. Die Standardabweichung kann aus den angegebenen Werten berechnet werden, die sich im Datenrahmen in Form einer Zeile oder Spalte befinden können. Wir werden alle möglichen Möglichkeiten implementieren, wie eine Pandas -Standardabweichung verwendet wird. Für die Implementierung des Code werden wir das Tool „Spyder“ verwenden, wie es in einer pythonfreundlichen Umgebung geschrieben ist.”

Syntax

„DF.std () ”


Die folgende Syntax wird zur Berechnung der Standardabweichung im Datenrahmen verwendet. Das "DF" im Datenrahmen ist die Abkürzung des "DataFrame". Was macht die Standardabweichung?? Es misst, wie erweitert die erforderlichen Daten sind. Je erweitertere hohe Werte, desto höher ist die Standardabweichung auftreten.

Zurückkehren

Die PANDAS -Standardabweichung gibt den Datenrahmen zurück, wenn die Ebene basierend auf den Anforderungen angegeben wird.

Beachten Sie, dass die Funktion „STD ()“ die "NAN" -Werte im "DF" automatisch ignoriert, während die Pandas -Standardabweichung berechnet wird. "Nan" kann als "nicht als Zahl" erklärt werden, was bedeutet, dass keiner Wert zugewiesen wird.

Im Folgenden finden Sie die Methoden, die mit Beispielen der Pandas -Standardabweichung ausgeführt werden:

    • Pandas Standardabweichung Berechnung in einer einzelnen Spalte.
    • Pandas Standardabweichung Berechnung in mehreren Spalten.
    • Pandas Standardabweichung Berechnung aller numerischen Spalten.
    • Pandas Standardabweichung unter Verwendung der Achse = 1.
    • Pandas Standardabweichung unter Verwendung der Achse = 0.

Erstellen des Datenrahmens für die Berechnung der Standardabweichung in Pandas

Öffnen Sie zunächst die "Spyder" -Software. Importieren Sie nun die Pandas -Bibliothek als PD. Wir werden einen Datenrahmen erstellen, der aus einer Anzeigetafel besteht, die Begriffe als "X", "Y" und "Z" mit ihren Punkten als "22", "10", "11", "16", "12", "45" hat "," 36 "und" 40 ". Wir haben ihre Assist -Werte als "8", "9", "13", "7", "22", "24", "4" und "6", auch den Wert von Rebounds als "17", "," 14 "," 3 ", 5", "9", "8", "7" und "4".


Die Anzeigen zeigen den erstellten DataFrame gemäß den im Code zugewiesenen Werten:

Beispiel # 01: Berechnung der Standardabweichung in einer einzelnen Spalte

In diesem Beispiel berechnen wir die Standardabweichung einer einzelnen Spalte im Pandas -Datenframe. Der DataFrame hat die Werte des Teams als "U", "V" und "B" mit ihren Punkten als "44", "33", "22", "44", "45", "88", "96" "Und" 78 ". Die Werte von Assists sind wie "7", ", 8", "9", "10", "11", "14", "18" und "17" auch die Werte von Rebounds als "11", " 9 "," 8 "," 7 "," 6 "," 5 "," 4 "und" 3 ". Die Spalte "Punkte" wird aus dem Datenrahmen ausgewählt, um die einzelne Spaltenstandardabweichung zu berechnen.


Die Ausgabe zeigt die Standardabweichung der Spalte „Punkte“:

Beispiel # 02: Berechnung der Standardabweichung in mehreren Spalten Pandas Standardabweichung

In diesem Beispiel werden wir die Pandas -Standardabweichungsberechnungen in mehreren Spalten ausführen. In diesem Datenrahmen befinden sich die Daten erneut über die Sport -Anzeigetafel, die die Werte des Teams als „N“, „W“ und „T“ mit der Punktzahl als „33“, „22“, „66“, „55“, mit der Punktzahl, mit der Partitur, und "55" und mit der Punktzahl. "44", "88", "99" und "77". Die Assists als "9", "7", "8", "11", "16", "14", "12" und "13" und rebounds als "5", "8", "1", "," 2 "," 3 "," 4 "," 6 "und" 7 ". Hier berechnen wir die Standardabweichung der beiden Spalten "Punkte" und "Rebounds", indem wir die auf den Datenrahmen angewendete Funktion STD () verwenden.


Wie wir sehen, zeigt die Ausgabe die Standardabweichung als 26.944387 in der Spalte Punkte und 2.449490 in der Rückprallsäule.

Beispiel # 03: Berechnung der Pandas Standardabweichung aller numerischen Spalten

Jetzt haben wir gelernt, wie man die Standardabweichung einzelner und mehrerer Zeilen berechnet. Was ist, wenn wir nicht alle Spaltennamen im Datenrahmen angeben und den gesamten Datenrahmen berechnen möchten? Dies ist mit nur einer einfachen Funktionsinimpomentierung der PANDAS -Standardabweichung für die Berechnung des vollständigen Datenrahmens in den Ergebnissen möglich. Der DataFrame hier besteht aus "L", "M" und "O" mit den Bewertungswerten "33", "36", "79", "78", "58", "55" und zwei Teams. das ist "25". Die Vorlagen sind "1", "2", "3", "4", "6", "9", "5" und "7" und ihre Rebounds als "14", "10", "2" , "5", "8", "3", "6" und "9". Wir können alle Standardspaltenabweichungen nach Pandas im Datenrahmen unter Verwendung der Pandas „STD ()“ -Funktion berechnen.


Die Anzeige hat die berechnete Standardabweichung des gesamten unten gezeigten „DF“; Wir können auch feststellen, dass die Pandas die Standardabweichung der ersten Spalte, das „Team“ ist, nicht berechnet haben, da es sich nicht um eine numerische Spalte handelt.

Beispiel # 04: Pandas Standardabweichung mit der Achse = 0

In diesem Beispiel haben die Datenrahmen die Teams des Sports als „G“, „H“ und „K“ mit weiteren Daten. Hier berechnen wir die Standardabweichung, indem wir die Achse als „0“ verwenden, einen Parameter, der in der Pandas -Standardabweichung verwendet wird. Dieses Argument berechnet die Spalte der Standardabweichung des Datenrahmens.


Der folgende Ausgang zeigt die Ergebnisse in Spalten der berechneten Standardabweichung an. Die Spalte Punkte hat die berechnete Standardabweichung als „24).0313062 ”, die Spalte Assists hat die berechnete Standardabweichung als„ 2).669270 ”und die berechnete Standardabweichung der Rückprallsäule wird als„ 3) angezeigt.943802 ”.

Beispiel # 05: Pandas Standardabweichung mit der Achse = 1

Hier werden wir den als „1“ zugewiesenen Achsenparameter verwenden, um die Standardabweichung in Pandas zu berechnen. Welchen Unterschied kann "1" machen? Das Argument „1“ -Axis berechnet die zeilenweise Standardabweichung der numerischen Werte im Datenrahmen. Der DataFrame hat die drei Teams als "S", "D" und "E", wobei Datenspalten hinzugefügt werden. Anweisungen sind alle mit unterschiedlichen Werten im DataFrame zugeordnet. Dieser Achsenparameter ist so ein Game Changer, dass wir bis zu dem Zeitpunkt an den Daten arbeiten müssen, in denen sie in einem Spalte Plus -Punkt der durchgeführten Standardabweichung berechnet werden sollen.


Die folgende Ausgabe zeigt die in einer Zeile des Datenrahmens berechnete Standardabweichung:

Abschluss

Die Standardabweichung von Pandas ist eine sehr technische Funktion, die eine sehr vorteilhafte Funktion ist, da sie die Standardabweichung des Begeisterungspakts von Pandas -Datenfaktoren findet. In diesem Editorial haben wir die Methoden zur Berechnung der Standardabweichung in Pandas untersucht. Wir haben Einspaltberechnungen von Standardabweichungen und mehreren Spalten durchgeführt und auch die Standardabweichung des gesamten Datenrahmens zusammen berechnet. Alle Strategien funktionieren gut, solange sie konsequent und mit den gewünschten Ergebnissen verwendet werden.