Pandas Groupby Sum

Pandas Groupby Sum
Pandas bietet eine Vielzahl hilfreicher Funktionen, mit denen wir die Daten in das gewünschte Format umwandeln können. Eine von ihnen ist die Gruppe von GroupBy, die die Zeilen eines Datenrahmens in Gruppen unterteilt, basierend auf den Werten bestimmter Spalten. Pandas sind das beste Werkzeug für diesen Fall, da sie die unvorhersehbare Natur der tatsächlichen Daten bewältigen können. Pythons „GroupBy ()“ -Methode für Pandas ist ein hoch entwickeltes und nützliches Werkzeug. Sie können Ihre Daten in mehrere Gruppen einteilen und die Berechnungen für eine genauere Analyse durchführen.

Pandas sum () Methode

Die Summe der Werte für die von Benutzer angerufene Achse wird durch die Funktion SUM () zurückgegeben. Wenn der Eingangswert eine Indizierungsachse ist, werden alle Werte in dieser Spalte hinzugefügt. Dies gilt für alle Spalten. Dies führt zu einer Serie, die die Gesamtwerte jeder Spalte enthält. Sie können die Pandas sum () -Methode auf den ausgewählten Spalten aus der Ausgabe des Pandas Groupby direkt verwenden, um die Summe oder die Gesamtheit jeder Gruppe zu erhalten. Diese Methode bildet die Summe der Zeilen und Spalten der Eingabe.

Pandas Groupby Sum () Methode

Es gibt einige folgende Schritte, um die Pandas Groupby Sum () zu finden:

  • Erstellen Sie einen Datentypen, der zweidimensional, größenanfällig ist und möglicherweise große Datensätze enthalten.
  • Zeigen Sie die DataFrame -Eingabe DF an.
  • Verwenden der DF. GroupBy Sum (), finden Sie den GroupBy Sum (). Diese Funktion sortiert die Werte in einer bestimmten Spalte. Die Werte der anderen Spalten werden dann abhängig von den sortierten Werten sortiert.
  • Die Summe für den Groupby.

Syntax für die GroupBy Sum () -Methode

Diese grundlegende Syntax wird verwendet, um die Wertesumme in der Gruppe Groupby Sum () zu berechnen.

Beispiel 1: Erstellen Sie ein GroupBy -Objekt mit DataFrame

Wir benötigen eine Software oder Tools, um uns eine Plattform zu bieten, auf der wir dieses Programm ausführen können, um die Beispielpython -Codes in die Praxis umzusetzen. Somit wird das "Spyder" -Tool verwendet. Wir müssen eine neue Datei öffnen, wenn die Schnittstelle angezeigt wird. Auf der Schnittstelle „Spyder“ haben wir die Option "Neue Datei" ausgewählt, um den Code auszuführen. Es gibt uns auch zusätzliche Optionen, um die Dateien zu öffnen. Daher können Sie es auch mit dem „Strg+n“ öffnen.

Wir müssen diese „Pandas als PD“ importieren, um den Pandas -Code auszuführen. Der Abschnitt „PD“ des Codes weist Python an, Pandas den Alias ​​von „PD“ zuzuweisen.Datenrahmen.GroupBy () ”als Funktionsname als DataFrame„ GroupBy () “. Mit GroupBy gruppieren wir den Pandas DataFrame. Die Zackenbarschfunktion wählt die erforderliche Spalte aus. Unter Verwendung eines Mapper oder einer Reihe von Spalten gruppiert die Funktion von GroupBy () einen Datenrahmen und gibt ein GroupBy -Objekt zurück. Große Datenmengen in diesen Gruppen können durch Anwenden einer Vielzahl von Methoden und benutzerdefinierten Funktionen auf Gruppby -Objekte kombiniert oder transformiert werden.

Wir haben einen Datenrahmen erstellt, dessen Größe „6, 2“ ist und seine Spaltennamen „Alphabet“ und „Wert“ sind. In diesem Beispiel sind die Variablen, die wir haben, "k", "l" und "m" und ihre Werte "36", "21", "42", "8", "9" und "3". Um die aggregierten Funktionen anzuwenden, gruppiert Pandas '"GroupBy ()" Method. Diese Methode gibt ein DataFrame GroupBy -Objekt zurück, das aggregierte Methoden wie Summe und andere ähnliche enthält. Das ”df.GroupBy (["Alphabet"] "fügt beispielsweise alle Wertspalten in einem Datenrahmen zusammen und berechnet ihre Summen. Die Verwendung der Gruppe „Gruppe“.count () ”” Methode besteht darin, die Anzahl für jede Gruppe zu erhalten und die None und die NAN -Werte zu ignorieren, um die Zeilen nach Spalte zu gruppieren. Darüber hinaus funktioniert es mit nicht schwierigen Typdaten. Konstruieren Sie mit Zählungen der Werte für jede Gruppe in einer Gruppe eine neue Serie oder eine neue Datenframe.

In diesem Code haben wir die Gruppe verwendet.Summe()". Diese Funktion sortiert die Werte in einer bestimmten Spalte. Die Werte der anderen Spalten werden dann abhängig von den sortierten Werten sortiert. Dadurch wird eine Tabelle erstellt, deren Spaltennamen „Alphabet“ und „Werte“ des Alphabets sind, das unter dem Alphabet geschrieben ist und ihre Werte vor sie schreiben. Durch Verwendung der Gruppe „Gruppe.sum () “kombinieren die ähnlichen Alphabete ihre Werte und machen sie zusammen. Durch Verwendung der Gruppe „Gruppe.sum () “kombinieren die ähnlichen Alphabete ihre Werte und machen sie zusammen.

Nach dem Ausführen des Codes zeigte es sein Ergebnis, in dem die „Gruppe“.count () ”erstellte eine Tabelle, indem die„ Alphabete “und„ Werte “gezählt wurden. In der nächsten Zeile sammelt es die ähnlichen Alphabete und fasst ihre Gruppen mit der Gruppe zusammen.sum () ”Funktion. Jetzt beträgt der Wert für "k" "99", der Wert für "L" "17" und der Wert für "M" 3 beträgt 3.

Beispiel 2: Finden und summieren Sie die Geschwindigkeit einiger Tiere mithilfe der Gruppe von GroupBy Sum ()

Dieses Szenario ist auch vergleichbar mit dem ersten. Für die Funktionen, die wir im vorherigen Beispiel verwendet haben, verwenden wir auch in diesem Code dasselbe. Dafür haben wir einen Datenrahmen mit zwei Spalten erstellt. Der Name für eine Spalte lautet "Tier" und die andere ist "Geschwindigkeit".

In diesem Code haben wir auch die gleichen Funktionen, die wir im vorherigen Programm hatten - die „Gruppe.count () “und„ Gruppe.Summe()". Die Summe jeder Gruppe kann unter Verwendung der Pandas „sum ()“ -Methode direkt auf den ausgewählten Spalten aus der Ausgabe des Pandas Groupby erhalten werden. Der DataFrame repräsentiert die Pandas -Datenfunktionsfunktion. In der Liste der Tiere haben wir drei Tiere genommen - "Affe", "Lion" und "Tiger". In der zweiten Spalte haben wir ihre Geschwindigkeit geschrieben. Der DataFrame wird unter Verwendung der Methode „DataFrame GroupBy ()“ in Gruppen unterteilt. Es berechnet die Anzahl der ähnlichen Datenzahlen, die in einer bestimmten Datenrahmenspalte vorhanden sind.

Verwenden der „DF.GroupBy () ”“, das Objekt wird gespalten, eine Funktion wird angewendet und die Produkte werden kombiniert. Eine große Datenmenge kann mit diesem gruppiert werden, und die Vorgänge können in diesen Gruppen berechnet werden. Sie können Ihre Daten mit der Methode „GroupBy ()“ gruppieren und die Vorgänge in diesen Gruppen ausführen. Die „Gruppe.count () ”Die Funktion gibt die Gesamtzahl der Nicht-NAN-Werte zurück. Ein Datenrahmen wird zurückgegeben, wenn mehrere Spalten vorliegen. Das Zählen ist die einfachste grundlegende Gesamttechnik. Die Anwendung der Funktion Pandas auf den gesamten Tierdatenfream zeigt schnell, wie viele “Affen“, „Löwen“ und „Tiger“ in der Gruppe „Animal“ da sind.

Untersuchen Sie die Ergebnisse der Quelldatei, führen Sie diesen Code aus und geben Sie eine wahrheitsgemäße Ausgabe an. Diese Ausgabe zeigt drei Tabellen mit drei verschiedenen Funktionen an. Wenn wir die Geschwindigkeit für drei „Affen“ zählen, wird es „105“ sein. Die Geschwindigkeit für zwei "Löwen" beträgt "160" und die Geschwindigkeit von einem "Tiger" "65".

Abschluss

In Anbetracht dieser Informationen dient dieser Artikel als Beispiel für die Idee und Notwendigkeit, die Dinge für Sie zu vereinfachen. Wir haben hier zwei Funktionen definiert. Dies sind die Anwendungen für die „Gruppe.sum () “und„ Gruppe.zählen ”Funktionen in Pandas. Sie können wahrscheinlich verstehen, wie unglaublich und hilfreich die „Gruppe.sum () “und„ Gruppe.count () ”-Funktionen dienen zur Untersuchung der Daten. In diesem Tutorial haben wir gesehen, wie man dieselben Daten mit dem „DF“ kombiniert.Gruppe “und summieren sie. Wir haben diesen Leitfaden eine gute und einfache Erklärung aller Methoden zur Verfügung gestellt, damit Sie unseren Standpunkt leichter erhalten können. Sie können eine der beiden verfügbaren Techniken basierend auf Ihren Bedürfnissen auswählen, aber das Mastering ist unerlässlich und verbessert daher Ihre Python Pandas -Fähigkeiten.