Pandas Agg

Lars Daub

"Pandas" liefert die Funktion "Agg ()". Mit der Funktion „Agg ()“ können wir verschiedene Funktionen nutzen. Es wird auf der Zeilenindexachse durchgeführt, die automatisch in den Datenrahmen eingefügt wird. Das Standardverhalten der numpy „Agg ()“ -Funktionen (Mittelwert, Median, Prod, Sum, STD, VAR), die das AGG () des abgeflachten Arrays bewerten, unterscheidet sich von diesem Verhalten von diesem Verhalten. Wir können Daten mit Hilfe der Agg () -Funktion hinzufügen. Diese Anleitung verwendet die Funktion „Pandas agg ()“ und zeigt die Funktionsweise dieser „Agg ()“ -Funktion in „Pandas“.

Syntax

Die Syntax dieser Funktion ist:

#Dataframe.AGG (Func, Achse, Args, Kwargs)

Beispiel # 01

Wir haben die "Spyder" -App für die Ausführung unserer "Pandas" -Codes. Bei der Entwicklung des "Pandas" -Codes müssen wir die "Pandas" -Methoden als "PD" importieren "importieren". Mit diesem „PD“ können wir auf die Methoden oder Funktionen der „Pandas“ zugreifen, indem wir „PD“ anstelle von „Pandas“ hinzufügen. Wir generieren die Daten und speichern sie in "Data1". Wir schreiben "x1" und in "x1". Wir fügen "60", "50" und "40" hinzu. Wir haben "y1" und fügen "900", "1212" und "51" hinzu. Wir platzieren auch "Z1". Darin setzen wir "200", "300" und "800" ein. Wir ändern dieses "Data1" in den "DataFrame" und schreiben "PD" mit dem "DataFrame", damit wir beim Zugriff auf diese Funktion von "Pandas" zugreifen können.

Wir bestehen „Data1“ als Parameter des „PD“.DataFrame () ”. Es generiert "DataFrame" für uns und verwendet auch die Variable hier "DFA", die diesen Datenrahmen darin speichert. Dann fügen wir "Print (DFA)" hinzu, um dies zu rendern. Im Folgenden verwenden wir die Funktion „Agg ()“, um einige Vorgänge für diesen Datenrahmen auszuführen. Wir beantragen "Summe" in dieser "Agg ()" -Funktion. Das Ergebnis, das wir nach der Summe erhalten, wird in der Variablen „ANS“ gespeichert. Wir drucken diese Summe auch, indem wir den "print ()" einlegen ".

Wir fügen auch die Ausgabe hier ein. Diese Ausgabe wird am Klemme „Spyder“ extrahiert, indem "Shift+Enter" gedrückt wird. Es wird zunächst die Daten angezeigt, wie sie in den Code eingefügt werden, und fügt die Werte von „x1“ hinzu. Anschließend wird in der folgenden „x1“ angezeigt. Die Werte des „Y1“ werden ebenfalls hinzugefügt und das Ergebnis wird in der Spalte „Y1“ angezeigt. Schließlich wird der Summenoperation auch für die Werte des „z1“ durchgeführt. Das Ergebnis nach der Summe wird in der Spalte „Z1“ wiedergegeben.

Beispiel # 02

Wir erstellen den Datenrahmen, nachdem wir die "Pandas" als "PD" importiert haben. Der DataFrame wird als "Daten" bezeichnet. Wir fügen zuerst drei Zeilen ein und fügen der ersten Reihe "9, 8, 7" hinzu. "4, 5, 6" zur zweiten Reihe; und auch "1, 2, 3" zur dritten Reihe. Dann fügen wir den Namen des Headers in jeder Spalte ein, indem wir das Schlüsselwort "Spalten" verwenden. Wir weisen „A1“ als Header der ersten Spalte zu. "A2" als Header der zweiten Spalte. Und "A3" für die dritte Spalte. Wir drucken die „Daten“ auf dem Terminal der Spyder -App.

Wir setzen den Namen des DataFrame "Daten" und verwenden die Methode "Agg ()" mit diesen "Daten". Wir haben zwei Funktionen, die wir für den Datenrahmen anwenden möchten: "Summe" und "min". "Sum" addiert die Nummern jeder Spalte getrennt hinzu. "Min" findet den Mindestwert der Spalte. Dann speichert es die Summe und den min -Wert im „Ergebnis“, das wir erstellt haben. Schließlich wird das „Ergebnis“ gedruckt, da wir auch den „Druck“ eingefügt haben.

Die Summe der Spalte "A1" ist "14" und der Mindestwert dieser Spalte "1" ist "1". Die Summe der zweiten Spalte "A2" ist "15". Der Mindestwert beträgt „2“. Die Summe der letzten Spalte "A3" ist "16" und der Mindestwert, den wir für diese Spalte haben, ist "3", der angezeigt wird.

Beispiel # 03

Wir wiederholen die erste Zeile in diesem Beispiel und konstruieren den DataFrame "Info". Legen Sie dann Daten in Zeilen als „3, 8, 7“ ein, die hier in die erste Zeile eingefügt werden. "4, 1, 6" und "7, 2,3" werden in die zweite bzw. dritte Zeilen eingefügt. Wir weisen allen Spalten auch einige Indexnamen als „Col1“, „Col2“ und „Col3“ für die erste, zweite und dritte Spalte zu. Wir machen diese "Info" mit "Drucken" mit "Drucken". Wir wenden verschiedene Aggregationen auf die Spalten an.

In der Methode „Agg ()“ erwähnen wir den Namen der Spalte und setzen dann die Operation ein, die wir auf die erwähnte Spalte anwenden möchten. Was "col1" betrifft, verwenden wir die "Summe" und "Min" -Operationen. Auf dem "Col2" wenden wir "min" und "max" an. Wir erwähnen jedoch nicht die „Col3“, sodass keine AGG -Funktion auf den „Col3“ angewendet wird. Wir verwenden auch die "endgültige" Variable, um dieses Ergebnis zu speichern und dann es dann zu rendern.

Die "Summe" und "min" werden auf das "col1" angewendet, aber in "max" druckt sie "nan", weil wir das "Max" nicht auf diese "Col1" angewendet haben. Dann sind "min" und "max" von "col2" hier, aber der Summenblock enthält "Nan", da wir nur "max" und "min" auf diesen "Col2" anwenden. Das „Col3“ ist nicht hier, weil wir keine "Agg ()" -Methode auf diese "Col3" angewendet haben.

Beispiel # 04

Wir wenden verschiedene Funktionen auf die Spalten an und aktualisieren auch den Namen des Index nach dem Ergebnis. Zu diesem Zweck haben wir den DataFrame "Rohdaten" erstellt und drei Zeilen mit einigen Zahlen "22, 82, 27" in der ersten Zeile. "14, 23, 36" hier in der zweiten Reihe; und "77, 29, 34" ist in der dritten Reihe. Die Namen der von uns hinzugefügten Spalten sind "Data1", "Data2" und "Data2". Im Folgenden haben wir die Methode "print ()".

Jetzt verwenden wir die "Agg ()" -Methode der "Pandas" und "X", mit der der Zeilenname umbenannt wird, nachdem die Aggregationsfunktion in der Spalte "Data1" angewendet wurde. Wir wenden die Funktion „max“ auf „Data11“ an. Wir wählen „y“ aus, um den Namen des Zeilenindex zu ersetzen, nachdem die Aggregationsfunktion ausgeführt wurde. Zu "Data2" verwenden wir die "min" -Funktion. Auf „Data3“ setzen wir die Funktion „Mittelwert“ ein und setzen den Zeile -Index -Namen auf „Z“, der nach Anwendung der Aggregationsfunktion ersetzt wird. Dann haben wir auch die "print ()", damit die "Berechnung" für uns angezeigt wird.

Auf „Data1“ wird nur die Funktion „max“ angewendet und die verbleibenden zwei Werte sind „Nan“. Außerdem wird der Indexwert in "x" geändert. In der Spalte „Data2“ wird nur das Ergebnis für die Funktion „min“ angezeigt und die verbleibenden Werte sind "Nan" und der Indexzeilenname dafür ist "y" dafür. Der einzige Mittelwert wird nun auf "Data3" angewendet und sein Zeilenindex wird in "Z" geändert.

Abschluss

Diese Anleitung befindet sich in der "Agg" -Funktion in "Pandas". Wir haben erklärt, dass die "Agg" -Funktion, die in Pandas verwendet wird, um verschiedene Funktionen anzuwenden. Wir haben vier Fälle eingerichtet, auf die wir die „Agg“ -Methode angewendet haben.

Python

Etiketten der Seeborn -Achse

Die „Äxte.set () ”-Funktion, Matplotlib -Bibliotheksfunktionen oder die Funktionen„ set_xlabel () “u...

Mohamed Flore

Docker

Wie werden Volumina in Docker definiert??

Volumina werden unter Verwendung der Taste „Volumes“ in Docker Compose YAML -Datei definiert. Benutz...

Jean Dengler

Golang

Einführung in die Golang -Programmiersprache

Golang ist eine von Google entwickelte Open-Source-Programmiersprache. Befolgen Sie diesen Artikel, ...

Prof. Dr. Julien Plank