Pandas Pivot Table

Pandas Pivot Table

Python bietet viele Bibliotheken für verschiedene Aufgaben. Die "Pandas" ist auch eine Bibliothek von Python. Wir verwenden diese Bibliothek zum Manipulieren und Analysieren der Daten. Wir können den DataFrame in "Pandas" problemlos entwerfen. Außerdem entwerfen wir auch die „Pivot -Tabellen“, indem wir die Funktionen von „Pandas“ nutzen. Eine Pivot -Tabelle ist ein Merkmal von Tabellenkalkulationen, die verschiedene Tabellenanordnung für verschiedene Perspektiven identischer Daten ermöglicht. Eine interaktive Technik zur Zusammenfassung eines großen Datenvolumens ist die „Pivot -Tabelle“. Die Methode „Pivot_table ()“ von „Pandas“ hilft uns beim Entwerfen der Pivot -Tabellen, indem wir die Daten der Datenrahmen verwenden. Wir können seine Index, Spalten und Werte in der Methode „Pivot_table ()“ gemäß unserer Wahl oder unserem Bedarf festlegen. Wir können auch Aggregationsfunktionen auf diese pivot_tables in "pandas" anwenden. In diesem Tutorial erstellen wir die Pivot -Tabelle, indem wir die Methode „Pivot_table ()“ verwenden und diese „Pivot -Tabelle“ im Detail erklären.

Syntax

Pandas.PIVOT_TABLE (DataFrame_Name, values ​​= values_names, index = index_names, columns = column_names, Aggfunc = 'Mean')

Wir fügen zunächst den Namen des Datenrahmens hinzu, dessen Daten wir in der Pivot -Tabelle verwenden möchten. In den Werten fügen wir dann die Namen der Spalten hinzu, die wir als Werte der Pivot -Tabelle anpassen möchten. Danach fügen wir die Namen der Spalten des Datenrahmens ein, die wir als Index der Pivot -Tabelle festlegen möchten. In den Spalten setzen wir nun die Namen der Spalten fest, die wir als Spaltennamen der Pivot -Tabelle anpassen möchten. Dann können wir auch die Aggregationsfunktion hinzufügen. Jetzt werden wir den Code „Pandas“ erstellen und die Erstellung der Pivot -Tabelle in unseren Codes zeigen. Schauen wir uns die folgenden Beispiele an.

Beispiel 01

Wir beginnen dieses Beispiel, indem wir den „Import“ zum Importieren der Module von „Pandas“ in die "Spyder" -App platzieren. Wir platzieren "Pandas als PD" nach dem Schlüsselwort "Import". Wir importieren auch eine andere Bibliothek, die der „Numpy“ auf die gleiche Weise ist. Wir platzieren "importieren" und fügen dann das "Numpy als NP" hinzu. Daher hilft es uns beim Zugriff auf die Methoden der „Numpy“ -Bibliothek. Nachdem wir beide Bibliotheken importiert haben, bewegen wir uns auf die Erstellung des Datenrahmens. Der DataFrame wird als "capense_df" bezeichnet und dann verwenden wir die "Pandas" -Methode "PD".DataFrame () ”“ So hilft es uns beim Erstellen des DataFrame.

Die Daten, die wir in "cupsense_df" hinzufügen, enthält drei Spalten, die "exp_id, cupse_type und Geld" bezeichnet werden. Die Daten, die wir in "Exp_id" hinzufügen, sind "E1, E2, E3, E4, E5 und E6". Dann platzieren wir in der „Ausspaltung“: „Wohnen, Unterhaltung, Transport, Lebensmittel, Rechnungen und Steuern“. Die letzte Spalte ist die Spalte „Geld“, die wir hinzufügen: „1500 $, $ 1200, 200, $ 3000, 5000 und 2000 US. Jetzt zeigen wir diese „cupsense_df mit„ print () “einfach an, indem wir" print () "verwenden. Der Datenrahmen wird erstellt und angezeigt. Wir haben die Methode „Pivot_table ()“ noch nicht verwendet. Erstens werden wir diesen Datenrahmen zeigen. Dann wenden wir auch in diesem Beispiel die Methode „Pivot_table ()“ an.

Wir erhalten das Ergebnis dieses Code in der "Spyder" -App mit Hilfe der Tasten "Shift+Enter" oder können wir das Symbol "Ausführen" dieser App verwenden. Hier wird nur der Datenrahmen im Ergebnis angezeigt und alle Daten werden diesem Datenrahmen hinzugefügt. Jetzt werden wir die Methode „Pivot_table“ zum Erstellen der Pivot -Tabelle anwenden, indem wir die Daten dieses Datenrahmens verwenden.

Wir fügen diese angegebenen Zeilen dem obigen Code hinzu. Hier können Sie sehen, dass wir auf die Methode „Pivot_table ()“ von „Pandas“ zugreifen, indem wir mit dieser Methode „PD“ verwenden. Danach fügen wir den Namen des DataFrame als erster Parameter hinzu. Dann haben wir in den "Werten" die Spalte "Geld" festgelegt, damit sie als Werte in den Zellen der Pivot -Tabelle angezeigt wird. Im "Index" setzen wir das "exp_id". Die Spalte "Exp_id" wird also in den Index der Pivot -Tabelle konvertiert. Wir passen auch die "cupsense_type" in den Spalten "Spalten" ein, sodass die Werte der Spalte "cupsense_type" als Spaltennamen der Pivot -Tabelle angezeigt werden.

Dann wenden wir auch die Aggregationsfunktion „Aggfunc“ an und setzen sie auf „NP. sum “, die Werte hinzufügen. Die "Summe" ist die Funktion der "Numpy" -Bibliothek, die wir erhalten, indem wir den "NP" platzieren. Wir haben diese "Pivot -Tabelle" in der Variablen "Tabelle" gespeichert und diese "Tabelle" -Variable in "Drucken" zum Anzeigen hinzugefügt.

Hier ist der Pivot -Tisch. Beachten Sie, dass die "Spaltennamen" dieser Pivot -Tabelle die Werte der Spalte "cupsense_type" des DataFrame sind. Der „Index“ dieser Pivot -Tabelle ist die Werte des "exp_id" des Datenrahmens, den wir oben erstellt haben. Außerdem sind die in den Zellen dieser Pivot -Tabelle hinzugefügten "Werte" die Werte der Spalte "Geld" des Datenrahmens.

Beispiel 02

Wir importieren erneut sowohl "Pandas" als auch "Numpy" -Bibliotheken, um den neuen Code zu generieren. Wir erstellen die PIVOT -Tabelle, nachdem wir die CSV -Datei gelesen und die Daten der CSV -Datei in den DataFrame konvertieren können. Verwenden Sie dann die Daten des Datenrahmens zum Erstellen der Pivot -Tabelle. Versuchen wir, wie wir die Pivot -Tabelle erstellen, indem wir die Daten der CSV -Datei verwenden. Nach dem Import der Bibliotheken verwenden wir die Methode "Read_csv" der "Pandas". Fügen Sie dann den Namen der CSV -Datei hinzu, die die Daten dieser CSV -Datei liest, und speichern Sie diese Daten in Form von Datenframe in der Variablen „DF“.

Dann drucken wir diese "DF" aus. Wir platzieren auch die Methode „Kopf (8)“ damit, damit nur die ersten "8" -Filzzeile des Datenrahmens angezeigt werden. Danach verwenden wir die Methode „Pivot_table ()“, in der wir den Namen des Datenrahmens einfügen. Anschließend setzen wir zwei Indizes für die Pivot -Tabelle ein. In den "Werten" platzieren wir die Spalten "Betrag" und "Land" des Datenrahmens, damit sie als Werte der Pivot -Tabelle hinzugefügt werden. In der Aggregationsfunktion fügen wir das „NP“ hinzu. Summe ”-Funktion. Diese Pivot -Tabelle ist in "Pivot_Result" gespeichert und wir zeigen auch das „Pivot_Result“ an, indem wir die "print ()" verwenden ".

Der DataFrame sowie die Pivot -Tabelle werden in diesem Ergebnis gerendert und Sie können die Indizes und Werte der Pivot -Tabelle problemlos überprüfen. Alle Werte und Indizes der Pivot -Tabelle werden entsprechend angepasst, da wir im Code festgelegt haben.

Beispiel 03

Wir können auch eine Pivot -Tabelle mit vielen Aggregationsmethoden erstellen. Hier entwerfen wir den Datenrahmen und haben dann die Pivot -Tabelle erstellt, indem wir dieselbe Methode befolgen, die wir bereits zuvor besprochen haben. In der Methode "Pivot_table ()" passen wir "EMP_TYPE" als "Index" an. Das "EMP_PAY" wird als "Werte" dieser Pivot -Tabelle festgelegt, und wir fügen hier mehrere Aggregationsfunktionen hinzu. Diese sind "Summe, Mittelwert und Zählen". Alle diese Funktionen gelten also für die Werte der Pivot -Tabelle. Dieser „pivot_table ()“ wird in „Ergebnis“ gespeichert und wir drucken das „Ergebnis“ auch, um die Pivot -Tabelle auf dem Terminal anzuzeigen.

Der DataFrame und die Pivot -Tabelle sind beide hier angezeigt. In der Pivot-Tabelle können Sie beachten, dass die drei Spalten- „Summe, Mittelwert und Anzahl“- das Ergebnis enthält, nachdem diese Funktionen auf die Daten der Pivot-Tabelle angewendet wurden. Beachten Sie außerdem, dass es einmal die gleichen Werte in der Indexspalte schreibt und hier keinen Indexwert dupliziert.

Abschluss

In diesem Tutorial haben wir die "Pivot -Tabelle" in "Pandas" studiert. Wir haben diskutiert, was eine Pivot -Tabelle ist, warum wir diese Pivot -Tabelle verwenden und wie diese Pivot -Tabelle in „Pandas“ erstellt werden kann. Wir haben die Method. Wir haben auch diese Methode „Pivot_table ()“ in den Codes „Pandas“ verwendet. Wir haben viele Aggregationsfunktionen auf dieser „Pivot -Tabelle“ angewendet. Wir haben auch die „Pivot -Tabelle“ entwickelt, nachdem wir die CSV -Datei in diesem Tutorial gelesen haben.