Pandas DataFrame Pivot

Pandas DataFrame Pivot
Pandas ist die Bibliothek von Python. Wir verwenden Pandas für viele Zwecke. Wir können den Datenrahmen in Pandas und Pivot erstellen, die den Datenrahmen angegeben haben. Um den Datenrahmen zu profitieren oder neu zu formulieren, liefert die Pandas die Methode „Pivot ()“. Ein angegebener Datenrahmen kann mit der Methode „Pivot ()“ durch die angegebenen Index- und Spaltenwerte neu angeordnet werden. Wenn wir den DataFrame umgestalten möchten, verwenden wir die Methode „Pivot ()“. Wenn wir die Methode „Pivot ()“ verwenden, muss sie den eindeutigen Indexwert verwenden. Die Datenaggregation wird nicht von der Methode „Pivot ()“ unterstützt. Mehrere Werte erzeugen in den Spalten einen Multiindex. In diesem Leitfaden untersuchen wir die Methode „Pivot ()“ in Pandas im Detail. Und wir werden Ihnen eine visuelle Demonstration der Codes geben, in denen wir den Datenrahmen mit "Pivot ()" neu gestalten "neu umgehen können.

Syntax:

Datenrahmen.pivot (self, index = keine, spalten = keine, values ​​= keine)

Beispiel 1:

Wir werden das praktische Beispiel der Methode „Pivot ()“ in Pandas zeigen. Wir machen den Pandas -Code in der "Spyder" -App. Wie wir wissen, müssen wir einige Funktionen von Pandas als „PD“ importieren. Wir entwickeln diesen Code, also wenden wir die Methode „Pivot ()“ an. Diese Methode wird auf den Datenrahmen angewendet. Wir erstellen zuerst den Datenrahmen hier. Der hier entwickelnde Datenrahmen heißt "cARS_DATA", wo wir die Daten zu Autos hinzufügen. Wir machen die erste Spalte mit dem Namen "car_name", in dem wir einige Namen von Autos wie "Wagonr, Swift, Lexus, Mehran, Mustang, Alto und Jaguar" hinzufügen.

Wir fügen auch mehr Spalten ein, die als "car_model, car_no und Challan" bezeichnet werden. Die Daten in diesen Spalten werden auch hier eingefügt. Die Spalte „CAR_MODEL“ enthält die Modellnummern der Autos, die „2014, 2001, 2010, 2015, 2020, 2012 und 2019“ sind. Die Spalte "car_no" enthält "R123, R456, R162, R102, S127, W190 und Z345". Dann haben wir die Spalte „Challan“, in der wir die Werte „500, 4000, 500, 6000, 2000, 1000 und 2000“ hinzufügen. Dies ist der vollständige Datenrahmen, der vier Spalten enthält. Danach setzen wir die Indexwerte für die Zeilen "R1, R2, R3, R4, R5, R6 und R7". Wir fügen diese Indexwerte mit der Methode "Index" in die "cARS_DATA" ein.

Dann setzen wir es in die Methode „print ()“ ein, um auf der Konsole zu rendern. Wir verändern den Datenrahmen noch nicht oder wenden die Methode „Pivot ()“ noch nicht an. Wir zeigen einfach den Datenrahmen „cARS_DATA“ an.

Wir drücken die "Shift+ Enter", um diesen Code auszuführen. Nachdem wir diese Schlüssel drücken. Jetzt wenden wir die „Pivot ()“ -Methode auf diesen Datenrahmen an und formen Sie sie nach unserer Wahl um.

Hier fügen wir diese Zeilen zu unserem Pandas -Code hinzu und verwenden die Methode „Pivot ()“. Diese „Pivot ()“ -Methode enthält drei Parameter. Im ersten Parameter setzen wir den neuen Index, der das „CAR_MODEL“ ist, das ist. Der zweite Parameter ist der Spaltenname, den wir hier als "Challan" festgelegt haben. Und der dritte Parameter ist der Wertparameter, den wir als "car_name". Jetzt wird der Datenrahmen "cARS_DATA" umgestaltet und erscheint, wie wir definiert sind. Die Spalte "car_model" wird als Index angezeigt, die Spalte "Challan" wird als Spaltennamen angezeigt, und die Werte des Datenrahmens sind der "car_name".

Hier erscheint der umgestaltete Datenrahmen und alle Werteanpassungen werden entsprechend angezeigt, die wir im Code definiert haben. Der Index in diesem umgestalteten Datenrahmen ist das "car_model". Der Spaltenname hier ist die Spalte "Challan". Alle "car_name" werden hier als Werte angepasst. Die "Nan" erscheint hier in der leeren Zelle.

Beispiel 2:

Der Datenrahmen, den wir in diesem Beispiel entwickeln, ist das "new_interview_df". Wir erstellen jedoch zuerst eine verschachtelte Liste mit dem Namen "new_interview". Und dann konvertieren wir diese verschachtelte Liste in den Datenrahmen. Die Liste "new_interview" enthält die "Pro_Language", in der wir die "Java, C#, Python, OOP und Python" haben. Es hat "code_office", bei dem wir die "Bar12, Lon34, Par33, Lon56, Bar53, Lon11 und Bar34" einstellen. Als nächstes haben wir das „emp_salary“ und fügen die „18000, 25000, 20000, 15000, 34000, 22000, 31000 und 43000“ ein. Das "new_interview" wird mit Hilfe des "PD" in "new_interview_df" verwandelt.DataFrame ”-Methode. Wir setzen auch die "new_interview_df" in die "print ()" -Methode ein. Es erscheint nach der Ausführung auf der Konsole.

Jetzt ändern wir die "new_interview_df" mit Hilfe der "Pivot ()" -Methode. Diesmal erwähnen wir die "Werte, Index und die Spalte" innerhalb der Methode "Pivot ()". Hier setzen wir das "emp_salary" als Werte, "code_office" als Index und "pro_Luage" als Spalten. Dann drucken wir diesen umgestalteten Datenrahmen aus.

Das Original sowie die umgeformten Datenrahmen erscheinen hier. Sie werden möglicherweise feststellen, dass Wert, Index und Spaltennamen geändert werden und ein neuer umgeformter Datenrahmen unter dem Originaldatenrahmen angezeigt wird. In dem umgestalteten Datenfreame, der hier erschien, ist der Index der "Code_Office", die Spaltennamen "Pro_Language", und die Werte sind die "emp_salary".

Beispiel 3:

Für dieses Beispiel erstellen wir erneut eine andere Liste. Diese Liste heißt "temp_list", das "Monat, Stadt, Temperatur und Luftfeuchtigkeit" enthält. Der „Monat“, den wir hier einfügen, lautet "Januar, Mai, Juni, Februar und Juli". Die "Stadt" hat "New York, Birmingham, Mumbai, Baljiam und Bangalore". In der „Temperatur“ und „Feuchtigkeit“ fügen wir die „62, 68, 70, 77, 69“ bzw. „60, 66, 69, 74, 63“ hinzu. Anschließend ändern wir die "temp_list" in den Datenrahmen "temp_df". Wir machen dann hier diese "temp_df".

Jetzt wollen wir diese "temp_df" drehen oder neu umgehen lassen. Die "Pivot ()" -Methode hier hilft dabei. Wir setzen den „Monat“ als Index und die „Stadt“ als Spaltenname. Die Werte, die wir hier festgelegt haben, sind sowohl "Temperatur" als auch "Feuchtigkeit". Sie erscheinen als zwei separate Datenrahmen mit unterschiedlichen Werten.

Dieses Ergebnis zeigt, dass nach der Umgestaltung zwei Datenframes durch Punkte getrennt sind. Der erste DataFrame enthält die "Temperatur" -Werte und der zweite DataFrame enthält die "Feuchtigkeit" -Werte. Die Indizes und Spaltennamen für beide Datenrahmen sind gleich. Der Index für beide DataFrames ist der "Monat" und die "Spalten" für beide "Stadt".

Beispiel 4:

Dieser Code enthält einen "DF" -Datenrahmen, in dem wir "A01" als erste Kolumne platzieren und "James, James und Mina" hinzufügen. Die zweite Spalte ist "A02", in dem "Ingenieur, Ingenieur und Lehrer" verfügt. Die dritte Spalte heißt "A03", in dem wir "44, 63, 21" einstellen,. Wir drucken die „DF“ und wenden hier den „Drehpunkt“ an. Das "A01" ist der Index, "A02" ist die Spalte und "A03" ist der Wert. Überprüfen Sie nun die Ausgabe dessen, was mit diesem Datenrahmen passiert.

Hier ist das Ergebnis dieses Code. Sie können feststellen, dass die Fehlermeldung in der Ausgabe angezeigt wird, die besagt, dass der Index die doppelten Einträge enthält. Dies bedeutet, dass wir diese Spalten nicht als Index festlegen, der die doppelten Einträge enthält, da die Indizes eindeutige Werte sind. Seien Sie also vorsichtig dabei, während Sie einen Datenrahmen drehen.

Abschluss

Das Ziel dieses Leitfaden. Wir haben dieses Konzept ausführlich beschrieben, damit Sie die Funktion „Pivot ()“ im Pandas -Code leicht anwenden können. Wir haben die „Pivot ()“ -Methode erklärt. Wir haben diese Methode verwendet, um den Datenrahmen in Pandas zu formen oder zu drehen. Wir haben hier auch seine Syntax erklärt. In diesem Leitfaden haben wir uns sowohl vier beschreibende als auch praktische Beispiele angesehen, die jede Codezeile sorgfältig betrachteten. Wir haben das Ergebnis für jeden Code hier zusammen mit den Skripten bereitgestellt.