Pandas stapelt

Pandas stapelt
„Nicht wenige integrierte Algorithmen zur Änderung einer Datenmenge sind in Pandas anwendbar. Unter allen von ihnen sind die beiden beliebtesten Algorithmen für Jumbeln und Zeilen "stack () und" instack () ", die" stack () und "instack ()" sind. Auf Stufe 0 des gruppierten Datensatzes verwenden wir sporadisch den „Stack ()“ und „instack ()“ sporadisch. Wir beabsichtigen, in diesem Artikel in Pandas „Unstapel“ zu untersuchen. "Unstack" ist eine der wichtigsten Haltung von Pandas, um Schmuckstücke aus dem Stapel zu entfernen. Das Unstapeln wird in Pandas stark verwendet, um die Form des zu demonstrierenden Datenrahmens erheblich zu ändern. Zwei Hauptparameter in Pandas Unstapel, die "Level" und "fill_value" verwendet werden können.”

Die Syntax für die Pandas -Unstack -Methode

Beispiel 1: Anzeigen von Pandas -Instapel in einem Datenrahmen mit einer einfachen Instack () -Funktion gleichzeitig

Jetzt werden wir diskutieren, wie wir den Datenrahmen in Pandas stapeln können. Zu diesem Zweck ist das Werkzeug, das wir als Compiler von Pandas Python verwendet haben, „Spyder“, „Spyder“. Um die Pandas -Implementierung einzubeziehen, haben wir die Bibliothek von Pandas als „PD“ importiert.

Lassen Sie uns den Code des ersten Beispiels untersuchen. Nachdem wir die Bibliothek des Pandas importiert hatten, haben wir unseren Datenrahmen als "Date_values" erstellt, wo wir das Datum "Index" als "2022-08-21" zugewiesen haben. Der zugewiesene Wert für die "Perioden" ist "120", und der Wert, den wir "freq" zugeordnet haben, ist "2 Minuten". Die deklarierten Spaltenwerte für den Datenrahmen enthalten "Daten", "Spalten" und "Index". Das Phänomen der Funktion „List“ wird zusammen mit dem Wert von „120“ auf „Daten“ angewendet. Die Variable "Spalten" speichert den Zeichenwert "Wert" mit dem Namen "Wert". Der Wert der Spalte "Index" als "Index" zugewiesen. Der Datenrahmen "Date_Value" wird mit zwei Spaltenwerten als "positiv" und "negativ" zugewiesen. Der "positive" Wert wird standardmäßig in der oberen Reihenfolge in den Datenrahmen zugewiesen, der Wert "negativ" wird jedoch dem Datenrahmen aus dem "loc [0: 8]" des "positiven" Werts zugewiesen. Nachdem wir die Werte den Spalten unseres Datenrahmens „Data_Values“ zugewiesen haben.

Kommen wir nun zu unserer Hauptfunktion, um unseren Datenrahmen "Date_values" zu stapeln. Zu diesem Zweck verwenden wir unsere Hauptfunktion „instack ()“ in unserem Datenrahmen "Data_values". Um es nicht zu machen, verwenden wir es im Allgemeinen wie „DATE_VALUES.unpack () ”zusammen mit dem Datenrahmen. Nach der Implementierung der Hauptfunktion verwenden wir die Funktion „print ()“ in der letzten Zeit, um unseren Datenrahmen in einem Unstapelformular anzuzeigen.

Werfen wir nun einen Blick auf unsere Ausgangsanzeige, in der wir sehen können, dass unser Datenrahmen „DATE_VALUES“ im ersten Abschnitt in drei Spalten unterteilt ist. Die erste linke Ecke hat den Datumswert von „2022-08-21“ zusammen mit dem Zeitintervall von „2 min“. Der mittlere Spaltenname "Wert" hat die "Index" -Zahlen. Der Spaltenname der rechten Ecke "Value_2" zeigt den Wert „negativ“ von oben nach unten an. Wenn wir von unten nach oben schauen, wird der Datumswert wie „2022-08-21“ zusammen mit einem Zeitintervall von „2 Minuten“ angezeigt, wobei die letzte Indexnummer als „119“ angezeigt wird, da wir den Bereich von „120“ bereitgestellt haben ”. In der Spalte "Value_2" wird der "positive" Wert von unten nach oben angezeigt. Nach dem Datenrahmen können wir sehen, dass die Summe von Spalten „120“ und „2“ Spalten angezeigt wird, die wir unserem Datenrahmen im Code zuweisen.

Wenn wir unsere Hauptfunktion „instack ()“ angewendet haben, trennt er den Wert vom Stapel und wir können sehen, dass der Wert von „Index“ -Zahlen und Datumswerten für die Spalte „Wert“ mit „120“ Zeilen zusammen mit den Zeilen „120“ angezeigt wird Spalten "2" von oben nach unten Reihenfolge. Die Spalte "Value_2" wird separat zusammen mit den Datumswerten mit dem Zeitintervall "2 min" angezeigt, der den "positiven" Wert von unten nach oben in Richtung "Negativ" zeigt. Nach der Implementierung von Unstapeln beträgt die Länge der Gesamtzeilen zu „240“. Da das Entfernen des Wertes aus dem Stapel die Gesamtlänge „240“ beträgt, beträgt der Wert.

Beispiel 2: Anzeige von Pandas Instapel im Datenrahmen mithilfe von Instack () -Funktion auf mehreren Ebenen

Jetzt werden wir unser zweites Beispiel diskutieren, in dem wir nach dem Import der Pandas -Bibliothek als „PD“ unseren Datenrahmen mit dem Namen "Record" erstellt haben. Der Datenrahmen "Record" wurde mit drei Wertenspalten als "Mobile", "Sales_R1 in $" und "sales_r2 in $" deklariert. Die gespeicherten Spalte "Mobiles" sind "iPhone", "iPhone", "Samsung" und "Samsung", "iPhone", "iPhone", "Samsung" und "Samsung". Die der Spalte "Sales_R1 in $" zugewiesenen Werte sind "10", "20", "30" und "40". Die der Spalte "Sales_R2 in $" zugewiesenen Werte sind "12", "15", "16" und "18". Nachdem wir die Werte zugewiesen hatten, haben wir sie als drei Spalten zugewiesen und einfach die Funktion „print ()“ angewendet, um unseren Datenrahmen „Datensatz“ zusammen mit den drei Spalten anzuzeigen, die alle zugewiesenen Werte enthalten.

Nach dem Erstellen unseres Datenrahmens haben wir zunächst die Funktion „Stack ()“ auf unserem Datenrahmen in zwei Ebenen zusammen mit beiden Spalten angewendet. Danach haben wir die Funktion „instack ()“ auf mehreren Ebenen an derselben Stelle angewendet. Zunächst haben wir die Funktion „instack ()“ auf dem Datenrahmen bei „Level = 0“ angewendet und sie "First_Stack" bezeichnet und sie mit der Funktion "print ()" angezeigt. Danach haben wir die Funktion „instack ()“ auf "Level = 1" angewendet und sie "Second_Stack" genannt und sie angezeigt, indem sie die Funktion "print ()" auf die letzte angewendet haben. Auf diese Weise können wir eine Unstapelfunktion auf mehreren Ebenen anwenden, indem wir einfach die Funktion „instack ()“ auf der Ebene zuweisen, auf der wir den Wert aus dem Stapel entfernen möchten.

Jetzt werden wir die Ausgabe unseres zweiten Beispiels diskutieren, bei dem wir die Funktion „Instack ()“ auf mehreren Ebenen angewendet haben. In der Ausgabe wird zunächst nur den Datenrahmen "Datensatz" angezeigt, den wir zusammen mit drei Spalten von "Mobiles", "Sales_R1 in $" und "Sales_R2 in $" erstellt haben, und "Sales_R1", und "Sales_R2 in $". Die Indexnummern reichen von "0" bis "3", und Werte, die in den ersten Spalten angezeigt werden, sind "iPhone", "iPhone", "Samsung" und "Samsung". Werte in der zweiten Spalte, die angezeigt werden, sind "10", "20", "30" und "40". Die in der dritten Spalte angezeigten Werte sind "12", "15", "16" und "18".

Wenn wir die Funktion „Stack ()“ angewendet haben, wandelte sie alle Werte von „0“ bis „3“ separat in den Stapel, zusammen mit beiden Spaltenwerten. Ab dem nächsten nach dem Datenrahmen können wir Index „0“, „1“, „2“ und „3“ -Werte beider Spalten sehen, die alle in den Stapel gesteckt werden. Wenn wir die Funktion „instack ()“ bei „Level = 0“ anwenden, entfernt sie den Wert aus dem Stapel und zeigt die gesamten Spaltenwerte auf horizontale Weise zusammen mit allen Werten innerhalb von drei Spalten an. Und als wir die Funktion „instack ()“ auf der „Ebene = 1“ angewendet haben, zeigt der Datenrahmen aus dem Stapel in die ursprüngliche Form an und Werte, die im Code zugewiesen wurden. Die letzten beiden sind die Anzeige von "First_Stack" und "Second_Stack" nach der Implementierung der Funktion "instack ()" bei "Level = 0" und "Level = 1". Dies ist der Weg, um stackende Phänomene auf mehreren Ebenen anzuwenden.

Beispiel 3: Anzeigen von Pandas -Instacke in einem Datenrahmen mit mehreren Funktionen von Unstack () auf verschiedenen Duplet -Ebenen

In unserem dritten Beispiel haben wir denselben Datenrahmen „Aufzeichnung“ genommen, den wir im vorherigen Beispiel verwendet haben, um die Funktion „Instack ()“ auf zwei verschiedenen Ebenen anzuzeigen. Zunächst haben wir einfach den Datenrahmen "Aufzeichnung" genauso wie im zweiten Beispiel gedruckt. Für die Anwendung der Funktion „nicht ()“ auf zwei verschiedenen Ebenen haben wir zunächst die Gruppe einer Spalte mit der Funktion „GroupBy ()“ zusammen mit "Agg ()" von "Sum" und "Max" in der Spalte verwendet "verwendet. Sales_r1 in $ ”. "Summe" und "min" in der Spalte "Sales_r2 in $" und nannte es als "grupped_data". Danach haben wir die Funktion "print ()" mit "grupped_data" verwendet, um sie anzuzeigen.

Nachdem wir zwei Spalten zusammen mit "sum", "max" und "min" zusammengefasst haben, haben wir die Funktion "instack ()" auf "grupped_data" unter "(Level = 0)" angewendet und sie als "First_unstack" bezeichnet und angezeigt und anzeigt mit "print ()" -Funktion. Dann haben wir die Funktion „instack ()“ auf "grupped_data" unter "(Level = 1)" angewendet und sie "Second_Undack" nannten. Zuletzt haben wir die Funktion "print ()" auf "Second_unstack" angewendet, um sie anzuzeigen.

Jetzt oben in der Ausgangsanzeige können wir feststellen, dass nur der Datenrahmen „Aufzeichnung“ genauso angezeigt wird wie im zweiten Beispiel. Danach können wir sehen, dass zwei Hauptspalten "Sales_R1 in $" und "sales_r2 in $" zusammen mit zwei Unterspalten von "sum", "max" und "sum", "min" zusammen mit den Werten von "30", "max" und "min" angezeigt werden "," 70 "," 20 "," 40 "," 27 "," 34 "," 12 "und" 16 ". Auf der linken Seite enthält es Werte von Spalte "Handys", die "iPhone" und "Samsung" sind, die "iPhone" und "Samsung" sind. Durch die Verwendung der Funktion "GroupBy ()" wurde sie entlang einer Gruppe von zwei gemeinsamen Werten von "iPhone" und "Samsung" zusammengeführt, die wir im Ausgangsdisplay zusammen mit "2" Zeilen und "6" -Spalten "sehen können. Nach der Implementierung der Funktion „instack ()“ auf zwei verschiedenen Ebenen gruppierter Daten werden sie einfach aus dem Stapel entfernt, aber die Daten bleiben aufgrund der Funktion „GroupBy ()“ in der gruppierten Form verbleiben.

Abschluss

In unserem Artikel haben wir zwei Datenrahmen verwendet, um für die Unstapelfunktion zu gelten. In unserem ersten Beispiel haben wir gelernt, wie wir uns auf einmalige Funktionen auf einmal bewerben konnten. Für die beiden anderen Beispiele haben wir dieselben Datenrahmen verwendet. Im zweiten Beispiel haben wir die Funktion „nicht ()“ auf mehreren Ebenen angewendet, während wir im dritten Beispiel die multiple „instack ()“ -Funktion auf verschiedenen Duplet -Ebenen angewendet haben, indem wir das Phänomen von „GroupBy“ verwendeten. Diese Methoden machen es einfacher zu verstehen, ob wir sie während der Arbeit an ihnen anwenden.