Pandas multiindex

Pandas multiindex
Wenn wir über die Open-Source-Bibliotheken von „Python“ sprechen, dann ist „Pandas“ einer von ihnen. Wir verwenden diese Bibliothek, wenn wir die Daten manipulieren und analysieren müssen. Wir können die "Pandas" -Module verwenden, um die verschiedenen Serien oder den Datenrahmen zu erstellen. Manchmal müssen wir die mehreren Spalten als Indexspalten im DataFrame anpassen. "Pandas" bietet eine "Multiindex" -Methode, um mehr als einen Index zu erstellen. Die Methode „MultiIndex“ bietet die Möglichkeit, die mehreren Zeilen oder Spalten als Indizes dieses Datenrahmens auszuwählen. Wir werden in diesem Leitfaden die „Multiindex“ -Methoden kennenlernen und einige Codes durchführen, in denen wir die „MultiIndex“ -Methoden von „Pandas“ verwenden, um mehrere Indizes zu erstellen.

Pandas Multiindex -Methoden

„Pandas“ bietet viele Methoden von „MultiIndex“, die wir verwenden, um mehrere Indizes zu erstellen. Diese sind:

  • MultiIndex.From_frame
  • MultiIndex.From_Product
  • MultiIndex.Von_Arrays
  • MultiIndex.Von_tUples

Jetzt entwickeln wir uns voran und verwenden diese "MultiIndex".

Beispiel 1:

Der erste Code dieses Leitfadens finden Sie hier. Wir haben alle Codes durchgeführt, die wir in diesem Leitfaden im Tool „Spyder“ besprechen werden. Wann immer wir den Code „Pandas“ entwickeln wollen, müssen wir einige "Pandas" -Module importieren. Wir können diese importieren, indem wir einfach das Keyword "Import" verwenden und die "Pandas als PD" schreiben und schreiben ". In diesem Code erhalten wir jetzt die Funktionen von „Pandas“, indem wir „PD“ platzieren. Wir erstellen hier einige Arrays. Das erste Array heißt "Raw_Names" und enthält "Smith, James, Bromley, Peter und Samuel". Das nächste Array heißt "Raw_ages", in dem wir die Werte "10, 11, 15, 12 und 13" speichern, die wir speichern. Das letzte Array, das wir haben, sind die "raw_marks", die die "90, 92, 83, 74 und 88" enthält.

Nachdem wir diese Arrays erstellt haben.Von_Arrays () ”Methode. Wir geben den Namen aller drei Arrays in dieser Methode ein, was bedeutet, dass diese drei Arrays so kombiniert werden, dass die Komponenten aus jedem Array verwendet werden können. In den Namen geben wir die „Namen, Altersgruppen und Markierungen“ vorbei. Jetzt zeigen wir das Ergebnis des genannten Code hier an, indem wir die Funktion „print ()“ verwenden.

Beim Schlagen auf die "Shift+Enter" erhalten wir dieses Ergebnis. Wenn der Code fehlerfrei ist, wird das folgende Ergebnis auf dem Bildschirm wiedergegeben. Es zeigt den MultiIndex hier, den wir in diesem Code erstellt haben:

Beispiel 2:

In diesem Code erstellen wir den Datenrahmen. Wir erstellen hier die Liste "Worker_information". Wir fügen den „Namen“ hinzu, der als Spaltenname angezeigt wird, wenn wir ihn in DataFrame konvertieren und „William, Timmy, James, Alexander und Graham“ einfügen und “einfügen. Die „Arbeit“ enthält „Software -Ingenieur, Softwaretester, Spieler, Verkäufer und Lehrer“. Dann haben wir das „monatliche Abstand“, in dem wir das Gehalt der Arbeiter "1500 US -Dollar, $ 1200, 1100 US -Dollar, $ 1300 und 1500 US -Dollar" einsetzen, und 1500 US -Dollar ". Dann konvertieren wir diese verschachtelte Liste im DataFrame. Wir verwenden die „PD.DataFrame () ”hier dafür.

Dann hilft uns der "print ()" bei der Wiedergabe dieses Datenrahmens. Jetzt haben wir hier eine Variable mit dem Namen "Ergebnis" und verwenden den "MultiIndex".Von_Frame () ”Methode zum Erstellen aller Spalten als Index. Es erstellt mit Hilfe dieser Methode einen MultiIndex dieses gegebenen Datenframe. Danach fügen wir diese Variable in "print ()" hinzu, sodass sie nach der Ausführung rendert.

Hier wird der Datenrahmen zuerst in diesem Ergebnis gesehen und der MultiIndex wird zusammen mit den folgenden Werten angezeigt. Wir erhalten diese Mehrfachindizes mit dem „MultiIndex.Von_Frame () ”Methode.

Beispiel 3:

In diesem Beispiel verwenden wir die "Worker_df" erneut. Dieses Mal fügen wir diesem Datenrahmen eine neue Spalte hinzu, die "w_no" ist. In dieser Spalte fügen wir auch einige Daten hinzu, die "W101, W102, W103, W104 und W105" lautet. Jetzt verwenden wir hier eine andere Methode, um die mehreren Indizes dieses Datenrahmens zu erstellen. Wir verwenden das „DF.set_index ”Methode hier, in der wir die Namen von zwei Spalten einfügen, die" W_NO und Name "sind. Dann fügen wir den "in die Uhr" und "Anhängen" sowohl zu "wahr" als auch dem "Drop" zu "Falsch" hinzu. Es wird also die Spalten nicht fallen lassen.

Diese Spalten erscheinen zweimal im DataFrame. Der Index sowie die Spalte werden hier angezeigt. Anschließend wenden wir die "print ()" auf "Worker_df" an. Der "Worker_df" wird gerendert. Jetzt zeigen wir die Indizes auch getrennt an, indem wir „Worker_df.Index “im" Drucken "nach der Anzeige des aktualisierten Datenrats, in dem wir diese Mehrfachindizes festgelegt haben.

Im ersten DataFrame wird nur der Standardindex angezeigt, und es gibt keine andere Indexspalte in diesem Datenrahmen. Der folgende Datenrahmen zeigt jedoch mehrere Indizes. Sie können leicht die Indizes „W_NO und Name“ sehen, die wir im Code erstellt haben. Diese Indizes zusammen mit den Werten werden am Ende getrennt angezeigt.

Beispiel 4:

Wir erstellen die verschiedenen Arrays in diesem Code erneut. Der „Callum, Tyler, Chloe, Lewis, Hazel, John und Peter“ sind im ersten Array aufgeführt. Der "Patient_Name" wird hier aufgerufen. Das folgende Array, „Patient_age“, enthält die Werte „28, 33, 45, 17, 22, 44 und 29“. Das letzte Array heißt "patient_contact" und enthält die Zahlen "1001234, 1001235, 1001236, 1001237, 1001238, 1001239 und 1001240".

Hier verwenden wir die "MultiIndex" -Methode, die die "MultiIndex" ist.von_arrays () ”Funktion nach dem Erstellen dieser Arrays. Wir geben dann die Namen dieser drei Arrays im „MultiIndex.von _arrays “, um diese Arrays hier als Indizes zu erstellen. Wir fügen auch das „Elternteil, Alter und Kontakt“ in den Namen hinzu. Danach haben wir die "print ()", die uns hilft, die Daten der Variablen „Patienten“ zu rendern, in der wir die Mehrfachindizes speichern, nachdem wir den „MultiIndex“ angewendet haben.Von_Arrays “Methode.

Dieses Ergebnis zeigt alle Indizes, die wir dem Code hinzugefügt haben. Der Name wird auch hier erwähnt. Alle Arrays werden hier als mehrere Indizes mit Hilfe des „MultiIndex“ festgelegt.Von_Arrays () ”Methode.

Beispiel 5:

Hier ist hier der letzte Code dieses Handbuchs, in dem wir den DataFrame generieren und die mehreren Indizes dieses Datenrahmens erstellen. Um den Datenrahmen zu erstellen, müssen wir hier einige Daten hinzufügen. Wir fügen alle Daten in die "XYZ" -Variable hinzu. Wir fügen zuerst den "xyz_name" hinzu, der "John, Michael, Foster, Samuel, Bromley, Smith und Fuller" enthält. Dann haben wir "xyz_codes" und setzen "XYZ23, XYZ24, XYZ25, XYZ26, XYZ27, XYZ28 und XYZ29". Jetzt kommt der „xyz_month“, der „Jan, Februar, März, April, Mai, Juni und Juli“ enthält. Wir fügen dann die "XYZ_Units" hinzu, in denen wir "20, 14, 19, 46, 35, 20 und 53" einstellen.

Jetzt erstellen wir den "xyz_dataframe" und platzieren den "PD".DataFrame () ”-Methode hier, mit der der Datenrahmen der" XYZ "-Daten erstellt wird. Anschließend zeigen wir auch den „xyz_dataframe“ an. Jetzt erstellen wir die mehreren Indizes des Datenrahmens, daher verwenden wir den „MultiIndex.Von_Frame () ”Methode. Dadurch werden die verschiedenen Indizes dieses Datenrahmens erstellt und in der Variablen „XYZ_DATAFRAME1“ gespeichert. Diese Variable wird auch in "print ()" platziert, damit diese Indizes auf dem Terminal angezeigt werden.

Es zeigt den „xyz_dataframe“ an. Dann gibt es die Indizes, die nach Anwendung des „MultiIndex.Von_Frame () ”Methode. Alle Indizes zusammen mit den Werten und Spaltennamen werden in diesem Ergebnis angezeigt.

Abschluss

Dieser Leitfaden ist hier geschrieben, um das Konzept des „MultiIndex“ in „Pandas“ zu klären. Wir haben die verschiedenen Methoden von „MultiIndex“ diskutiert, die „Pandas“ liefert. Wir haben hier auch einige von ihnen ausführlich besprochen. Wir haben diese Methoden hier in den "Pandas" -Codes angewendet und gezeigt, wie die mehreren Indizes in "Pandas" mit Hilfe von "MultiIndex" -Methoden erstellt werden. Wir haben diese Methoden auf Arrays und DataFrame angewendet und alle diese Codes ausführlich erläutert. Wir haben den DataFrame vor dem Erstellen der mehreren Indizes und nach dem Erstellen der Mehrfachindizes mithilfe der MultiIndex -Methode "Pandas" gezeigt. Wir haben die Mehrfachindizes auch in diesen Codes getrennt angezeigt.