Pandas Union

Pandas Union

Die Funktion des Pandas “Index.Union () ”wird verwendet, um den Index in einer Gewerkschaftsordnung wie im festgelegten Kapitel der Mathematik zu erhalten, in dem wir die Gewerkschaftsfunktion verwendeten. Wir können auch die Vereinigung des Index mit der Funktion „concat ()“ ermitteln, die den Datenrahmen kombiniert und die Indexreihenfolge auf eine Sequenzstufe festlegt.

Die Syntax für die concat () -Methode


Die Syntax für den „Index.Gewerkschaftsmethode


Beispiel 1: Die Vereinigung von zwei Datenframe -Indizes unter Verwendung der concat () -Methode

In diesem Beispiel verwenden wir die Funktion „concat ()“, um die Indizes von zwei Datenrahmen zu „Gewerkschaft“. Die Zusammensetzung von zwei Datenrahmen zusammen ist ein unkomplizierter Prozess. Obwohl die „Gewerkschaft“ -Funktion in Pandas einer Gewerkschaft ähnlich ist, beseitigt sie auch Duplikate. Concat und die Drop -Duplikate in Pandas verwenden beide die Gewerkschaft. Diese Gewerkschaftsfunktion arbeitet ähnlich wie die Gewerkschaftsfunktion im Mathematikkapitel „Sets“ und kombiniert alle Zahlen nacheinander. In Pandas wird die wiederholte Zahl jedoch fallen gelassen.

Wir verwenden das Tool „Spyder“, um den Code im ersten Beispiel des Artikels zu implementieren. Der erste Schritt in jedem Python -Pandas -Code besteht darin, die Panda -Bibliothek als „PD“ zu importieren.


Wir werden jetzt einen Datenrahmen generieren. Um die Datenrahmen zu verkettet und Union auf ihre Indizes anzuwenden, werden zwei Datenrahmen erstellt. Der erste Datenrahmen, den wir haben, heißt "Tabelle 1". Es enthält zwei Spalten, die „Kurse“ und „Gebühren“, jeweils enthält einige Werte darin enthalten. In der ersten Spalte listen wir die Namen einiger Programmierkurse auf, darunter "OOP", "Python", "Java" und "Android Studio". Wir haben die Kursgebühren in der zweiten Spalte "Fee" erwähnt, und sie sind "30000", "35000", "32000" und "25000". Um unser erstes DataFrame "Tabelle1" zu generieren, verwenden wir jetzt "PD".DataFrame “, wie Sie im folgenden Bild sehen können:


Die Erstellung des zweiten Datenrahmens „Tabelle 2“ ist die folgende Phase. Die Spaltennamen in diesem Datenrahmen sind die gleichen wie im vorherigen Datenrahmen, aber ihre Werte unterscheiden sich. Wir haben "Grafikdesign", "Php", "SQL" und "Swift" in der Spalte "Kurse", und wir haben "34000", "32000", "22000" und "24000" in der "Gebühr" Spalte. Für die Erzeugung des zweiten Datenframees, Tabelle 2, verwenden wir wieder „PD“.DataFrame ”wie demonstriert.


In diesem Abschnitt werden wir nun die Hauptfunktion unserer Beispiele implementieren, die zwei Datenrahmen mit der Funktion „concat ()“ kombiniert und die Funktion „Gewerkschaft“ auf ihre Indizes anwendet. Die Methode „concat ()“ verkettet Pandas -Elemente über eine bestimmte Achse mit optionaler Set -Logik, die zusammen mit den anderen Achsen Schnittstellen oder Vereinigung sein kann. Hier haben wir „PD verwendet.concat (Tabelle1, Tabelle2) ”, um den Datenrahmen zu kombinieren. Wir haben auch den Parameter „ignor_index = true“ übergeben, weil wir nicht möchten, dass der Index wiederholt wird. Stattdessen möchten wir, dass der Index bei der Kombination der Datenrahmen in zusätzlicher Form in zusätzlicher Form ist. Schließlich haben wir das Ergebnis in der Gewerkschaftsvariable gespeichert und mit der Funktion „print ()“ gedruckt. Infolgedessen wird die Methode „Concat ()“ den Index im Wesentlichen verwenden, um die Vereinigung des Datenrahmens zu ermitteln.


Wenden wir uns der Ausgabe zu, die im folgenden Bild angezeigt wird. Wie wir sehen können, hat die Kombination unserer Datenrahmen erfolgreich mit der Funktion „concat ()“ gearbeitet. Die beiden Spalten, „Kurse“ und „Gebühren“, werden angezeigt. Da unser Index nicht wiederholt wird, wird er im Schaum der Union angezeigt, wie man zu sehen ist, da wir den Parameter der Funktion „concat ()“ übergeben haben, die "ignore_index = true" ist. Die Indexgröße, die wir derzeit haben, lautet "8", was bedeutet, dass es einen Bereich von "0 bis 7" umfasst.

Beispiel 2: Kombinieren des Index mit dem Index.Union () Methode

Dies ist ein einfaches und kompaktes Beispiel. Vor dem Zusammenführen der beiden Indizes in diesem Beispiel haben wir den „Index.Union () ”Methode. Wie immer müssen wir die Bibliothek des Pandas als „PD“ importieren, bevor wir diesen Code ausführen. In diesem Beispiel erstellen wir einfach einen Index anstelle eines Datenrahmens. Um den anfänglichen "Index1" zu erstellen, haben wir "PD" verwendet.Index “mit den Zahlen" 4 "," 5 "," 6 "und" 7 ", und wir verfolgten dem gleichen Verfahren wie Sie für den" Index2 "sehen können. Die "Index2" -Werte sind "8", "9", "10" und "11".


Wie Sie sehen können, verwenden wir derzeit „Index1.Union (Index2) ”. Es wird eine Gewerkschaftsbestellung erstellen, indem beide Indizes kombiniert werden. Als nächstes verwenden wir die Methode "print ()", um das generierte Ergebnis anzuzeigen.


Das Ausgabeergebnis zeigt, dass der kombinierte Index auf Nummer vier beginnt und mit elf Jahren endet. Diesmal wird eine einzelne Zeile des Index angezeigt. Es zeigt auch an, dass sein Datentyp "int64" ist.

Beispiel 3: Eine Vereinigung von drei DataFrame -Indizes unter Verwendung der concat () -Methode

Dieses Beispiel ähnelt dem ersten Beispiel, aber dieses kombiniert drei Datenrahmen und bestellt ihre Indizes nacheinander. Im Allgemeinen gibt der Index von Python den Speicherort des bereitgestellten Elements in einer Liste oder den Zeichen in einer Zeichenfolge zurück. Index definiert im Wesentlichen die Position des Elements, um es einfach auszudrücken.

Wir müssen die Pandas -Bibliothek als „PD“ importieren, bevor wir den Code für dieses Beispiel schreiben können. In diesem Szenario sollten drei Datenrahmen erstellt werden. Der erste Datenrahmen, den wir haben, heißt "Data1" und hat drei Spalten "Student_Name", "Marks" und "Bemerkungen". Zu diesen Spalten wurden einige Werte hinzugefügt. Wir haben in der ersten Kolumne "student_name" und in der zweiten Spalte "Marks" "Noah", "Emma", "Enna" und "George" eine Liste der Marken "450", "490", und in der zweiten Spalte "490 "," 482 "und" 209 "und die letzte Spalte enthält die" Bemerkungen "des Schülers entweder einen" Pass "oder einen" Fehler ". Jetzt erstellen wir diesen Datenrahmen, wie sie mit „PD“ angezeigt werden.DataFrame ”.


Es ist Zeit, einen zweiten Datenrahmen mit drei Spalten zu konstruieren, die mit dem ersten identisch sind, die Werte der Spalten werden jedoch geändert. Der DataFrame heißt "Data2". Wir haben drei Spalten "Student_Name", "Marks" und "Bemerkungen". In der ersten Kolumne "Student_Name" haben wir "Watson", "Henry", "James" und "Oliver" die Werte in der zweiten Spalte "Marks", wir haben "499", "390", "290 "Und" 400 "und in der letzten Spalte haben wir die Bemerkungen" Pass "oder" Fail ". Dieser Datenrahmen „Data2“ ist abgeschlossen, sodass wir die gleiche „PD“ verwenden.DataFrame “, um dies zu produzieren.


Es ist Zeit, den dritten DataFrame "Data3" zu erstellen, der drei Spalten mit den gleichen Namen wie der letzte Datenrahmen enthält, jedoch mit unterschiedlichen Werten. Die Werte, die wir in der ersten Kolumne haben, sind "Archie", "Ethan", "Michael" und "Samuel". Wir haben in der zweiten Spalte "230", "498", "290" und "403", und in der dritten haben wir "scheitern", "Pass", "Fail" und "Pass". Um den dritten DataFrame "Data3" zu generieren, verwenden wir erneut "PD".DataFrame ”.


Hier kombinieren wir unsere drei Datenrahmen und weisen ihren Indizes eine Sequenzgewerkschaft mit der Funktion „concat ()“ mit ihrem Parameter zu. Hier verwenden wir „PD.concat (df1, df2, df3) ”wird verwendet, um die Datenrahmen zu kombinieren, die die" Data1 "," Data2 "und" Data3 "sind. Wie Sie sehen können, haben wir auch "ignore_index = true" verwendet, der den wiederholten Index weglassen und ihnen einen neuen Index liefern, der korrekt und in der richtigen Reihenfolge ist, weil wir eine Gewerkschaftsreihenfolge für unseren Index wünschen. Legen Sie die Option "Ignore_index = true" fest, um die Verkettung zu unterweisen, derzeit verwendete Indizes zu ignorieren. Anschließend wird der Index ab '0' festgelegt, um die Ergebnisse fortzusetzen. Um das von dieser Funktion erzeugte Ergebnis zu speichern, initialisieren wir die Variable „Union“. Danach rufen wir die Funktion „print ()“ auf, um den Inhalt anzuzeigen, der in dieser „Vereinigung“ gespeichert ist:


Die Datenrahmen werden kombiniert und als einzelner Datenrahmen in der Ausgabe angezeigt, wie es zu sehen ist. Die drei Datenrahmen werden unter Verwendung der Funktion „concat ()“ und der Vereinigung ihrer Indizes unter Verwendung des Parameters „Ignore_index = true“ kombiniert. Aufgrund der gleichen Anzahl von Spalten und den gleichen Namen von Spalten in jedem dieser drei Datenrahmen wurden im Ergebnis keine zusätzlichen Spalten angezeigt. Die "Student_Name", "Marks" und "Bemerkungen" sind die drei Spalten, die nach der Verkettung angezeigt werden. Die Gewerkschaftsrepräsentation des Index ist sichtbar. Es beginnt mit „0“ und endet mit „11“, was darauf hinweist, dass die Indexgröße „12“ ist.

Abschluss

In diesem Artikel haben wir den Datenrahmen zusammengetan, um den Unionsindex durch die Verwendung der Funktion „concat ()“ zu erhalten. Wir verwenden zusätzlich den Parameter der Concat -Funktion "ignor_index = true", da wir den wiederholten Index nicht wollen. Im zweiten Beispiel des Artikels, der kurz und einfach ist, haben wir den „Index verwendet.Union () ”Funktion zum Kombinieren der Indizes und zur Anzeige des Datentyps des Index. Wir glauben, dass diese Methoden Ihre Aufgabe vereinfachen werden.