Pandas beitreten gegen VS Merge

Pandas beitreten gegen VS Merge

"Pandas" ist ein Hochleistungswerkzeug für die Python-Umgebung. Es ist ein "offener" Quellcode für die Analyse von Daten. Die Pandas -Join und die Pandas -Merge -Methode werden zum Verbinden der beiden Datenrahmen zusammen in einen einzelnen Datenrahmen verwendet. In beiden Methoden von Pandas besteht der Unterschied darin, dass die PANDAS -Funktion „Join“ mit einem Index mit dem DataFrame verbunden ist. Während die Pandas -Funktion „Merge“ den Datenrahmen mit dem Index und der Spaltenmethode verwendet, in der wir die gewünschte Spalte selbst auswählen können. Die Zusammenführungsmethode von Pandas wird hauptsächlich im Vergleich zur Join -Methode von Pandas verwendet. Die Software, die wir für die Implementierung verwenden werden.

Syntax der Pandas Join () -Methode

„DF1.Join (df2) ”

Die "DF" in der obigen Syntax ist die Abkürzung des "DataFrame". In der Syntax befinden sich zwei Datenrahmen mit der Funktion „DOT -Join“, die zum Aufrufen der Methode dient. Es ist die Pandas -Methode, um zwei Datenrahmen zu verbinden. Es funktioniert mit dem Index, um die Datenrahmen in einem einzigen zu kombinieren.

Syntax der Pandas merge () -Methode

„DF1.merge (df2, auf = 'column_name') ”

Die Pandas Merge -Methodensyntax hat zwei Datenrahmen als "DF1" und "DF2". Die Funktion „DOT Merge“ fordert die Methode zum Verbinden beider Datenrahmen mit dem Erscheinen von invertierten Spalten auf.

Wir werden die folgenden Möglichkeiten abdecken, zwei Datenrahmen zu kombinieren, um die Methoden von Panda Merge zu verwenden, und Pandas Join:

  • Die Pandas -Join -Methode überlappen sich.
  • Pandas beitragen der Methode mit einem Index -Reset mit einem Index -Reset.
  • Pandas merge -Methode (Spalte „links und rechts“).
  • Pandas verschmelzen die Methode explizit.

Erstellen der Datenrahmen für die Implementierung der Pandas Merge- und Pandas -Join -Methode

Zunächst müssen wir einen Datenrahmen erstellen. Dafür werden wir das Tool "Spyder" verwenden. Nach dem Öffnen beginnen Sie den Code zu schreiben. Importieren Sie Pandas als „PD“ für die Pandas Library Association. Wir haben die DataFrame -Variablen als "x", "y", "p" und "q entsprechend und" A "mit Werten" 1 "und" B ", wobei der als" 2 "zugewiesene Wert zugewiesen wurde.

Die Ausgabe ist ein „DF“, das mit den zugewiesenen Werten erstellt wurde. Wir können es so groß machen wie die Daten.

Erstellen eines weiteren Datenrahmens

Wir müssen einen weiteren Datenrahmen erstellen, um die Methoden von Pandas zu verstehen, die sich zusammenschließen und Pandas klar verschmelzen. Hier haben wir "DF" genauso erstellt wie die obigen "DF", nur die Werte sind Variablen zugewiesen. Wir haben "H", "J", "S" und "D", während Werte "B" mit dem Wert "8" und "y" mit dem Wert "3" zugewiesen werden.

Die Ausgabe zeigt eine einfache „DF“ erstellt.

Beispiel # 01: Pandas -Join -Methode (überlappend)

Jetzt werden wir sehen, wie Sie zwei Datenrahmen mit der Pandas -Join -Methode beitreten können. Für diese Methode können wir die Spalte Ihrer Wahl auswählen, an der wir aus dem DataFrame arbeiten möchten. Wir haben das Beispiel mit der überlappenden Spalte „links“ aus dem „DF“ genommen, damit wir dies mit dem „Suffix“ beheben können, um die Überlappung von Daten zu überwinden. Hier sind die verwendeten Variablen "X", "Z", "V", "D". "P", "O", "L" und "Y" mit den als "3", "6", "7" zugewiesenen Werten und "9". Der ".Join ”ruft die Methode auf, wobei der Ausrichtung auf links mit dem rechten„ DF “-Suffix eingestellt ist. ”. Das im Code verwendete „Suffix“ liegt daran, dass im DataFrame zwei Spalten mit demselben Namen „Schlüssel“ enthalten sind und die Daten nicht überlappen werden.

Die Ausgabe zeigt keine überlappenden Daten mit der Methode zum Verbinden von zwei „DF“ mit der Pandas -Join -Methode.

Beispiel Nr. 02: Pandas -Join -Methode mit einem Index -Reset

In diesem Beispiel werden wir die Spalte separat mit dem Parameter „On“ als „Schlüssel“ in der Methode Join angeben, die beim Verbinden der beiden Datenrahmen hilft. Das kombinierte Ding wird mit diesem Parameter gemacht. Auch der Index eines der beiden „DF“ sollte ähnlich sein wie bei ihnen. Ähnliche Arten von Daten oder Daten, die für denselben Zweck verwendet werden, können zusammen zur Verarbeitung zusammen sein. Dadurch wird der Index noch verwendet, und verwendet von rechts. Die Variablen sind die "S", "T", "U", "V", "N", 'W "," K "und" Q ". Die zugewiesenen Werte sind "3", "6", "7" und "9". Der "Reset DOT -Index" ist eine Methode von Pandas, um den Index des "DF" zurückzusetzen. Der Reset -Index legt alle Ganzzahlen Ihrer Datenrahmenliste von 0 fest, bis die Datenframedaten verlängert sind.

Hier ist die Ausgabe, die mit der Index „Key -Join“ -Methode von Pandas angezeigt wird.

Beispiel # 03: Pandas Merge -Methode (Spalte „links und rechts“)

Die Merge -Methode führt einen ähnlichen Betrieb wie die Pandas -Join -Methode durch. Beide Methoden dienen zum Kombinieren von Daten zu einem ähnlichen Datenrahmen. Die Zusammenführungsmethode ist vielseitiger, um den Schlüssel anzugeben. Wir können es auch in den linken und rechten Spalten angeben, abhängig von der Arbeit Ihres Datenrahmens. Die Variablen im Code sind "S", "D", "G", "F", "K", "J", "B" und "Q". Die zugewiesenen Werte sind "9", "5", "6" und "7". Die äußere "Join" -Implementierung erfolgt sowohl für "DF" mit dem Parameter "Wie" der Pandas Merge -Methode -Funktion.

Die Ausgabe, die wir sehen, zeigt die fusionierten Daten der beiden Datenrahmen an. Die „Nan“ repräsentiert „nicht eine Zahl“, was bedeutet, dass in den Daten, die die „Nan“ dort zeigt.

Beispiel # 04: Die Zusammenführungsmethode explizit

Hier ist in diesem Beispiel die Merge -Methode die Zerstörung des Index und der Indexwert wird nicht auf dem Datenrahmen angenommen. Wir werden diese Methode gemäß den Arbeiten ausführen. Es wird die Daten basierend auf einem linken Index oder rechten Index mit dem Parameter verschmelzen. Die Variablen in diesem Datenrahmen sind "T", "R", "I", "U", "H", "O", "E" und "E". Die zugewiesenen Werte sind "2", "4", "6" und "4". Das obige Beispiel für die Pandas -Merge -Methode mit der Spaltenauswahl entsprechend dem Bedarf ist die präsentierbare und wertvolle Methode, um die beiden Datenrahmen zu verbinden. Überprüfen Sie am Ende der Codezeile über den Zusammenführungsschlüssel im Datensatz eindeutig.

In der folgenden Ausgabe wird der Index ohne den Index nicht angezeigt, aber die Funktion wird basierend auf dem rechten und linken Index durchgeführt.

Abschluss

Die Methoden merge () und die join () sind beide Methoden, die sehr bequem und effektiv sind. Beide Funktionen werden zum Verbinden des beiden separaten Datenrahmens für denselben Datenrahmen verwendet, haben jedoch je nach Fall unterschiedliche Verwendung. In diesem Artikel haben wir die wichtigsten Unterschiede zwischen der Pandas -Join- und Merge -Methode gelernt. Nachdem wir die Beispiele durchgeführt und die Pandas -Join -Methode verstanden haben, werden wir sie mit dem Wissen schließen, dass es vorzuziehen ist, mit der Pandas -Merge -Methode zu gehen, wenn wir flexiblere und Datenbankstil -Stymes wollen. Wenn wir dagegen den DataFrame, der sich ausgiebig mit dem Index kombinieren möchten.