Pandas schließen zwei Datenrahmen bei

Pandas schließen zwei Datenrahmen bei

„Pandas ist eines der Pakete der Python -Sprache, die die Datenanalyse einfacher und flexibel machen und besser verarbeiten und besser verarbeiten können. Im wirklichen Leben stehen wir oft vor der Situation, in der wir unsere Arbeit in mehreren verschiedenen Dateien durchgeführt haben, und müssen manchmal alle Daten in einem „Datenrahmen“ zusammen sehen, um Daten zu analysieren, anstatt die Daten an verschiedenen Orten zu haben. Pandas bieten uns also dies, indem wir uns ermöglichen. Es gibt verschiedene Möglichkeiten, diese Methode auszuführen. Wir werden die „Join“ -Methode von Pandas auf alle möglichen Arten implementieren. Die join () -Methode wird in erster Linie verwendet und verbindet die Datenrahmen basierend auf "Index". Wir werden das Tool „Spyder“ für die Implementierung der Codes verwenden. Es handelt sich um eine pythonorientierte Software, die uns Vorteile für die Codeimplementierung der Pandas-Join-Methode bietet ().”

Syntax

„DataFrame. verbinden"

Die obige Syntax wird zum gemeinsamen Verbinden der beiden Datenrahmen verwendet. Es funktioniert immer, indem es den anderen Index für den Verbindungszweck verwendet. Der Datenrahmen kann als "DF" geschrieben werden. Der "Dot -Join" ist für den Methode -Aufruf geeignet. Da es den Index verwendet, aber im realen keine Schäden oder Änderungen erfolgen. Der reale Datenindex ist als Original erhalten.

Parameter

Später werden wir einen Parameter als "andere" Datenrahmen verwenden. Das hilft dabei, gemeinsam den beiden Datenrahmen zusammenzuschließen. Das kombinierte Ding wird mit diesem Parameter gemacht. Auch der Index eines der beiden „DF“ sollte ähnlich sein wie bei ihnen. Das bedeutet, dass ähnliche Arten von Daten oder Daten, die für denselben Zweck verwendet werden, zusammen zur Verarbeitung zusammen sein können.

Im Folgenden finden Sie die verschiedenen Möglichkeiten, wie wir die Beispiele für die Implementierung der join () -Methode in einer „DF“ durchführen werden.

  • Panda -Join -Methode unter Verwendung der Indizes.
  • Panda -Join -Methode mit (Schlüssel-) Spalten.
  • Die Panda -Join -Methode bewahrt den ursprünglichen DataFrame -Index.
  • Panda-Join-Methode unter Verwendung von Nicht-Unique (Schlüssel).

Erstellen des Datenrahmens für die Methodenimplementierung von Join ()

Zuerst müssen wir die Pandas -Bibliothek als „PD“ importieren, dann werden wir den Datenrahmen erstellen, der aus zwei Spalten besteht, eines ist der „Schlüssel“ als „T0“, „T1“, „T2“, „T3 "," T4 "und" T5 "und der andere haben" n "Werte als" n0 "," n1 "," n2 "," n3 "," n4 "und" n5 ". Das "DF" repräsentiert den Datenrahmen im Code.

Die Ausgabe zeigt die im DataFrame eingegebenen Daten. Wir können sehen, dass die Spalten „Schlüssel“ und „N“ gedruckt werden.

Erstellen eines weiteren Datenrahmens für die Panda Join () -Methode

Wir erstellen einen weiteren Datenrahmen, da wir die DataFrames getrennt haben, und dann werden wir sie mit der Pandas Join () -Methode kombinieren. Der Datenrahmen besteht aus zwei Spalten; Während wir die letzte "DF" erstellen, hat die Spalte "Schlüssel" Werte als "T0", "T1", "T2" und "T3"; Andererseits hat die andere Spalte die Werte von „M“ als „M0“, „M1“, „M2“, „M3“.

Hier ist die Ausgabe, in der die einfache Datenframeerstellung gemäß dem Code angezeigt wird.

Sie können sehen, dass es zwei Datenrahmen gibt, und wir möchten beide zusammen im selben Datenrahmen haben. Wir werden jetzt die Beispiele tun.

Beispiel # 01: Panda Join () Methode mit den Indizes

Öffnen Sie das "Spyder" -Tool. Wenn wir uns nun den beiden Datenrahmen zusammenschließen, sollten wir zuerst die beiden Datenrahmen erstellen, um sie beizutreten. Hier bestehen die Datenrahmen aus den Variablen „x“ und „y“ mit Werten, die als „x“ mit „x0“, „x1“, „x2“, „x3“, „x4“ und „x5“ zugewiesen sind, während „y“ „y“ zugewiesen wird hat weniger Werte, die "y0", "y1", "y2" und "y3" sind. Die "Schlüssel" -Werte stammen von "K0" bis "K5" und in anderen "DF" -Werten "Schlüssel" von "K0" bis "K2" stammen von "K0". Dann kombiniert der Datenrahmen mit dem Aufruf „Dot -Join“ die beiden "DF". Das im Code verwendete „Suffix“ liegt daran, dass es im Datenrahmen zwei Spalten gibt, die denselben Namen haben, i.e., "Taste". Das überlappt die Daten nicht.

Die Ausgabe zeigt die beiden „DF“ in einem an. Wie wir sehen können, dass es einige Werte als „Nan“ gibt, was bedeutet, dass es „nicht eine Zahl“ ist. Der "df", hat mehr Werte als die zweite "DF", so dass es keinen Wert zugewiesen hat. Es zeigt sich als "Nan" an.

Beispiel # 02: Panda -Join -Methode mit (Schlüssel-) Spalten

Wie wir jetzt wissen, wie Sie zwei Datenrahmen zusammen mitmachen. Die Schlüsselspaltenmethode stellt die Daten als Spalten bezüglich ihres Index an. Hier besteht der Datenrahmen aus den Variablen "n" und "w". Das „N“ hat Werte als „n0“, „n1“, „n2“, „n3“, „n4“ und „n5“. Während „W“ die Werte „W0“, „W1“ und „W2“ hat. Der df mit “.Set index ”zeigt mit der„ Schlüssel “und mit der Aufruf -Join -Methode als“.Join ”, wobei der andere„ DF “-Index angehängt ist. Diese Join -Methode kombiniert beide „DF“ mit ihrem Index. Dies ist eine sehr effizient.

Die Ausgabe unter Verwendung der Spaltenmethode der Index join () von Pandas zeigt die Spalten mit Schlüsselwerten und die Variablen „N“ und „W“ an.

Beispiel # 03: Panda -Join -Methode, die den Originaldatenframe -Index beibehält

In diesem Beispiel werden wir sehen und beweisen, was wir oben geschrieben haben, dass die Daten in ihrem ursprünglichen Zustand erhalten bleiben. Hier haben die Datenrahmen die Variablen "P" und "W". Das "P" mit den Werten "p0", "p1", "p2", "p3", "p4" und "p5". "W" mit den Werten "Q0", "Q1" und "Q2". Der ".Die Implementierung "Implementieren" im "DF" ist mit dem "Index" (Schlüssel) festgelegt (Schlüssel). Diese Methode zeigt die gehaltenen Daten mit dem Index „Die Originaldaten“ an.

Die Anzeige repräsentiert die realen Daten, ohne dass die Originalität genommen wird.

Beispiel Nr. 04: Panda-Join-Methode mit Nicht-Gewerbe (Schlüssel)

Jetzt werden wir ein Beispiel geben, um eine einzigartige Methode zu verstehen. Im vorherigen Beispiel haben wir gelernt, wie die Originaldaten aufbewahrt werden. Dies geschah, indem die beiden auf dem Code verfügbaren Datenrahmen angezeigt werden. Wir werden nun dasselbe tun, um den ursprünglichen Zustand zu überprüfen und auch der Methode mit dem anderen „DF“ beizutreten, der nicht da ist. Das "DF" hier hat "P" und den "Schlüssel". "P" hat die Werte von "p0" bis "p5" kontinuierlich und die "Schlüssel" -Werte von "K0" bis "K5". Die Anrufe „Dot -Join“ -Methode erfolgt mit dem anderen "Set -Index", der "Schlüssel" induziert, der "Schlüssel" induziert wird.

Die Ausgabe ähnelt der Ausgabe des letzten Beispiels. Die Daten werden aus den originellen Daten aufgehaltenen Daten erfasst.

Abschluss

Die Methode von Pandas, die zwei Datenrahmen verbinden, ist effizient und bequem. Diese Methode verwendet die “.Verbinden Sie die Funktion, um die Daten zu bedienen und die Datenrahmen zusammenzuschließen. Diese Methode ist eine großartige Möglichkeit, die Daten zu präsentieren, insbesondere wenn wir an einer großen Datenmenge im Verzeichnis überall dort arbeiten, wo die Datenanalyse durchgeführt wird. Wir haben diskutiert, wie die Panda -Join -Methode für ein besseres Verständnis der Funktion implementiert werden kann. Wir haben den "Index" -Sty, "Spalten" -Sty und den "Schlüssel" -Heweg gemacht, um die beiden verschiedenen Datenrahmen in einen einzelnen zu bringen.