Die beliebteste Python -Bibliothek, die in Data Science verwendet wird, heißt Pandas. Es bietet Python-Programmierern Hochleistungs-, benutzerfreundliche und Datenanalyse-Tools. Sobald Sie die grundlegenden Funktionen verstanden und wie man sie nutzt. In „Pandas“ sind die Standardmethoden zum Speichern von Daten in tabellarischer Form die Datenrahmen. Wir können einige „Pandas“ -Methoden verwenden, um die eindeutigen Werte in der Spalte "Pandas" DataFrame zu erhalten. Wenn wir eindeutige Werte in den Spalten des DataFrame erhalten müssen und keine Doppelarbeit in der Spalte „Pandas“ DataFrame -Spalte doppelt. Schauen wir uns solche Methoden in diesem Handbuch zusammen mit einigen Beispielen und Ausgaben an, um eindeutige Werte in der Spalte "Pandas" des DataFrame zu erhalten.
Methoden zum Erhalten eindeutiger Werte in "Pandas" -Datenframe -Spalten
Wir können zwei Methoden verwenden, um die eindeutigen Werte in den Spalten des DataFrame von „Pandas“ zu erhalten. Wir lassen die doppelten Werte fallen und erhalten nur die eindeutigen Werte in den Spalten von Datenrahmen. Die Methoden, die „Pandas“ für diese Aufgabe liefern, sind:
Jetzt werden wir beide Methoden in den "Pandas" -Codes verwenden.
Beispiel # 01
Die "Spyder" -App wird hier verwendet, um diese "Pandas" -Codes zu generieren, um die Methoden zu verwenden, die uns helfen. Wir müssen die "Pandas" -Module importieren, die für den "Pandas" -Coder erforderlich sind, bevor wir den Datenrahmen erstellen. Durch die Verwendung des Begriffs „importieren“ und „Pandas als PD“ importieren wir diese Module.
Mit Hilfe von „PD“ können wir nun die „Pandas“ -Funktionen oder -Methoden schnell erhalten. Wir setzen dann die "Betreff_Data" ein, in der wir "Name" hinzufügen, und im "Namen" fügen wir die Daten des Namens hinzu, die "Roman, William, Peter, Smith, John, Milli, Thomas und James" sind. Anschließend fügen wir die Subjektdaten im „SubJ“ hinzu, die „Mathematik, Wirtschaft, Naturwissenschaften, Mathematik, Statistik, Statistik, Statistik und Computer“ sind. Anschließend konvertieren wir diesen "Subjekt_Data" in den Datenrahmen "Subjekt_DF", indem wir die PD verwenden.DataFrame () ”Methode. Wir platzieren "Subjekt_DF" in die Methode "print ()", damit sie auf dem Terminal angezeigt wird.
Jetzt möchten wir die eindeutigen Werte in der Spalte "SubJ" von "Pandas" DataFrame "erhalten". Zu diesem Zweck verwenden wir hier die Methode „Unique ()“ und fügen den Namen der Spalte und auch den Namen des Datenrahmens hinzu, wie unten gezeigt. Wir fügen diese Methode in "print ()" hinzu, sodass das Ergebnis auch auf dem Terminal angezeigt wird.
Jetzt drücken wir die „Shift+Enter“, um das Ergebnis dieses Code zu erhalten, und er wird auch auf dem Terminal verteilt und wird auch hier angezeigt, das den Datenrahmen mit allen Werten enthält. Dies ist der ursprüngliche Datenrahmen, den wir im Code hinzugefügt haben, und darunter zeigt die eindeutigen Werte der Spalte „SubJ“. Es löst die doppelten Werte ab und zeigt die eindeutigen Werte der Spalte „SubJ“ des Datenrahmens an.
Beispiel # 02
Wir erstellen die "sample_list", die einige Informationen enthält. Wir fügen „Layla, 21, 28, 31, 14 und 39“ ein, die als erste Spalte angezeigt werden, wenn wir diese Liste in den Datenrahmen umwandeln. Dann fügen wir "lusy, 31, 25, 34, 26 und 21" als zweite Zeile des Datenframe hinzu. Danach haben wir "Peter, 38, 20, 20, 35 und 24" und "Layla 38, 23, 39 24, 23", die die dritten und vierten Zeilen des Datenframees sein werden. Wir fügen auch drei weitere Daten ein, die "Stella, 21, 24, 24, 28, 31", "Layla, 33, 32, 26, 30, 25" sowie "Peter, 21, 21, 31, 21, 29" sind.
Jetzt konvertieren wir die "sample_list" in das "df_sample", das hier der Name des Datenrahmens ist, indem wir den "PD" einstellen.DataFrame () ”-Funktion. Außerdem setzen wir den Namen der Spalten dieses Datenrahmens und diese Namen sind "Name, Ass_1, Ass_2, Ass_3, Ass_4 und Ass_5". Anschließend verwenden wir den "print ()", der beim Anzeigen des DataFrame "DF_Sample" hilft,. Jetzt verwenden wir in diesem Beispiel eine andere Methode, um die eindeutigen Werte in der Spalte des DataFrame zu erhalten. Diese Methode ist die Methode "Drop_duplicates ()" von "Pandas".
In der Methode „Drop_duplicates ()“ setzen wir den Namen der Spalte, in der wir die eindeutigen Werte in der Spalte des DataFrame erhalten möchten. Wir erhalten eindeutige Werte der Spalte „Name“, indem wir die doppelten Werte in dieser Spalte mit Hilfe der Methode „Drop_duplicates ()“ fallen lassen und diese eindeutigen Werte auch mit der Funktion „print ()“ hier rendern.
Die doppelten Namen werden fallen gelassen und eindeutige Werte werden nach Anwendung der Methode „Drop_duplicates ()“ gerendert. Sie können beachten, dass der Name "Layla" in drei Zellen der Spalte "Name" angezeigt wird. Wenn jedoch die Methode „Drop_duplicates ()“ auf diese Spalte angewendet wird, werden alle doppelten Werte fallen gelassen und ein "Layla" -Name ist auf dem Bildschirm angezeigt. Nachdem die doppelten Werte fallen gelassen wurden, erschien der neue Datenrahmen, der die eindeutigen Werte in dieser Spalte „Name“ enthält. Auf diese Weise können wir die doppelten Werte fallen lassen und den eindeutigen Wert in der Spalte des DataFrame mit Hilfe der Methode „Drop_duplicates ()“ erhalten.
Beispiel # 03
Der gleiche Datenrahmen wird erneut verwendet, und jetzt wenden wir hier die Methode „Unique ()“ an. Mit der Methode "eindeutig ()" platzieren wir den Namen der Spalte sowie den Namen des DataFrame, auf den wir diese "eindeutige ()" -Methode anwenden möchten, um die eindeutigen Werte zu erhalten. Dadurch wird nur die eindeutigen Werte dieser Spalte gerendert und zeigt diese Werte nicht in Form von DataFrame an.
Hier enthält der DataFrame sieben Werte in der Spalte „Name“. Es macht keine doppelten Werte.
Beispiel # 04
Der Datenrahmen, den wir in diesem Beispiel erstellen, ist das "F_G_DF". Wir fügen "my_fruits" und "my_vegs" in diesen Datenrahmen ein. Die Spalte "my_fruits" enthält "Apple, Orange, Apple, Birne, Litschi, Apple, Apple, Birne und Apple". Als nächstes haben wir die "my_vegs", die die Namen des Gemüses enthält, die "Chili, Bringle, Karotten, Kartoffeln, Kartoffeln, Karotten, Zwiebeln, Knoblauch und Ingwer" sind. Dieser Datenrahmen enthält nur zwei Spalten.
Jetzt erhalten wir die eindeutigen Werte in beiden Spalten mit Hilfe der Methode „Unique ()“. Wir erwähnen den Namen des Datenrahmens. Geben Sie dann den Spaltennamen der Spalte Erstes an. Danach verwenden wir die append () -Methode. In dieser Anhänge platzieren wir erneut den Namen des DataFrame und den zweiten Spaltennamen und platzieren die Methode "eindeutig ()". Dadurch wird die eindeutigen Werte beider Spalten erhalten und dann die eindeutigen Werte beider Spalten angehängt und auf dem Bildschirm angezeigt.
Der Datenrahmen wird zuerst mit allen Werten wiedergegeben. Danach wird die Methode „Unique ()“ angewendet und die eindeutigen Werte beider Spalten werden unten gerendert. In diesem Code erhalten wir die eindeutigen Werte in den mehreren Spalten des Datenrahmens, indem wir die Methode "eindeutig ()" verwenden.
Abschluss
Die vollständige Erläuterung des Erhaltens der eindeutigen Werte in der Spalte des DataFrame finden Sie in diesem Handbuch. Wir haben die Methoden „Unique ()“ und „Drop_duplicates ()“ diskutiert, die uns dabei helfen. Wir haben untersucht, wie diese Methoden im Code „Pandas“ verwendet werden, indem wir diese Methoden hier in unseren Codes verwenden. Wir haben verschiedene Beispiele in diesem Handbuch veranschaulicht und Ihnen gezeigt. Wir haben auch untersucht.