Pandas nicht in

Pandas nicht in
Die "Pandas" ist die Bibliothek von "Python". Wir können einen Datenrahmen in "Pandas" erstellen. Nachdem wir einen Datenrahmen in „Pandas“ erstellt haben, wenden wir einige Funktionen auf diesen Datenrahmen für die Arbeit an, die wir tun möchten. Wir können auch einige Daten im DataFrame überprüfen, ob die Daten im Datenrahmen vorhanden sind oder nicht. Um die Daten in einem Datenrahmen zu überprüfen, können wir den Filter "nicht in" in "Pandas" verwenden, um den Filter "nicht in" zu verwenden, in "Pandas". Dies wird überprüft, ob bestimmte Daten im Datenrahmen, die wir im Code erwähnt haben, und das Ergebnis zurückgeben. In diesem Handbuch werden wir besprechen, wie Sie den Filter „Nicht in“ nicht in einer einzelnen Spalte anwenden können, sowie in mehreren Spalten im Datenrahmen „Pandas“. Wir wechseln nun zu den Codes von „Pandas“, in denen wir einige Werte in verschiedenen Spalten des Datenrahmens überprüfen werden.

Beispiel # 01:

Das "Spyder" -Tool wird verwendet, um jedes Codeskript zu schreiben, das wir in diesem Handbuch diskutieren werden. Jedes Mal, wenn wir neuen „Pandas“ -Codes entwickeln möchten, müssen wir ein paar „Pandas“ -Module importieren. Diese können importiert werden, indem einfach den Begriff „importieren“ mit dem Ausdruck „Pandas als PD“ folgt. Nun wurde dieser „PD“ diesem Code hinzugefügt, wenn wir auf die Funktionen „Pandas“ zugreifen müssen. Jetzt müssen wir den Datenrahmen erstellen.

In der Variablen „RAW_RECORD“ werden einige Daten hinzugefügt, die wir in den DataFrame einfügen möchten. Die Daten werden zuerst hinzugefügt, die "12/08/22, 12/08/22, 13/08/22, 14/08/22, 15/08/22 und 17/08/22" im "datierten" sind. Dann haben wir "Name", in dem wir "Ballstift, Zeiger, Radiergummi, Hefter, Skala und Klebstock" setzen. Danach fügen wir die Menge dieser Elemente in die „Menge“ hinzu, die „18, 21, 36, 4, 15 und 9“ sind. Wir fügen auch den Preis in der Spalte „Preis“ hinzu, die „350, 520, 220, 900, 90 und 250“ beträgt.

Jetzt setzen wir die „PD“ ein.DataFrame () ”, der bei der Konvertierung dieses„ RAW_RECORD “in den" RAW_RECORD_DF ", der der Name des Datenrahmens ist. Anschließend initialisieren wir eine Variable mit dem Namen "Werte" mit einigen Daten, die "Ballstift, Zeiger, Klebstock" sind. Danach wenden wir den Filter „nicht in“ an, um einige Daten zu überprüfen. Wir verwenden diesen "nicht in" -Filter mit der Methode "ISIN ()". Zum Filtern von Daten mithilfe der Methode "Nicht in". Sie können unten sehen, dass wir zuerst den Namen des DataFrame erwähnt haben, und in ihm platzieren wir den Spaltennamen, in dem wir die Daten überprüfen möchten.

Wir platzieren das "~" -Schild, bevor wir den Namen der Spalte mit dem Namen des Datenrahmens platzieren. Dann setzen wir die "isin ()" -Methode danach ein und übergeben die Variable "Werte" an diese "isin ()" -Funktion. Wir speichern das Ergebnis, das wir nach der Anwendung dieser Funktion in der Variablen „resting_values“ erhalten haben. Jetzt legen wir die "restlichen Werte" in den "print ()" ein. Das Ergebnis, das wir hier erhalten, nachdem wir diesen "Nicht in" -Filter angewendet haben, wird angezeigt.

Wir können schnell die Ergebnisse der "Pandas" -Codes im "Spyder" erhalten, indem wir "Shift+Enter" oder das Run -Symbol drücken. Das Ergebnis dieses Codes enthält den Datenrahmen mit allen Daten, die wir dazu hinzugefügt haben. Dann filtert es einige Daten und zeigt die Zeilen an, in denen der „Ballstift, der Zeiger und der Kleberstock“ in der Spalte „Name“ nicht vorhanden sind. Wir filtern diesen Datenrahmen mit Hilfe der Filtermethode „nicht in“.

Beispiel # 02:

Der Datenrahmen "pre_rank_record" wird in diesem Beispiel erstellt, das Spalten "Name, Pre_Rank und New_fee" enthält. Diese Spalten enthalten auch einige Daten darin. In der Spalte "Name" haben wir "Stella, Tatum, George, Peter, Kenna und Lila" hinzugefügt. Dann setzen wir "Python, Datenbank, künstliche Intelligenz, Python, Webentwicklung und Python" in die Spalte "Pre_Rank" ein. Die Gebühren, die wir in die Spalte „Fee“ einfügen, sind: "1300, 1900, 2000, 1300, 1500 und 1300". Wir drucken auch den "pre_rank_record" mit "print ()" aus.

Nach Abschluss dieses Datenrahmens setzen wir die Variable „Werte1“ ein und initialisieren sie mit zwei Namen, die „Stella und George“ sind, mit zwei Namen. Anschließend verwenden wir den "Nicht in" -Filter zum Filtern der Spalten "Name", in denen die Namen nicht in den Werten enthalten sind, die wir in der Variablen der Werte1 hinzugefügt haben. Es bedeutet, dass der Name weder "stella" noch "George" ist. Wir platzieren den Namen des Datenrahmens, das Symbol „~“ und den Namen des Datenrahmens zusammen mit dem Spaltennamen, in dem wir die Daten filtern möchten. Die Spalte, in der wir diese Funktion anwenden müssen.

Jetzt möchten wir auch Daten aus der Spalte "Pre_Rank" filtern. Zu diesem Zweck initialisieren wir die Variable "Werte2" mit einigen Daten aus der Spalte "Pre_Rank", die wir aus der Spalte "Pre_Rank" filtern möchten. Jetzt platzieren wir erneut den "Nicht in" -Filter für die Filterung der Daten und das Anzeigen der verbleibenden Zeilen, in denen das "Python" in der Spalte "Pre_Rank" nicht vorhanden ist. Danach verwenden wir auch den Filter "nicht in" zum Filtern der Daten aus der letzten Spalte "new_fee". Wir platzieren die Variable "values3" und initialisieren die "Werte3" mit zwei Werten, die wir in der Spalte "new_fee" hinzugefügt haben. Dann drucken wir die verbleibenden Werte, in denen die Werte „Werte3“ nicht vorhanden sind.

Es zeigt den DataFrame zuerst in diesem Ergebnis an. Anschließend wird der Datenrahmen angezeigt, den wir in den obigen Code eingegeben haben. Zunächst zeigt es diese Zeilen des DataFramewhere „Stella und George“ an, die in der Spalte "Name" nicht vorhanden sind. Anschließend werden die Zeilen angezeigt, in denen das "Python" in der Spalte "Pre_Rank" nicht vorhanden ist.

Beispiel # 03:

Wir verwenden den Datenrahmen "Datensatz". Wir haben hier gerade den Namen des Datenrahmens geändert. Jetzt filtern wir Daten, indem wir den Filter "nicht in" mit mehreren Spalten des Datenrahmens "pre_rank_record" verwenden. Wir geben „Tatum, Kenna, 1900“ in die Variable „my_list1“, wobei „Tatum und Kenna“ die Werte der Spalte „Name“ sind und „1900“ der Wert der Spalte „New_fee“ ist.

Da wir die Werte von zwei verschiedenen Spalten in der Variablen „my_list1“ hinzugefügt haben. Nachdem wir den Namen des Datenrahmens und des Symbols „~“ hinzugefügt haben. Dann platzieren wir die Methode "isin ()", in der wir die Variable "my_list1" übergeben. Wir platzieren auch "Achse = 1" damit.

Jetzt initialisieren wir eine andere Variable, die die Variable "my_list2" mit "Lila" und "künstliche Intelligenz" ist. Hier ist "Lila" der Wert der Spalte "Name" und "künstliche Intelligenz" ist der Wert der Spalte "Pre_Rank". Danach verwenden wir den "Nicht in" -Filter wieder auf die gleiche Weise wie in den obigen Zeilen in diesem Beispiel.

Nachdem der vollständige Datenframe angezeigt wurde, werden nur die Zeilen, in denen die Zeilen nicht "Tatum, Kenna und 1900" in den Spalten "Name" und "New_fee" enthalten. Dann rendert es die Reihen dort, wo wir keine "Lila- und künstlichen Intelligenz" in den Spalten "Name" und "Pre_Rank" haben.

Abschluss

Der Filter „Nicht in“ wird in diesem Leitfaden zusammen mit den Codes und Ergebnissen dieser Codes im Detail erläutert. Wir haben erklärt, wie die Daten mit der Methode „Nicht in“ nicht in "in" gefiltert werden können und wie der beste Weg ist, diese Methode in "Pandas" zu verwenden. Wir haben auch die Codes gezeigt, in denen wir diesen "nicht in" -Filter mit der Methode "isin ()" verwendet haben und jeden Schritt des Code hier im Detail erläutert haben. Wir haben die Daten des Datenrahmens nach Anwendung der Filtermethode „Nicht in“ nicht in den Datenrahmen gemacht und den Datenrahmen nach dem Antrag des Filters „nicht in“ gezeigt und erklärt, dass die verbleibenden Daten des Datenrahmens angezeigt werden, in denen die Werte sind Nicht vorhanden, was wir in der Filtermethode „nicht in“ erwähnt haben.