Pandas DataFrame Wählen Sie Zeilen nach Bedingung

Pandas DataFrame Wählen Sie Zeilen nach Bedingung
"In" Python "haben wir eine Open_Source -Bibliothek, die die" Pandas "-Bibliothek ist. In „Pandas“ können wir mehrere Aufgaben einfach und effizient ausführen. Wie wir wissen, dass wir Datenrahmen in „Pandas“ erstellen können, indem wir die „Pandas“ -Methoden verwenden. Nach dem Erstellen der Datenrahmen können wir Zeilen auswählen, indem wir Bedingungen anwenden. Wir können verschiedene Methoden verwenden, die „Pandas“ für die Auswahl der Zeilen des Datenrahmens anbieten, abhängig von der Bedingung, die wir in den „Pandas“ -Methoden hinzugefügt haben. Wir werden alle Methoden diskutieren, die wir zur Auswahl der Zeilen im DataFrame in „Pandas“ in diesem Handbuch verwenden können.”

Methoden zur Auswahl von Zeilen des Datenrahmens nach Bedingung

Das „Pandas“ enthält vier verschiedene Methoden zur Auswahl der Zeilen des Datenrahmens nach Bedingung. Diese Methoden sind hier:

  • Datenrahmen.Query () Methode.
  • Datenrahmen.loc () Methode.
  • Datenrahmen.ISIN () Methode.
  • Datenrahmen.filter () Methode.
  • Datenfarm.Iloc () Methode.
  • Datenrahmen.anwenden () Methode.

Alle diese Methoden werden in „Pandas“ zur Auswahl der Zeilen des Datenrahmens „Pandas“ verwendet. Wir setzen auch die Bedingung in diese Methoden ein und sie werden je nach Bedingung die Zeilen auswählen. Wir werden diese Methoden verwenden und Zeilen in diesem Handbuch auswählen und jeden Code hier ausführlich erklären.

Beispiel # 01
Das Tool, das wir in diesem Leitfaden zur Entwicklung des "Pandas" -Codes verwenden werden. Wir generieren den Code „Pandas“, indem wir die Module von „Pandas“ importieren und dann eine Liste mit dem Namen "matric_class" -Liste entwickeln, die "Name" enthält, die Namen der Schüler wie "Peter, George, Bromley, Samuel, Leo" enthält , Farnham und Lily ”.

Danach fügen wir einige Noten dieser Schüler in verschiedenen Fächern hinzu, und diese Fächer sind „Englisch, Computer, Physik, Chemie und Biologie“. In "English" haben wir "46, 32, 54, 71, 68, 31 und 54" in "Computer" hinzugefügt, "82, 23, 48, 34, 32, 15 und 33", dann "82, 23, 48, 34, 32, 15" hinzugefügt, dann Kommt "Physik", in dem wir "29, 31, 27, 55, 29, 20 und 32" hinzugefügt haben, dann ist „Chemie“ da, die „59, 32, 57, 85, 59, 55 und 81 enthält ", Die" Biologie "kommt als nächstes, in dem die Markierungen" 90, 31, 84, 95, 98, 72 und 77 "sind. Dies ist die verschachtelte Liste "matric_class".

Jetzt müssen wir diese verschachtelte Liste in den Datenrahmen umwandeln. Für diesen Zweck haben wir also die „Pandas“ -Methode verwendet, die auch unten „PD“ gezeigt wird.DataFrame ”. Diese Methode ändert die Liste "matric_class" in den Datenrahmen mit dem Namen "matric_class_df" mit dem Namen "matric_class_df". Diese "matric_class_df" wird dann in die "print ()" -Methode eingefügt. Hier wird der Datenrahmen abgeschlossen und auch gerendert.

Jetzt müssen wir diesen Code ausführen. Während wir am „Spyder“ -Tool arbeiten, drücken wir deshalb das „Auslauf“ -Symbol dieses Tools zur Ausführung. Danach wird das folgende Ergebnis erzielt, in dem der Datenrahmen gerendert wird. Jetzt werden wir einige Zeilen aus diesem Datenrahmen auswählen, indem wir die Methode „Pandas“ verwenden, abhängig von einigen Bedingungen, die wir in der „Pandas“ -Methode hinzufügen werden.

Hier filtern wir einige Zeilen, indem wir den DataFrame -Namen einlegen, und die Bedingung, die wir in dieser Methode hinzugefügt haben, ist, dass der „Name“ gleich „Bromley“ ist. Es ist also die Zeile, in der der Schülername „Bromley“ lautet. und speichern Sie die "Bromley" -Reile in "result_df". Das Ergebnis von „Bromley“ wird nun auf dem Bildschirm gerendert, indem es in „print ()“ einfügt ".

Die vollständige Zeile wird hier angezeigt, die die Daten der „Bromley“ enthält. Wir haben diese Zeile aus dem DataFrame gefiltert, indem wir die Bedingung in die „Pandas“ -Methode aufgenommen haben.

Beispiel # 02
Wir verwenden erneut die "matric_class_df", und hier wählen wir andere Zeilen als "Bromley" aus. Die Bedingung, die wir hier angeben, ist also, dass der „Name“ des Schülers nicht gleich „Bromley“ ist. Es wird alle Zeilen ausgewählt oder gefilter.

Hier wählt es alle Zeilen aus dem Originaldatenrahmen mit Ausnahme der 2 Indexzeile, da in dieser Zeile die Spalte "Name" "Bromley" enthält. So ignoriert es diese Zeile und wählt alle anderen Zeilen des Datenrahmens aus und macht sie hier.

Beispiel # 03
Jetzt erstellen wir eine neue Liste für das neue Beispiel hier, in dem die erstellte Liste die "ABC_LIST" ist. In der Spalte "Name" fügen wir "James, Milli, Farnham, Lily, Leo, Samuel und Fuller" hinzu. Als nächstes haben wir die „Codes“, in denen wir „ABC19, ABC34, ABC39, ABC45, ABC59, ABC62 und ABC15“ einfügen. Dann kommt der „Monat“, der „Juli, April, Juli, August, September, Juli und Oktober“ enthält. Die "Einheiten" haben "19, 14, 9, 16, 15, 10 und 13". Diese Liste wird in den Datenrahmen konvertiert und dann wird der Datenrahmen gerendert.

Danach verwenden wir den „DataFrame.Query () ”Methode zur Auswahl einiger Zeilen. Wir setzen die Bedingung "Monat == Juli" ein, was bedeutet, dass alle Zeilen ausgewählt werden, in denen der "Monat" "Juli" ist. Diese Zeilen werden in "ABC_DF2" gespeichert, und dann zeigen wir die Zeilen an, die den Monat "Juli" mit "print ()" enthalten

Der ursprüngliche DataFrame enthält 7 Zeilen, und wir wählen die Zeilen aus, in denen der Monat „Juli“ ist. Daher sind in diesem Datenrahmen nur drei Zeilen vorhanden, die „Juli“ enthalten, und diese drei Zeilen werden auch separat nach dem Originaldatenrahmen gerendert.

Beispiel # 04
Der in diesem Beispiel erstellte Datenrame. Die Namen der Patienten sind im „Namen“, nämlich „James, Noah, Peter, Bromley und Samuel“, die "James, Noah, Peter, Bromley und Samuel" sind. Die Städte dieser Patienten werden in „City“ eingefügt, die „New York, Birmingham, New York, Los Angeles und Banglore“ sind. Dann setzen wir die Anzahl der Sitzungen in "Sites_No", die "2, 6, 4, 4 und 3" sind. Wir setzen auch die Sitzungsgebühr dieser Patienten ein, die „6000, 6000, 6900, 7400 und 6300“ sind, die sind.

Danach wird die Liste der Patienten auch in den "patient_df" geändert, der hier der Datenrahmen ist. Dann drucken wir "patient_df" und nach dem Drucken bewegen wir uns, um die „loc“ -Methode zu verwenden, die uns bei der Auswahl der Zeilen hilft. Die Bedingung, die wir hier festgelegt haben, ist, dass es diese Zeilen auswählt, in denen das „Sites_NO“ des Patienten „4“ ist und diese Zeilen am Terminal zeigt.

In dem Datenrahmen befinden sich nur zwei Zeilen, in denen das „Sitess_no“ des Patienten „4“ ist, und Sie können diese Zeilen auch in der folgenden Ausgabe beachten.

Beispiel # 05
Jetzt geben wir hier ein weiteres Beispiel an und erstellen hier direkt den DataFrame „lerner_df“, in dem die von uns hinzugefügten Spalten „Exam_code, Prüfer_Name, Prüfer_Duty_Num, Prüfung_room_no und Exam_Block“ sind. Wir fügen auch Daten in alle Spalten auf die gleiche Weise ein, die wir in unseren vorherigen Codes erklärt haben. Dann rendern wir auch "lehrer_df", hier filtern wir Zeilen mit der Methode "isin ()". Wir initialisieren eine "Daten" -Variable mit "A und C" und platzieren dann die "Daten" in der Methode "isin ()" und setzen auch den Spaltennamen, in dem diese Datenwerte überprüft werden. Der Spaltenname ist hier "prüfung_block", sodass er die Spalte "prüfung_Block" überprüft und diese Zeilen ausgewählt wird, in denen das "Prüfung" "A" oder "C" ist, und dann diese Zeilen drucken, in denen diese Bedingung erfüllt ist.

Diese "isin ()" -Methode wählt alle Spalten aus, in denen das "prüfung_block" "a" oder "c" ist. In diesem Datenrahmen erscheinen nur fünf Zeilen, die diesen Zustand erfüllen, und diese werden auch hier angezeigt.

Abschluss

Dieser Leitfaden zeigt das Konzept „Auswählen der DataFrame -Zeilen durch die Bedingung in Pandas“. Wir haben verschiedene Methoden besprochen, die zur Auswahl der Zeilen in Pandas je nach Bedingungen verwendet werden. Wir haben hier vier Methoden in unseren Codes verwendet und jeweils alle von ihnen im Detail erläutert. Wir haben gezeigt, wie wir die Bedingung in diese Methoden einfügen und wie diese Methoden die Zeilen des Datenrahmens zurückgeben oder auswählen. Wir haben besprochen, dass, wenn wir die Bedingung in eine Methode einfügen, die wir hier für die Auswahl der Zeilen erklärt haben, diese Bedingung überprüft und diese Zeilen aus dem DataFrame ausgewählt haben, was die angegebene Bedingung erfüllt. Wir haben die Ausgabe zusammen mit dem Codeskript in diesem Handbuch angezeigt.