Pandas Series Filter

Pandas Series Filter

Eine Pandas-Serie ist ein eindimensionales Array mit Indexbezeichnungen und Werten. Wir können eine PANDAS -Serie bei Bedarf für bestimmte Bedingungen filtern. Für die Filterung der Serie werden wir zwei Techniken anwenden, die „Serien“ sind.filter () ”und„ Serie.loc [] ”.

Die Syntax für „Serie.filter () ”Methode ist:

Um die Eigenschaft „loc []“ zu verwenden, muss die unten angegebene Syntax befolgt werden:

Beispiel Nr. 1: Verwendung der Filter () -Methode zum Filtern einer PANDAS -Serie

In dieser Illustration werden wir die Pandas -Serie verwenden.filter () ”Methode zum Filtern einer Pandas -Serie.

Das Spyder -Tool wird gestartet, um Beispielcodes zu erstellen. Die grundlegende Voraussetzung für den Bau des Programms ist die Belastung der erforderlichen Bibliotheken. In diesem Fall benötigen wir nur ein einzelnes Paket, das als "Pandas" bezeichnet wird. Um diese Bibliothek in unsere Python-Datei einzuführen, haben wir ein einzelnes Skript "Pandas als PD importieren" verwendet. Dieses Skript enthält zwei Teile: Das „Pandas importieren“ wird im Pandas -Toolkit in unsere Programmdatei und den Teil des Skripts "PD" geladen, um als Alias ​​von "Pandas" im Python -Programm zu verwendet zu werden.

Die nächste Zeile berief sich auf die „PD.Serie () ”Methode. Die „PD“ bezieht sich auf Pandas, während sich die „Serie“ auf die Initialisierung des Serienkonstruktionsverfahrens bezieht. Wir haben diese Methode angewendet und einige ganzzahlige Werte darin angegeben, um eine Reihe mit diesen Werten zu erstellen. Die Werte, die wir bereitgestellt haben, sind "23", "34", "56", "39", "78", "61", "36", "92", "54" und "11". Wir haben 10 Werte in die „PD) eingefügt.Serie () ”Methode.

Abgesehen von der Angabe des Wertearrays haben wir den „Namen“ verwendet,. Das Argument "Name" legt das Etikett für dieses Wertearray fest. Daher haben wir ein Etikett dafür als "ganze Zahlen" angegeben. Das „PS.Series () ”-Funktion erstellt eine Serie, kann diese Serie jedoch nicht behalten können. Wenn wir das nächste Mal diese Methode in dem jeweiligen Programm aufrufen, verliert sie die zuvor erstellte Serie. Um diese aktuell generierte Serie zu erhalten, wird ein Serienobjekt erstellt und mit dem Namen „Info“ bezeichnet und das Ergebnis zugewiesen, das aus der Ausübung der „PD“ generiert wurde.Serie () ”Methode. Unsere Serie wird im Serienobjekt "Info" gespeichert und kann danach zugegriffen werden, indem dieser Objektname überall im Programm erwähnt wird.

Die Serie wird mit den angegebenen Werten und der Standardindexliste generiert. Wir möchten jedoch nicht die Standard -Sequentialliste verwenden. Stattdessen müssen wir eine benutzerdefinierte Indexliste platzieren. Dafür haben wir eine Variable "Vögel" erstellt und sie mit diesen Werten "Tauben", "Papagei", "Sparrow", "Pea_cock", "Crow", "Owl", "King_Fisher", "Swan", "Pea_cock", "Crow", "Crow", "Swan", "initialisiert", initialisiert. Taube “und" Wood_pecker ". Die Anzahl der Werte muss gleich der Anzahl der Werte für die Serie sein, die 10 ist, da diese Werte als Indexliste festgelegt werden.

Um diese Werteliste in die Indexliste umzuwandeln, haben wir die „Serie" verwendet.Index “Eigenschaft. Hier lautet unser Serienname „Info“, die mit dem “erwähnt wurden.Index “Eigenschaft. Dann zugewiesen. Die Eigenschaft „Index“ nimmt die Werte an und setzt sie als Indexliste für die Serie anstelle einer sequentiellen Liste des Index. Wir haben eine Serie, einen festgelegten Namen und eine Indexliste erstellt. Jetzt möchten wir es im Ausgangsfenster sehen. Dies kann durch die Verwendung der Python -Funktion „print ()“ erfolgen. Wir haben unsere Serie „Info“ als Eingabe zum Drucken ihrer Inhalte bereitgestellt.

Klicken Sie einfach zusammen auf die Tasten „Shift+Enter“ zusammen, um das Programm auszuführen. Dadurch wird die Ausgaberie mit den angegebenen Werten und angegebenen Indexlisten in der Python -Konsole angezeigt.

Jetzt filtern wir diese Serie mit der „Serie.filter () ”Funktion. Zwischen den Klammern der Methode definieren wir eine Liste von Werten, die aus der Serie herausgefiltert werden sollen.

Die Serie.filter () ”wird aufgerufen. Wir müssen unseren Seriennamen anstelle des Wortes „Serie“ liefern. Wir haben es als „Info geschrieben.Filter()". Wir haben die Methode auf die Serie angewendet. Nehmen wir an, wir möchten eine Liste von Indexbezeichnungen durchsuchen, damit wir diese Indexbezeichnungen in dieser Funktion identifizieren werden. Um die Indexbezeichnungen zu identifizieren, haben wir das Argument „Elemente“ verwendet. Dieser Parameter „Element“ nimmt die Werte aus, um aus der Serie zu filtern. Wir haben es zwei Indexbezeichnungen "Crow" und "Swan" zugewiesen. Aus der "Info" -Serie wird nach diesen beiden Indexbezeichnungen gesucht und falls gefunden, sie extrahiert sie mit ihren entsprechenden Werten. Um die gefilterte Ausgabe zu speichern, haben wir die Variable „Alpha“. Die Funktion „print ()“ zeigt das Ergebnis am Terminal an.

In dem unten beigefügten Bild können wir sehen, dass zwei Datensätze in Ansicht gestellt wurden, die die angegebenen Indexbezeichnungen besaßen.

Jetzt werden wir die gleiche Methode verwenden, um die Indexbezeichnungen mit einem bestimmten regulären Ausdruck zu filtern.

Dafür haben wir die „Serie aufgerufen.filter () ”Methode. Und in seinen Zahnspangen wird der Parameter „Regex“ verwendet. Dies wird in einem Ausdruck zum Filtern der Indexbezeichnungen, die sie enthalten. Der Ausdruck, den wir für die Suche angegeben haben. Das Ergebnis wird in der Variablen „Beta“ gespeichert und mit der Methode „Print ()“ ausgestellt.

Die gefilterte Serie zeigt drei Datensätze, deren Indexbezeichnungen den Ausdruck „_“ hatten.

Beispiel Nr. 2: Verwendung der Eigenschaft loc (), eine PANDAS -Serie zu filtern

Eine andere Methode zur Filterung einer Pandas -Serie nach Wert ist die „Serie.loc [] ”Eigenschaft. Wir werden eine Bedingung innerhalb der „Serie angeben.LOC [] ”Eigenschaft zum Extrahieren des Datensatzes, der den definierten Zustand angibt.

Wir haben zuerst die Pandas -Bibliothek importiert und dann die „PD“ verwendet. Serie () ”Funktion zur Generierung einer Reihe mit diesen Werten„ 1 “,„ 25 “,„ 93 “,„ 44 “,„ 51 “,„ 6 “,„ 72 “,„ 18 “,„ 99 “,„ 12 "," 64 "," 44 "," 16 "," 77 "," 19 "," 44 "und" 22 ". Die resultierende Serie wird im Objekt „Y“ -Serie gespeichert. Um es auf dem Bildschirm zu präsentieren, haben wir dieses Objekt an die Methode „Print ()“ übergeben.

Dies ergibt uns die folgende Serie als Ausgabe:

Wir haben die „Serie aufgerufen.LOC [] ”Eigenschaft und spezifizierte eine Bedingung darin mit der Funktion„ Lambda “. Die Bedingung, die wir definiert haben, ist für jeden Wert in der Serie, ob der Wert gleich „44“ ist. Speichern Sie dann das generierte Ergebnis in der Variablen „Cond“ und zeigen Sie es mit der Funktion „print ()“.

Das Ergebnis zeigt 3 Datensätze bei Index „3“, „11“ und „15“, die einen Wert von 44 haben.

Für die Demonstration wenden wir eine „oder“ Bedingung mit der Eigenschaft „loc []“ an.

Zwischen den Klammern der Immobilie „Serie“.loc [] “haben die Funktion„ Lambda “verwendet, um die Bedingung anzugeben, die sich angibt, um Werte zu extrahieren, die weniger als 30 sind. Oder die Werte, die größer als 50 sind, wobei „x“ in der "Y" -Serie ein Wert ist. Die Variable „Z“ hält die Ausgabe auf.

Hier ist die Ausgabe, die im folgenden Snapshot gerendert wird.

Abschluss

In diesem Artikel haben wir das Konzept der Filterung einer PANDAS -Serie mit bestimmten Bedingungen erläutert. Wir haben zwei Methoden dafür erklärt: „Serie.filter () ”und die„ Serie.loc [] ”Eigenschaft. Die erste Illustration erklärte die „Serie.filter () ”Funktion zum Filtern der Indexbezeichnungen in einer PANDAS -Reihe, indem die Liste der Indexbezeichnungen bereitgestellt wird und auch den regulären Ausdruck verwendet wird, der in den Indexbezeichnungen vorhanden ist. Die 2nd Die Instanz arbeitete an der Verwendung der „Serie.loc [] ”Eigenschaft, um Werte in der Reihe zu durchsuchen, die die bestimmte Bedingung erfüllen.