Die beliebteste Datenframe -Manipulation in Pandas ist die Filterung. In diesem Beitrag werden wir uns untersuchen. In Pandas gibt es mehrere Methoden zum Extrahieren von Daten aus dem Datenrahmen unter Verwendung mehrerer Bedingungen. In den folgenden Beispielen zeigen wir, wie verschiedene Funktionen verwendet werden, um den Datenrahmen mit mehreren Bedingungen zu filtern.
Methode 1: Verwenden von Eval ()
Eval () wird verwendet, um einen Ausdruck zu bewerten. Daher fungiert es als Filter im DataFrame und gibt die Zeilen zurück, die mit der Bedingung übereinstimmen.
Syntax
Pandas.DataFrame_Object [DataFrame_Object.Eval („Bedingungen“)]Beispiel 1
Erstellen wir einen Datenrahmen mit 6 Spalten und 4 Zeilen und geben die Zeilen basierend auf der Gebührspalte zurück, in der die ID größer als 20 ist, und der Name endet mit "N".
Pandas importierenAusgang
ID -Name Statusgebühr Punkte1 Punkte2Es gibt nur eine Zeile, so dass der Name mit 'n' endet, und die ID ist größer als 20. Hier haben wir zwei Bedingungen mit dem „und“ Operator angegeben.
Beispiel 2
Geben Sie die Zeilen anhand der Spalte "Gebühr" zurück, in der die ID größer als 20 und "Punkte1" weniger als 35 ist und der Name mit "s" beginnt.
Pandas importierenAusgang
ID -Name Statusgebühr Punkte1 Punkte2Zwei Zeilen entsprechen der Bedingung.
Methode 2: Verwenden von LOC []
Syntax
DataFrame_Object.loc []Parameter
Indexbezeichnung: Liste der Zeichenfolgen oder einer einzelnen Zeichenfolge der Indexnamen der Zeile.
Beispiel 1
Erstellen Sie einen Datenrahmen mit dem Namen "Bemerkungen" mit 6 Spalten. Lassen Sie uns die Zeilen basierend auf der Gebührenspalte zurückgeben, in der die Gebühr größer als 300 und Punkte von weniger als 76 ist.
Pandas importierenAusgang
ID -Name Statusgebühr Punkte1 Punkte2Es gibt 3 Zeilen, bei denen die Gebühr größer als 300 und Punkte von weniger als 76 ist. Hier haben wir zwei Bedingungen mit dem "&" -Operator angegeben.
Beispiel 2:
Erstellen Sie einen Datenrahmen mit dem Namen "Bemerkungen" mit 6 Spalten. Lassen Sie uns die Zeilen basierend auf der Gebührenspalte zurückgeben, in der die Gebühr größer als 300 und Punkte von weniger als 76 ist.
Pandas importierenAusgang
ID -Name Statusgebühr Punkte1 Punkte2Es gibt 2 Zeilen, in denen die Gebühr größer als 300 und Punkte von mehr als 76 liegt, und der Status ist "scheitern". Hier haben wir drei Bedingungen mit dem "&" -Operator angegeben.
Methode 3: Verwenden von Query ()
query () nimmt die Bedingung als Ausdruck so, dass Zeilen im Datenrahmen basierend auf dem angegebenen Ausdruck filtriert werden. Stellen Sie sicher, dass Sie einen Ausdruck in "" schreiben müssen "".
Syntax
Pandas.DataFrame_Object.Abfrage ("Ausdruck")Beispiel
Lassen Sie uns die Zeilen basierend auf der Gebührenspalte zurückgeben, in der die Gebühr größer als 300 und Punkte von weniger als 76 ist.
Pandas importierenAusgang
ID -Name Statusgebühr Punkte1 Punkte2Es gibt 3 Zeilen, bei denen die Gebühr größer als 300 und Punkte von weniger als 76 ist. Hier haben wir zwei Bedingungen mit dem 'und' Operator angegeben.
Abschluss
Die Filterung ist der am häufigsten verwendete Datenrahmenbetrieb in Pandas. In diesem Leitfaden haben wir darüber nachgedacht, wie Sie den Datenrahmen unter Verwendung mehrerer Bedingungen filtern. Nachdem Sie diesen Artikel behandelt haben, können Sie die Daten möglicherweise selbst filtern, indem Sie selbst mehrere Bedingungen verwenden. In diesem Artikel haben wir einige Beispiele implementiert, um Ihnen beizubringen, wie Sie Daten aus dem DataFrame mit Hilfe mehrerer Bedingungen mithilfe der verschiedenen Funktionen in Pandas und numpy wie loc [], query () und eval () extrahieren können.