Dieser Artikel hilft Ihnen dabei, verschiedene Methoden zu verstehen, mit denen wir in einem PANDAS -Datenframe nach einer Zeichenfolge suchen können.
Pandas enthält Methode
Pandas liefern uns eine Funktion contains (), die die Suche ermöglicht, wenn ein Substring in einer PANDAS -Serie oder einem DataFrame enthalten ist.
Die Funktion akzeptiert eine wörtliche Zeichenfolge oder ein reguläres Ausdrucksmuster, das dann mit den vorhandenen Daten übereinstimmt.
Die Funktionssyntax ist wie gezeigt:
Serie.str.Enthält (Muster, case = true, Flags = 0, Na = keine, regex = true)Die Funktionsparameter werden wie gezeigt ausgedrückt:
Rückgabewert
Die Funktion gibt eine Reihe oder einen Index von Booleschen Werten zurück, die angeben, ob das Muster/Substring im Datenrahmen oder in der Reihe gefunden wird.
Beispiel
Angenommen, wir haben unten einen Beispieldatenrahmen angezeigt:
# Pandas importierenSuchen Sie eine Zeichenfolge
Um nach einer Zeichenfolge zu suchen, können wir das Substring als Musterparameter wie gezeigt übergeben:
drucken (df.ganze Namen.str.Enthält ('Shelton'))Der obige Code überprüft, ob der Zeichenfolge 'Shelton' in den Spalten von Full_Names des DataFrame enthalten ist.
Dies sollte eine Reihe von booleschen Werten zurückgeben, die angeben, ob sich die Zeichenfolge in jeder Zeile der angegebenen Spalte befindet.
Ein Beispiel ist wie gezeigt:
Um den tatsächlichen Wert zu erhalten, können Sie das Ergebnis der entsprechenden () -Methode als Index des Datenrahmens übergeben.
drucken (df [df.ganze Namen.str.enthält ('Shelton')]))Das obige sollte zurückkehren:
ganze NamenFallempfindliche Suche
Wenn bei Ihrer Suche die Fallempfindlichkeit wichtig ist, können Sie den Fallparameter wie gezeigt auf True einstellen:
drucken (df.ganze Namen.str.enthält ('Shelton', case = true))Im obigen Beispiel setzen wir den Fallparameter auf true ein und aktivieren eine Fallempfindlichkeitssuche.
Da wir nach der Kleinbuchstaben -String 'Shelton' suchen, sollte die Funktion das Großbuchstaben ignorieren und false zurückgeben.
Regex -Suche
Wir können auch mit einem regulären Ausdrucksmuster suchen. Ein einfaches Beispiel ist wie gezeigt:
drucken (df.ganze Namen.str.enthält ('wi | em', case = false, regex = true))Wir suchen nach einer Zeichenfolge, die den Mustern 'WI' oder 'Em' im obigen Code entspricht. Beachten Sie, dass wir den Fallparameter auf False einstellen und die Fallempfindlichkeit ignorieren.
Der obige Code sollte zurückgeben:
Schließen
In diesem Artikel wurde erfasst. Überprüfen Sie die Dokumente für weitere.