Finden Sie Saiten in Pandas

Finden Sie Saiten in Pandas

Dieser Artikel hilft Ihnen dabei, verschiedene Methoden zu verstehen, mit denen wir in einem PANDAS -Datenframe nach einer Zeichenfolge suchen können.

Pandas enthält Methode

Pandas liefern uns eine Funktion contains (), die die Suche ermöglicht, wenn ein Substring in einer PANDAS -Serie oder einem DataFrame enthalten ist.

Die Funktion akzeptiert eine wörtliche Zeichenfolge oder ein reguläres Ausdrucksmuster, das dann mit den vorhandenen Daten übereinstimmt.

Die Funktionssyntax ist wie gezeigt:

Serie.str.Enthält (Muster, case = true, Flags = 0, Na = keine, regex = true)

Die Funktionsparameter werden wie gezeigt ausgedrückt:

  1. Muster - Bezieht sich auf die Zeichensequenz oder das Regex -Muster, um zu suchen.
  2. Fall - Gibt an, ob die Funktion der Fallempfindlichkeit gehorchen sollte.
  3. Flaggen - Gibt die Flags an, die an das Regex -Modul übergeben werden sollen.
  4. n / A - Füllt die fehlenden Werte.
  5. Regex - Wenn wahr, behandelt das Eingabemuster als regulärer Ausdruck.

Rückgabewert

Die Funktion gibt eine Reihe oder einen Index von Booleschen Werten zurück, die angeben, ob das Muster/Substring im Datenrahmen oder in der Reihe gefunden wird.

Beispiel

Angenommen, wir haben unten einen Beispieldatenrahmen angezeigt:

# Pandas importieren
Pandas als PD importieren
df = pd.DataFrame ("full_names": ['Irene Coleman', 'Maggie Hoffman', 'Lisa Crawford', 'Willow Dennis', 'Emmett Shelton'])
df

Suchen Sie eine Zeichenfolge

Um nach einer Zeichenfolge zu suchen, können wir das Substring als Musterparameter wie gezeigt übergeben:

drucken (df.ganze Namen.str.Enthält ('Shelton'))

Der obige Code überprüft, ob der Zeichenfolge 'Shelton' in den Spalten von Full_Names des DataFrame enthalten ist.

Dies sollte eine Reihe von booleschen Werten zurückgeben, die angeben, ob sich die Zeichenfolge in jeder Zeile der angegebenen Spalte befindet.

Ein Beispiel ist wie gezeigt:

Um den tatsächlichen Wert zu erhalten, können Sie das Ergebnis der entsprechenden () -Methode als Index des Datenrahmens übergeben.

drucken (df [df.ganze Namen.str.enthält ('Shelton')]))

Das obige sollte zurückkehren:

ganze Namen
4 Emmett Shelton

Fallempfindliche Suche

Wenn bei Ihrer Suche die Fallempfindlichkeit wichtig ist, können Sie den Fallparameter wie gezeigt auf True einstellen:

drucken (df.ganze Namen.str.enthält ('Shelton', case = true))

Im obigen Beispiel setzen wir den Fallparameter auf true ein und aktivieren eine Fallempfindlichkeitssuche.

Da wir nach der Kleinbuchstaben -String 'Shelton' suchen, sollte die Funktion das Großbuchstaben ignorieren und false zurückgeben.

Regex -Suche

Wir können auch mit einem regulären Ausdrucksmuster suchen. Ein einfaches Beispiel ist wie gezeigt:

drucken (df.ganze Namen.str.enthält ('wi | em', case = false, regex = true))

Wir suchen nach einer Zeichenfolge, die den Mustern 'WI' oder 'Em' im obigen Code entspricht. Beachten Sie, dass wir den Fallparameter auf False einstellen und die Fallempfindlichkeit ignorieren.

Der obige Code sollte zurückgeben:

Schließen

In diesem Artikel wurde erfasst. Überprüfen Sie die Dokumente für weitere.