Werte innerhalb eines Datenrahmens oder andere Objekte von Pandas können mit der Methode Ersatz () in Pandas ersetzt werden. In Python können wir diese Methode zur Datenmanipulation und zur Reinigung der Daten verwenden. In diesem Tutorial werden Sie übermittelt.Ersetzen () Funktion. Im DataFrame können wir String -Daten und sogar reguläre Ausdrücke (REGEX) ersetzen, indem wir den Pandas -Datenfreame verwenden.str.Ersetzen () Funktion. Ähnlich wie bei Pythons Ersatz () -Funktion die STR.Ersetzen () Methode in Pandas funktioniert auch auf Serien.
str.ersetzen()
Die Methode str.Ersatz () wird verwendet, um eine Zeichenfolge oder Regex durch einen Stringwert oder Daten zu ersetzen. Die Ersatz () -Funktion kann alles andere ersetzen, auch die Zeichenfolgen und Regex. Schauen Sie sich den str -Blick an.Ersatz () Syntax der Funktion.
Syntax
Pandas.Serie.str.ersetzen (pat, repl, n = -1, case = keine, flags = 0, regex = keine)
Parameter:
- klopfen: Compiled Regex oder str. Regelmäßige Ausdrücke oder Zeichensequenzen können beide als Zeichenfolgen verwendet werden.
- Wiederholung: Callable oder str. Ersatz Zeichenfolge oder aufrufbar. Eine Ersatzzeichenfolge muss vom Callable zurückgegeben werden, damit er nach dem Empfangen des Regex -Match -Objekts verwendet werden soll.
- N: Standardmäßig als -1 festgelegt, int. Totaler Ersatz zu machen.
- Fall: Keine standardmäßig, bool. Findet heraus, ob „Ersatz“ von Fall sensitiv ist:
- Fallempfindlichkeit, wenn wahr.
- Für die Unempfindlichkeit der Fall auf False festgelegt
- Wenn Pat als kompilierte Regex angegeben ist, kann es nicht eingestellt werden.
- Flaggen: 0 oder standardmäßig keine Flags, int int. Flags im Regex -Modul wie Re.FALL IGNORIEREN. Wenn Pat als kompilierte Regex angegeben ist, kann es nicht festgelegt werden.
- Regex: Standardmäßig wahr, bool. Identifiziert, ob ein regulärer Ausdruck im überschrittenen Muster vorhanden ist: Wenn wahr, wird das übergebene Muster als regulärer Ausdruck angesehen. Ansonsten wird das Muster als wörtliche Schnur behandelt.
Szenario 1: str.Ersetzen () im DataFrame
Wir werden diese Funktion in Pandas DataFrame -Spalten anwenden, um einzelne/mehrere Werte zu ersetzen. Wir werden in diesem Szenario mehrere Beispiele sehen.
Syntax:
Einzel -
DataFrame_Object ['Spalte'].str.ersetzen ('alt', 'neu')
Mehrere-
DataFrame_Object ['Spalte'].ersetzen ([alte Werte…], [neue Werte…])
Hier ist die vorhandene und neue Zeichenfolge die neue Zeichenfolge, die die vorhandene ersetzt.
Beispiel 1: Einzelzeichenfolge ersetzen
In diesem Beispiel haben wir einen Datenrahmen mit dem Namen "Datensätze", die "Chemikalie", "Alphabet" und "Valent" -Spalen halten. Ersetzen Sie 'Wasserstoff' durch „Wasserstoffchemikalie“ in der chemischen Säule.
Pandas importieren
Records = Pandas.DataFrame ('Chemical': ['Wasserstoff', 'Stickstoff', 'Sauerstoff', 'Wasserstoff', 'Natrium'],
'Alphabet': ['hy', 'n', 'o', 'hy', 'na'],
'Valenz': [10, 2, 3, 4, 11])
Druck (Datensätze)
# Ersetzen Sie 'Wasserstoff' durch „Wasserstoffchemikalie“ in der chemischen Säule.
Records ['Chemical'] = Records ['Chemical'].str.ersetzen(
"Wasserstoff", "Wasserstoffchemikalie")
drucken()
Druck (Datensätze)
Ausgang:
Erläuterung
In der chemischen Säule gibt es zwei Saiten mit 'Wasserstoff'. So wurden beide durch „Wasserstoffchemikalie“ ersetzt.
Beispiel 2: Ersetzen Sie ein einzelnes Zeichen
In diesem Beispiel haben wir einen Datenrahmen mit dem Namen "Datensätze", der "Chemical" und "Alphabet" -Spalen hält. Ersetzen Sie 'O' durch "O" in der Alphabet -Spalte.
Pandas importieren
Records = Pandas.DataFrame ('Chemical': ['Wasserstoff', 'Stickstoff', 'Sauerstoff', 'Wasserstoff'],
'Alphabet': ['hy', 'n', 'o', 'no'])
Druck (Datensätze)
# Ersetzen Sie 'O' durch "O" in der Alphabet -Spalte.
Records ['Alphabet'] = Records ['Alphabet'].str.ersetzen ('o', 'o')
drucken()
Druck (Datensätze)
Ausgang:
Es gibt zwei Zeichen in der Alphabet -Spalte. So wurden beide durch "O" ersetzt.
Beispiel 3: Ersetzen Sie mehrere Zeichenfolgen
Ersetzen wir "Wasserstoff" durch "Wasserstoff", "Sauerstoff" durch "Oxy" und "Schwefel" mit "S" in der chemischen Säule
Pandas importieren
Records = Pandas.DataFrame ('Chemical': ['Wasserstoff', 'Stickstoff', 'Sauerstoff', 'Wasserstoff', 'Schwefel'],
'Alphabet': ['hy', 'n', 'o', 'nein', 'sul'])
Druck (Datensätze)
# Ersetzen Sie mehrere Werte gleichzeitig.
Records ['Chemical'] = Records ['Chemical'].ersetzen (['Wasserstoff', 'Sauerstoff', 'Schwefel'], ['Wasserstoff', 'Oxy', 's'])
drucken()
Druck (Datensätze)
Ausgang:
2 „Wasserstoff“ -Saiten werden durch „Wasserstoff“ ersetzt, 1 „Sauerstoff“ und „Schwefel“ werden durch „Oxy“ und „S“ ersetzt.
Beispiel 4: Ersetzen Sie mehrere Zeichenfolgen durch Wörterbuch
Ersetzen wir "Wasserstoff" durch "Säure" und "Schwefel" durch "Base" in der chemischen Säule
Pandas importieren
Records = Pandas.DataFrame ('Chemical': ['Wasserstoff', 'Stickstoff', 'Sauerstoff', 'Wasserstoff', 'Schwefel'],
'Alphabet': ['hy', 'n', 'o', 'nein', 'sul'])
Druck (Datensätze)
# Ersetzen Sie mehrere Werte gleichzeitig.
Records ['Chemical'] = Records ['Chemical'].ersetzen ('Wasserstoff': 'Säure', 'Schwefel': 'Base')
drucken()
Druck (Datensätze)
Ausgang:
2 „Wasserstoff“ werden durch „Säure“ ersetzt und 1 „Schwefel“ durch „Base“ ersetzt.
Szenario 2: str.Ersetzen () in Serie
Erstellen wir eine PANDAS -Serie und ersetzen Strings durch neue Saiten durch ein Regex -Muster. Wir können das Substring angeben, das im RE ersetzt werden muss.Compile () -Methode und dies kann in der Ersatz () -Methode als erster Parameter und neuer Zeichenfolge als zweiter Parameter übergeben werden, der das Substring ersetzt.
Syntax:
Single - Series_Object.str.ersetzen (re.kompilieren ("alt)," neu ")
Hier ist die vorhandene und neue Zeichenfolge die neue Zeichenfolge, die die vorhandene ersetzt.
Beispiel: Einzelzeichenfolge ersetzen
In diesem Beispiel haben wir eine Serie mit dem Namen "Record" mit 4 Saiten.
Ersetzen Sie das Substring - "Gen" durch "und".
Pandas importieren
Import Re
# Erstellen Sie die PANDAS -Serie mit 4 Saiten
record = pandas.Serie (['Wasserstoff', 'Stickstoff', 'hy', 'n'])
# Ersetzen Sie das Substring - "Gen" durch "und".
Druck (Aufzeichnung.str.ersetzen (re.kompilieren ("Gen") und "))
drucken()
# Ersetzen Sie das Substring - "Gen" mit "und", indem Sie den Fall ignorieren.
Druck (Aufzeichnung.str.ersetzen (re.kompilieren ("Gen", Flags = Re.Ignorecase), "und"))
Ausgang:
Erläuterung
- Bei der ersten Ausgabe ignorieren wir die Fallempfindlichkeit nicht. Also sind „Gen“ und „Gen“ unterschiedlich. Da in der Serie „Gen“ nicht existiert, wird kein Ersatz durchgeführt.
- In der zweiten Ausgabe ignorieren wir die Fallempfindlichkeit, indem wir „Flags = re einstellen.FALL IGNORIEREN". Also sind „Gen“ und „Gen“ gleich. Es wird durch "und" ersetzt. Daher sind die aktualisierten Zeichenfolgen - "Hydroand" und "Nitroand".
Abschluss
Wir bringen Ihnen bei, wie Sie die Zeichenfolgenwerte in Pandas ersetzen/ersetzen können. Wir haben die Syntax des Strs besprochen.Ersetzen Sie () Methode, um ihre Funktionalität zu verstehen. In diesem Tutorial haben wir einige Beispiele implementiert, um Ihnen beizubringen, wie Sie die Zeichenfolgenwerte durch Zeichenfolgedaten ersetzen, ein bestimmtes Zeichen ersetzen, eine Substring- oder Zeichensequenz durch die Zeichenfolgewerte ersetzen und mehrere Zeichenfolgen aus der DataFrame -Spalte mit STR ersetzen können.ersetzen () und ersetzen () Funktionen ersetzen. Außerdem ersetzen Sie Strings aus der Serie mit Regex.