Pandas spalteten die Spalten von dem Trennzeichen auf

Pandas spalteten die Spalten von dem Trennzeichen auf
"Pandas" ist ein Python -Paket. Es ist flexibel und verfügt. Auch Panda DataFrames eignen sich hervorragend zum Manipulieren der Daten. Meistens arbeiten wir an Daten, die eine Spalte mit einem abgrenzten String -Wert enthalten, z. B. "X, Y, Z", und wir möchten, dass sie in separaten Spalten sind. Dies ist möglich, indem wir eine Funktion von Pandas verwenden, die wir in diesem Artikel diskutieren werden. Wir werden lernen, wie man eine Textspalte einzeln in separate Spalten aufteilt. Für diese PANDAS -Funktion der Spalte Spalte durch den Trennzeichen sollte verwendet werden. Seine Syntax ähnelt der Python -String „Str ()“ -Funktion. Die nach Spalte aufgeteilten Pandas spaltet jedoch die Daten des gesamten Datenrahmens auf. Für die Implementierung des Codes werden wir das Tool "Spyder" verwenden. Da es sich um eine sprachfreundliche Python-Software handelt.

Syntax

Str.Teilt()

Die obige Syntax wird verwendet, um den Text in Spalten in einem Datenrahmen aufzuteilen. Es funktioniert, indem die Spalte mit dem Trennzeichen in verschiedene Spalten aufgeteilt wird. Wir implementieren die Syntax der Pandas -Serie „Str.Split () ”-Funktion in der Spalte„ Adresse “und übergeben Sie sie mit dem„ Komma “für die Trennung der Spalte, die wir teilen möchten.

Parameter

Es gibt einige Parameter, die wir später in den Beispielen der Panda Split -Spalte durch den Trennzeichen verwenden werden:

Expandieren: Es erweitert den Stringwert in eine separate Spalte.

Bedingungen: Wenn „wahr“, gibt der Datenrahmen zurück; Wenn „Falsch“, gibt die Serie/den Index (Zeichenfolgen) zurück.

"N" begrenzt die Anzahl eines Splits im Ausgang.

Im Folgenden finden Sie die Art und Weise, wie die von dem Trennzeichen geteilten Pandas durchgeführt werden können:

  • Pandas Spalte Spalte von Delimiter (fügen Sie der "DF" eine neue Spalte hinzu)).
  • Pandas Spalte Spalte von dem Trennzeichen (innerhalb einer Liste).
  • PANDAS -Spalte durch Trennzeichen angibt die Anzahl der Spaltungen.

Erstellen des Datenrahmens für die Beispiele implementieren der Pandas -Spalte durch den Trennzeichen

Importieren Sie nach dem Öffnen des Tools „Spyder“ die Pandas -Bibliothek als „PD“. Erstellen Sie nun den "DF" erstellen. Das "DF" ist die Abkürzung des "DataFrame". Das „DF“ hat die vollständige Adresse einiger Bereiche der verschiedenen Länder wie: „5632 Main Street, Park, Kanada“; "2525 Downtown, Salzmine, Italien"; "7896 Sky View, Wohnung, Mexiko"; und die "3988" Sunshine Road, Villa, Japan ". Hier sehen wir, dass die Daten durch Spalte getrennt sind. In den nächsten Beispielen werden wir lernen, wie diese „Komma“ -Bereiche getrennt in die Spalten aufgeteilt werden können.

Die Ausgabe zeigt die Erstellung der Daten des Datenframes der im Code bereitgestellten Daten.

Beispiel 01: Pandas Spalte Spalte für Trennzeichen in mehrere Spalten

In diesem Beispiel werden wir die Spalten der Textdaten nach dem Trennzeichen der Pandas -Split -Funktion in mehrere Spalten aufzeigen. Der DataFrame besteht aus den Adressen der Straßen als: „5623 Main Street, Einkaufszentrum, Türkei“; "4585 Downtown, Schulbereich, Frankreich"; "0032 Sky View, College, Indonesien"; und "1125 Sunshine Next, University, China". Alle diese Adressen bestehen aus verschiedenen Bereichen. Wir können sagen, dass wir es als Trenner -Erkenner -Operator zum Spalten nehmen können. Wir werden die Pandas -Split -Funktion auf die "Adresse" anwenden. Dann spaltet sich das Komma in diesem Fall. Außerdem müssen wir sicherstellen.

Die Ausgabe zeigt die separaten Spalten der Adresse in der Spalte „0“ an. In der Spalte „1“ haben wir insbesondere die Bereiche und in der Spalte „2“ haben wir die Ländernamen. Es wird ein gut präsentiertes und organisiertes Datenrahmen erstellt.

Beispiel 02: Pandas Spalte Spalte von dem Trennzeichen in einer Liste

Wir erstellen einen Datenrahmen für die Beispielimplementierung der PANDAS -Spalte von Pandas Split durch den Trennzeichen dieses Mal "innerhalb einer Liste". Der DataFrame ist als „7854 Main Street, Reifengeschäft“; "8009 Downtown, Sweet Shop, Tokio"; "1003 Sky View, Eisdiele, Sri Lanka"; und "7009 Sunshine Next, High School, Afrika". Jetzt werden wir den Parameter in diesem Beispiel nicht übergeben, um die Spaltung innerhalb der Spalte durchzuführen.

Hier in der Ausgabe erfolgt die Spaltung innerhalb der Spalten. Dies stellte sich jedoch nicht heraus, dass die Erstellung separater Spalten angezeigt wurde, da sich der Split in einer Liste befindet. Wenn wir uns in eine separate Spalte teilen möchten, wird das letzte Beispiel angezeigt.

Beispiel 03: Pandas Spalte Spalte von Trennzeichen (fügen Sie der "DF" eine neue Spalte hinzu)

In diesem Beispiel werden wir dem DataFrame neben den separaten Spalten eine weitere Spalte hinzufügen, die einfach durch die Pandas -Spalte und durch die Trennzeichenfunktion erfolgen kann. Der Datenrahmen entspricht dem letzten Beispiel. Jetzt haben wir den „Status“ als Add-On-Spalte ausgewählt. Wir haben den gesamten Datenrahmen und eine andere Spalte in einer separaten Spalte. Auf diese Weise können wir sie separat haben, ohne die Originaldaten zu beeinflussen, wenn wir eine Analyse dieser spezifischen Datenmenge ändern oder durchführen möchten.

Die Anzeige hat Spalten getrennt und fügt die Spalte von „Status“ in einer separaten Spalte von sich selbst hinzu. Dies sind vier mal vier Spalten, dh 2 Zeilen und 2 Spalten.

Beispiel 04: PANDAS -Spalte Spalte durch Trennzeichen, die die Anzahl der Splits angibt

In Beispiel 01 oben haben wir die Aufteilung der Textspalten durchgeführt, indem wir die Adresse zum Auftreten des Trennzeichens „Komma“ angelegt haben, was zu einer Trennung von drei Spalten führte. Ebenso können wir die Anzahl der gewünschten Spaltungen angeben. In diesem Fall werden wir lernen, wie das geht. Der Datenrahmen besteht aus den Adressen als: „4585 12th Straße, Lebensmittelgeschäft, New York "," 7000 Portlands, Flughafen, Italien "; “4555 13th Straße, Bahnhof, Spanien “; und der "7777 Commercial Next, Candy Shop, Australien". Das "n = 1" bedeutet, dass wir den Datenrahmen einmal teilen möchten. Die Spaltung wird beim ersten Ereignis auftreten, die die anderen linken Säulen zusammen gesehen werden.

Die Ausgabe zeigt die Aufteilung des Datenrahmens mithilfe der Spalte Pandas Split für die Degrenzfunktion und durch Bezeichnung von N als „1“ Zeigt an und bezeichnet N als „1“. Die Aufteilung erfolgt also nur einmal. Die Städte und die Zustände befinden sich in der zweiten Spalte und das erste Auftreten der Adressen befindet sich in der ersten Spalte.

Abschluss

Die Pandas -Funktionsspalte durch den Trennzeichen ist nützlich und effizient. Nach den Bedürfnissen möchten wir die Daten nach Bedarf in einer bestimmten Spalte oder Konvention haben. All dies kann also mit der Pandas Split -Spalte durch den Trennzeichen erfolgen. Wir haben Funktionen wie mehrere Spalte geteilt, in der Spalte geteilt, gespalten und eine neue Spalte hinzufügen und zuletzt aufgeteilt, indem die Anzahl der Spaltungen angegeben wird.