Pandas ändern den Spaltentyp in die Zeichenfolge

Pandas ändern den Spaltentyp in die Zeichenfolge
Die Spaltentypen eines DataFrame müssen möglicherweise aus verschiedenen Gründen nach der Erstellung geändert werden, z. B. um eine Spalte in ein numerisches Format umzuwandeln, das für die Modellierung und Klassifizierung verwendet werden kann. Dieses Tutorial zeigt, wie Sie die Werte der Spalte mithilfe von Pythons Pandas -Paket in einen String -Datentyp konvertieren. Wir werden versuchen, Ihnen beizubringen, wie Sie die Pandas schwebenden und ganzzahligen Werte in Zeichenfolgen ändern können. Darüber hinaus erfahren Sie die Vorteile der Verwendung des String -Datentyps in Pandas sowie wie sich die Saiten in Pandas entwickelt haben. Wir werden verschiedene Funktionen verwenden, um die Dataypes der DataFrame -Spalte in eine Zeichenfolge zu ändern.

String -Datentyp in Pandas

Pandas verwenden den Objektdatenatyp standardmäßig, um Zeichenfolgen zu speichern. Saiten und gemischte Datentypen werden beide vom Objektdatentyp behandelt. Es ist jedoch nicht explizit. In Version 1 gab es einen speziellen Datenatyp der String in Pandas.0. Obwohl dieser Datentyp noch keine explizite Ressourcen- oder Leistungsverbesserungen bietet, sagte das Pandas -Entwicklungsteam, dass dies in Zukunft passieren wird. Infolgedessen wird dieses Tutorial ausschließlich den String -Datentyp verwendet. Verwenden Sie die „STR“ anstelle von String, wann immer möglich, wenn Sie eine Python -Version weniger als 1 verwenden.0.

So ändern Sie die Pandas -Spalte in Zeichenfolge

Verschiedene Funktionen können verwendet werden, um die Spalte in Pandas in den String -Datentyp zu ändern. Die Verwendung der Asttype () -Methode ist die häufigste Möglichkeit, dies zu tun. Schauen wir uns die Funktion astype () an, um zu sehen, wie es funktioniert.

Syntax: df.ASType (“Column_Name”: st, fehler = "raise")

df.Astype (): Eine Methode zum Aufrufen der Pandas -Astype -Funktion.

"Spaltenname": str: Spalten, die in ein anderes Format konvertiert werden sollen (String -Datentyp). Der Spaltenname ist die Spalte, deren Datentyp geändert wird. Die Spaltenwerte müssen in den erforderlichen Datentyp transformiert werden, der String ist. Jeder integrierte Datenatyp von Python oder Datentyp ist akzeptabel.

Fehler = 'Erhöhung': Zu definieren, wie Ausnahmen während der Konvertion behandelt werden sollten. Nur die möglichen Werte der Zellen werden umgewandelt; "Erhöhung" zeigt einen Fehler an, und "ignorieren" ignoriert ihn.

Wir haben die Syntax der Asttype () -Methode gesehen. In den folgenden Beispielen erfahren Sie nun, wie Sie die ASType (), andere Funktionen und Attribute verwenden, um die Datenfreamspalten in Zeichenfolgen umzuwandeln.

Beispiel 1: Verwenden der Asttype () -Methode

Ein Pandas -Objekt kann mit der Asttype () -Methode in einen bestimmten Datentyp konvertiert werden. Jede geeignete vorhandene Spalte kann unter Verwendung der Funktion astype () in einen kategorialen Typ konvertiert werden. Wenn wir den Datentyp einer bestimmten Spalte in einen anderen Datentyp konvertieren müssen, ist die Methode astype () sehr nützlich. In diesem Beispiel werden wir den Spaltendatenatyp mithilfe der Funktion ASType () ändern, damit wir einen Datenrahmen erstellen müssen. Zum Erstellen eines Datenrahmens importieren wir zuerst die Pandas -Bibliothek, um ihre Funktionen und Funktionen zu verwenden.


Wir haben unseren Datenrahmen erstellt, indem wir ein Wörterbuch an die PD weitergeleitet haben.DataFrame () -Funktion als Argument. Die Schlüssel des Wörterbuchs werden zu den Etiketten für jede Spalte, nachdem sie sie in der PD übergeben haben.DataFrame () -Funktion und die Werte der Schlüssel werden zu den Werten der Spalten des Datenfreams. Um den Datenrahmen zu visualisieren, verwenden wir die Funktion print ().


Im vorherigen DataFrame haben wir vier DataFrame -Spalten. Die erste Kolumne "Student" enthält die Namen der Schüler - "Jack", "Tony", "Marty", "Alex", "Rob". In der zweiten Spalte „Alter“ wird das Alter jedes Schülers „16, 15, 18, 17, 17“ aufbewahrt. Während die Spalte "Gebühr" die Gebühr jedes Kurses "7000" speichert.0, 6500.0, 7100.0, 7000.0, 6900.0 ". Das Säulen Thema besteht aus den Namen von Themen - „Englisch“, „Statistik“, „Mathematik“, „Englisch“, „Wissenschaft“ . Wir können den Datentyp jeder Zeile über das DTYPES -Attribut wie folgt überprüfen:


Der Datentyp der Spalten "Student" und "Fach" ist "Objekt".Während der Datentyp der Spalten „Alter“ und „Fee“ INT64 bzw. Float64 ist. Ändern wir nun den Datentyp der Spalte "Gebühr" von Float zu String.


Da wir die Asttypes () -Methode angewendet und die Datenatype „String“ übergeben haben, um den Datentyp der Spalte „Gebühr“ zu ändern.


Sie können feststellen, dass der Datentyp der Spalte „Gebühr“ von Float64 in String konvertiert wird.

Beispiel 2: Verwenden der Methode map () und apply ()

Die MAP () -Methode wird verwendet, um die Serienwerte in ihre entsprechenden Eingänge umzuwandeln. Um jeden Datenwert in einer Reihe mit einem anderen Wert zu ändern, wird die Funktion map () verwendet. Dieser Wert kann von einer Reihe, einem Diktat oder einer Funktion erhalten werden. Diese Funktionen können jedoch verwendet werden, um den Datentyp der Spalten zu ändern. Verwenden wir denselben Datenrahmen, den wir im vorherigen Beispiel erstellt haben.


Jetzt überprüfen wir die Datenatypen der Spalten mithilfe des Attributs dTypes.


Ändern wir nun die Datenatypen der Spalte „Alter“ mit der Funktion MAP () und die Datenatypen der Spalte „Gebühr“ mit Apply () -Funktion ändern.


Wir haben sowohl die Funktion MAP () als auch die Funktion apply () auf Spalte "Gebühr" bzw. "Alter" angewendet. Verwenden wir das DTYPES -Attribut für unseren "DF" -Datenrahmen, um die Ergebnisse anzuzeigen.


Hier können wir sehen, dass der Datenatype „String“ nicht verwendet werden kann, wenn die Methode MAP () und uepuse () verwendet wird. Beide Spalten „Alter“ und „Gebühr“ werden jetzt als Ergebnis in Objektdatenatypen konvertiert. Pandas verwenden jedoch standardmäßig den Objektdatenatyp, um die Strings zu speichern, aber wir möchten das Ergebnis in "String" -Datenatype. Aus diesem Grund würden wir nicht empfehlen, diese Methoden in den neuen Versionen von Python zu verwenden, um die Datentypen der Spalten zu ändern.

Beispiel 3: Verwenden der Asttype () -Methode

Zu guter Letzt verwenden wir die Asttype () -Methode, um den Datentyp des Datenrahmens in Zeichenfolgen zu ändern. Wir haben gesehen. Jetzt ändern wir die Datentypen aller Spalten in diesem Beispiel in "String". Auch hier verwenden wir den Datenrahmen "DF" für dieses Beispiel.


Überprüfen wir mithilfe des Attributs von DTYPES zunächst die Datenatypen unserer "DF" -Datenfreame -Spalten.


Keine der Spalten im vorherigen Datenrahmen hat eine Spalte mit String Datentype. Jetzt verwenden wir die Asttype () -Methode, um den Datentyp aller Spalten des DataFrame in den Datentyp „String“ zu ändern.


Wie zu sehen ist, können Sie durch einfaches Verwenden der Eigenschaft astype () mit dem Datenrahmen beim Übergeben der „String“ innerhalb der Funktion problemlos alle Spalten des DataFrame in die Zeichenfolge ändern.


Die Datenatypen jeder Spalte werden in Zeichenfolge geändert.

Wir können auch die Funktion applymap () oder die verwenden .Werte.Asttype () um die DataTypes konvertieren, aber sie geben den Datentyp "Objekt" anstelle von "String" zurück.

Abschluss

In diesem Tutorial haben wir besprochen, was für eine Datenatyp -Zeichenfolge in Python ist und wie Sie die Pandas -Spalte in die Zeichenfolge ändern können. Wir haben die Syntax der Funktion astype () gelernt, um zu verstehen, wie sie funktioniert. Nachdem Sie dieses Tutorial durchlaufen haben, können Sie die Spalten möglicherweise selbst in die Zeichenfolge wechseln. Wir haben verschiedene Beispiele implementiert, um Ihnen beizubringen, wie die Methode der MAP () und apply () verwendet werden kann.