Ein Datentyp ist ein grundlegender Baustein, der von Computersprachen verwendet wird, um zu verstehen, wie die Daten erhalten und verändert werden können. In einem PANDAS -Datenfreame möchten Sie häufig die einzelnen oder mehrere Spalten in Zeichenfolgen verwandeln. Bequem ist dies einfach zu erreichen, wenn die verschiedenen nativen Funktionen von Pandas verwendet werden.
In diesem Artikel werden Sie übermittelt, wie Sie die Werte in einer Spalte in einen String -Datentyp mithilfe der Pandas -Bibliothek in Python umwandeln können. Sie werden dann entdecken, wie Sie die Schwimmer und Ganzzahlen in Pandas -Saiten verwandeln können. Sie werden feststellen. Der Datenrahmen.Astype (STR), DataFrame.Werte.Astype (STR), DataFrame.anwenden (STR), DataFrame.Karte (STR) und DataFrame.ApplyMap (STR) sind einige der in der Demonstration verwendeten Methoden, um einen beliebigen Typ in einen String -Typ umzuwandeln.
Konstruktion von Datenframe mit Pandas.DataFrame () Methode
Die erste und wichtigste Anforderung für das Programm besteht darin, die Pandas -Bibliothek als PD zu importieren, um die Pandas -Funktionen in Anspruch zu nehmen. Der nächste Schritt besteht darin, einen PANDAS -Datenfreame zu erstellen. Wir werden einen Datenrahmen mit drei verschiedenen Spalten erstellen, einer davon läuft als Zeichenfolge und die anderen beiden werden als Ganzzahlen geladen. Dann verwenden wir die Print () -Funktion, um ihre fünf Datensätze anzuzeigen.
In der vorherigen Abbildung haben wir einen Datenrahmen erstellt, der die Pandas verwendet.DataFrame () Methode. Dieser Datenrahmen hat drei Spalten: "Name", "Alter" und "Gehalt". Jede Spalte speichert fünf Datensätze oder Werte. Wir haben ein DataFrame -Objekt "Daten" erstellt und es die Ausgabe des Aufrufens des PD zugewiesen.DataFrame () Methode. Auf den Pandas -Datenframe ist also durch die Verwendung dieses Objekts zugegriffen. Anschließend haben wir die Funktion print () verwendet, um den DataFrame anzuzeigen.
Der von uns erstellte Datenrahmen erscheint auf dem Terminal, das im folgenden angehängten Snapshot angezeigt wird:
Jetzt finden wir die Datentypen aller Spalten des Datenrahmens heraus. Dafür verwenden wir die Pandas .info () Funktion. Der .Info () -Methode zeigt uns die Details zum DataFrame an und stellt die Datentypen für jede Spalte bereit, sodass wir untersuchen können, wie die Pandas die String -Daten verarbeitet.
Wir haben den Pandas DataFrame verwendet.Info () Methode im vorherigen Code. Die Funktion print () wird dann aufgerufen, die die Daten haben.info () als Parameter, um die Informationen zum Datenspalten des DataFrame -Datenatyps anzuzeigen.
Dies ist die Ausgabe, die am Terminal angezeigt wird:
Im vorherigen Beispiel können wir beobachten, dass Pandas die Saiten immer standardmäßig als Objekte behandelt. Saiten und gemischte Datentypen werden beide vom Objektdatentyp behandelt. Es ist jedoch nicht besonders offensichtlich.
Pandas haben einen bestimmten String -Datentyp aus Version 1.0. Obwohl dieser Datentyp noch keine eindeutigen Speicher- oder Effizienzverbesserungen bietet, sagte das Pandas Developer -Team, dass dies in Zukunft passieren wird. Infolgedessen wird die Lektion ausschließlich den String -Datentyp verwendet.
Beginnen wir zunächst mithilfe des bevorzugten Pandas -Ansatzes eine Spalte in eine Zeichenfolge konvertieren.
Beispiel 1:
Die erste Methode, die wir verwenden, ist die Funktion pandas astype (). Die Spalte (Series) -Technik ist ein Merkmal von Pandas.
Wenn Sie die Pandas 1 betreiben.0 oder später, geben Sie die "String" ein. Verwenden Sie ansonsten die „STR“ für die Ausgaben von Pandas früher als 1.0. Durch die Übernahme können Sie sicher sein, dass der String -Datentyp anstelle des Objektdatatyps verwendet wird.
Beginnen wir mit seiner praktischen Demonstration in einer Python -Umgebung.
Im vorherigen Code verwendeten wir den zuvor erstellten DataFrame „Daten“ nun die Pandas “.Astype () ”Funktion. Wir haben den Namen des DataFrame mit dem "geschrieben".Asttype () ”-Funktion und lieferte den Datenatyp„ String “als Parameter. Danach haben wir die "aufgerufen".Info () ”Methode Innerhalb der Klammern der Print () -Funktion zum Anzeigen des aktualisierten Datentyps der DataFrame -Spalten.
Die Ausführung des vorherigen Python -Skripts ergibt uns das folgende Ergebnis:
Die Spalte „Alter“ unseres Pandas -Datenframe, der ursprünglich als INT64 aufbewahrt wurde.
Beispiel 2:
Sie können die verwenden .MAP () -Technik, um eine Pandas -Spalte in Strings in einer Weise zu ändern, die mit dem identisch ist .Asttype () Pandas Series -Funktion.
Lassen Sie uns untersuchen, was dies zu sein scheint:
Die Abbildung beginnt mit der Verwendung des Code des Datenrahmens, den wir im vorherigen Beispiel erklärt haben. Nach dem Drucken des Datenrahmens haben wir die DataTypes mit Hilfe des “angezeigt.info () ”Funktion. Jetzt wählen wir eine Spalte aus, deren Datenatype in eine Zeichenfolge konvertiert werden, um umzuwandeln. Wir haben die Spalte „Alter“ für den genannten Zweck erneut ausgewählt. Dann haben wir die "aufgerufen".map () ”Funktion mit dem DataFrame -Objekt und dem angegebenen Spaltennamen. Wir haben auch den Datentyp in der “definiert“.MAP (STR) ”-Funktionsstreben. Wir müssen den aktualisierten Datentyp mit der “überprüfen.info () ”Methode.
Die Ausgabe ist im folgenden Bild zu sehen:
Daraus ist klar, dass der String -Datentyp nicht verwendet werden kann, wenn Sie die verwenden .MAP () Methode. Die Daten werden als Folge im Objektdatenatyp gespeichert. Aus diesem Grund führen Sie eine Ausgabe über 1 aus.0, wir empfehlen, diese Methode nicht anzuwenden.
Beispiel 3:
Wie die zuvor beschriebene Technik können wir ebenfalls den Datentyp einer Pandas -Spalte in Zeichenfolgen mit der .anwenden () Methode. Die gleichen Einschränkungen gelten insofern, als wir sie nur in Objektdatenatypen umwandeln können. Wir sind immer noch nicht in der Lage, sie in String -Datenatypen zu verwandeln.
Schauen wir es uns an:
Wie Sie im vorherigen Skript sehen können. Zwischen den Zahnspangen dieser Funktion geben wir den Datentyp an. Diese Methode nimmt die "String" nicht an. Stattdessen funktioniert es mit "Str". Anschließend haben wir die DataTypes mit der Info () -Methode -Nutzung angezeigt.
Das resultierende Terminal zeigt, dass der aktualisierte Datentyp von INT64 zu Objekt geändert wurde, das eine Zeichenfolge ist.
Beispiel 4:
Darüber hinaus können wir den Wert der Pandas nutzen.Asttype () -Funktion, um die Werte einer Spalte direkt in Zeichenfolgen zu transformieren.
Hier untersuchen wir seine Arbeiten mit der Implementierung von Python Code:
Mit demselben Datenrahmen und derselben Spalte haben wir die Pandas -Werte verwendet.Asttype () ”-Methode und bestanden den Datentyp„ Str “als Argument. Schließlich haben wir die DataTypes mit der info () -Methode angezeigt.
Dies gibt uns die folgende Ausgabe:
Beispiel 5:
Unser letztes Segment bringt Ihnen bei, wie Sie das nutzen können .applyMap () Funktion zur Umwandlung aller Pandas -Datenfream -Spalten in Zeichenfolgen.
Bei dieser Methode haben wir die verwendet .applyMap () Methode. Da wir alle Spalten konvertieren möchten, müssen wir keinen bestimmten Spaltennamen mit dem DataFrame -Objekt erwähnen, wie wir es zuvor getan haben. Wir haben einfach das DataFrame -Objekt mit dem verwendet .applyMap () Funktion und bestanden den Datentyp „Str“ als Parameter.
Dies ist die folgende Ausgabe:
Abschluss
Diese Lektion basiert auf den verschiedenen Methoden der Pandas, um die Spalten in String -Datenatypen umzuwandeln. Wir haben alle möglichen Möglichkeiten genutzt, um Ihnen eine Reihe einfacher Entscheidungen zu geben, wenn wir auf solche Probleme stoßen. Wir haben einige praktische Beispielcodes demonstriert, mit denen Sie die verschiedenen Pandas -Techniken lernen können. Wir hoffen, dass dieses Schreiben Ihnen hilft, die Pandas -Module zu verstehen.