Pandas konvertieren die Spalte in DateTime

Pandas konvertieren die Spalte in DateTime
Zeitreihendaten werden häufig beim Umgang mit Daten in Pandas auftreten. Pandas ist ein idealer Rahmen für die Bewältigung von Zeitreihendaten in Python. Mit dem bereitgestellten Datensatz müssen wir die Zeichenfolge in DateTime -Format umwandeln. Möglicherweise müssen Sie die DateTime -Formatierung einer Spalte ändern, wenn Sie die Daten derzeit entweder als Zeichenfolge oder Objekttyp gespeichert haben. Zahlreiche zeitliche Aktionen können in der Spalte im DateTime -Format durchgeführt werden. Zum Beispiel können Sie den Zeitunterschied zwischen zwei Daten bestimmen und spezifische Details wie das Monat, das Jahr usw. abrufen.

Wir können das Format einer Spalte entweder aus einer Zeichenfolge oder sogar einem Objekt in eine DateTime ändern, indem wir die Methoden Pandas to_datetime () und Astype () verwenden. Man kann eine DateTime in einem Datenrahmen, der eine Stringspalte enthält, die auf eine bestimmte Weise mit der Methode datetime () formatiert wird, die das Formatargument zur Definition des Formatdatums und der Zeit und Zeit anerkennt. Der Benutzer kann keine zeitreizbasierten Funktionen für ihn ausführen, wenn die Daten nicht im richtigen Format eingegeben wurden. Wir müssen die Daten in das erforderliche Datum-Zeit-Format ändern, um dies zu behandeln.

In diesem Artikel werden Methoden zum Konvertieren einer PANDAS -Datenfreame -Spalte mit einem Objekt oder einer Zeichenfolge in einen DataType -Datentypen behandelt.

Beispiel Nr. 1: Verwendung der PD.to_datetime () Methode zum Konvertieren des Spaltentyps des Pandas -Datenframe

In dieser Methode werden wir die „Pandas verwenden.to_datetime () ”Funktion zum Ändern des Datentyps der Spaltespalte -Datentyp der Spalte.

Importieren Sie zunächst die Bibliothek in das Python -Programm. Stellen Sie dann den Alias ​​auf PD ein, um die Funktionalität der Pandas -Bibliothek zu verwenden. Der Hauptcode beginnt mit dem Erstellen eines DataFrame -Objekts „Eintrag“. Wir haben dieses Objekt dann für die Ausgabe des Aufrufens der Pandas -Datenfunktion zugewiesen. Wir haben einen Datenrahmen durch die Verwendung der Pandas erstellt.DataFrame () Methode. In diesem Datenrahmen haben wir drei Spalten initialisiert: Datum, Ereignis und Kosten.

Sie können sehen, dass die Spalte "Datum" Daten bereits im Format „DD/MM/YY“ speichert. Wir müssen es also nicht einstellen. Stattdessen können wir direkt an unserer erforderlichen Aufgabe arbeiten. Wir werden den DataFrame, den wir gerade erstellt haben, mit der Print () -Methode erstellt.

Sobald unser Datenrahmen erfolgreich erstellt wurde, werden wir den Datentyp für alle Spalten des Datenrahmens überprüfen. Verwenden wir die Methode pandas info (), um den Datenatyp der Werte in jeder Spalte zu betrachten.

Das folgende Ausgabebild zeigt uns einen Datenrahmen mit 3 Spalten und dann den Datentyp für alle 3 Spalten an.

Da wir den Datentyp der Spalte „Datum“ ändern müssen. Wir müssen sein Format von Objekt in DateTime ändern. Hier sind die Pandas.Die Funktion to_datetime () ermöglicht es uns, das Format in DateTime umzuwandeln:

Wir müssen dieser Syntax folgen, um die PD zu verwenden.to_datetime () Funktion:

Der Name des DataFrame -Objekts mit dem Namen der Spalte zwischen langen Klammern und dem Zuordnungsoperator "=", der jetzt die Pandas beruft.DATETIME () -Methode mit dem Datenträgernamen, der den Namen der Spalte als Parameter benötigt. In unserer Illustration ist es „Eintrag ['Datum'] = PD.to_datetime (Eintrag ['Datum']) ”.

Sobald diese Funktion aufgerufen wurde, wird der nächste Anruf bei der Funktion pandas info () angezeigt, um die aktualisierten Datentypen des Datenrahmens anzuzeigen.

Das Terminal zeigt die Ausgabe des oben ausgeführten Programms mit dem Konvertieren des Datentyps der Spalte "Datum" von Objekt zu DateTime.

Beispiel Nr. 2: Verwendung Der Pandas DataFrame.Asttype () -Methode zum Konvertieren des Spaltentyps des PANDAS -Datenfreame vom String in DateTime

Eine andere Methode zum Umwandeln des Datentyps der DataFrame -Spalte in DateTime besteht darin, den PANDAS -Datenrahmen zu verwenden.Astype () -Funktion.

Wir verwenden den Datenrahmen, den wir im letzten Beispiel erstellt haben, um diese Illustration zu erstellen. Mit den gleichen drei Spalten des Datenrahmens haben wir sie im DataFrame -Objekt gespeichert. Und anzeigen Sie es mit der Funktion print () an.

Sehen wir uns das Ausgabebild für das Programm an.

Die Spalte "Datum" und die Spalte "Ereignis" besitzen einen Objektdatenatyp, während die Spalte "Kosten" int -DataType enthält. Die Konvertierung des Datentyps wird in der Spalte "Datum" durchgeführt, da wir die Änderung der Spalte in DateTime Datentyp.

Wir werden zeigen. Aber diesmal verwenden wir den PANDAS -Methodendatenrahmen.Astype () für diesen Zweck.

In der Snapshot des obigen Code. Die Syntax, die wir für die Ausführung dieser Methode befolgen Spaltenname mit “.Astype () ”Funktion.

Zwischen den Klammern der Asttype () -Methode müssen Sie den erforderlichen Datenatyp angeben. Da wir es in den Datentyp datetime konvertieren müssen, haben wir "DateTime64 [NS]") "Datentype" bereitgestellt. Zuletzt haben wir die DataTypes angezeigt, indem wir die Info () -Methode aufgerufen haben.

Dies ergibt uns das folgende Ergebnis:

Beispiel Nr. 3: Nutzung die Pandas.to_date () Methode zum Umwandeln des Datentyps in datetime und das Format der Pandas -Datenfreamespalte ändern

Angenommen, wir müssen eine Datenrahmensäule von 'yymmdd' auf 'yyyy-mm-dd' ändern. Diese Abbildung führt Sie, um das Ergebnis zu erreichen.

Starten Sie das Programm erneut, indem Sie die Pandas -Bibliothek als PD importieren, um auf Pandas -Funktionen zuzugreifen. Im nächsten Schritt haben wir eine Wörterbuchliste „Plist“ erstellt und ihm einen Datensatz mit 2 Wertensätzen zugewiesen. Um diese Liste in einen Datenrahmen zu konvertieren, erstellen wir ein DataFrame -Objekt „neu“ und weisen sie die Ausgabe des Aufrufens des PD zu.DataFrame () -Funktion. Wir übergeben den Listenamen und die Eigenschaft "Spalten", die zwei Spalten mit dem Namen "Dates" und "Termine" als Parameter der PD angegeben sind.DataFrame () -Funktion zum Konstruktion eines Datenframees mit 2 Spalten. Anschließend rufen wir die Funktion „print ()“ auf, um diesen Datenrahmen anzuzeigen. Wir verwenden auch einen anderen Print () mit der Eigenschaft „DTYPES“, um den Datentyp der Spalten des Datenrahmens zu bestimmen.

Der Snapshot des folgenden Ausgabeterminals zeigt den DataFrame mit 2 Spalten und geben Sie den Datenatyp jeder Spalte explizit an.

Im obigen Bild können Sie sehen, dass der Datentyp der Spalte "Daten" als Objekt definiert ist.

Wir verwenden die PD.to_datetime () Funktion mit derselben Syntax, die wir im ersten Beispiel mit einer Ergänzung zu den Parametern erklärt haben. Mit dem Namen des Datums- und Spaltennamens verwenden wir in dieser Abbildung auch das Parameter -Format "Format", um das Format anzugeben, in dem die Spalte "Daten" angezeigt werden soll. Wir haben den Stil „format = '%y%m%d'“ festgelegt. Jetzt werden wir den DataFrame und auch die Datentypen der Datenfrequenzspalten anzeigen.

Hier ist die Ausgabe mit früheren und aktualisierten Formaten der Spalte „Daten“ und auch der konvertierte Datentyp für diese bestimmte Spalte:

Abschluss

Das Pandas -Modul von Python bietet mehrere Funktionen, damit die Programmierer die Datenverarbeitung arbeiten können. Die Pandas -Methode “PD.to_datetime () “und„ DataFrame.Asttype () ”wurde für die Konvertierung des String -Datentyps in eine DateTime erörtert. Wir haben die Techniken mit Hilfe von praktischen Python-Code-Beispielen erläutert, die auf Spyder implementiert wurden, um Ihren Lernprozess reibungslos und mit einfach zugreifenden Konzepten übereinzustimmen.