Pandas extrahieren Jahr aus der DateTime

Pandas extrahieren Jahr aus der DateTime
"Pandas" ist ein starkes Python -Paket, das für eine hohe Effizienz und Rechenrate verwendet wird. Eine DateTime -Spalte in „Pandas“ bietet eine umfangreiche Quelle für Zeitreihendaten, die von Vorteil sein könnten. Zum Beispiel möchten Sie Ihre Daten möglicherweise jährlich oder monatlich anzeigen. Das Erlernen des schnellen Extrahierens solcher Informationen kann sehr vorteilhaft sein, wenn Sie mit Datenrahmen befassen, die DateTime -Spalten (en) enthalten. In diesem Artikel werden wir untersuchen.

Pandas extrahieren Sie das Jahr aus DateTime:

"Pandas" -Date -Time -Spalten enthalten Attribute wie Jahr, Monat, Tag usw. Um das Jahr aus der DateTime -Spalte eines Datenrahmens abzurufen. „Pandas“ verfügt über eine Vielzahl einfacher Methoden zum Extrahieren von Komponenten aus einem DateTime -Objekt, von denen wir in diesem Tutorial zwei implementieren werden. Die Syntax für diese Methoden ist unten angegeben:

PD.DatetimeIndex ().Jahr

df.dt.Jahr

Wir werden nun die praktische Implementierung dieser Python -Methoden sehen.

Beispiel Nr. 1: Verwendung der „PD.DatetimeIndex ().Jahr “Methode, um Jahre aus der DateTime -Spalte von DataFrame zu extrahieren

In dieser Abbildung werden wir die erste oben erwähnte erste Methode verwenden: „PD.DatetimeIndex ().Jahr, um Jahre aus dem Datenrahmen zu extrahieren.

Um diese Methode im Python -Programm praktisch zu implementieren, haben wir das "Spyder" -Tool verwendet. Wir haben angefangen, das Skript in der Python -Datei zu schreiben. Das erste und grundlegende Ding ist es, das Pandas -Toolkit zu aktivieren. Python wird angewiesen, die Pandas -Bibliothek in unsere aktuelle Arbeitsumgebung durch den Abschnitt Pandas des Imports des Codes in unsere aktuelle Arbeitsumgebung zu laden. Der Abschnitt „PD“ des Codes weist Python an, Pandas den Alias ​​von „PD“ zuzuweisen. So können wir auf alle Funktionen von Pandas zugreifen. Wir haben dann einen Datenrahmen erstellt.

Der Datenrahmen wird durch die Verwendung der Pandas -Methode „PD) generiert.DataFrame () ”. Wir haben diese Methode aufgerufen und sie mit vier Spalten initialisiert: "Titel", "Vorträge", "Note" und "start_date". Die erste Spalte, "Titel", speichert die Titel verschiedener Programmiersprachen. Dies sind "C ++", "Python", "Java" und "R". Die zweite Spalte, die wir im Datenrahmen erstellt haben, lautet "Vorträge" und hält die Anzahl der Vorlesungen für jeden Kurs als "30", "26", "35" und "20" als "30", "26", "35" und "20". Die Spalte „Note“ teilt das Niveau, auf dem diese Kurse angeboten werden, ich.e., "12", '10 "," 14 "und" 16 ". Die letzte Spalte sind die Kerndaten dieses Datenrahmens, da sie die DateTime -Werte, auf denen dieses Tutorial basiert, gespeichert wird. Diese Spalte enthält Werte "02-02-2022", "09-01-2023", "07-29-2024" und "11-24-2025" als Startdaten jedes Kurses.

Die Länge der Säule, die wir für jede Spalte übernommen haben. Wir benötigen ein Datenrahmenobjekt, um den Inhalt des Datenrahmens zu speichern. Daher haben wir ein Datenrahmenobjekt „Extrahieren“ erstellt und es das Ergebnis gegeben, das durch Aufrufen des PD erzielt werden würde.DataFrame () ”Methode. Die am häufigsten verwendete Methode von Python zur Anzeige der Ausgabe „Print ()“ wird hier aufgerufen, um den Inhalt des Datenrahmenobjekts „Extrahieren“ zu zeigen.


Wenn wir das oben erwähnte Programm ausführen, erhalten wir einen Datenrahmen, der auf der Konsole angezeigt wird, die vier Spalten enthält. Hier können Sie sehen, dass die Spalte "start_date" die DateTime -Werte speichert.


Jetzt müssen wir vorwärts gehen, um mit unserer Hauptaufgabe zu beginnen, für die wir den Datenrahmen generiert haben. Wir werden das Jahr aus der DateTime -Spalte unseres Datenrahmens mit der „PD“ extrahieren. DatetimeIndex ().Jahr “Methode hier.

Wir haben die „PD“ angerufen.DatetimeIndex ().Jahr “Methode gleich nach dem Erstellen und Drucken des Datenrahmens. “.Jahr “gibt an, dass wir diese Methode verwenden, um das Jahr aus der bestimmten Spalte DateTime zu extrahieren. Es kann auch andere Attribute haben, ich.e., “.Monat “, um die Monate zu extrahieren,“.Woche ”, um die Wochen abzurufen,“.Tag “, um die Tage und viele andere zu bekommen. Wir haben die Funktion bezeichnet, und zwischen ihren Klammern haben wir den Namen des Datenrahmens mit dem Spaltennamen angegeben, auf den die Funktion angewendet wird, um die Jahre daraus zu extrahieren.

Der Name des Datenrahmens "Extrahieren" wird mit der Spalte "start_date" mit DateTime -Werten geliefert. Wenn diese Funktion aufgerufen wird, wird sie in den Datenrahmen „Extrahieren“ eingereicht und ruft aus der Spalte „start_date“ die Jahre ab. Um diese Jahre zu speichern, haben wir in unserem Datenrahmen eine neue Spalte „Jahr“ erstellt. Also die Jahre, die aus dem Aufruf der PD extrahiert wurden.DatetimeIndex ().Jahr ”wird in der Kolumne„ Jahr “aufbewahrt. Wir haben dann die Methode „Print ()“ verwendet, um den aktualisierten Datenrahmen anzuzeigen.


Hier haben wir unseren resultierenden Datenrahmen. Wir sehen.

Beispiel Nr. 2: Verwendung des „DF.dt.Jahr “Methode, um Jahre aus der DateTime -Spalte des Datenrahmens zu extrahieren

In dieser Demonstration wird erklärt.dt.Jahr “Methode. Mal sehen, wie es funktioniert.

Wir haben gerade das "Spyder" -Tool geöffnet und begannen, den Code zu schreiben. Wir haben die Pandas -Bibliothek geladen, weil die Methode, die wir hier verwenden möchten. Wir haben dann einen Datenrahmen erstellt, indem wir die PD verwenden.DataFrame () ”Methode. Wir haben die Funktion aufgerufen und drei Spalten darin erstellt, die "Name", "Birth_date" und "Age" sind. In der Spalte "Name" speichert die Namen einiger Leute, die "Parker", "Jack", "Leo" und "Rabecca" sind. Das "Birth_Date" speichert das Geburtsdatum dieser Personen als "02-02-1989", "09-01-1996", "07-29-1981" und "11-24-2001".

Die Spalte "Alter" hält das aktuelle Alter von ihnen als "32", "26", "40" bzw. "21". Wir haben ein Datenrahmenobjekt "biodata" erstellt, um die Ausgabe aus dem „PD“ zu speichern.DataFrame () ”-Funktion. Die Methode „Print ()“ wird dann aufgerufen, um den resultierenden Datenrahmen anzuzeigen, der im Objekt „Biodata“ gespeichert ist.


Wenn wir diesen Code -Snippet ausführen, erhalten wir einen Datenrahmen mit drei bereitgestellten Spalten, die im unten angeschlossenen Snapshot angezeigt werden können.


Jetzt werden wir diesen Datenrahmen verwenden, um das Jahr aus seiner DateTime -Spalte mit dem „DF) zu extrahieren.dt.Jahr “Methode. Hier enthält die Spalte „Birth_date“ die Daten mit dem Jahr. Daher müssen wir die Funktion auf diese bestimmte Spalte anwenden, um das Jahr zu extrahieren. Um diese Spalte zu verwenden, müssen wir sie zuerst in das DateTime -Format konvertieren. Weil die hier verwendete Funktion ein DT -Attribut enthält, das für DateTime dient. Es wird also nur ausgeführt, wenn die angegebene Spalte in DateTime konvertiert wird. Dazu haben wir die Methode "to_datetime ()" verwendet und den Namen des Datenrahmens mit dem Spaltennamen zwischen seinen Klammern angegeben.

Jetzt wurde der Datentyp der Spalte „Birth_date“ in DateTime geändert. Wir nannten dann die „DF.dt.Jahr “Funktion. Wir haben den Namen des Datenrahmens mit dem Spaltennamen und dem “erwähnt.dt.Jahr ”Erweiterung. Um dieses extrahierte Wertjahr im Datenrahmen zu speichern, haben wir in der „Biodata“ eine neue Spalte „Jahr“ erstellt. Schließlich haben wir den DataFrame mit der Funktion "print ()" angezeigt.


Dies ergibt das folgende Ergebnis.

Abschluss:

Das Extrahieren eines Jahres aus einer DateTime -Spalte aus dem Pandas -Datenrahmen ist eine nützliche Übung. Pandas lehrt uns einige sehr nützliche und praktische Techniken, um das gewünschte Ergebnis zu erzielen. In diesem Tutorial haben wir Sie mit zwei Techniken von Pandas vorgestellt, um das Jahr aus der DateTime -Spalte in einem Datenrahmen zu extrahieren. Wir haben jedes Detail in der praktischen Implementierung der Beispielcodes aufgenommen. Wir haben alles beschrieben und erklärt, was wir in Beispielen verwendet haben, damit Sie beim Üben dieser Methoden keine Schwierigkeiten haben, um Pandas zu lernen.