Pandas -Serie zu CSV

Pandas -Serie zu CSV

Die Serie.to_csv () ”Methode in Pandas gibt das angegebene Serienobjekt in einer von Kommas getrennten Werten (CSV) aus. Diese Funktion nimmt die Werte einfach aus einer Reihe aus und verändert ihr Format, indem sie Kommas für die Trennung von Index- und Spaltenwerten hinzufügen.

Um diese Funktion zu verwenden, müssen wir die folgende Syntax verwenden:

Dieser Artikel bietet Ihnen zwei verschiedene Techniken, um zu erfahren, wie Sie diese Methode in einem Python -Programm anwenden können.

Beispiel Nr. 1: Verwendung der Serie.to_csv () Methode zum Umwandeln einer Reihe mit DateTimeIndex in von Kommas getrennte Werte

Um eine Serie in ein CSV -Format zu modifizieren, werden wir die „Serie verwenden.to_csv () ”Funktion. Diese Abbildung generiert eine Reihe mit einem DateTimeIndex und konvertiert sie dann in ein von Kommas getrennter Werteformat.

Um diese Methode in Betrieb zu nehmen, müssen wir ein Werkzeug haben, das die Python -Programmierung unterstützt. Das "Spyder" -Tool wird für das Kompilieren der Codes entschieden. Um das Skript darauf zu schreiben, haben wir das installierte Tool zuerst in unserem System gestartet. Das Python -Programm benötigt eine Bibliothek, um seine Methoden zum Erreichen des erforderlichen Ergebnisses auszuüben. Die Bibliothek, die wir hier geladen haben, ist die „Pandas“. In der gleichen Codezeile wird der Alias ​​dieser Bibliothek als „PD“ identifiziert. Überall im Programm müssen wir "Pandas" schreiben, um auf eine Funktion zuzugreifen. Wir würden stattdessen "PD" schreiben.

Der erste Schritt zum Beginn des Code besteht darin, eine PANDAS -Serie zu generieren. Wir müssen „PD“ schreiben, um die Serienerstellungsmethode von Pandas anzuwenden. Der „PD.Series () ”-Funktion wird aufgerufen, um eine Serie mit den angegebenen Werten zu konstruieren. Die Werte, die wir für die Serie bereitgestellt haben, sind "Istanbul", "Izmir", "Ankara", "Ankara", "Antalya", "Konya" und "Bursa". Wenn Sie diesem Wertenarray einen Namen geben möchten, können Sie dies mit dem Parameter „Name“ verwenden. Hier haben wir diese Wertearray "Städte" benannt, da sie die Namen von 6 Städten hält. Um diese Serie zu speichern, wurde ein Serienobjekt „Türkei“ erstellt.

Um einen DateTimeIndex zu erstellen, haben wir die „PD“ aufgerufen.DATE_RANGE () ”Methode. Zwischen den Klammern dieser Funktion haben wir 4 Argumente bestanden: „Start“, „Freq“, „Perioden“ und „TZ“.

Das Argument „Start“ nimmt ein Datum und eine Uhrzeit an, um einen Datumsbereich daraus zu generieren. Hier haben wir das Startdatum und die Uhrzeit als "2022-03-02 02:30" angegeben. Der Parameter „FREQ“ klassifiziert die Frequenz für den Datumsbereich. Also haben wir es mit dem Wert "D" geliefert. Jetzt erzeugt es einen Datumsbereich für die tägliche Frequenz. Das Argument „Perioden“ ist auf „6“ eingestellt, was bedeutet, dass es 6 Tage lang einen Datumsbereich generiert. Der letzte Parameter ist „TZ“, der die Zeitzone für den angegebenen Bereich angibt. Wir haben die Zeitzone für „Asien/Istanbul“ angegeben.

Um diesen Datumsbereich zu speichern, haben wir eine variable "datetime" -Variable erstellt. Um den DateTimeIndex festzulegen, haben wir die „Serie“ verwendet.Index “Eigenschaft. Der Name der Serie "Türkei" wird mit dem "geliefert".Index “Eigenschaft und zugewiesen dem Datumszeitbereich, der in der Variablen„ DateTime “gespeichert ist. Somit nimmt die Eigenschaft "Index" die Werte aus der Variablen "DateTime" und macht sie zur Indexliste der "Truthahn" -Serie. Um die Ausgaberie anzuzeigen, haben wir die "print ()" -Methode verwendet und die "Türkei" -Serie als Eingabe an sie übergeben, um ihren Inhalt anzuzeigen.

Wir haben gerade die Option "Datei ausführen" gedrückt, um das Skript auszuführen. Infolgedessen können wir eine Serie mit dem DateTimeIndex sehen, der von „2022-03-02 02: 30: 00+03: 00“ und endet mit „2022-03-07 02: 30: 00+03: 00“ Erstellen eines Zeitraums “ 6 Tage. Unterhalb der Serie werden die "Freq: D", der Name der Array -Liste "Städte" und das DTYPE -Objekt ebenfalls erwähnt.

Jetzt werden wir lernen, diese Serie zu konvertieren, die wir gerade im Snapshot oben in ein CSV -Format gesehen haben. Um die Serie an von Kommas getrennten Werten zu ändern, haben wir eine Methode des PANDAS-Moduls, die „Serie“ ist.to_csv () ”. Diese Methode nimmt die Werte der bereitgestellten Serie an und fügt Kommas zwischen den Werten der Spalte hinzu.

Die Serie.to_csv () ”Die Funktion wird aufgerufen. Der Name der Serie, die wir konvertieren möchten, wird mit der Methode als „Türkei“ erwähnt.to_csv () ”. Um die von Kommas getrennten Werte zu erhalten, haben wir eine Variable „comma_Separated“ erstellt und dann ihren Inhalt im Ausgabefenster auf die Funktion „print ()“ aufzurufen.

Hier ist unsere Serie im CSV -Format. Wir können in der Snapshot sehen, dass der Index und die Serienwerte unter Verwendung der darin enthaltenen Kommas getrennt wurden.

Beispiel Nr. 2: Verwendung der Serie.to_csv () Methode zum Umwandeln einer Reihe mit NAN-Werten in von Kommas getrennte Werte

Die zweite Technik, um die „Serie“ auszuüben.to_csv () ”Methode besteht darin, diese Methode anzuwenden, um eine Reihe mit einigen Nulleinträgen in ein CSV -Format zu konvertieren.

Wir haben zunächst die erforderlichen Pakete importiert. Das „PD“ wird als Alias ​​für Pandas und „NP“ als Alias ​​für Numpy hergestellt. Das Numpy -Toolkit wird hier geladen, da wir einige Nulleinträge in unsere Serie mit „NP) einnehmen werden.Nan ”beim Erstellen der Pandas„ PD.Serie () ”Methode.

Der „PD.Serie () ”Die Funktion wird für den Bau einer Pandas -Serie mit diesen Werten aufgerufen:„ Nile “,„ Amazon “, NP.Nan, "Ganges", "Mississippi", "NP.Nan "," Yangtze "," Donau "," Mekong "," NP.Nan “und„ Wolga “. Es gibt insgesamt 21 Werte, die für die Serie definiert sind, aus denen 3 Einträge „NP“ halten.NAN ”-Werte, was bedeutet, dass 3 Werte in der Serie fehlen. Die Eigenschaft "Name" gibt den Namen für dieses Wertearray an, den wir "Titel" angegeben haben. Die Eigenschaft „Index“ wird verwendet, um die benutzerdefinierte Indexliste festzulegen, anstatt mit der Standardliste zu gehen.

Hier wollen wir die Indexliste mit den Werten "10", "11", "12", "13", "14", "16", "17", "18", "19", "20",. und 21 ”. Jetzt wird unsere Serie die Indexliste von „10“ anstelle von „0“ haben. Speichern Sie diese Serie nun, damit wir sie später im Programm verwenden können. Wir haben ein Serienobjekt „Flüsse“ initialisiert und die Ausgaberie aus dem Aufruf "PD" generiert.Serie () ”Methode. Die Serie ist zu sehen, indem sie mit der Funktion „print ()“ von Python angezeigt wird.

Die gerenderte Ausgabe auf dem Terminal druckte eine Serie, deren Indexliste von 10 beginnt und bei 21 endet, was bedeutet, dass die Serie 21 Werte aufweist.

Die Serie wird in ein CSV -Format mit der „Serie“ umgewandelt.to_csv () ”Methode.

Wir haben die „Serie aufgerufen.to_csv () ”Methode mit unserer Serie„ Türkei “. Daher nimmt diese Methode die Werte aus der "Truthahn" -Serie und wandelt sie in ein von Kommas getrennter Werteformat um. Das Ergebnis wird in der Variablen „Converted_csv“ gespeichert. Und letztendlich wird die konvertierte Serie mit Hilfe der Funktion „print ()“ gedruckt.

In der Schnappschuss des folgenden Ergebnisses sehen Sie, dass die Werte der Serie jetzt so geändert werden, dass ein Komma verwendet wird, um sie von der Indexliste zu trennen. Wenn die Werte fehlen, wird nur die Indexnummer mit einem Komma gedruckt.

Abschluss

Die Modifikation einer PANDAS -Serie in ein CSV -Format ist ein praktischer Ansatz. Dies kann durch die Verwendung der Pandas -Serie erreicht werden.to_csv () ”Funktion. Dieser Leitfaden brachte zwei Techniken in die Praxis um diese Methode. In der ersten Abbildung haben wir diese Methode aufgerufen, um eine Serie mit einem DateTimeIndex in ein von Kommas getrennter Werteformat umzuwandeln. Die 2. Instanz verwendete die „Serie“.to_csv () ”Funktion zum Ändern einer Reihe mit einigen fehlenden Einträgen in ein CSV -Format. Beide Techniken wurden praktisch mit dem Tool „Spyder“ unter Windows -Betriebssystem implementiert.