Pandas exportieren nach Excel

Pandas exportieren nach Excel
Der DataFrame ist die Kernkomponente in fast allen Pandas -Operationen. Normalerweise speichern Sie Daten, die Sie aus einer Datei in einem Pandas -DataFrame -Objekt importieren. Es bleibt im DataFrame -Objekt, auch nachdem Änderungen darauf angewendet wurden. Um auf Daten außerhalb von Python zuzugreifen, müssen Sie häufig in einem anderen Format exportieren.

In diesem Tutorial erläutern wir Ihnen zwei Methoden zum Exportieren eines Pandas -Datenframes in eine Excel -Datei. Die erste Technik besteht darin, das „DF) aufzurufen.to_excel () ”zum Exportieren in eine Excel -Datei. Der „PD.Excelwriter () ”-Methode ist der zweite Ansatz in diesem Artikel. Diese Technik schreibt Objekte in die Excel -Tabelle und exportiert sie anschließend in die Excel -Datei mit der Methode "To Excel".

Beispiel Nr. 1: Verwendung von Pandas DF.to_excel () Methode

Um den DataFrame in Excel zu exportieren, benötigen wir eine Voraussetzungsbibliothek „OpenPyxl“. Diese Bibliothek kann in die Python -Umgebung installiert werden, indem der PIP -Befehl "PIP Installation OpenPyxl" ausgeführt wird.

Beginnend mit dem Python -Skript haben wir zuerst die Pandas -Bibliothek geladen. Das PANDAS -Modul wird als „PD“ importiert, was für Pandas Alias ​​ist. Um das Datagramm in Excel zu exportieren, müssen wir in erster Linie einen Datenrahmen erstellen. Die Datenframekonstruktion kann durch die Verwendung des „PD“ erreicht werden.DataFrame () ”Methode. Der „PD.Die DataFrame () ”-Methode wird aufgerufen, um Datenframe mit 3 Spalten„ Sprache “,„ Punkten “und„ Projekte “zu generieren. Die Spalte "Sprache" speichert Namen der Programmiersprachen, die "Java", "Python", "C ++", "R", "Kotlin" und "Php" sind.

Wir haben die Ganzzahl -Typwerte für die Spalte "Punkte" als "10", "6", "20", "15", "9" und "14" definiert. Die dritte Spalte "Projekte" hat eine Anzahl von Projekten für jede Sprache, die "11", "4", "8", "17", "6" und "5" sind. Wir haben diesen Datenrahmen in das DataFrame -Objekt "Prog" gespeichert. Um diesen Datenrahmen anzuzeigen, haben wir Pythons „Print ()“ -Methode verwendet.

Wir können das Skript ausführen, indem wir die Tasten "Eingeben+Umschalteingänge eingeben" zusammenklicken oder auf die Schaltfläche "Datei ausführen" klicken. Die Python -Konsole zeigt uns einen Datenrahmen mit 3 Spalten und 6 Zeilen.

Der Datenrahmen wurde produktiv erstellt. Das Exportieren in die Excel -Datei ist die nächste Aufgabe. Wenn wir einen Datenrahmen in die Excel/CSV -Datei exportieren, wird dies standardmäßig im aktuellen Arbeitsverzeichnis unserer Python -Umgebung gespeichert. Sie können diese Einstellung auch ändern, indem Sie einen bestimmten Pfad bereitstellen, auf dem Sie die Datei exportieren möchten. Wir werden in dieser Instanz mit den Standardeinstellungen arbeiten.

Zunächst müssen wir das aktuelle Arbeitsverzeichnis unserer Umwelt sehen. Dies kann durch die Verwendung des unten angegebenen Python -Skripts erfolgen:

Hier haben wir unser aktuelles Arbeitsverzeichnis gefunden, das "Desktop" ist. Dies bedeutet, dass die Dateien in das Desktop -Verzeichnis unseres Systems exportiert werden.

Um den Datenrahmen zu exportieren, haben wir nun eine Methode „DF.to_excel () ”von Pandas bereitgestellt. Die Methode "to_excel ()" wird mit dem Namen des Datenrahmens aufgerufen, der "Prog" ist. Zwischen den Klammern der Funktion haben wir den Namen der Excel -Datei als „mydata“ mit dem “angegeben.XLSX ”Erweiterung. Dadurch wird das DataFrame -Objekt "Prog" direkt in das Excel -Blatt geschrieben. Die Excel -Datei wird in unserem aktuellen Arbeitsverzeichnis gespeichert, das wir bereits als Desktop zugewiesen haben.

Wenn wir das Skript ausführen, wird der Datenrahmen in die Excel -Datei auf dem Desktop exportiert. Wir haben das Desktop -Verzeichnis unserer Maschine geöffnet und eine Excel -Datei namens "MyData" gefunden. Das Öffnen der Datei zeigt uns den Datenrahmen an, den wir in die "XLSX" -Datei exportiert haben. In dem hier angeschlossenen Schnappschuss können Sie beobachten, dass der Blattname so angegeben ist, dass "mydata" angegeben ist.

Im obigen Bild haben wir gesehen, dass die Indizes in einer Spalte gespeichert sind. Außerdem können Sie auch die Beschriftungen der Spalten beseitigen. Dies kann nur mit zwei Parametern "Index" und "Header" erfolgen.

Standardmäßig werden die Parameter "Index" und "Header" auf "True" gesetzt. Wenn wir sie nicht wollen, ändern wir einfach die Standardeinstellungen für beide Argumente in „Falsch“.

Hier haben wir unsere Excel -Datei ohne Indexspalte und die Titel der Spalten.

Beispiel Nr. 2: Verwendung von Pandas PD.Excelwriter () -Methode

Diese Demonstration vermittelt Ihnen eine andere Methode zum Exportieren eines Pandas -Datenfreame in eine Excel -Datei.

Das Programm begann mit dem Importieren des Pandas -Toolkits in die Python -Datei. Die Pandas -Funktionen sind für uns jetzt in der Python -Datei zugänglich. Um einen Datenrahmen in Excel zu exportieren, müssen wir zunächst einen haben. Der Datenrahmen wird durch Verwendung der Pandas „PD) generiert.DataFrame () ”-Funktion. Wir haben die „PD angerufen.DataFrame () ”-Methode und initialisierte den DataFrame mit 4 Spalten. Die Spaltenbezeichnungen sind "STD_ID", "Economics", "Geographie" und "Geschichte".

Die Spalte "STD_ID" speichert die IDs der Schüler als "1011", "1012", '1013 "," 1014 "und" 1015 ". Die Markierungen von 3 Probanden werden in Spalten "Wirtschaft" mit Werten "98", "60", "70", "65", 87 "gespeichert. "Geographie", die Werte "51", "78", "88", "97" und "56"; und "Geschichte" mit diesen Einträgen "56", "76", "78", "65" und "79". Alle diese Spalten müssen die gleiche Wertelänge haben müssen.

In unserer Abbildung beträgt die Säulengröße 5. Der „PD.Datenfreame () “-Methode, wenn aufgerufen wird, um einen Datenrahmen mit diesen Werten zu erstellen, erfordert ein Objekt, in dem er den Datenrahmen speichern kann. Wir haben ein DataFrame -Objekt "Bericht" erstellt und es die Ausgabe des Aufrufens des PD zugewiesen.DataFrame () ”Methode. Um den DataFrame auf dem Bildschirm anzuzeigen, haben wir die Funktion „print ()“ verwendet.

Der neu erstellte DataFrame mit 4 Spalten wurde auf der Python -Konsole ausgestellt.

Wir werden nun sehen, wie Sie diesen Datenrahmen in einer Excel -Datei unter Verwendung von Pandas „PD speichern können.Excelwriter () ”Methode. Der „PD.Excelwriter () ”wird aufgerufen und zwischen ihren Klammern haben wir den Namen der Excel -Datei mit der“ definiert.XLSX ”-Weiterung als„ ReportCard “.XLSX ”. Eine Variable „Speicher“ ist gebaut, um das Ergebnis von „PD“ zu speichern.Excelwriter () “, der eine Excel -Datei ist. Jetzt haben wir ein Excel -Blatt mit dem Namen „ReportCard.XLSX ”. Wir werden den Datenrahmen jetzt in ihn exportieren.

Dafür ist die Pandas -Methode „df.to_excel () “heißt. Der Name des DataFrame "Berichts" wird mit dem "angehängt".to_excel () ”Methode. Die Variable „Speicher“, die eine Excel -Datei hat, wird als Parameter übergeben. Der Datenrahmen wird also in der „ReportCard“ exportiert.XLSX ”Datei. Um den Tabelleninhalt zu speichern, haben wir eine Methode „DF.speichern()". Die Methode „Save ()“ wird verwendet und der Datenrahmen wird erfolgreich in die Excel -Datei gespeichert. Denken Sie daran, dass diese Datei im aktuellen Arbeitsverzeichnis unseres Projekts gespeichert wird, was in diesem Fall das Desktop -Verzeichnis ist.

Die „ReportCard.Die XLSX -Datei finden Sie im Desktop -Verzeichnis unserer Maschine. Die Datei wird gestartet und hier sehen wir, dass der von uns erstellte Datenrahmen in dieser Datei gespeichert ist.

Abschluss

Dieser Artikel hat Sie mit zwei Strategien vertraut gemacht, um das gewünschte Ergebnis zu erzielen. Die beiden Methoden von Pandas wurden diskutiert. Die praktische Demonstration von Beispielcodes für die Verwendung beider Methoden wurde im Spyder -Tool durchgeführt. Das erste Beispiel verwendete das „DF.to_excel () ”Methode zum Exportieren des Datenrahmens in eine Excel.Excelwriter () ”Methode zum Speichern des Datenfrequers in einem Excel -Blatt.