XLSX zu CSV in Python

XLSX zu CSV in Python
In den letzten Jahren ist Python zu einer der dominierenden Programmiersprachen gestiegen. Die Python -Community hat sich aufgrund der Beliebtheit und des Nutzens von Python erheblich erweitert. In diesem Artikel werden wir detailliert eingehen, wie Sie mit Python XLSX in CSV konvertieren können. Wir sind uns bewusst, dass Excel -Dateien häufig zur Durchführung von Finanzanalysen, zur Organisation der Daten, der Dateneingabe, der Buchhaltung, des Datenmanagements, zum Erstellen von Diagrammen und Grafiken usw. verwendet werden. Wir bevorzugen jedoch meistens CSV -Dateien für den Datenimport und Exportieren. Es ist ein Ansatz, die strukturierten Daten mit einer einfachen Textdatei zu übertragen.

Was ist eine XSLX -Datei?

Bei der Erstellung von Tabellenkalkulationen in den neuesten Versionen von Excel verwendet Microsoft eine XLSX -Datei als Standard -Dateityp. Ähnlich wie der DOCX -Dateityp von Word können wir die XLSX -Dateien mit einer Vielzahl von Anwendungen/Programmen öffnen.

Was ist eine CSV -Datei?

Das CSV -Dateiformat können die tabellarischen Datenwerte in Tabellenkalkulationen und Datenbanken speichern. Die tabellarischen Daten, Text oder Text werden in einer CSV -Datei als einfacher Text gespeichert. Ein Datensatz in der CSV -Datei ist der Datenwert, der in jeder Zeile der Datei gespeichert ist. Jeder Datensatz kann mehr als ein Feld haben, das durch Kommas getrennt wird.

Schlüsselunterschiede zwischen XLSX- und CSV -Dateien

Benutzer verwenden häufig CSV- und XLSX austauschbar, und sie sind sich der Unterscheidungen zwischen ihnen im Allgemeinen nicht bewusst, was ihre grundlegenden Merkmale sind und wie sie funktionieren. Es dient nur als Informationsquelle für den Benutzer. Nahe. Im Folgenden finden Sie einige wichtige Unterschiede zwischen XLSX- und CSV -Dateien, die Sie kennen sollten:

  • Das CSV -Format speichert tabellarische Daten in eine Trennzeichen -Textdatei mit der .CSV -Erweiterung. Während die Excel- oder XLSX -Datei eine Tabelle ist, die Dateien in ihrem proprietären Format speichert, nämlich. XLS oder XLSX.
  • Excel -Dateien sind Binärdateien, die die Daten auf jedem Arbeitsblatt in einer Arbeitsmappe enthalten. Während CSV ein einfaches und einfaches Textformat mit einer Abfolge von Datenwerten ist, die durch Kommas getrennt sind.
  • Datenoperationen können nicht in CSV -Dateien durchgeführt werden. Sie können jedoch auf Excel -Dateien durchgeführt werden.
  • CSV -Dateien sind schneller und verwenden weniger Speicher als XLSX -Dateien. Excel verwendet jedoch mehr Speicher beim Importieren der Daten.
  • Wenn wir CSV mit Excel vergleichen, können wir die CSV -Dateien in einem Windows -Texteditor öffnen, während Excel -Dateien dies nicht können.

Wie kann eine XLSX -Datei mit Python in CSV konvertiert werden??

Eine XLSX -Datei kann mit einer Vielzahl von Methoden in eine CSV -Datei in Python umgewandelt werden. Python enthält eine Vielzahl von Modulen und Funktionen, die uns helfen können, diese Aufgabe zu erfüllen. Hier werden wir einige Methoden durchlaufen, mit denen die XLSX -Dateien in Python in CSV -Dateien konvertiert werden können.

Voraussetzungen, um die Excel -to -CSV -Umwandlung durchzuführen

Die Installation der Anforderungen ist der erste Schritt. Wir verwenden die Module wie Combine Pandas, CSV und OpenPyxl usw. In diesem Tutorial. Pythons Pandas -Paket ermöglicht die Manipulation und Analyse von Daten. Pandas ist eine bekannte Bibliothek unter Python-Programmierern. Excel -Dateien können mit dem Python -Paket gelesen und geschrieben werden, das als OpenPyxl bezeichnet wird. Wir werden uns nicht direkt mit dieser Bibliothek auseinandersetzen. Pandas nutzen stattdessen OpenPyxl intern.

Mit dem PYPI -Repository können wir beide Pakete installieren:

Methode 1: Konvertieren von XLSX mit dem PANDAS -Modul in CSV konvertieren

Beispiel 1: Konvertieren einer XLSX -Datei in CSV

Pandas ist ein Open-Source-Modul, das für die Python-Programmiersprache erstellt wurde, um die Daten zu manipulieren und zu analysieren. Um mit Zeitreihen und numerischen Tabellen zu arbeiten, bietet Pandas eine Vielzahl von Funktionen und Funktionen. Mit Pandas können kleine und riesige Datensätze gelesen, gefiltert und neu angeordnet werden. Und die Ergebnisse können in verschiedenen Formaten wie Excel, JSON und CSV produziert werden. Wir verwenden die Pandas -Methode read_excel (), um eine Excel -Datei zu lesen, und die Methode to_csv (), um den Datenrahmen in eine CSV -Datei umzuwandeln.

Wir drucken unsere .CSV -Datei als Datenrahmen, wie in der Ausgabe angezeigt werden kann. Das vorherige Skript wandelt unsere XLSX -Datei in CSV um und erstellt ein „Gehalt.CSV ”-Datei im aktuellen Verzeichnis.

Beispiel 2: Konvertieren der XLSX -Datei (mit mehreren Blättern) in CSV

In dem folgenden Beispiel haben wir zuerst die Blattnamen der Excel -Datei gelesen. Die Namen einzelner Blätter werden dann durchgeschaltet und als unterschiedliche CSV -Dateien gespeichert. Das Skript speichert CSVs am selben Ort.

Wir verwenden eine Beispiel -XLSX -Datei mit zwei oder mehr Arbeitsblättern oder Tabellenkalkulationen.

Wie zu sehen ist, besteht unsere XLSX -Datei aus zwei Blättern (Sheet1 und Sheet2). Jetzt schreiben wir einen Code, um diese XLSX -Datei in CSV umzuwandeln.

Ausgang:

Das Skript konvertierte die XLSX -Datei erfolgreich mit zwei Blättern in eine einzelne CSV -Datei mit einem einzelnen Blatt.

Beispiel 3: Konvertieren mehrerer XLSX -Dateien in separate CSV -Dateien

Betrachten Sie ein Szenario, in dem Sie mehrere Excel -Dateien in Ihrem Arbeitsverzeichnis in CSV konvertieren möchten. Sie könnten diese Methode anwenden. Wir beginnen mit der Annahme, dass jede Datei nur ein Blatt enthält. Dann erweitern wir unsere Methode, um mehrere Dateien und mehrere Blätter zu verarbeiten. Der folgende Python -Code verwendet das Glob -Standardmodul. Wir entsprechen den Dateipfaden, die Muster mit GLOB verwenden. Es stimmt mit allen Dateien mit dem überein .XLSX -Erweiterung im Arbeitsverzeichnis. Danach entwickeln wir eine Funktion, die die Excel -Dateien liest und sie als CSV -Dateien speichert. Wir nennen diese Funktion auf jedem Dateipfad, der gefunden wurde.

Dieses vorherige Skript wandelt alle XLSX -Dateien im aktuellen Verzeichnis in CSV -Dateien um.

Jetzt konvertieren wir die XLSX -Dateien mit mehreren Tabellenkalkulationen in CSV. Dies ist höchstwahrscheinlich der schwierige Teil. Drei Excel -Dateien befinden sich in unserem Arbeitsverzeichnis. Einige von ihnen bestehen auch aus mehr als einem Blatt. Wir zielen auf:

  1. Erstellen Sie ein Verzeichnis für jede Tabellenkalkulationsdatei,
  2. Konvertieren Sie die Excel -Dateiblätter in CSV und sie sollten im neu erstellten Verzeichnis aufbewahrt werden.

Das Skript wandelt den XLSX mit einzelnen und mehreren Blättern in separate CSV -Dateien um und speichert sie in neuen Verzeichnissen mit demselben Namen.

Um jede Excel -Datei im aktuellen Verzeichnis abzurufen, wird die Glob -Funktion verwendet. Danach werden Ordner für jede XLSX -Datei mit dem Betriebssystem erstellt.MKDIR -Funktion. Anschließend wird für jedes Blatt im neuen Verzeichnis eine CSV -Datei erstellt, indem Sie über den Blattnamen schleifen.

Methode 2: Konvertieren von XLSX in CSV mithilfe von OpenPYXL- und CSV -Modulen

In dieser Methode werden wir die OpenPYXL- und CSV -Module verwenden, um die XLSX -Dateien in CSV umzuwandeln. So lesen und schreiben Sie 2010 XLSX-, XLSM-, XLTX- und XLTM -Dateien, das Python -Modul OpenPyXL kann verwendet werden. Das CSV-Modul enthält Klassen, die das Lesen und Schreiben von tabellarischen CSV-formatierten Tabellendaten ermöglichen.

Um unsere XLSX -Datei zu lesen oder zu laden, verwenden wir die Funktion load_workbook () des OpenPyxl -Moduls. Sie können diese Funktion verwenden, wenn Sie eine vorhandene XLSX/Excel -Datei in Python schreiben oder lesen müssen. Nach der Aktivierung von Excel verwenden wir den CSV.Writer () Funktion zum Erstellen unserer CSV -Datei. Anschließend wird die For-Schleife verwendet, um die Daten in den Datenzellen der CSV-Datei zu speichern. Wir konvertieren unser Beispiel.XLSX -Datei in MyFile.CSV, wie im folgenden Bild zu sehen ist:

Abschluss

In diesem Tutorial haben wir Ihnen eine kurze Einführung in XLSX -Dateien und CSV -Dateien gegeben. Wir haben die wichtigsten Unterschiede zwischen beiden Dateiformaten erläutert. Wir haben zwei Methoden mit mehreren Beispielen besprochen, um zu lehren, wie die XLSX -Dateien mit einzelnen oder mehreren Blättern in CSV -Dateien konvertiert werden können. Wir haben ein Beispiel implementiert, um mehrere XLSX -Dateien gleichzeitig in CSV -Dateien umzuwandeln. Es kann einfach oder schwierig sein, die Daten von Excel in CSV umzuwandeln. Wenn Sie nur eine Datei mit einer kleinen Anzahl von Blättern haben, ist sie einfach. Aber wenn nicht, kann es schwierig sein.