So lesen Sie die Excel -Datei in Python

So lesen Sie die Excel -Datei in Python

Der .xlsx ist die Erweiterung des Excel -Dokument. Manchmal ist es erforderlich, die Daten aus dem Excel -Dokument mithilfe des Python -Skripts für Programmierzwecke zu lesen. In Python gibt es viele Module, um das Excel -Dokument zu lesen. Einige der nützlichen Module sind xlrd, openpyxl, Und Pandas. Die Möglichkeit, diese Module zu verwenden, um die Excel -Datei in Python zu lesen, wurden in diesem Tutorial gezeigt.

Voraussetzung:

Eine Dummy Excel -Datei mit der .Die XLSX -Erweiterung ist erforderlich, um die Beispiele dieses Tutorials zu überprüfen. Sie können jede vorhandene Excel -Datei verwenden oder eine neue erstellen. Hier eine neue Excel -Datei mit dem Namen Verkauf.xlsx Die Datei wurde mit den folgenden Daten erstellt. Diese Datei wurde zum Lesen verwendet, indem im nächsten Teil dieses Tutorials verschiedene Python -Module verwendet werden.

Verkauf.xlsx

Verkaufsdatum Verkäufer Menge
12/05/18 Sila Ahmed 60000
06/12/19 Mir Hossain 50000
09/08/20 Sarmin Jahan 45000
07/04/21 Mahmudul Hasan 30000

Beispiel 1: Lesen Sie die Excel-Datei mit XLRD lesen

Das XLRD -Modul ist standardmäßig nicht mit Python installiert. Sie müssen also das Modul installieren, bevor Sie es verwenden. Die neueste Version dieses Moduls unterstützt die Excel -Datei nicht mit der .XLSX -Erweiterung. Sie müssen also die 1 installieren.2.0 Version dieses Moduls zum Lesen der XLSX -Datei. Führen Sie den folgenden Befehl vom Terminal aus, um die erforderliche Version von zu installieren xlrd.

$ pip installieren xlrd == 1.2.0

Erstellen Sie nach Abschluss des Installationsprozesses eine Python -Datei mit dem folgenden Skript, um das zu lesen Verkauf.xlsx Datei mit der xlrd Modul. open_workbook () Die Funktion wird im Skript verwendet. Öffnen Sie die XLSX -Datei zum Lesen. Diese Excel -Datei enthält nur ein Blatt. Also die Arbeitsmappe.Sheet_by_index () Die Funktion wurde im Skript mit dem Argumentwert 0 verwendet. Als nächstes das verschachtelte 'für' Die Schleife hat verwendet, um die Zellwerte des Arbeitsblatts mit den Zeilen- und Spaltenwerten zu lesen. Im Skript wurden zwei Funktionen von Range () verwendet, um die Zeile und die Spaltengröße basierend auf den Blattdaten zu definieren. Der cell_value () Funktion wurde verwendet, um den jeweiligen Zellwert des Blattes in jeder Iteration der Schleife zu lesen. Jedes Feld in der Ausgabe wird durch einen Registerkartenraum getrennt.

# Das XLRD -Modul importieren
XLRD importieren
# Öffnen Sie die Arbeitsmappe
Arbeitsbuch = xlrd.Open_workbook ("Verkauf.xlsx ")
# Öffnen Sie das Arbeitsblatt
Arbeitsblatt = Arbeitsmappe.Sheet_by_index (0)
# Iterieren Sie die Zeilen und Spalten
für i im Bereich (0, 5):
für j in Reichweite (0, 3):
# Drucken Sie die Zellwerte mit Tabellenraum
Druck (Arbeitsblatt.cell_value (i, j), end = '\ t')
drucken(")

Ausgang:

Die folgende Ausgabe wird nach der Ausführung des obigen Skripts angezeigt.

Beispiel-2: Lesen Sie die Excel-Datei mit OpenPyXL

Der openpyxl ist ein weiteres Python -Modul zum Lesen der XLSX -Datei und wird standardmäßig nicht mit Python installiert. Führen Sie den folgenden Befehl vom Terminal aus, um dieses Modul vor der Verwendung zu installieren.

$ pip Installieren Sie OpenPyxl

Erstellen Sie nach Abschluss des Installationsprozesses eine Python -Datei mit dem folgenden Skript, um das zu lesen Verkauf.xlsx Datei. Wie das XLRD -Modul, Der OpenPyxl Modul hat das load_workbook () Funktion zum Öffnen der XLSX -Datei zum Lesen. Der Verkauf.xlsx Die Datei wird als Argumentwert dieser Funktion verwendet. Das Objekt der Wookbook.aktiv wurde im Skript erstellt, um die Werte des max_row und das max_column Eigenschaften. Diese Eigenschaften wurden im verschachtelten Schleifen verwendet, um den Inhalt der zu lesen Verkauf.xlsx Datei. Die Funktion von Range () wurde verwendet, um die Zeilen des Blattes zu lesen, und die Funktion iter_cols () wurde verwendet, um die Spalten des Blattes zu lesen. Jedes Feld im Ausgang wird durch zwei Registerkartenbereiche getrennt.

# Openyxl -Modul importieren
OpenPyxl importieren
# Definieren Sie die Variable, um das Wookbook zu laden
WOOKBOOK = OpenPyxl.Load_workbook ("Verkauf.xlsx ")
# Variable definieren, um das aktive Blatt zu lesen:
Arbeitsblatt = Wookbook.aktiv
# Iterieren Sie die Schleife, um die Zellwerte zu lesen
für i in Reichweite (0, Arbeitsblatt.max_row):
für Col in Arbeitsblatt.Iter_cols (1, Arbeitsblatt.max_column):
print (col [i].Wert, end = "\ t \ t")
drucken(")

Ausgang:

Die folgende Ausgabe wird nach der Ausführung des obigen Skripts angezeigt.

Beispiel-3: Lesen Sie die Excel-Datei mit Pandas

Das Pandas-Modul ist nicht mit Python-artig installiert, das vorherige Modul. Wenn Sie es also noch nicht installiert haben, müssen Sie es installieren. Führen Sie den folgenden Befehl aus, um die zu installieren Pandas vom Terminal.

$ pip install Pandas

Erstellen Sie nach Abschluss des Installationsprozesses eine Python -Datei mit dem folgenden Skript, um das zu lesen Verkauf.xlsx Datei. Der read_excel () Die Funktion von Pandas wird zum Lesen der XLSX -Datei verwendet. Diese Funktion wurde im Skript verwendet, um die zu lesen Verkauf.xlsx Datei. Der DataFrame () Die Funktion wurde hier verwendet, um den Inhalt der XLSX -Datei im Datenrahmen zu lesen und die Werte in der benannten Variablen zu speichern Daten. Der Wert der Daten wurde später gedruckt.

# Pandas importieren
Pandas als PD importieren
# Die XLSX -Datei laden
excel_data = pd.read_excel ('Verkauf.XLSX ')
# Lesen Sie die Werte der Datei im Datenrahmen
Daten = Pd.DataFrame (excel_data, columns = [
"Verkaufsdatum", "Verkäuferin", "Betrag"])
# Drucken Sie den Inhalt
print ("Der Inhalt der Datei ist: \ n", Daten)

Ausgang:

Die folgende Ausgabe wird nach der Ausführung des obigen Skripts angezeigt. Die Ausgabe dieses Skripts unterscheidet sich von den beiden vorherigen Beispielen. Die Zeilennummern werden in der ersten Spalte gedruckt, wobei der Zeilenwert von 0 gezählt wurde. Die Datumswerte sind zentral ausgerichtet. Die Namen der Verkäufer sind rechts ausgerichtet. Die Menge ist links ausgerichtet.

Abschluss:

Die Python -Benutzer müssen mit XLSX -Dateien für verschiedene Programmierzwecke arbeiten. In diesem Tutorial wurden drei verschiedene Möglichkeiten zum Lesen der XLSX -Datei unter Verwendung von drei Python -Modulen gezeigt. Jedes Modul verfügt über unterschiedliche Funktionen und Eigenschaften, um die XLSX -Datei zu lesen. Dieses Tutorial hilft Python -Benutzern, die XLSX -Datei nach dem Lesen dieses Tutorials einfach mit dem Python -Skript zu lesen.