Python CSV Skip Header Row

Python CSV Skip Header Row
In diesem Artikel erfahren wir, wie wir den Header der CSV -Dateidaten entfernen können, während wir das CSV selbst lesen, da wir manchmal nicht den Header der CSV -Dateidaten benötigen. Wir werden also diese vier Methoden lernen, die unten angegeben sind:
  1. Verwenden der nächsten () Methode
  2. Verwenden Sie die Dictreader () -Methode
  3. Pandas Skiprows basierend auf einer bestimmten Zeilennummer
  4. Pandas Skiprows basierend auf einer Indexposition

Erklären wir jede der oben genannten Methoden im Detail im Detail.

Methode 1: Verwendung von Next () Methode

In dieser Methode werden wir die nächste () -Methode verwenden und sehen, wie diese Methode die Header -Zeile verwerfen wird, bevor wir alle anderen CSV -Daten drucken.

CSV -Datei: Die folgende CSV -Datei (Test.CSV) Wir werden für diesen Blog verwenden.

Monat 1958.1959.1960
Jan, 340.360.417
Februar 318.342.391
März, 362.406.419
April 348.396.461
Jan, 340.360.417
Februar 318.342.391 CSV importieren
mit offen ("Test.CSV "," R ") als Aufzeichnung:
# Wir erstellen ein Objekt des CSV -Lesers
csvReader_object = csv.Leser (Datensatz)
# Die Zeile überspringt die erste Zeile der CSV -Datei (Header -Zeile)
Weiter (csvReader_object)
# Wir drucken jetzt alle Zeilen mit Ausnahme der ersten Zeile des CSV
Für Zeile in CSVReader_Object:
Druck (Zeile)

Ausgang:

['Jan', '340', '360', '417']
['Feb', '318', '342', '391']
['Mar', '362', '406', '419']
['Apr', '348', '396', '461']
['Jan', '340', '360', '417']
['Feb', '318', '342', '391']

Zeile 1: Wir importieren das CSV -Modul.

Zeile 3 -7: Wir öffnen den Test.CSV -Datei im Lesemodus ('R') als Datensatz, und dann erstellen wir ein Objekt des CSV.Reader () Methode. Die nächste () -Methode, wenn wir sie nennen, verwaltet die erste Zeile automatisch vom CSV -Readerobjekt und den Rest der Daten, die wir verwenden können, wie wir benötigen.

Zeilen 10-11: Jetzt iterieren wir das CSV -Leserobjekt und drucken jede Zeile. Die obige Ausgabe zeigt, dass es jetzt keine Kopfzeile gibt.

Methode 2: Verwendung von Dictreader () Methode

Jetzt werden wir sehen, wie wir das CSV als Wörterbuchformat lesen können. Nachdem wir die CSV -Datei als direktes Format gelesen haben, drucken wir nur den Wert und nicht den Schlüssel, der unser Problem des Druckens aller Daten ohne die Header -Zeile löst. Wir verwenden den gleichen Test.CSV -Datei, wie wir zuvor verwendet haben. Ein Beispiel für diese Methode ist unten angegeben:

CSV importieren
mit offen ("Test.CSV "," R ") als Aufzeichnung:
# Wir erstellen ein Objekt des CSV -Lesers
csvReader_object = csv.Dictreader (Aufzeichnung)
# Die Zeile überspringt die erste Zeile der CSV -Datei (Header -Zeile)
# weil es als Diktat funktioniert und wir nur Werte drucken, nicht Schlüssel
Für Zeile in CSVReader_Object:
print (row ["monat"], row ["1958"], row ["1959"], row ["1960"])

Ausgang:

Jan 340 360 417
Februar 318 342 391
März 362 406 419
Apr 348 396 461
Jan 340 360 417
Februar 318 342 391

Zeile 1: Wir importieren das CSV -Modul.

Zeile 3 -5: Wir öffnen den Test.CSV -Datei im Lesemodus ('R') als Datensatz, und dann erstellen wir ein Objekt des CSV.Dictreader () Methode.

Zeilen 8-9: Jetzt iterieren wir das CSV-Dictreader-Objekt und drucken jede Zeile. Diese Zeile verengt jedoch automatisch die erste Zeile vom CSV -Reader -Objekt, da Dictreader jede Zeile in einem Diktat (Schlüssel und Wert) umwandelt. Wenn wir nur Wert drucken, nicht der Schlüssel, der nur die Daten zeigt, nicht das k, v, was unser Hauptziel war.

Methode 3: Verwenden von pandas read_csv Skiprows -Attributen

In dieser Methode werden wir das Pandas Read_CSV -Attribut Skiprows verwenden. In den Skiprows erwähnen wir die Header -Zeilennummer, die offensichtlich 1 ist. Daher definieren wir den Wert der Skiprows als 1, wie im folgenden Programm gezeigt. Auf diese Weise können wir die Header -Reihe vom CSV beim Lesen der Daten ignorieren.

Pandas als PD importieren
Skipheaderdf = Pd.Read_csv ('Test.CSV ', Skiprows = 1)
drucken (Skipheaderdf)

Ausgang:

Jan 340 360 417
0 Feb 318 342 391
1. März 362 406 419
2 Apr 348 396 461
3. Januar 340 360 417
4. Februar 318 342 391

Linie 1: Wir importieren die Pandas -Bibliothek als PD.

Zeile 2: Wir haben die CSV -Datei mit dem Pandas Read_CSV -Modul gelesen, und in diesem Fall haben wir die SkipRows = 1 erwähnt, was bedeutet, die erste Zeile zu überspringen, während wir die CSV -Dateidaten lesen.

Zeile 4: Jetzt drucken wir das endgültige DataFrame -Ergebnis, das in der obigen Ausgabe ohne die Kopfzeile gezeigt wurde.

Methode 4: Entfernen Sie mit Pandas den Header des CSV mithilfe der Indexposition

In dieser Methode werden wir das Pandas Read_CSV -Attribut Skiprows verwenden. In den Skiprows erwähnen wir die Header -Index -Positionsnummer, die offensichtlich 0 ist. Daher definieren wir den Wert der Skiprows in quadratischen Klammern ([0]), wie im folgenden Programm gezeigt. Auf diese Weise können wir die Header -Reihe vom CSV beim Lesen der Daten ignorieren.

Pandas als PD importieren
Skipheaderdf = Pd.Read_csv ('Test.CSV ', Skiprows = [0])
drucken (Skipheaderdf)

Ausgang:

Jan 340 360 417
0 Feb 318 342 391
1. März 362 406 419
2 Apr 348 396 461
3. Januar 340 360 417
4. Februar 318 342 391

Linie 1: Wir importieren die Pandas -Bibliothek als PD.

Zeile 2: Wir haben die CSV -Datei mit dem Pandas Read_CSV -Modul gelesen. Darin haben wir die Skiprows = [0] erwähnt, was bedeutet, dass die erste Zeile übersprungen wird, während wir die CSV -Dateidaten lesen.

Zeile 4: Jetzt drucken wir das endgültige DataFrame -Ergebnis, das in der obigen Ausgabe ohne die Kopfzeile gezeigt wurde.

Abschluss:

In diesem Artikel wurden vier verschiedene Methoden vorhanden, um die Header -Zeile beim Lesen der CSV -Datei zu überspringen. Alle Methoden im obigen Artikel sind vollkommen in Ordnung und werden vom Python -Programmierer verwendet, um den Header der CSV -Datei beim Lesen der CSV -Daten zu überspringen. Mit der Pandas -Bibliotheksmethode können wir nicht nur den Header der CSV -Dateidaten entfernen, sondern auch zum Entfernen anderer Zeilen verwendet werden, wenn wir ihre Nummer oder Indexposition in den Skiprows angeben. Die Skiprows können also alle Zeilen entfernen, deren Zahlen ihnen zugewiesen werden. Das Pandas -Modul zum Überspringen von Header ist also am besten zu verwenden und ist auch sehr bequem, um die anderen Zeilen zu entfernen.

Die anderen Methoden, die Dictreader und Leser verwenden.