Python las CSV in 2D -Array vor

Python las CSV in 2D -Array vor
Wie wir wissen, sprechen wir, wenn wir über das 2D -Array sprechen, über das Numpy -Array. Das Numpy -Array wird im Grunde genommen von Informatikern und Ingenieuren für maschinelles Lernen verwendet, um die enormen Datenmengen in der CSV -Datei zu befassen. Infolgedessen ermöglicht Numpy sie, große Datenmengen in einer CSV -Datei auf sehr bequeme Weise zu verarbeiten. Python hilft auch auf die gleiche Weise, indem sie verschiedene Methoden zum Lesen der CSV -Dateidaten in ein Numpy -Array bereitstellen. Wir werden also in diesem Artikel diese verschiedenen Arten von Methoden kennenlernen.
  1. Mit Numpy loadTxt () Methode
  2. Unter Verwendung von Numpy GenfromTxt () -Methode
  3. Verwenden von Pandas DataFrame
  4. Verwenden der Listendatenstruktur
  5. Verwenden der Pandas DataFrame Values ​​() -Methode

Was ist eine CSV -Datei?

Ein CSV ist eine Datei (comma -getrennte Werte), in der Daten in Form einer Tabelle enthalten sind. Die Erweiterung der CSV -Datei ist .CSV. Diese CSV -Datei wird hauptsächlich in der Datenanalyse verwendet. Neben der Datenanalyse wird die CSV-Datei auch in der E-Commerce-Anwendung verwendet, da sie in allen Arten von Programmiersprachen sehr einfach zu handhaben ist.

Methode 1: Verwendung der Methode Numpy LoadTxt ()

In dieser Methode werden wir den Numpy verwenden.methode loadTxt (), die die CSV -Daten in ein 2D -Array umwandelt. Das folgende ist eine Beispiel -CSV -Datei, die wir in diesem Programm verwenden werden.

1,2
3,4
5,6
7,8
9,10

Python -Code:

Numph als NP importieren
Csvdata = open ("samplecsv.CSV ")
Array2d_result = np.loadTxt (csvdata, delimiter = ","))
print (array2d_result)

Ausgang:

[1. 2.]
[ 3. 4.]
[5. 6.]
[7. 8.]
[9. 10.]]]

Linie 1: Wir importieren die Numpy -Bibliothek.

Zeile 3-4: Wir öffnen die SampleCSV -Datei und übergeben sowohl CSVData als auch den Trennzeichen an NP.loadTxt () -Funktion, die die Daten in ein 2D -Array zurückgibt.

Zeile 6: Wir drucken endlich das Ergebnis, das zeigt, dass unsere CSV -Daten jetzt in ein 2D -Array konvertiert wurden.

Methode 2: Mit der Methode Numpy GenfromTXT ())

In dieser Methode werden wir den Numpy verwenden.GenfromTXT () -Methode, die die CSV -Daten in ein 2D -Array umwandelt. Das folgende ist eine Beispiel -CSV -Datei, die wir in diesem Programm verwenden werden.

1,2
3,4
5,6
7,8
9,10

Python -Code:

Numph als NP importieren
Csvdata = open ("samplecsv.CSV ")
Array2d_result = np.GenfromTXT (csvdata, delimiter = ","))
print (array2d_result)

Ausgang:

[1. 2.]
[ 3. 4.]
[5. 6.]
[7. 8.]
[9. 10.]]]

Linie 1: Wir importieren die Numpy -Bibliothek.

Zeile 3-4: Wir öffnen die SampleCSV.GenfromTxt () -Funktion, die die Daten in ein 2D -Array zurückgibt.

Zeile 6: Wir drucken endlich das Ergebnis, das zeigt, dass unsere CSV -Daten jetzt in ein 2D -Array konvertiert wurden.

Methode 3: Verwenden des PANDAS -Datenframe

Bei dieser Methode werden wir die Pandas verwenden, die die CSV -Daten in ein 2D -Array umwandeln. Im Folgenden finden Sie eine Beispiel -CSV -Datei, die wir in diesem Programm verwenden werden.

1,2
3,4
5,6
7,8
9,10 Pandas als PD importieren
df = pd.read_csv ('samplecsv.CSV ')
Druck (df)
Array2d_result = df.to_numpy ()
print (array2d_result)

Ausgang:

1 2
0 3 4
1 5 6
2 7 8
3 9 10
[[3 4]
[5 6]
[7 8]
[9 10]]

Linie 1: Wir importieren die Pandas -Bibliothek als PD.

Zeile 2-3: Wir lesen die CSV -Datei mithilfe der PANDAS -Read_CSV.

Zeile 4-5: Wir verwenden dann die DataFrame -Methode to_numpy, die die gesamten Datenframewerte in ein 2D -Array umwandelt, wie in der Ausgabe gezeigt.

Methode 4: Verwenden der Listendatenstruktur

In dieser Methode werden wir die Listendatenstruktur verwenden. Die Liste kann uns auch helfen, die CSV-Daten in ein 2-D-Array zu bringen. Das folgende Programm zeigt dieselbe Methode.

CSV importieren
Numpy importieren
mit offen ("Samplecsv.CSV ", newline =") als Datei:
result_list = list (csv.Leser (Datei))
print (result_list)
result_2d = numpy.Array (result_list)
print (result_2d)

Ausgang:

[['1', '2'], ['3', '4'], ['5', '6'], ['7', '8'], ['9', '10'] ]
[['1' '2']
['3' '4']
['5' '6']
['7' '8']
['9' '10']]]

Linie 1: Wir importieren die CSV- und Numpy -Bibliotheken.

Zeilen 3-5: Wir öffnen die SampleCSV -Datei und lesen dann die Daten der CSV -Datei mit dem CSV.Reader () Methode und konvertieren die Ergebnisse in eine Liste von Listen.

Zeile 6: Jetzt benutzen wir den Numpy.Array-Methode Um die gesamte Liste der Listen in ein 2-D-Array umzuwandeln. Das Ergebnis der Ausgabe zeigt, dass unsere CSV-Daten nun erfolgreich in ein 2-D-Array umgewandelt wurden.

Methode 5: Verwenden von PANDAS -Datenfream -Werten

In dieser Methode werden wir die sehr grundlegende Methode verwenden, um die CSV -Daten in ein Numpy -Array zu konvertieren, indem wir die Funktion "DataFrame Values ​​()) verwenden. Das folgende Programm zeigt dasselbe.

Pandas als PD importieren
df = pd.read_csv ('samplecsv.CSV ')
Druck (df)
Array2d_result = df.Werte
print (array2d_result)

Ausgang:

1 2
0 3 4
1 5 6
2 7 8
3 9 10
[[3 4]
[5 6]
[7 8]
[9 10]]

Linie 1: Wir importieren die Pandas -Bibliothek als PD.

Zeile 2-4: Wir lesen die CSV -Datei mithilfe der PANDAS -Read_CSV.

Zeile 5-6: Wir verwenden dann die Funktion DataFrame Values ​​(), die den DataFrame in ein numpy 2-D-Array umwandelt, wie in der Ausgabe gezeigt.

Abschluss

In diesem Artikel haben wir verschiedene Methoden zum Lesen von CSV -Daten in ein 2D -Array gesehen. Wir haben alle Methoden gezeigt, die derzeit von verschiedenen Programmierern und Informatikern verwendet werden. Einige der Methoden sind gebaut, und einige der Methoden werden erstellt, indem verschiedene Methoden aus verschiedenen Bibliotheken kämmen. Aber alle oben genannten Methoden, die Sie entsprechend Ihren Anforderungen verwenden können. Wenn Sie wissen, wie Sie die CSV -Datei lesen, können Sie auch einige Ihrer eigenen Methoden erstellen.