Pandas las TSV

Pandas las TSV

In „Pandas“ können wir einfach Dateien lesen, wie wir CSV -Dateien lesen können, wir können TSV -Dateien lesen, Textdateien lesen und SQL auch lesen können. Wir erklären die TSV -Datei hier. Es handelt sich um eine Textformatdatei, in der die tabellarischen Daten im Textformat gespeichert sind. Wir können die Datei „Tab-getrennte Wert“ in „pandas“ problemlos erstellen oder lesen, da die „Pandas“ eine integrierte Funktion enthält, die beim Erstellen und Lesen der TSV-Dateien hilft. Wir werden in diesem Tutorial die Methoden, die „Pandas“ uns zur Verfügung stellen, zum Lesen der TSV -Datei diskutieren. Wir werden die TSV -Datei erstellen und lesen und ihre Daten nach dem Lesen der TSV.

Methoden zum Lesen der TSV -Datei in "Pandas"

Wir können die TSV -Datei mit zwei Methoden von „Pandas“ lesen und diese beiden Methoden in diesem Tutorial verwenden. Die Methoden sind unten angegeben:

  • Read_table () Methode.
  • Read_csv () Methode.

Beispiel Nr. 01: Verwenden der Methode "read_table ()"

Wir verwenden das "Spyder" -Tool, um die "Pandas" -Codes zu generieren. Bevor wir das Konzept des Lesens der TSV -Datei beschreiben, haben wir erklärt, wie wir die TSV -Datei in "Pandas" erstellen können. Wir importieren die "Pandas" -Bibliothek und erstellen dann einen "new_df" -Datenrahmen, in dem wir einige Spalten eingegeben haben. Die Daten werden auch in jeder Spalte eingegeben. Wir haben "New_Name, New_1, New_2, New_3, New_4 und New_5" eingegeben.

Dann haben wir die Methode "to_csv ()" hinzugefügt, in der wir den Namen der Datei hinzufügen. Wir fügen „Newfile ein.TSV “, der den Datenrahmen, den wir in diesem Code erstellt haben.TSV ”. Wir haben auch den Parameter „SEP“ angepasst, bei dem wir „\ t“ als Wert hinzugefügt haben. Jetzt die „Neufile.TSV ”wird erstellt. Wir werden diese TSV -Datei auch zeigen.

Wir drücken "Shift+Enter", die die Codes und die "Neuheit" ausführen.TSV ”wird dann erzeugt. Diese TSV -Datei ist unten angezeigt. Hier werden die Daten des Datenrahmens in Textform gespeichert. Jetzt werden wir diese TSV -Datei auch lesen.

Wir haben die „Pandas“ erneut in der neuen Datei importiert. Wir werden die oben erstellte TSV -Datei lesen. Wir platzieren "my_dataframe", das nach dem Lesen die Daten der TSV -Datei speichert. Wir verwenden die „PD.methode read_table () ”und übergeben den Namen der Datei, die wir lesen müssen, was„ Newfile “ist.TSV ”. Diese Methode liest die Daten, die in der TSV -Datei vorhanden sind, und generieren den Datenrahmen der Daten der TSV -Datei und speichern sie dann in "my_dataframe". Danach ist der "my_dataframe" in die "print ()" eingegeben. Es wird also auf dem Terminal bei der Ausführung gedruckt.

Wenn wir diesen "PANDAS" -Code ausführen, werden die Daten der TSV -Datei als Datenrahmen am Terminal angezeigt. Die Daten der TSV -Datei werden angezeigt, unter dem wir nach dem Lesen der TSV -Datei erhalten werden.

Beispiel # 02: Verwendung "Read_csv ()" -Methode

Wir können die TSV -Datei auch mit der Methode „Read_csv ()“ lesen. Hier verwenden wir die Methode „Read_csv ()“ zum Lesen der "Newfile".TSV ”. Wir initialisieren die Variable „Daten“ mit der Methode „Read_csv ()“ und haben auch zwei Parameter hinzugefügt. Zuerst haben wir den Dateinamen hinzugefügt und dann den Parameter „SEP“ festgelegt. Sein Wert wird als "\ t" eingestellt. Wir drucken hier auch "Daten" mit "print ()".

Es zeigt auch die Daten der TSV -Datei im DataFrame -Format an oder wir können dies in tabellarischer Form sagen. Beide Methoden funktionieren gleich und geben das gleiche Ergebnis zurück.

Beispiel # 03:

Die neue TSV -Datei wird unten gerendert. Jetzt müssen wir die Daten dieser TSV -Datei lesen, indem wir die Methode „Pandas“ verwenden.

Wir haben die Methode "read_table ()" hinzugefügt, um die TSV -Datei zu lesen, aber wir haben diesmal einen weiteren Parameter hinzugefügt. Nach dem Hinzufügen des Namens der TSV -Datei, die „Bildung“ ist.TSV ”haben wir auch den Parameter„ Index_col “hinzugefügt, der die Anpassung der Indexspalte des Datenrahmens hilft, der nach dem Lesen der TSV -Datei erstellt wird. Wir passen die Spalte „RandomName“ als Index des Datenrahmens an. Wenn der Code ausgeführt wird, wird die Datei gelesen, dann wird der Datenrahmen, den wir erhalten. Wir zeigen auch die Daten der TSV -Datei nach dem Lesen hier an, indem wir "print ()" verwenden ".

Hier sehen Sie, dass die obigen Daten der TSV -Datei in tabellarischer Form angezeigt werden. Wir erhalten diesen Datenrahmen, indem wir die TSV -Datei mit Hilfe der Methode „Read_table ()“ lesen. Beachten Sie auch, dass die Spalte "RandomName" hier als Indexspalte festgelegt wird.

Beispiel # 04:

Jetzt haben wir eine weitere TSV -Datei, die unten angezeigt wird. Die Datei enthält die Daten im Textformat. Wir werden diese Datei auch lesen.

Wir haben die Variable "New_Columns" erstellt. Wir fügen einige Namen hinzu, weil wir diese Namen als Spaltennamen des Datenrahmens anpassen möchten, den wir nach dem Lesen der oben gezeigten TSV -Datei erhalten haben. Die Namen, die wir hinzugefügt haben, sind "class_Mammals, class_fish, class_repatiles, class_amphibians und class_birds". Danach haben wir die Methode "Read_table" verwendet, in der wir drei Parameter hinzugefügt haben. Zuerst haben wir „tiere_data eingefügt.TSV ”Das ist der Name der TSV -Datei und dann„ keine “an den Parameter„ Header “eingestellt. Wir haben auch den "New_Columns" hinzugefügt, den wir in diesem Code in den Parameter "Namen" initialisiert haben. Die oben hinzugefügten Namen werden also als Spaltennamen des Datenrahmens angepasst. Dann rendern wir die Daten mit dem "print ()" ".

Die Daten, die im Textformat in der obigen TSV -Datei angezeigt werden. Die neuen Spaltennamen, die wir im Code hinzugefügt haben, werden gerendert und die vorherigen Spaltennamen werden in die Zeile oder die Werte dieser Spalten umgewandelt.

Beispiel # 05:

Wir lesen dieselbe Datei, die wir in Beispiel 4 gezeigt haben.TSV ”Datei. Wir haben gerade den vierten Parameter zur Methode "read_table ()" hinzugefügt, bei der der Parameter "Skiprows" ist. Stellen Sie es auf "4" ein, weil wir die ersten vier Zeilen des Datenrahmens überspringen möchten, der nach dem Lesen der "Animals_Data" generiert wird.TSV ”.

Der Datenrahmen wird erneut gerendert, aber die ersten vier Zeilen sind in diesem Datenrahmen nicht vorhanden.

Beispiel # 06:

Wir lesen erneut die „tiere_data.TSV -Datei jedoch mit der Methode "Read_csv ()". Wir haben in die „tiere_data“ eingegeben.TSV ”und dann den„ SEP “auf„ \ t “einstellen. Außerdem haben wir den Wert "Keine" für den "Header" angepasst, und die Namen, die wir hier hinzufügen, werden als Spaltennamen festgelegt. Wir haben nur eine Zeile mit dem Parameter "Skiprows" übersprungen.

Der von uns abgerufene Datenrahmen wird angezeigt und die Spaltennamen werden entsprechend angepasst, wie wir in den Code eingegeben haben. Außerdem wird die erste Zeile hier aus dem DataFrame entfernt.

Beispiel # 07:

Eine weitere TSV -Datei wird angezeigt. Jetzt werden wir zeigen, wie Sie die ausgewählte Spalte erhalten, nachdem Sie die TSV -Datei gelesen haben.

Wir haben die Methode „Read_table ()“ angewendet und einen neuen Parameter hinzugefügt, bei dem es sich um die Parameter „usecols“ handelt und den Namen der Spalte hinzugefügt, die wir von den „Autos erhalten möchten.TSV ”Datei. Wir haben "Preis" hinzugefügt, was der Spaltenname ist. Jetzt greifen nur auf die Spaltendaten „Preis“ zugänglich zu und sparen Sie sie in „CARSDF“. Dann rendern wir die Daten der Spalte „Preis“ hier.

Es wird nur eine Spalte angezeigt, da wir den Parameter „usecols“ in der Methode „Read_table ()“ angepasst haben. Es wurde also nicht die gesamten Daten der TSV -Datei hier angezeigt.

Abschluss

Mit Hilfe der "Pandas" -Methode können wir verschiedene Dateien in "Pandas" lesen. Also haben wir dieses Tutorial geschrieben, in dem wir erklärt haben, wie die TSV -Datei in "Pandas" gelesen werden soll. Wir haben zuerst die Erstellung der TSV. Wir haben die "read_table ()" sowie die "read_csv ()" -Methode hier erklärt und erklärt, wie diese Methoden dazu beitragen, die TSV -Datei in "Pandas" zu lesen. Wir haben diese Methoden in diesem Tutorial jedes Mal in jedem Code unterschiedliche Parameter verwendet, um unterschiedliche Ergebnisse zu erzielen.