Wie man über Zeilen in einem Datenrahmen in Pandas iteriert

Wie man über Zeilen in einem Datenrahmen in Pandas iteriert
Iteration ist eine Methode, die uns hilft, alle Werte zu durchqueren. In Pandas müssen wir beim Erstellen eines Datenrahmens immer auf die Werte zugreifen und wo die Iteration hilft. In diesem Artikel werden wir also verschiedene Methoden für die Zeilen-Iteration von DataFrame-Zeilen überprüfen.

Pandas.Datenrahmen

Ein Pandas -Datenfreame kann mit dem folgenden Konstruktor erstellt werden:

Pandas.DataFrame (Data = None, Index = Keine, Spalten = Keine, dType = None, Copy = False)

Methode: Verwenden des Indexattributs des Datenrahmens

Wir haben ein Wörterbuch mit Daten mit vier Tasten erstellt und dieses Datenwörterbuch mit der PANDAS -Bibliothek wie unten gezeigt in den DataFrame konvertiert:

In der Zellnummer [4] drucken wir diesen Datenrahmen nur, um zu sehen, wie unser Datenrahmen aussieht:

In der Zellnummer [5] zeigen wir an, welchen tatsächlichen Index Informationen über den DataFrame enthält. Die Ausgabe zeigt, dass der Index die Details der DataFrame -Gesamtzeilen in Form des Bereichs speichert, wie oben in der Ausgabe gezeigt.

In der Zellnummer [6] speichert der Index, wie wir bereits wissen, die Bereichsfunktion, die Werte von 0 bis 4 enthält (der letzte Wert wurde nicht gezählt, so dass die Schleife von 0 bis 3 funktioniert). Daher iterieren wir die Schleife wie gewohn.

Methode: Verwenden der LOC [] -Funktion des Datenrahmens

Lassen Sie uns zunächst die LOC- und ILOC -Methode verstehen. Wir haben eine Serie_DF (Serie) erstellt, wie unten in der Zellnummer gezeigt [24]. Dann drucken wir die Serie, um die Indexkennzeichnung zusammen mit den Werten zu sehen. Jetzt drucken wir bei der Zellnummer [26] die Series_df.loc [4], der die Ausgabe c gibt c. Wir können sehen, dass die Indexkennzeichnung bei 4 Werten C ist. Also haben wir das richtige Ergebnis erhalten.

Jetzt bei der Zellnummer [27] drucken wir Series_df.Iloc [4], und wir haben das Ergebnis e, das nicht das Indexkennzeichnung ist. Dies ist jedoch der Indexort, der von 0 bis zum Ende der Zeile zählt. Wenn wir also aus der ersten Zeile zählen, erhalten wir e am Indexspeicherort 4. Jetzt verstehen wir also, wie diese beiden ähnlichen Loc- und Iloc -Arbeiten funktionieren.

Jetzt werden wir die benutzen .LOC -Methode, um die Zeilen eines Datenrahmens zu iterieren.

In der Zellnummer [7] drucken wir nur den Datenrahmen, den wir zuvor erstellt haben. Wir werden denselben Datenrahmen auch für dieses Konzept verwenden.

In der Zellnummer [8] können wir, wenn die Indexkennzeichnung von Null (0) beginnt.

Methode: Verwenden der ITerrows () -Methode des Datenrahmens

Lassen Sie uns zunächst die Iterrowrows () verstehen und sehen, wie sie die Werte drucken.

In der Zellnummer [32]: Wir haben einen DataFrame df_test erstellt.

In der Zellnummer [33 und 35]: Wir drucken unseren df_test, damit wir sehen können, wie es aussieht. Dann schleifen wir es durch die iterrowrows () und drucken die Zeile, die alle Werte zusammen mit ihren Spaltennamen linke Seite druckt.

In der Zellnummer [37] erhalten wir die Spaltennamen auf der linken Seite, wenn wir die Zeile mit der obigen Methode drucken. Wenn wir jedoch den Spaltennamen bereits erwähnen, erhalten wir Ergebnisse wie in der Zellnummer gezeigt [37]. Jetzt verstehen wir klar, dass es die Zeile itererieren wird.

In der Zellnummer [9]: Wir drucken nur den Datenrahmen, den wir zuvor erstellt haben. Wir werden denselben Datenrahmen auch für dieses Konzept verwenden.

In der Zellnummer [10]: Wir iterieren jede Zeile mit den Iterrows () und drucken das Ergebnis aus.

Methode: Verwenden der ITERTUPLE () -Methode des Datenrahmens

Die obige Methode ähnelt dem iterrowrows (). Der einzige Unterschied besteht jedoch darin, wie wir auf die Werte zugreifen. In der Zellnummer [11] können wir sehen, dass der Zugriff auf den Spaltenwert jeder Iteration zugänglich ist. Wir benutzen die Zeile. Name (Punktbetreiber).

Methode: Verwenden der ILOC [] -Funktion des Datenrahmens

Wir haben bereits zuvor erklärt, wie die .Die ILOC -Methode funktioniert. Jetzt werden wir diese Methode direkt anwenden, um die Zeilen zu iterieren.

In der Zellnummer [18]: Wir drucken nur den Datenrahmen, den wir zuvor für dieses Konzept erstellt haben.

In Zellnummer [19]: df.Iloc [i, 0], zu dem ich zum Ort und zum nächsten Wert 0 gehört, der den Index des Spaltennamens mitteilt.

Methode: Iterieren Sie über Zeilen und drucken zusammen mit ihren Spaltennamen

In der Zellnummer [20]: Wir drucken einfach den Datenframe (DF), den wir zuvor erstellt haben, um das Konzept zu verstehen.

In der Zellnummer [21]: Wir iterieren durch die itertuples () -Methode, die wir bereits erklärt haben. Wenn wir jedoch keine anderen Informationen erwähnt haben, erhalten wir die Ausgabe zusammen mit ihren Spaltennamen zusammen.

Abschluss:

Heute lernen wir verschiedene Methoden, um den Pandas DataFrame zu iterieren. Wir haben auch erfahren .loc und .ILOC -Methoden und der enge Unterschied zwischen ihnen. Wir haben auch die Methoden iterrowrows () und itertuples () untersucht. Wir haben auch die Index -Attributmethode gesehen. All diese oben genannten Methoden haben ihre jeweiligen Vor- und Nachteile. Wir können also sagen, dass es von der Situation abhängt, welche Methode wann verwendet werden muss.