Pandas iterieren über Reihen

Pandas iterieren über Reihen
In diesem Artikel werden wir verschiedene Methoden und Techniken entdecken, mit denen wir Zeilen in einem Pandas -Datenframe iterieren können.

Beispieldatenrahmen

Beginnen wir mit dem Einstellen eines Beispieldatenrahmens. Danach können Sie Ihren Datenrahmen so verwenden, wie Sie es für richtig halten.

df = pd.DataFrame (
'DB': ['MySQL', 'postgreSQL', 'Redis', 'MongoDB', 'SQL Server'],
'Port': [3306, 5480, 3309, 9001, 5500],
'Records': [12000, 2344, 4500, 90000, 1000]
)
df

Der obige Code sollte einen einfachen Datenrahmen erstellen, wie unten gezeigt:

Methode 1 - Zeilen mit der Iterrowrows () itere Zeilen ()

Pandas liefert uns die Iterrowrows () -Methode, mit der wir über die Zeilen eines Datenrahmens iterieren können. Die Funktion gibt ein Indexpaar und eine Reihe als Serie zurück.

Wir können diese Funktion verwenden, um die Zeilen zu iterieren, wie im folgenden Beispiel gezeigt:

Für _, Zeile in df.Iterrows ():
print (f "row \ n")

Im obigen Beispielcode verwenden wir die Funktion iterrowrowrows (), um jede Zeile aus dem DataFrame abzurufen. Der obige Code sollte zurückgeben:

Beachten Sie, dass die _ in der Schleife den Index der Spalte im Datenrahmen darstellt.

Methode 2 - Zeilen mit ITTERPLE () iterieren () ()

Mit der ItertUples () -Methode in Pandas können wir über die Zeilen eines Pandas -Datenframes iterieren. Die Funktion gibt ein Objekt zurück, mit dem wir für jede Zeile im DataFrame über die genannten Tupel iterieren können.

Mit der Funktion können Sie auch den Datentyp bei der Iterierung bewahren. Daher wird es als schneller angesehen als Iterrows ().

In dem folgenden Code wird eine Beispielillustration angezeigt:

für Zeile in df.ITTERPLE ():
Druck (Zeile)

Der obige Code sollte Tupel für jede Zeile im DataFrame zurückgeben. Ein Beispielausgang ist wie gezeigt:

Um den Index aus dem Ergebnis auszuschließen, können wir den Indexparameter auf false festlegen. Ein Beispiel ist wie gezeigt:

für Zeile in df.ITERTUPLE (INDEX = FALSE):
Druck (Zeile)

Der obige Code sollte zurückgeben:

Gedanken

Pandas entmutigen im Allgemeinen die Iteration eines Datenrahmens. Ändern Sie auch niemals Daten, während die Iteration iteriert wird.

Wenn Sie während der Iterierung Daten ändern möchten, können Sie sich für andere Optionen entscheiden, wie z. B.:

  1. Listen Sie Verständnisse auf
  2. Vektorisierung
  3. Cython -Routinen.