Pandas Rolling Groupby

Pandas Rolling Groupby
Die Python -Programmiersprache bietet Pandas -Bibliothek, die viele Methoden enthält, die einfache zu komplexe Funktionen ausführen. Pandas in Python machen die Datenanalyse sehr einfach und einfach. Darüber hinaus ist es eine sehr außergewöhnliche Sprache für die Durchführung von Datenuntersuchungen und eine unglaubliche Umgebung von informationsgetriebenen Python-Bündeln bietet eine unglaubliche Umgebung.

In diesem Artikel werden wir die Pandas Rolling Groupby -Funktion in Python diskutieren. Hier werden wir einige nützliche Beispiele demonstrieren, mit denen Sie die Funktion Pandas Rolling Groupby kennenlernen und die Verwendung dieser Funktion im Python -Code verwenden können. Beginnen wir also mit der Definition der Rolling -Funktion.

Was ist Pandas rollen?

Die Pandas bieten mehrere nützliche Funktionen und Rolling () ist eine dieser außergewöhnlich guten Funktionen, die komplexe Berechnungen für Daten durchführen können. Die Funktion rolling () bietet eine Rolling -Fensterberechnung für die Eingabedaten in der angegebenen Objektreihe. Das Rolling -Fensterkonzept wird hauptsächlich in Zeitreihendaten oder Signalverarbeitung verwendet.

Mit anderen Worten, wir sagen, wir haben eine Fenstergröße von 'W' gleichzeitig 'T' genommen und einige mathematische Operationen darauf angewendet. Die 'W' Größe des Fensters bedeutet die aufeinanderfolgenden Werte jeweils 't' t ', wobei alle' W 'Werte gewichtet werden.

Was ist ein rollendes Fenster?

Das grundlegende Konzept eines Roll -Fensters besteht darin. Nehmen wir zum Beispiel an, ein Mitarbeiter befindet. Einfach, das Roll-Fenster ist relativ zum ersten Datum und leitet automatisch mit der angegebenen Rollfensterzeit weiter. In unserem Beispiel handelt es sich um ein 6-monatiges Rollfenster.

Wie funktioniert die Funktion pandas rolling () mit DataFrame??

Die Rolling () -Funktion in Python Pandas liefert die Elemente der Rolling -Fensterzahl. Die Idee des rollenden Fensters in Python entspricht der allgemeinen Vorstellung eines rollenden Fensters. In einfachen Worten bietet der Benutzer eine gewichtete Fenstergröße 'W' gleichzeitig und führt einige mathematische Operationen aus.

Was ist die Syntax der Pandas Rolling Groupby -Funktion??

Unten finden Sie die Syntax der Pandas Rolling Groupby -Funktion.

Wie Sie sehen können, nimmt die Funktion rolling () 8 Parameter; Windowsize, Minperiod, Frequenz, Zentrum, Wintypen, Eins, Achse und geschlossen.

Der Parameter "Windowsize" definiert die Größe des sich bewegenden Fensters, das in einfachen Worten ist, wie oft eine Berechnung durchgeführt werden muss, und standardmäßig beträgt sein Wert 1 1. Der Parameter "minperiod" definiert die minimale Anzahl der Beobachtungen, die in einem definierten Fenster erforderlich sind. Der Parameter "Frequenz" definiert die Häufigkeit der Daten, bevor statistische Berechnungen durchgeführt werden. Der Parameter "Mittel" definiert das Etikett in der Mitte des Fensters.

Der Parameter "WinType" definiert den Fenstertyp. Der Parameter 'on' definiert eher die Spalte als den Index des Datenrahmens, auf dem die Berechnung des Rollfensters durchgeführt werden muss. Der Parameter "geschlossen" definiert, welches Intervall geschlossen werden muss. Entweder ist er nicht "weder", "links", "rechts" oder "beide" Endpunkte geschlossen.

Und schließlich liefert der Parameter "Achse" den Wert der Achse im Ganzzahl- oder String -Format und standardmäßig ist es 0. Lassen Sie uns nun zu den Beispielen übergehen, um zu erfahren.

Beispiel 1

Beginnen wir nun mit dem Erstellen eines einfachen Datenrahmens, den wir in der Funktion rolling () verwenden müssen. 5 Werte sind im Datenrahmen definiert, die 10, 18, 50, 70 und NP sind.Nan. Danach rufen wir einfach die Funktion rolling () auf und geben die Fenstergröße 3 an. Hier ist der Code von Pandas Rolling Groupby -Funktion:

Pandas als PD importieren
Numph als NP importieren
df = pd.DataFrame ('z': [10, 18, 50, 70, NP.nan])
drucken (df.Rollen (3).Summe())

Unten finden Sie die Ausgabe des obigen Code. Beachten Sie, dass die ersten 2 Werte NAN sind, während der dritte Wert 78 ist, was die Summe der vorherigen 3 Werte 10, 18 und 50 ist. Da wir die Fenstergröße 3 zur Verfügung gestellt haben, führte die Rolling -Funktion den Taschenrechner nach drei Fenstern aus. Der vierte Wert 138 ist die Summe von drei früheren Werten, die 18, 50 und 70 sind. Beachten Sie, dass der letzte Wert erneut NAN ist, er nicht daran liegt. Alles, was zu Nan hinzugefügt wird, wird Nan sein.

Beispiel 2

Wir haben ein einfaches Beispiel für die Funktion rolling () gesehen. Lassen Sie uns nun einen Zeitstempel -Datentyp erstellen, um zu verstehen. Hier verwenden wir denselben Datenrahmen, den wir im vorherigen Beispiel erstellt haben, aber jetzt werden wir die Indexspalte hinzufügen, in der der Zeitstempelwert für jede Spalte angegeben wird. Siehe die zusätzliche Indexspalte im folgenden Code:

Pandas als PD importieren
Numph als NP importieren
df_time = pd.DataFrame ('B': [10, 18, 50, 70, NP.nan],
Index = [PD.Zeitstempel ('20220101 10:00:00'),
PD.Zeitstempel ('20220101 10:00:01'),
PD.Zeitstempel ('20220101 10:00:02'),
PD.Zeitstempel ('20220101 10:00:03'),
PD.Zeitstempel ('20220101 10:00:04')]))
df_time
print (df_time.rollen ('5s').Summe())

Nach Ausführung der Rolling () -Funktion von Zeitstempeldaten erhalten wir die folgende Ausgabe:

Beispiel 3

In diesem Beispiel helfen wir Ihnen, zu erfahren, wie Sie die minperiod für die rolling () -Funktion angeben können. Wie oben erläutert, definiert der Minperiod -Parameter der Rolling () -Funktion die minimale Anzahl der Beobachtungen, die zur Durchführung des mathematischen Betriebs erforderlich sind. Hier berechnen wir die Summe erneut mit Rollfenstergröße 3 und Minperiod 1. Siehe den Code unten:

Pandas als PD importieren
Numph als NP importieren
df = pd.DataFrame ('z': [10, 18, 50, 70, NP.nan])
drucken (df.Rollen (2, min_periods = 1).Summe())

Hier ist die Ausgabe des oben angegebenen Code.

Abschluss

In diesem Artikel haben wir die Verwendung der Rolling () -Funktion in Python gezeigt. Mit Hilfe einfacher Beispiele haben wir beobachtet, wie die Funktion rolling () mit Datenrahmen funktioniert. Alle oben genannten Codes können auf jedem Compiler von Python implementiert werden.