Pandas Rolling Mean

Pandas Rolling Mean

„Die Rolling -Fenster -Berechnungsfunktionalität wird durch das Pandas -Datenfream bereitgestellt.rolling ().Mean () ”Methode. Der Mittelwert einer bestimmten Anzahl früherer Intervalle in einer Zeitreihe wird als rollender Mittel bezeichnet.”

Die folgende Syntax kann verwendet werden, um den Rolling -Durchschnitt für einzelne oder mehrere Spalten in einem PANDAS -Datenfream zu bestimmen:

Wir werden verschiedene Techniken untersuchen, um diese Methode in dieser Lektion anzuwenden.

Beispiel 1

In dieser Illustration werden wir die Pandas „DF verwenden.rolling ().Mean () ”Methode zur Berechnung des Rollmittelwerts einer einzelnen Spalte.

Wir müssen zuerst die Anforderungen für die Zusammenstellung des Codes ergreifen. Wir brauchen eine Software, die uns eine von Python unterstützte Umgebung bietet, um unser Python -Skript zu kompilieren. Wir haben das "Spyder" -Tool in unser System installiert. Nach dem Start des Tools können wir auf die Schnittstelle zugreifen.

Beginnend mit dem Programm müssen wir die essentielle Bibliothek zunächst laden. Die Methode „Rolling ()“, auf der unser Artikel basiert. Um diese Methode in unserem Programm zu verwenden, müssen wir die "Pandas" -Bibliothek importieren und "PD" als Alias ​​für "Pandas" erstellen.

Nachdem die Voraussetzung erreicht wurde.DataFrame () ”-Modul vom Pandas -Toolkit bereitgestellt. Der „PD.Die DataFrame () "-Methode wird mit 4 Spalten aufgerufen, die wir als" Sommer "," Winter "," Herbst "und" Frühling "angegeben haben. Jede Spalte speichert 8 Werte. Die identifizierten Werte für die Spalte "Sommer" sind "200", "130", "280", "100", "270", "360", "120" und "311". In der Spalte "Winter" enthält diese Werte "12", "34", "54", "67", "98", "45", "78" und "43". Die dritte Spalte "Herbst" hat Werte als "12", "13", "42", "32", "71", "61", "77" und "89". Für die Spalte "Spring" sind die Werte "10", "29", "78", "44", "76", "55", "32" und "22".

Der „PD.DataFrame () “konstruiert beim Aufrufen einen Datenrahmen mit diesen bereitgestellten Werten. Anschließend benötigt es einen Speicherplatz, in dem dieser Datenrahmen für die spätere Verwendung eingesetzt werden kann. Der neu erstellte DataFrame ist jetzt zugänglich, indem das Objekt „Saison“ erwähnt wird,. Die nächste Anforderung besteht darin, diesen Datenrahmen auf dem Bildschirm anzuzeigen, damit wir ihn richtig sehen können. Dafür haben wir Pythons „Print ()“ -Methode verwendet. Zwischen seinen Klammern liefern wir die Eingabe, die angezeigt werden muss. Hier haben wir das „Saison“ -Objekt als Eingabe für die Methode „Print ()“ zur Verfügung gestellt, um den Inhalt anzuzeigen.

Um das oben genannte Skript auszuführen, müssen wir auf die Option „Datei ausführen“ klicken. Alternativ können Sie auch die Tasten „Shift+Enter eingeben“ zusammen drücken, um den Code auszuführen. Dies gibt uns einen Datenrahmen mit 4 Spalten und 8 Zeilen. Die Indexliste startet standardmäßig mit "0" und endet mit "7".

Jetzt werden wir die PANDAS -Methode „Rolling ()“ ausüben, um das geschätzte Rollen einer einzelnen Spalte im bereitgestellten Datenrahmen zu berechnen. Lassen Sie uns lernen, wie man das bekommt.

Wir haben den „DF angerufen.rolling () ”Methode. Der Dataframe -Name "Saison" mit dem ".Rolling () ”-Methode ist geschrieben. Da wir das Roll -Fenster für die Berechnung des Rolling -Mittelwerts einer einzelnen Spalte erhalten möchten, müssen wir den Spaltennamen mit dem Datentaframe -Namen angeben. Die Spalte, die wir hier ausgewählt haben. Zwischen den runden Klammern der „Rolling ()“ -Methode haben wir den Wert „3“ definiert, der den Wert „3“ definiert hat,. Es bedeutet, dass wir das Rollen der Spalte „Sommer“ berechnen wollen.

Der ".Mean () ”-Funktion berechnet den Mittelwert für das 3-tägige Rollen des„ Sommers “. Wir möchten diesen geschätzten rollenden Mittelwert der Spalte „Sommer“ in einer neuen Spalte speichern. Zum Erstellen einer neuen Spalte haben wir also den Namen des DataFrame, den Namensschreibbetreiber und dann den neuen Spaltennamen als "summer_rolling" geschrieben, als "summer_rolling". Wir haben es das Ergebnis von „Saison [„ Sommer ““ zugeteilt,.Rollen (3).Mean () ”Funktion. Daher wird der Rollmittelwert für 3 Tage der Spalte der "Sommer" -Spalte in der Spalte "summer_rolling" gespeichert. Drucken Sie den Datenrahmen zuletzt, indem Sie die Methode „Print ()“ aufrufen.

In der nachgegebenen Snapshot können wir ansehen, dass die ersten beiden Einträge, die wir erhalten, Nullwerte sind. Dies liegt daran, dass wir den Mittelwert nicht schätzen können, da er nur dann berechnet werden kann, wenn wir ein 3-Tage-Fenster haben. Für die ersten beiden Datensätze haben wir jedoch keine vorhergehenden Werte, um die angegebenen Fenster zu vervollständigen. Daher werden NAN -Werte zurückgegeben. In der 3Rd Zeile, wir erhalten einen Wert „203.333333 ”, was das durchschnittliche Rollen für die 3 Tage ist.

Beispiel # 2

Wir haben gelernt, den Rolling -Durchschnitt einer Spalte in einem Pandas -Datenfreame zu finden. Der Rollmittelwert kann auch für mehrere Spalten berechnet werden. Für mehrere Spalten müssen wir für jede Spalte die Rolling -Mittelungsmethode separat aufrufen.

Wir werden die Rolling -Methode auf dem zuvor generierten Datenrahmen ausüben, um den Rollmittelwert mehrerer Spalten abzuschätzen. Das „df.rolling ().Mean () ”-Methode wird aufgerufen. Wir haben diese Methode zweimal aufgerufen, weil wir den Rolldurchschnitt für zwei Spalten berechnen möchten. Das erste „rolling ().Mean () "Methode wird als DataFrame- und Spaltenname als" Saison ['summer'] "bezeichnet und der Wert für Rolling Days wird" 4 "angegeben.

Um den kalkulierten Rolling -Mittel in einer anderen Spalte zu speichern, haben wir eine Spalte "summer_rolling" initialisiert, dass wir initialisiert wurden. Dies bedeutet, dass wir den Rollmittelwert für ein 4-tägiges Fenster der Spalte "Sommer" berechnen und das Ergebnis in der Spalte "summer_rolling" speichern möchten. Dann beschäftigten wir die 2nd „DF.rolling ().Mean () ”Methode. Die Spalte, die wir hier ausgewählt haben, ist "Herbst", und das Roll -Fenster wird als "4" angegeben. Um die Berechnungen zu speichern, haben wir in der vorhandenen Datenrahmen "Saison" eine Spalte "autumn_rolling" erstellt, die "Saison" vorhanden ist. Die Methode „Print ()“ zeigt die endgültige Ausgabe auf der Python -Konsole an.

Im Ausgabebildschirm kann untersucht werden, dass dem DataFrame zwei neue Spalten hinzugefügt wurden. Die Spalten "summer_rolling" und "autumn_rolling" enthalten einen geschätzten Rollmittelwert für die Spalten "Sommer" und "Herbst". Die ersten 3 Werte in beiden Spalten sind NAN, da sie nicht genügend Einträge haben, um das 4-Tage-Fenster zu vervollständigen, um den Rolldurchschnitt zu berechnen. Aus dem 4th Eintrag erhält seinen ersten Rollmittelwert.

Beispiel # 3

Der Rolling -Durchschnitt der gesamten Spalten im Datenrahmen wird unter Verwendung der Pandas „DF“ berechnet.rolling ().Mean () ”Methode als letzter Schritt.

Für die Berechnung des Rolling -Durchschnitts aller Spalten müssen wir den Namen einer Spalte speziell nicht erwähnen. Wir haben den „DF angerufen.rolling ().Mean () ”Funktion, indem einfach der Name des DataFrame als„ Jahreszeit “und den Wert für das Roll -Fenster als„ 5 “angegeben wird. Um das Ergebnis zu bewahren, haben wir eine Variable „Ergebnis“ erstellt. Das „rolling ().Die Methode von Mean () ”berechnet den Rolling-Durchschnitt der Datenfrequer-Saison durch ein 5-Tage. Wir haben die Python -Methode „Print ()“ verwendet.

Dies gibt uns den Datenrahmen mit einem geschätzten Rollmittelwert für ein 5-Tage-Fenster.

Abschluss

Die Berechnung des Rollmittelmittels für das angegebene Fenster in einem Datenrahmen ist ein einfacher Ansatz. Wir haben die Pandas „df benutzt.rolling ().Mean () ”Methode zur Schätzung des Rolling -Durchschnitts in diesem Tutorial. Es wurden drei verschiedene Strategien diskutiert, um den Rolling -Mittelwert in einem Datenrahmen zu finden. Die erste Abbildung basiert auf der Berechnung des Rollmittelmittels einer einzelnen Spalte, die 2nd Beispiel gibt die Idee, den Rolling -Durchschnitt für mehrere Spalten zu berechnen, und die letzte Instanz hat kurz den Rollmittelwert aller im DataFrame vorhandenen Spalten gefunden. Alle Techniken wurden praktisch im Spyder -Tool implementiert.