Pandas gleitender Durchschnitt

"Die" Pandas ", die Bibliothek von" Python "ist, bietet viele integrierte Funktionen, die uns helfen. Es gibt unterschiedliche Methoden, die wir verwendet haben, um die beweglichen Durchschnittswerte zu berechnen. Es wird zur Analyse der Zeitreiheninformationen verwendet, indem die Durchschnittswerte verschiedener Teilmengen des gesamten Datensatzes generiert werden. Wir können den rollenden durchschnittlichen Namen anstelle des gleitenden Durchschnitts auch verwenden. Mit Zeitreiheninformationen wird der gleitende Durchschnitt typischerweise verwendet, um kurzfristige Variationen zu erfassen und sich auf längere Trends zu konzentrieren. Wir werden alle ihre Methoden in diesem Leitfaden diskutieren und erklären, wie es in „Pandas“ funktioniert.”

Methoden für den gleitenden Durchschnitt

Die „Pandas“ erleichtert uns drei verschiedene Methoden dieser Methode „Pandas Moving Average“. Wir werden auch alle drei Methoden in diesem Leitfaden ausführlich diskutieren. Diese Methoden sind:

- Einfacher gleitender Durchschnitt.
- Exponentieller gleitender Durchschnitt.
- Kumulativer gleitender Durchschnitt.

Lassen Sie uns hier in der praktischen Demonstration all dieser Methoden im „Pandas“ -Code achten.

Beispiel # 01

Da wir das Tool „Spyder“ verwenden, um diese Methoden in „Pandas“ praktisch zu nutzen. Für die Anwendung der Methode „Moving Average“ müssen wir den Datenrahmen in "Pandas" erstellen. Dafür generieren wir zuerst das Wörterbuch hier, das als "Group_Data" bezeichnet wird, und wir fügen "Group_leader" ein, in dem "Olive, Rowan, Julian, Howard, Novah, Julia, Ella und Ava" eingegeben werden. Dann haben wir "Supervisor", das "Amina, Asher, Felix, William, Bromley, Nora, Collins und Freya" enthält. Dann setzen wir „Präsentation“, die die Markierungen der Präsentation enthält, die „15, 18, 16, 10, 19, 11, 15 und 14“ sind. Wir haben auch „Aufgaben“, in denen wir die Markierungen der Aufgaben hinzugefügt haben, und diese Markierungen sind „29, 26, 25, 27, 28, 28, 25 und 26“.

Nach den Zuordnungsmarken haben wir die internen Markierungen in „intern“ hinzugefügt, die „5, 6, 9, 8, 5, 7, 2 und 6“ sind. Dann müssen wir dieses "Group_Data" -Dictionary in den Datenrahmen "Group_DF" konvertieren. Dafür haben wir die „Pandas“ -Methode verwendet, die uns bei der Umwandlung des Wörterbuchs in den Datenrahmen hilft. Diese Methode ist „PD.DataFrame () ”“ hier, und wir geben den Namen des Wörterbuchs darin als Parameter ein. Danach drucken wir die "Group_DF" mit der Methode "print ()".

Wir führen diesen Code im Tool "Spyder" aus, indem wir auf "Shift+Enter" drücken. Nach der Ausführung des obigen Code wird der Datenrahmen am Terminal angezeigt. Jetzt werden wir voranschreiten und die gleitende Durchschnittsmethode auf die Spalten dieses Datenrahmens anwenden.

Wir verwenden hier den „einfachen gleitenden Durchschnitt“ und haben diesen einfachen gleitenden Durchschnitt auf zwei Spalten des Datenrahmens angewendet. Wir speichern die Werte in der Variablen „Group_DF1“, die wir nach dem Anwenden des Rolling -Durchschnitts auf zwei Spalten erhalten haben. Diese beiden Spalten werden hinzugefügt, nachdem der Name des Datenrahmens in zwei Quadratklammern gesetzt wurde. Diese beiden Spalten sind hier „Präsentation und Zuordnungen“. Dann platzieren wir das Rollfenster, das hier „2“ ist und dann die Methode „Mean ()“ verwenden. Dieses Rollfenster wird verwendet. Danach wird die "Group_DF1" in der Methode "print ()" zum Drucken auf dem Terminal hinzugefügt.

Die Werte, die wir nach der Anwendung der Durchschnittsmethode für bewegte oder rollende auf die Spalten „Präsentation“ und „Zuweisungen“ erhalten haben, werden unten angezeigt. Die hier angezeigten Werte sind die gleitenden Durchschnittswerte beider Spalten.

Beispiel # 02

Wir verwenden die "Group_DF" erneut und diesmal wenden wir den „exponentiellen gleitenden Durchschnitt“ an. Wenn wir den exponentiellen gleitenden Durchschnitt anwenden möchten, verwenden wir die „EWM ()“ -Methode. In dieser "eWM ()" -Methode müssen wir den "Spann" -Wert übergeben. Wir wenden diese Methode in der Spalte „Intervalle“ an und speichern die neuen Werte in der Spalte „EWM_30“, die auch zu diesem Datenrahmen „Group_DF“ hinzugefügt wird, nachdem die Methode „EWM ()“ angewendet wurde. Der hier festgelegte "Spann" -Wert ist "30" und wir platzieren auch die "Mean ()" -Methode mit dieser "ewm ()" -Methode.

Der Datenrahmen, bevor die Methode „EWM ()“ angewendet wird und nach der Anwendung der Methode „EWM ()“ hier angezeigt wird. Die Spalte „EWM_30“ wird im folgenden Datenrahmen hinzugefügt, der hier erstellt wird, um die gleitenden Durchschnittswerte der Spalte „Intervalle“ zu speichern.

Beispiel # 03

Die Bibliotheken „Pandas“ und „Numpy“ werden hier importiert, weil wir die Methoden beider Bibliotheken in "Pandas" anwenden müssen. Der hier erstellte Datenrahmen enthält vier Spalten. Die erste Spalte "Cola" enthält "0, 1, 2, 3, 4, NP.Nan, 7, NP.Nan und 9 ”. Das „Colb“ ist hier, in dem wir "7, 8, 9, 10, 4, 17, 14, 12 und 22" hinzugefügt haben. Dann haben wir "colc", in denen wir "10, 21, 12, NP.Nan, 14, 15, 17, 11 und 33 ”. Die „Kälte“ wird nun hinzugefügt, in der wir „20, 31, 2, 14, 11, NP eingefügt haben.Nan, 24, 10 und NP.Nan ”.

Anschließend verwenden wir den "Druck (df)", mit dem dieser Datenrahmen gedruckt wird. Wir werden den gleitenden Durchschnitt anwenden, aber zuerst werden wir diesen Datenrahmen hier anzeigen.

Der Datenrahmen, bevor eine gleitende Durchschnittsmethode angewendet wird. Sie können leicht beachten, dass alle Spalten hier angezeigt werden. Jetzt werden wir den gleitenden Durchschnitt in all diesen Spalten anwenden und das Ergebnis anzeigen.

Wir wenden hier den einfachen beweglichen oder rollenden Durchschnitt an und wissen, dass wir den Roll -Fensterwert in dieser Rolling -Methode bestehen müssen. Also verabschieden wir uns hier „2“ und wenden dann die Methode „sum ()“ mit dieser gleitenden Durchschnittsmethode an. Wir haben die Werte gespeichert, die wir nach der Anwendung der Methode „Rolling ()“ auf die Spalten erhalten haben. Die "Cola" -Werte werden in "Sum A", "Colb" -Werten in "sum B" und "colc" -Werten in "sum C" und "Kalt" -Werte in "sum D" -Variable gespeichert.

Wir haben auch die Methode „fillna ()“ hier angewendet und über die Parameter „0“ bestanden, die alle Nullwerte ändert Zeigt auch „DF2“ an. Führen wir diesen Code aus und sehen das Ergebnis, nachdem diese beweglichen Durchschnittswerte auf alle Spalten getrennt angewendet werden können.

Hier ist das Ergebnis dieses Code, in dem die Werte angezeigt werden, die wir nach der Verwendung der Methode „Rolling ()“ für alle Spalten erhalten und die gleitenden Durchschnittswerte in der neuen Spalte angezeigt werden. Danach ersetzt es alle Nullwerte durch "0" und zeigt auch den neuen Datenrahmen unten an, der „0“ an der Stelle von „Nan“ enthält, die Nullwerte sind.

Beispiel # 04

Wir können auch die beweglichen Durchschnittswerte der CSV -Datei berechnen, nachdem wir die Daten in der Datei gelesen haben. Hier lesen wir die „Kurse.CSV ”-Datei durch Einlegen der PD.read_csv () ”Methode und dann die Daten als Datenrahmen in„ cures_df “speichern. Wir wenden hier die Methode „Cumulative Moving Average“ an. In dieser Methode müssen wir die feste Fenstergröße nicht hinzufügen, da sich die Größe des Fensters mit der Zeit ändert. Um dies zu nutzen, müssen wir die „expanding ()“ -Methode platzieren, und danach platzieren wir das „Mean ()“. Wir haben diese Methode auf die Spalte „Rabatt“ angewendet, die in der CSV -Datei vorhanden ist, und das Ergebnis in der Spalte "ADIVE_CMA" gespeichert.

Der Datenrahmen, den wir nach dem Lesen der Kurse erhalten haben.Die CSV -Datei wird zuerst wiedergegeben. Dann wird hier die kumulative gleitende Durchschnittsmethode angewendet, und das Ergebnis, das wir nach der Anwendung dieser Methode erhalten.

Abschluss

Das Konzept „gleitender Durchschnitt“ von „Pandas“ wird in diesem Leitfaden ausführlich erörtert. Wir haben drei verschiedene Methoden diskutiert, die wir in „Pandas“ zur Berechnung der „beweglichen Durchschnittswerte“ verwendet haben. Wir haben alle drei Methoden in unseren Beispielen getrennt angewendet und erklärt, wie diese Methoden funktionieren und wie diese Methoden in „Pandas“ verwendet werden können. Wir haben diese Methoden nach dem Erstellen des Datenrahmens hier auf die Spalten angewendet und diese Methode auch auf die Daten der CSV -Datei angewendet, nachdem wir die CSV -Datei gelesen haben. Wir haben hier alle Methoden im Detail erläutert.

Oracle -Datenbank

Betrachtet man Oracle Fusion als besser als SAP??

Oracle Fusion (Cloud-basierte ERP) verfügt über eine benutzerfreundliche Oberfläche....

Hussein Burkhard

Golang

Einführung in die Golang -Programmiersprache

Golang ist eine von Google entwickelte Open-Source-Programmiersprache. Befolgen Sie diesen Artikel, ...

Prof. Dr. Julien Plank

Linux -Befehle

So lassen Sie die Version von CUDA unter Linux installiert

Umfassendes Tutorial, wie Sie die Versionen von CUDA herausfinden, die von den derzeit installierten...

Fr. Chris Frisch