Kumulatives Produkt Pandas

Kumulatives Produkt Pandas
Python ist eine benutzerfreundliche Programmiersprache auf hoher Ebene, die für die Durchführung von Datenanalysen am besten in Betracht gezogen wird. Der Hauptgrund dafür ist, dass Python ein großes Ökosystem von datenzentrierten Paketen wie Pandas bietet. Die Pandas in Python machen es einfach, die Daten zu importieren und zu analysieren.

Eine der Funktionen des Pandas ist die Serie.cumprod (). Diese Methode wird verwendet, um das kumulative Produkt einer Reihe zu berechnen. In diesem Artikel werden wir erklären, wie das kumulative Produkt mithilfe der Pandas Library in Python berechnet werden kann.

Was ist ein kumulatives Produkt?

Ein kumulatives Produkt ist ein iteratives Produkt jedes Elements in einem Array. Eine bestimmte Sequenz wird iterativ mit jedem Element in dieser Sequenz multipliziert. Jeder resultierende Wert ist die Summe der aktuellen und früheren Werte des Arrays. Zum Beispiel haben wir eine Sequenz von 3 Elementen [x, y, z], und das kumulative Produkt wird [X, XY, XYZ] sein.

Die Pandas in Python bieten einige Funktionen, um das kumulative Produkt einer Serie zu berechnen. cumprod () ist eine dieser Funktionen, die üblicherweise verwendet werden, um das kumulative Produkt einer Serie in Python zu finden. Ein Datenrahmen oder eine Reihe von Elementen, die der Funktion cumprod () zur Verfügung gestellt werden.

Was ist die Syntax der Serien?.cumprod () Methode?

Hier ist die Syntax der Serien.cumprod () Methode:

Die Serie.cumprod () nimmt zwei Parameter; Achse und Skipna. Der Wert für die Achse beträgt entweder 0 oder 1; oder es handelt sich entweder index oder in der Spalte, 0 und des Index, beide stellen die zeilenweise Operation dar, während 1 und die Spalte beide die Spalten-Weise darstellen. Darüber hinaus ist der Skippa -Wert ein boolescher Wert (wahr oder falsch). Es wird verwendet, um die NA -Werte in einem Datenrahmen zu überspringen. Die Serie.cumprod () gibt die gleiche Größe der Serien wie die Eingabe zurück.

Lassen Sie uns nun mit den Beispielen fortfahren, um zu sehen, wie wir die Funktion cumprod () in Python implementieren können.

Beispiel 1

In diesem Beispiel werden wir eine kleine Reihe von Zahlen erstellen, die auch einen NA -Wert enthalten. Der NA -Wert wird in der Serie aufbewahrt, um zu sehen, wie cumprod () darauf reagiert. Darüber hinaus wird für den Skipna -Parameter kein Wert bereitgestellt, wodurch der Standard -Skipna -Wert verwendet wird. Siehe den Code unten.

Wie bereits erwähnt, ist das kumulative Produkt das Produkt des aktuellen Wertes und alle vorherigen Werte im Array. Der erste Artikel im ursprünglichen Array entspricht immer dem ersten kumulativen Produkt. Der zweite Wert ist das Produkt der ersten und zweiten Werte, 2 * 3 = 6, und der dritte Wert ist das Produkt der ersten drei Werte, 2 * 3 * 5 = 30.

Wenn der vierte Wert Nan ist, war die Skipna wahr, wodurch Cumprod () den Na -Wert übersprungen und vorwärts gehen kann, wobei NA für den aktuellen Wert zurückgegeben wurde. Für die restlichen Werte im Array wird der gleiche Prozess des kumulativen Produkts befolgt.

Pandas als PD importieren
Numph als NP importieren
num = [2, 3, 5, np.Nan, 7, 9, 1, 0]
S = PD.Serie (Num)
cumprod = s.cumprod ()
drucken (cumprod)

Siehe die folgende Ausgabe, um das kumulative Produkt jedes Wertes im Array zu kennen:

Beispiel 2

Im vorherigen Beispiel haben wir nicht den Wert für Skipna bereitgestellt, die die Skipna standardmäßig wahr halten. Jetzt werden wir Skipna falsch liefern, damit Cumprod () NA nicht überspringt, und wir können sehen, was in diesem Fall passieren wird.

Durch die Bereitstellung des falschen Wertes für Skipna zwingen wir den Cumprod (), den Na -Wert zu jedem Zeitpunkt zu bemerken und ihn jedes Mal nach seinem Auftreten zu vergleichen. Sehen Sie den folgenden Code an, um zu erfahren, wie Sie einen falschen Wert für den Skipna -Parameter bereitstellen:

Pandas als PD importieren
Numph als NP importieren
num = [2, 3, 5, np.Nan, 7, 9, 1, 0]
S = PD.Serie (Num)
cumprod = s.cumprod (Skipna = false)
drucken (cumprod)

Hier ist die Ausgabe des vorherigen Codes:

Beachten Sie, dass die ersten vier Werte dem vorherigen Beispiel übereinstimmen. Der fünfte Wert wird jedoch na, da wir Skipna = False bereitgestellt haben, was bedeutet, dass NA nicht ignoriert und verglichen wird, wenn er in der Liste aufgetreten ist. So machen Sie alle verbleibenden Werte na.

Beispiel 3

Wir haben das kumulative Produkt eines einfachen Arrays in den vorherigen Beispielen gesehen. Schauen wir uns an, wie wir das kumulative Produkt eines Arrays berechnen können, abhängig von der Achse. In diesem Beispiel werden zwei Spalten in einem Array bereitgestellt und ihr kumulatives Produkt finden. Hier ist der Code dafür:

Numph als NP importieren
arr = np.Array ([[1, 3, 5, 7], [2, 4, 6, 8]])
print ("Das Eingangsarray ist =", arr)
res = np.cumprod (arr)
print ("Das kumulative Produkt des Eingangsarrays ist =", res)

Beachten Sie, dass das resultierende Array die Summe der Länge beider Spalten ist, die 4 + 4 = 8 beträgt. Siehe die Ausgabe unten:

Beispiel 4

Jetzt wissen wir, dass es möglich ist, das kumulative Produkt eines Arrays basierend auf der Achse zu berechnen. Wir können entscheiden, ob wir das kumulative Produkt der gesamten Achse oder nur der 1 -Achse gleichzeitig berechnen möchten. Sehen Sie sich den folgenden Code an, um zu wissen, wie wir dies erreichen können.

Wie Sie beobachten können, haben wir nur den zusätzlichen Achsenparameter für die Funktion cumprod () zur Verfügung gestellt. Der Wert für den Achsenparameter ist 1, was bedeutet, das kumulative Produkt der 1 -Achse zu berechnen. In einfachen Worten nimmt der Cumprod () die erste Spalte ein, berechnet sein kumulatives Produkt und gibt das Ergebnis zurück. Nehmen Sie anschließend die zweite Spalte, starten Sie das neue kumulative Produkt, berechnen Sie das kumulative Produkt jedes Elements und geben Sie das Ergebnis für die zweite Spalte zurück.

Numph als NP importieren
arr = np.Array ([[1, 3, 5, 7], [2, 4, 6, 8]])
print ("Das Eingangsarray ist =", arr)
res = np.cumprod (arr, axis = 1)
print ("Das kumulative Produkt des Eingangsarrays ist =", res)

Hier ist das Ausgabebild:

Abschluss

Wir haben das grundlegende Konzept der Berechnung des kumulativen Produkts in diesem Artikel behandelt. Wir haben auch Richtlinien zur Berechnung des kumulativen Produkts unter Verwendung von Pandas in Python erwähnt. Die Pandas in Python bieten eine Cumprod () -Funktion zur Berechnung des kumulativen Produkts einer Reihe.