PYSPARK - PANDAS -Serie repräsentiert die PANDAS.
Pandas unterstützt die Datenstruktur der Serie und Pandas wird aus dem PYSPARK -Modul importiert.
Vorher müssen Sie das PYSPARK -Modul installieren.”
Befehl
PIP Installieren Sie PYSPARKSyntax zum Import
aus pyspark import PandasDanach können wir die Serie aus dem Pandas -Modul erstellen oder verwenden.
Syntax zum Erstellen von PANDAS -Serien
PYSPARK.Pandas.Serie()Wir können eine Liste oder Liste der Listen mit Werten übergeben.
Erstellen wir eine Pandas -Serie über PYSPARK mit fünf numerischen Werten.
#import pandas aus dem pysparkmodulAusgang
Jetzt werden wir in unser Tutorial gehen.
Kumulative Operationen werden verwendet, um kumulative Ergebnisse über die Werte in der PYSPARK PANDAS -Reihe zurückzugeben.
Lassen Sie uns sie einzeln sehen.
PYSPARK.Pandas.Serie.Cumsum ()
cumsum () gibt die kumulative Summe der Serie für jedes Element zurück. Es kann auf die gesamte PYSPARK PANDAS -Serie angewendet werden.
Syntax
PYSPARK_SERIES.Cumsum ()Wo pyspark_series die pyspark pandas -Serie ist
Beispiel
In diesem Beispiel werden wir eine kumulative Summenoperation in der Serie durchführen.
Ausgang
Arbeiten:PYSPARK.Pandas.Serie.cumprod ()
Cumprod () gibt das kumulative Produkt der Serie für jedes Element zurück. Es kann auf die gesamte PYSPARK PANDAS -Serie angewendet werden.
Syntax
PYSPARK_SERIES.cumprod ()Wo pyspark_series die pyspark pandas -Serie ist
Beispiel
In diesem Beispiel werden wir einen kumulativen Produktbetrieb in der Serie durchführen.
Ausgang
Arbeiten:PYSPARK.Pandas.Serie.Cummin ()
Cummin () gibt den kumulativen Mindestwert der Serie für jedes Element zurück. Es kann auf die gesamte PYSPARK PANDAS -Serie angewendet werden.
Syntax
PYSPARK_SERIES.Cummin ()Wo pyspark_series die pyspark pandas -Serie ist
Beispiel
In diesem Beispiel werden wir einen kumulativen Min -Operation in der Serie durchführen.
Ausgang
Arbeiten:PYSPARK.Pandas.Serie.Cummin ()
Cummin () gibt den kumulativen Mindestwert der Serie für jedes Element zurück. Es kann auf die gesamte PYSPARK PANDAS -Serie angewendet werden.
Syntax
PYSPARK_SERIES.Cummax ()Wo pyspark_series die pyspark pandas -Serie ist
Beispiel
In diesem Beispiel werden wir in der Serie eine kumulative maximale Operation durchführen.
Ausgang
Arbeiten:Abschluss
In diesem PYSPARK PANDAS -Tutorial diskutierten wir kumulative Operationen, die in der PYSPARK PANDAS -Serie durchgeführt wurden. Cumsum () wird verwendet, um die kumulative Summe zurückzugeben, Cumprod () wird verwendet, um das kumulative Produkt in, Cummin () zurückzugeben.