PYSPARK - PANDAS -Serie repräsentiert die PANDAS.
Pandas unterstützt die Datenstruktur der Serie und Pandas wird aus dem PYSPARK -Modul importiert.
Vorher müssen Sie das PYSPARK -Modul installieren.”
Befehl
PIP Installieren Sie PYSPARKSyntax zum Import
aus pyspark import PandasDanach können wir die Serie aus dem Pandas -Modul erstellen oder verwenden.
Syntax zum Erstellen von PANDAS -Serien
PYSPARK.Pandas.Serie()Wir können eine Liste oder Liste der Listen mit Werten übergeben.
Erstellen wir eine Pandas -Serie über PYSPARK mit fünf numerischen Werten.
#import pandas aus dem pysparkmodulAusgang
Jetzt werden wir in unser Tutorial gehen.
Arithmetische Operationen werden verwendet, um Operationen wie Addition, Subtraktion, Multiplikation, Abteilung und Modul durchzuführen. Die PYSPARK PANDAS-Serie unterstützt integrierte Funktionen, mit denen diese Operationen ausgeführt werden.
Lassen Sie uns sie einzeln sehen.
PYSPARK.Pandas.Serie.hinzufügen()
add () in der pyspark pandas -Serie wird verwendet, um Elemente in der gesamten Serie mit einem Wert hinzuzufügen.
Es nimmt den Wert als Parameter.
Syntax
PYSPARK_SERIES.Mehrwert)Wo,
Beispiel
In diesem Beispiel werden wir der Serie 5 hinzufügen.
Ausgang
Wir können sehen, dass 10 zu jedem Element in der Serie hinzugefügt wird.
PYSPARK.Pandas.Serie.sub ()
sub () in der PYSPARK PANDAS -Reihe wird verwendet, um Elemente in der gesamten Serie mit einem Wert zu subtrahieren.
Es nimmt den Wert als Parameter.
Syntax
PYSPARK_SERIES.Sub (Wert)Wo,
Beispiel
In diesem Beispiel werden wir 10 von der Serie abziehen.
Ausgang
Wir können sehen, dass 10 von jedem Element in der Serie abgezogen wird.
PYSPARK.Pandas.Serie.mul ()
MUL () in der PYSpark Pandas -Serie wird verwendet, um Elemente in der gesamten Serie mit einem Wert zu multiplizieren.
Es nimmt den Wert als Parameter.
Syntax
PYSPARK_SERIES.Mul (Wert)Wo,
Beispiel
In diesem Beispiel werden wir 10 mit der Serie multiplizieren.
Ausgang
Wir können sehen, dass 10 mit jedem Element in der Serie multipliziert wird.
PYSPARK.Pandas.Serie.div ()
Div () in der PYSPARK PANDAS -Serie wird verwendet, um die Elemente in der gesamten Serie durch einen Wert zu teilen. Es gibt einen Quotienten zurück.
Es nimmt den Wert als Parameter.
Syntax
PYSPARK_SERIES.Div (Wert)Wo,
Beispiel
In diesem Beispiel werden wir die Serie durch 10 teilen.
Ausgang
Wir können sehen, dass jedes Element in der Serie durch 10 geteilt und den Quotienten zurückgegeben wird.
PYSPARK.Pandas.Serie.mod ()
Div () in der PYSPARK PANDAS -Serie wird verwendet, um die Elemente in der gesamten Serie durch einen Wert zu teilen. Es gibt den Rest zurück.
Es nimmt den Wert als Parameter.
Syntax
PYSPARK_SERIES.Mod (Wert)Wo,
Beispiel
In diesem Beispiel werden wir die Serie durch 10 teilen.
Ausgang
Wir können sehen, dass jedes Element in der Serie durch 10 geteilt wird und den Rest zurückgegeben hat.
Abschluss
In diesem PYSPARK PANDAS -Tutorial diskutierten wir arithmetische Operationen, die in der PYSPARK PANDAS -Serie durchgeführt wurden. add () wird verwendet, um alle Werte in der gesamten Serie hinzuzufügen, und Sub () wird verwendet, um Werte von der gesamten PYSpark -Pandas -Reihe zu subtrahieren. MUL () wird verwendet, um alle Werte in der gesamten Serie mit einem Wert zu multiplizieren, und div () wird verwendet, um alle Werte durch einen Wert in der PYSpark Pandas -Serie zu teilen und den Quotienten zurückzugeben. Mod () wird verwendet, um alle Werte durch einen Wert in der PYSpark Pandas -Serie zu teilen und den Rest zurückzugeben. Die Differenz zwischen mod () und div () ist mod () gibt Rest zurück, aber Div () gibt Quotienten zurück.