PYSPARK Signum -Funktion

PYSPARK Signum -Funktion
Der Hauptvorteil der Signumfunktion besteht darin, die angegebenen Werte ein Vorzeichen bereitzustellen. In PySpark DataFrame mit den numerischen Spalten, wenn der Wert weniger als 0 beträgt, gibt das Signum -1 zurück. Wenn der Wert gleich 0 ist, gibt das Signum 0 zurück. Ansonsten gibt es 1 zurück 1.

Signum () Funktion

Die Funktion signum () ist eine mathematische Funktion, die in PYSPark verwendet wird. Es ist im PYSPARK erhältlich.sql.Funktionsmodul.

Es kann mit der Methode Select -Methode verwendet werden.

Syntax:
DataFrame_OBJ.Select (signum (DataFrame_OBJ.Spalte))

Parameter:
Der Spaltenname als Parameter, um Signalwerte für diese Spalte zurückzugeben.

Jetzt werden wir einige Beispiele sehen, um diese Funktion besser zu verstehen.

Beispiel 1
Erstellen wir einen PYSPARK -Datenframe mit 3 Zeilen und 4 Spalten sowie allen numerischen Typen und senden Signumwerte zurück.

pysspark importieren
Mathematik importieren
aus pysspark.SQL Import SparkSession
aus pysspark.sql.Funktionen importieren Signum
Spark_app = SparkSession.Erbauer.App Name('_').Getorcreate ()
#Mathematikwerte
Werte = [(Mathematik.Pi, 0,7.8,120),
(Mathematik.PI/2,1,0.5,180),
(Mathematik.pi/3, -5, -12.9.360)
]
#Spalten anhand des PYSPARK -Datenframe
DataFrame_OBJ = Spark_App.createdataframe (values, ['value1', 'value2', 'value3', 'value4'])
DataFrame_OBJ.zeigen()
#Get die Signumwerte der Spalte von Wert1
DataFrame_OBJ.Select (signum (DataFrame_OBJ.Wert 1)).zeigen()

Ausgang:

Für den Spaltenwert1 haben wir also die Signumwerte zurückgegeben.
3.141592653589793 ist größer als 0. Der Unterschweifeln beträgt also 1.
1.5707963267948966 ist größer als 0. Der Unterschweifeln beträgt also 1.
1.0471975511965976 ist größer als 0. Der Unterschweifeln beträgt also 1.

Beispiel 2
Jetzt geben wir die Signumwerte für Value2- und Value3 -Spalten zurück.

pysspark importieren
Mathematik importieren
aus pysspark.SQL Import SparkSession
aus pysspark.sql.Funktionen importieren Signum
Spark_app = SparkSession.Erbauer.App Name('_').Getorcreate ()
#Mathematikwerte
Werte = [(Mathematik.Pi, 0,7.8,120),
(Mathematik.PI/2,1,0.5,180),
(Mathematik.pi/3, -5, -12.9.360)
]
#Spalten anhand des PYSPARK -Datenframe
DataFrame_OBJ = Spark_App.createdataframe (values, ['value1', 'value2', 'value3', 'value4'])
DataFrame_OBJ.zeigen()
#Get die Signumwerte der Spalte von Wert2 und Value3
DataFrame_OBJ.Select (signum (DataFrame_OBJ.value2), signum (DataFrame_OBJ.Wert3)).zeigen()

Ausgang:

Spalte - Wert 2:

0 ist 0. Der Unterschweifeln beträgt also 0.
1 ist größer als 0. Der Unterschweifeln beträgt also 1.
-5 ist weniger als 0. Der Unterschweifeln beträgt -1.

Spalte - Wert 3:

7.8 ist größer als 0. Der Unterschweifeln beträgt also 1.
0.5 ist größer als 0. Der Unterschweifeln beträgt also 1.
-12.9 ist weniger als 0. Der Unterschweifeln beträgt -1.

Notiz: Signum () -Funktion gibt NULL zurück, wenn Sie sie in Zeichenfolgenwerten anwenden. Es funktioniert nur auf numerischen Daten.

Abschluss

In diesem PYSPARK -Tutorial haben wir die Funktion signum () besprochen. Signum () ist eine mathematische Funktion, die in PYSPark verwendet werden kann. Es ist im PYSPARK erhältlich.sql.Funktionsmodul. Wenn der Wert unter 0 liegt, gibt das Signum -1, wenn der Wert weniger als 0 liegt. Wenn der Wert gleich 0 ist, gibt das Signum 0 zurück. Ansonsten gibt es 1 zurück 1.