PYSPARK ASC_NULLS_FIRST UND ASC_NULLS_LAST -Funktionen

PYSPARK ASC_NULLS_FIRST UND ASC_NULLS_LAST -Funktionen
Wenn Sie die Werte in einer Spalte in PYSpark -Datenframe mit Nulls in aufsteigender Reihenfolge sortieren möchten, können Sie mit den Funktionen von ASC_NULLS_FIRST () und ASC_Nulls_Last () entscheiden.

Bevor wir diese Funktionen diskutieren, erstellen wir einen Beispielpyspark -Datenframe.

Daten

pysspark importieren
aus pysspark.SQL Import SparkSession
Spark_app = SparkSession.Erbauer.App Name('_').Getorcreate ()
Schüler = [(4, 'Sravan', 23, keine, keine),
(4, "Chandana", 23, "CSS", "pyspark"),
(46, 'Mounika', 22, keine, ''.NETZ'),
(4, 'Deepika', 21, 'Html', keine),
]
DataFrame_OBJ = Spark_App.Createdataframe (Studenten, ['Subjekt_ID', 'Name', 'Alter', 'Technology1', 'Technology2'])
DataFrame_OBJ.zeigen()


Ausgang:


Jetzt gibt es 5 Spalten und 4 Zeilen.

ASC_Nulls_First () Funktion

Die Funktion von ASC_Nulls_First () sortiert die Werte in einer Spalte in aufsteigender Reihenfolge, platziert jedoch die vorhandenen Nullwerte zuerst in einer Spalte.

Es kann mit der Methode Select () verwendet werden, um die geordneten Spalten auszuwählen. Es ist sehr wichtig, OrderBy () zu verwenden, weil die Hauptsache hier sortiert wird.orderBy () und nimmt ASC_Nulls_First () als Parameter.

Syntax

DataFrame_OBJ.select (DataFrame_OBJ.Spalte).orderBy (DataFrame_OBJ.Spalte.ASC_NULLS_
Erste())


Wenn DataFrame_OBJ der Datenrahmen und die Spalte ist, ist der Spaltenname, in dem die Werte sortiert sind.

Unser Datenrahmen ist also bereit. Lassen Sie uns die Funktion asc_nulls_first () demonstrieren.

Beispiel 1

Jetzt sortieren wir die Werte in der Spalte Technology1 mit keinen/null -Werten in aufsteigender Reihenfolge unter Verwendung der Funktion asc_nulls_first ().

#Sortieren Sie die Spalte für Technologie1 in aufsteigender Reihenfolge und erhalten Sie zuerst die Nullwerte.
DataFrame_OBJ.select (DataFrame_OBJ.Technologie1).orderBy (DataFrame_OBJ.Technologie1.ASC_
nulls_first ()).zeigen()


Ausgang:


Eigentlich gibt es zwei Nullwerte. Erstens werden sie platziert und später werden CSS und HTML in aufsteigender Reihenfolge sortiert.

Beispiel 2

Jetzt sortieren wir die Werte in der Spalte Technology2, die keine/null -Werte in aufsteigender Reihenfolge mit der Funktion ASC_Nulls_First () enthält.

#Sortieren Sie die Spalte für Technologie2 in aufsteigender Reihenfolge und erhalten Sie zuerst die Nullwerte.
DataFrame_OBJ.select (DataFrame_OBJ.Technologie2).orderBy (DataFrame_OBJ.Technologie2.ASC_
nulls_first ()).zeigen()


Ausgang:


Eigentlich gibt es zwei Nullwerte. Erstens werden sie platziert und später, .Net und pyspark sind in aufsteigender Reihenfolge sortiert.

ASC_Nulls_Last () Funktion

Die Funktion von ASC_Nulls_Last () sortiert die Werte in einer Spalte in aufsteigender Reihenfolge, platziert jedoch die vorhandenen Nullwerte in einer Spalte zuletzt in einer Spalte.

Es kann mit der Methode Select () verwendet werden, um die geordneten Spalten auszuwählen. Es ist sehr wichtig, OrderBy () zu verwenden, weil die Hauptsache hier sortiert wird.orderBy (), da es asc_nulls_first () als Parameter dauert.

Syntax

DataFrame_OBJ.select (DataFrame_OBJ.Spalte).orderBy (DataFrame_OBJ.Spalte.ASC_Nulls_Last ())


Wenn DataFrame_OBJ der Datenrahmen und die Spalte ist der Spaltenname, in dem die Werte sortiert werden, werden alle Nullwerte endlich platziert.

Unser Datenrahmen ist also bereit. Lassen Sie uns die Funktion asc_nulls_last () demonstrieren.

Beispiel 1

Jetzt sortieren wir die Werte in der Spalte Technology2, die keine/null -Werte in aufsteigender Reihenfolge mit der Funktion asc_nulls_last () enthält.

#Sortieren Sie die Spalte für Technologie1 in aufsteigender Reihenfolge und erhalten Sie die Nullwerte zuletzt.
DataFrame_OBJ.select (DataFrame_OBJ.Technologie1).orderBy (DataFrame_OBJ.Technologie1.ASC_
nulls_last ()).zeigen()


Ausgang:


Eigentlich gibt es zwei Nullwerte. Erstens werden CSS und HTML in aufsteigender Reihenfolge sortiert, und zwei Nullwerte werden zuletzt platziert.

Beispiel 2

Jetzt sortieren wir die Werte in der Spalte Technology2, die keine/null -Werte in aufsteigender Reihenfolge mit der Funktion asc_nulls_last () enthält.

#Sortieren Sie die Spalte für Technologie2 in aufsteigender Reihenfolge und erhalten Sie die Nullwerte zuletzt.
DataFrame_OBJ.select (DataFrame_OBJ.Technologie2).orderBy (DataFrame_OBJ.Technologie2.ASC_
nulls_last ()).zeigen()


Ausgang:


Eigentlich gibt es zwei Nullwerte. Erste, .Net und pyspark sind in aufsteigender Reihenfolge sortiert und zwei Nullwerte werden zuletzt platziert.

Gesamtcode

pysspark importieren
aus pysspark.SQL Import SparkSession
Spark_app = SparkSession.Erbauer.App Name('_').Getorcreate ()
Schüler = [(4, 'Sravan', 23, keine, keine),
(4, "Chandana", 23, "CSS", "pyspark"),
(46, 'Mounika', 22, keine, ''.NETZ'),
(4, 'Deepika', 21, 'Html', keine),
]
DataFrame_OBJ = Spark_App.Createdataframe (Studenten, ['Subjekt_ID', 'Name', 'Alter', 'Technology1', 'Technology2'])
DataFrame_OBJ.zeigen()
#Sortieren Sie die Spalte für Technologie1 in aufsteigender Reihenfolge und erhalten Sie zuerst die Nullwerte.
DataFrame_OBJ.select (DataFrame_OBJ.Technologie1).orderBy (DataFrame_OBJ.Technologie1.ASC_
nulls_first ()).zeigen()
#Sortieren Sie die Spalte für Technologie2 in aufsteigender Reihenfolge und erhalten Sie zuerst die Nullwerte.
DataFrame_OBJ.select (DataFrame_OBJ.Technologie2).orderBy (DataFrame_OBJ.Technologie2.ASC_
nulls_first ()).zeigen()
#Sortieren Sie die Spalte für Technologie1 in aufsteigender Reihenfolge und erhalten Sie die Nullwerte zuletzt.
DataFrame_OBJ.select (DataFrame_OBJ.Technologie1).orderBy (DataFrame_OBJ.Technologie1.ASC_
nulls_last ()).zeigen()
#Sortieren Sie die Spalte für Technologie2 in aufsteigender Reihenfolge und erhalten Sie die Nullwerte zuletzt.
DataFrame_OBJ.select (DataFrame_OBJ.Technologie2).orderBy (DataFrame_OBJ.Technologie2.ASC_
nulls_last ()).zeigen()

Abschluss

Am Ende dieses PYSPARK -Tutorials haben wir gelernt, dass es möglich ist, mit Null umzugehen, während die Werte in einem Datenrahmen mithilfe der Funktionen ASC_NULLS_FIRST () und ASC_Nulls_Last () sortiert werden. Die Funktion von ASC_Nulls_First () sortiert die Werte in einer Spalte in aufsteigender Reihenfolge, platziert jedoch die vorhandenen Nullwerte zuerst in einer Spalte. Die Funktion von ASC_Nulls_Last () sortiert die Werte in einer Spalte in aufsteigender Reihenfolge, platziert jedoch die vorhandenen Nullwerte in einer Spalte zuletzt in einer Spalte. Sie können den gesamten Code im letzten Teil des Tutorials ausführen.