Bevor wir diese Funktionen diskutieren, erstellen wir einen Beispielpyspark -Datenframe.
Daten
pysspark importieren
aus pysspark.SQL Import SparkSession
Spark_app = SparkSession.Erbauer.App Name('_').Getorcreate ()
Schüler = [(4, 'Sravan', 23, keine, keine),
(4, "Chandana", 23, "CSS", "pyspark"),
(46, 'Mounika', 22, keine, ''.NETZ'),
(4, 'Deepika', 21, 'Html', keine),
]
DataFrame_OBJ = Spark_App.Createdataframe (Studenten, ['Subjekt_ID', 'Name', 'Alter', 'Technology1', 'Technology2'])
DataFrame_OBJ.zeigen()
Ausgang:
Jetzt gibt es 5 Spalten und 4 Zeilen.
ASC_Nulls_First () Funktion
Die Funktion von ASC_Nulls_First () sortiert die Werte in einer Spalte in aufsteigender Reihenfolge, platziert jedoch die vorhandenen Nullwerte zuerst in einer Spalte.
Es kann mit der Methode Select () verwendet werden, um die geordneten Spalten auszuwählen. Es ist sehr wichtig, OrderBy () zu verwenden, weil die Hauptsache hier sortiert wird.orderBy () und nimmt ASC_Nulls_First () als Parameter.
Syntax
DataFrame_OBJ.select (DataFrame_OBJ.Spalte).orderBy (DataFrame_OBJ.Spalte.ASC_NULLS_
Erste())
Wenn DataFrame_OBJ der Datenrahmen und die Spalte ist, ist der Spaltenname, in dem die Werte sortiert sind.
Unser Datenrahmen ist also bereit. Lassen Sie uns die Funktion asc_nulls_first () demonstrieren.
Beispiel 1
Jetzt sortieren wir die Werte in der Spalte Technology1 mit keinen/null -Werten in aufsteigender Reihenfolge unter Verwendung der Funktion asc_nulls_first ().
#Sortieren Sie die Spalte für Technologie1 in aufsteigender Reihenfolge und erhalten Sie zuerst die Nullwerte.
DataFrame_OBJ.select (DataFrame_OBJ.Technologie1).orderBy (DataFrame_OBJ.Technologie1.ASC_
nulls_first ()).zeigen()
Ausgang:
Eigentlich gibt es zwei Nullwerte. Erstens werden sie platziert und später werden CSS und HTML in aufsteigender Reihenfolge sortiert.
Beispiel 2
Jetzt sortieren wir die Werte in der Spalte Technology2, die keine/null -Werte in aufsteigender Reihenfolge mit der Funktion ASC_Nulls_First () enthält.
#Sortieren Sie die Spalte für Technologie2 in aufsteigender Reihenfolge und erhalten Sie zuerst die Nullwerte.
DataFrame_OBJ.select (DataFrame_OBJ.Technologie2).orderBy (DataFrame_OBJ.Technologie2.ASC_
nulls_first ()).zeigen()
Ausgang:
Eigentlich gibt es zwei Nullwerte. Erstens werden sie platziert und später, .Net und pyspark sind in aufsteigender Reihenfolge sortiert.
ASC_Nulls_Last () Funktion
Die Funktion von ASC_Nulls_Last () sortiert die Werte in einer Spalte in aufsteigender Reihenfolge, platziert jedoch die vorhandenen Nullwerte in einer Spalte zuletzt in einer Spalte.
Es kann mit der Methode Select () verwendet werden, um die geordneten Spalten auszuwählen. Es ist sehr wichtig, OrderBy () zu verwenden, weil die Hauptsache hier sortiert wird.orderBy (), da es asc_nulls_first () als Parameter dauert.
Syntax
DataFrame_OBJ.select (DataFrame_OBJ.Spalte).orderBy (DataFrame_OBJ.Spalte.ASC_Nulls_Last ())
Wenn DataFrame_OBJ der Datenrahmen und die Spalte ist der Spaltenname, in dem die Werte sortiert werden, werden alle Nullwerte endlich platziert.
Unser Datenrahmen ist also bereit. Lassen Sie uns die Funktion asc_nulls_last () demonstrieren.
Beispiel 1
Jetzt sortieren wir die Werte in der Spalte Technology2, die keine/null -Werte in aufsteigender Reihenfolge mit der Funktion asc_nulls_last () enthält.
#Sortieren Sie die Spalte für Technologie1 in aufsteigender Reihenfolge und erhalten Sie die Nullwerte zuletzt.
DataFrame_OBJ.select (DataFrame_OBJ.Technologie1).orderBy (DataFrame_OBJ.Technologie1.ASC_
nulls_last ()).zeigen()
Ausgang:
Eigentlich gibt es zwei Nullwerte. Erstens werden CSS und HTML in aufsteigender Reihenfolge sortiert, und zwei Nullwerte werden zuletzt platziert.
Beispiel 2
Jetzt sortieren wir die Werte in der Spalte Technology2, die keine/null -Werte in aufsteigender Reihenfolge mit der Funktion asc_nulls_last () enthält.
#Sortieren Sie die Spalte für Technologie2 in aufsteigender Reihenfolge und erhalten Sie die Nullwerte zuletzt.
DataFrame_OBJ.select (DataFrame_OBJ.Technologie2).orderBy (DataFrame_OBJ.Technologie2.ASC_
nulls_last ()).zeigen()
Ausgang:
Eigentlich gibt es zwei Nullwerte. Erste, .Net und pyspark sind in aufsteigender Reihenfolge sortiert und zwei Nullwerte werden zuletzt platziert.
Gesamtcode
pysspark importieren
aus pysspark.SQL Import SparkSession
Spark_app = SparkSession.Erbauer.App Name('_').Getorcreate ()
Schüler = [(4, 'Sravan', 23, keine, keine),
(4, "Chandana", 23, "CSS", "pyspark"),
(46, 'Mounika', 22, keine, ''.NETZ'),
(4, 'Deepika', 21, 'Html', keine),
]
DataFrame_OBJ = Spark_App.Createdataframe (Studenten, ['Subjekt_ID', 'Name', 'Alter', 'Technology1', 'Technology2'])
DataFrame_OBJ.zeigen()
#Sortieren Sie die Spalte für Technologie1 in aufsteigender Reihenfolge und erhalten Sie zuerst die Nullwerte.
DataFrame_OBJ.select (DataFrame_OBJ.Technologie1).orderBy (DataFrame_OBJ.Technologie1.ASC_
nulls_first ()).zeigen()
#Sortieren Sie die Spalte für Technologie2 in aufsteigender Reihenfolge und erhalten Sie zuerst die Nullwerte.
DataFrame_OBJ.select (DataFrame_OBJ.Technologie2).orderBy (DataFrame_OBJ.Technologie2.ASC_
nulls_first ()).zeigen()
#Sortieren Sie die Spalte für Technologie1 in aufsteigender Reihenfolge und erhalten Sie die Nullwerte zuletzt.
DataFrame_OBJ.select (DataFrame_OBJ.Technologie1).orderBy (DataFrame_OBJ.Technologie1.ASC_
nulls_last ()).zeigen()
#Sortieren Sie die Spalte für Technologie2 in aufsteigender Reihenfolge und erhalten Sie die Nullwerte zuletzt.
DataFrame_OBJ.select (DataFrame_OBJ.Technologie2).orderBy (DataFrame_OBJ.Technologie2.ASC_
nulls_last ()).zeigen()
Abschluss
Am Ende dieses PYSPARK -Tutorials haben wir gelernt, dass es möglich ist, mit Null umzugehen, während die Werte in einem Datenrahmen mithilfe der Funktionen ASC_NULLS_FIRST () und ASC_Nulls_Last () sortiert werden. Die Funktion von ASC_Nulls_First () sortiert die Werte in einer Spalte in aufsteigender Reihenfolge, platziert jedoch die vorhandenen Nullwerte zuerst in einer Spalte. Die Funktion von ASC_Nulls_Last () sortiert die Werte in einer Spalte in aufsteigender Reihenfolge, platziert jedoch die vorhandenen Nullwerte in einer Spalte zuletzt in einer Spalte. Sie können den gesamten Code im letzten Teil des Tutorials ausführen.