Sie können entweder mit der Filterklausel oder an der Klausel verwendet werden. Wir werden sie einzeln mit verschiedenen Beispielen sehen.
Like () Funktion
Die Funktion von Like () in pySpark wird verwendet, um zu überprüfen. Wenn es existiert, werden die übereinstimmenden Zeilen zurückgegeben. Andernfalls wird ein leerer Datenrahmen zurückgegeben. Es ist Fallempfindlichkeit.
Syntax
DataFrame_Object.filter (DataFrame_OBJ.Spalte.wie (Muster/String))Wo,
DataFrame_Object ist der PYSPARK -Datenrahmen.
Parameter:
Der wie() Funktion hat einen Parameter.
Es kann ein Muster oder eine Zeichenfolge sein, sodass die Funktion Like () überprüft, ob der angegebene Wert in der Spalte DataFrame vorhanden ist oder nicht.
Zurückkehren:
Basierend auf diesem Spaltenwert wird die gesamte Zeile zurückgegeben.
Zunächst erstellen wir den PYSPark -Datenframe mit 10 Zeilen und 5 Spalten.
pysspark importierenAusgang:
Wenden wir nun die Funktion Like () auf den PYSPARK -Datendarbeam an, um die Ergebnisse zurückzugeben.
Beispiel 1
Wir geben die Zeichenfolge 'Sravan' in der Spalte Name innerhalb der Methode () () an und geben alle Zeilen zurück, die dieser Zeichenfolge entsprechen.
Ausgang:
Sie können sehen, dass Sravan dreimal gefunden wird und die Zeilen zurückgegeben wurden.
Beispiel 2
Wir werden die String 'Php' in der Spalte Technology1 in der Methode Like () bereitstellen und alle Zeilen zurückgeben, die dieser Zeichenfolge entsprechen.
Ausgang:
Sie können sehen, dass PHP in der Spalte Technology1 nicht zu finden ist. Daher wurden 0 Zeilen zurückgegeben.
ilike () Funktion
Die Funktion ilike () in PYSPark wird verwendet, um zu überprüfen. Wenn es existiert, werden die übereinstimmenden Zeilen zurückgegeben. Andernfalls wird der leere Datenrahmen zurückgegeben. Es ist unempfindlich.
Syntax
DataFrame_Object.filter (DataFrame_OBJ.Spalte.Ilike (Muster/String))Wo,
DataFrame_Object ist der PYSPARK -Datenrahmen.
Parameter:
Die Funktion ilike () hat einen Parameter.
Es kann ein Muster oder eine Zeichenfolge sein, so dass die Funktion ilike () prüft, ob der angegebene Wert in der Spalte DataFrame vorhanden ist oder nicht.
Zurückkehren:
Basierend auf diesem Spaltenwert wird die gesamte Zeile zurückgegeben.
Beispiel 1
Wir geben die Zeichenfolge 'Sravan' in der Spalte Name in der ilike () -Methode an und geben alle Zeilen zurück, die dieser Zeichenfolge entsprechen.
Ausgang:
Erläuterung
Sie können sehen, dass Sravan dreimal gefunden wird und die Reihen zurückgegeben wurden.
Beispiel 2
Wir werden die String 'Php' in der Spalte Technology1 in der Methode Like () bereitstellen und alle Zeilen zurückgeben, die dieser Zeichenfolge entsprechen.
Ausgang:
Erläuterung
Sie können sehen, dass PHP in der Spalte Technology1 nicht zu finden ist. Aber ilike () ist unempfindlich. Also braucht es PHP und PHP als gleich. Also wurden die Zeilen zurückgegeben.
Abschluss
In diesem PYSPARK. Die Funktionen von Like () und Ilike () werden verwendet, um zu überprüfen. Der Unterschied ist wie () ist Fallempfindlichkeit und Ilike () ist unempfindlich.