STR_EXTRACT- und STR_DETECT -Funktionen in r

STR_EXTRACT- und STR_DETECT -Funktionen in r
In diesem Artikel werden wir über die Funktionen von str_extract () & str_detekt () in R erörtert.

Lassen Sie uns sie einzeln sehen.

Str_extract ()

Die Funktion str_extract () wird verwendet, um die Zeichenfolgen/Zahlen aus der angegebenen Zeichenfolge zu extrahieren. Dies ist im StringR -Paket verfügbar. Daher müssen wir die StringR -Bibliothek laden.

Syntax:

str_extract ("Objekt", "Muster")

Parameter:

Es dauert zwei Parameter:

  1. Objekt bezieht sich auf den String oder Vektor oder eine Liste
  2. Muster wird verwendet, um die Art der Zeichen aus dem Objekt zu extrahieren

Die Muster sind:

  1. String - Es dauert eine normale Zeichenfolge. Wenn es im Objekt vorhanden ist, wird die Zeichenfolge zurückgegeben. Ansonsten wird NA zurückgegeben.
  2. \\ d+ - Es wird verwendet, um den im Objekt vorhandenen numerischen Wert zu überprüfen. Wenn es vorhanden ist, gibt es diese Zahl zurück. Ansonsten wird NA zurückgegeben. Wenn es mehrere numerische Werte gibt, wird der erste numerische Wert zurückgegeben.
  3. [A -Z]+ - Es wird verwendet, um den im Objekt vorhandenen Stringwert zu überprüfen. Wenn es vorhanden ist, wird diese Zeichenfolge ohne Platz zurückgegeben. Ansonsten wird NA zurückgegeben. Wenn es mehrere Zeichenfolgewerte gibt, wird der erste Zeichenfolgenwert ohne Speicherplatz zurückgegeben.

Beispiel 1:

In diesem Beispiel werden wir eine Zeichenfolge in Betracht ziehen und nach einem Muster suchen - "Linux".

Bibliothek (stringr)
#scheck, ob der String Linux im tatsächlichen oder nicht vorhanden ist oder nicht
print (str_extract ("Willkommen bei Linux Hinweis 100% Codierung", "Linux"))

Ergebnis:

Wir können das Linux -Muster finden. Daher gibt es es zurück.

Beispiel 2:

In diesem Beispiel werden wir eine Zeichenfolge betrachten und nach dem numerischen Muster - "\\ D+" überprüfen,.

Bibliothek (stringr)
#Überprüfen Sie das numerische Muster
print (str_extract ("Willkommen bei Linux Tipp 100% Codierung", "\\ d+"))

Ergebnis:

Wir können den numerischen Wert 100 finden. Daher gibt es es zurück.

Beispiel 3:

In diesem Beispiel werden wir eine Zeichenfolge berücksichtigen und nach einem String -Muster suchen - "[a -z]+".

Bibliothek (stringr)
#Überprüfen Sie das String -Muster
print (str_extract ("Willkommen bei Linux Tipp 100% Codierung", "[a-z]+"))

Ergebnis:

Wir finden den ersten Nonspace -String -Wert "Willkommen". Daher gibt es es zurück.

In einem Vektor

Jetzt wenden wir die Funktion str_extract () in einem Vektor von drei Zeichenfolgen an.

Beispiel:

Hier wenden wir alle Muster auf einen Vektor namens vector_fruits an.

Bibliothek (stringr)
#create einen Vektor mit 3 Saiten
vector_fruits = c ("Papayya sind in 100 Verkauf erhältlich", "Wasser-Lemons", "Es gibt 11 Früchte in einem Korb")
#Display der tatsächliche Vektor
print (vector_fruits)
print (paste ("Zeichenfolgen mit Are:", str_extract (vector_fruits, "sind"))))
print (paste ("Zeichenfolgen mit ersten Alphabeten:", str_extract (vector_fruits, "[a-z]+")))
print (paste ("Zeichenfolgen mit Zahlen:", str_extract (vector_fruits, "\\ d+"))))

Ergebnis:

Wir sehen. Da sich „sind“ nicht in der zweiten Zeichenfolge, kehrt es zu NA zurück.

Als nächstes das Muster -[A-Z]+ Gibt die erste Zeichenfolge aus den drei Saiten in einem Vektor zurück.

Schließlich gibt das letzte Muster die numerischen Werte in der ersten und letzten Zeichenfolge zurück, da 100 und 11 vorhanden sind.

In einer Liste

Jetzt wenden wir die Funktion str_extract () in einer Liste von drei Zeichenfolgen an.

Beispiel:

Hier wenden wir alle Muster auf eine Liste mit dem Namen list_fruits an.

Bibliothek (stringr)
#creat eine Liste mit 3 Saiten
list_fruits = list ("Papayya sind in 100 Verkauf erhältlich", "Water-Lemons", "Es gibt 11 Früchte in einem Korb")
#Display die eigentliche Liste
print (list_fruits)
print (paste ("Zeichenfolgen mit Are:", str_extract (list_fruits, "are"))))
print (paste ("Zeichenfolgen mit ersten Alphabeten:", str_extract (list_fruits, "[a-z]+")))
print (paste ("Zeichenfolgen mit Zahlen:", str_extract (list_fruits, "\\ d+"))))

Ergebnis:

Wir sehen. Da "Are" in der zweiten Zeichenfolge nicht vorhanden ist, kehrt es zu NA zurück.

Als nächstes das Muster -[A-Z]+ Gibt die erste Zeichenfolge aus den drei Zeichenfolgen in einer Liste zurück.

Schließlich gibt das letzte Muster die numerischen Werte in der ersten und letzten Zeichenfolge zurück, seit 100 und 11 vorhanden sind.

Str_detect ()

Str_detect () ist in der StringR -Bibliothek verfügbar, mit der überprüft wird, ob die Zeichenfolge oder das Muster in einem Objekt vorhanden ist. Wenn es existiert, kehrt es zu True zurück. Ansonsten kehrt es zu False zurück.

Syntax:

str_detekt (Objekt, "String")

Parameter:

  1. Objekt bezieht sich auf String/Vektor/Liste
  2. String repräsentiert das Muster, um zu überprüfen, ob es in einem Objekt existiert oder nicht

Beispiel 1:

In diesem Beispiel werden wir eine Zeichenfolge in Betracht ziehen und nach einem Muster suchen - "Linux".

Bibliothek (stringr)
#scheck, ob der String Linux im tatsächlichen oder nicht vorhanden ist oder nicht
print (str_detekte ("Willkommen bei Linux Tipp 100% Codierung", "Linux"))

Ergebnis:

Wir können Linux finden. Daher kehrte es wahr zurück.

Beispiel 2:

In diesem Beispiel werden wir eine Zeichenfolge berücksichtigen und nach einem numerischen Muster suchen - "\\ D+".

Bibliothek (stringr)
#Überprüfen Sie das numerische Muster
print (str_detekte ("Willkommen bei Linux Tipp 100% Codierung", "\\ d+"))

Ergebnis:

Wir können den numerischen Wert 100 finden. Daher kehrt es wahr zurück.

Beispiel 3:

In diesem Beispiel werden wir eine Zeichenfolge betrachten und nach dem String -Muster - "[a -z]+" prüfen,.

Bibliothek (stringr)
#Überprüfen Sie das String -Muster
print (str_detekte ("Willkommen bei Linux Tipp 100% Codierung", "[a-z]+"))

Ergebnis:

Wir können den ersten Nonspace -String -Wert „Willkommen“ finden. Daher kehrt es wahr zurück.

In einem Vektor

Jetzt wenden wir die Funktion str_detect () in einem Vektor von drei Zeichenfolgen an.

Beispiel:

Hier wenden wir alle Muster auf einen Vektor namens vector_fruits an.

Bibliothek (stringr)
#create einen Vektor mit 3 Saiten
vector_fruits = c ("Papayya sind in 100 Verkauf erhältlich", "Wasser-Lemons", "Es gibt 11 Früchte in einem Korb")
#Display der tatsächliche Vektor
print (vector_fruits)
print (paste ("Zeichenfolgen mit Are:", str_detekt (vector_fruits, "sind"))))
print (paste ("Zeichenfolgen mit ersten Alphabeten:", str_detekt (vector_fruits, "[a-z]+")))
print (paste ("Zeichenfolgen mit Zahlen:", str_detekt (vector_fruits, "\\ d+"))))

Ergebnis:

Wir sehen. Da "Are" in der zweiten Zeichenfolge nicht vorhanden ist, gibt es falsche zurück.

Als nächstes das Muster -[A-Z]+ kehrt aus drei Saiten in einem Vektor zu True zurück.

Schließlich gibt das letzte Muster die numerischen Werte in True zurück, da 100 und 11 in der ersten und letzten Zeichenfolge vorhanden sind und in der zweiten Zeichenfolge false zurückgegeben werden.

In einer Liste

Jetzt wenden wir die Funktion str_detect () in einer Liste von drei Zeichenfolgen an.

Beispiel:

Hier wenden wir alle Muster auf eine Liste mit dem Namen list_fruits an.

Bibliothek (stringr)
#creat eine Liste mit 3 Saiten
list_fruits = c ("Papayya sind in 100 Verkauf erhältlich", "Wasser-Lemons", "Es gibt 11 Früchte in einem Korb")
#Display die eigentliche Liste
print (list_fruits)
print (paste ("Zeichenfolgen mit Are:", str_detekt (list_fruits, "are"))))
print (paste ("Zeichenfolgen mit ersten Alphabeten:", str_detekt (list_fruits, "[a-z]+")))
print (paste ("Zeichenfolgen mit Zahlen:", str_detekt (list_fruits, "\\ d+"))))

Ergebnis:

Wir sehen. Da "Are" in der zweiten Zeichenfolge nicht vorhanden ist, gibt es falsche zurück.

Als nächstes das Muster -[A-Z]+ kehrt aus drei Saiten in einer Liste zu True zurück.

Schließlich gibt das letzte Muster die numerischen Werte in True zurück, da 100 und 11 in der ersten und letzten Zeichenfolge vorhanden sind und in der zweiten Zeichenfolge false zurückgegeben werden.

Abschluss

In diesem Artikel haben wir die Funktionen von Str_Extract () und str_detekten () in R und zur Anwendung dieser Funktionen im Vektor und der Liste gesehen. Str_detect () wird verwendet, um zu überprüfen, ob das Muster im angegebenen Objekt vorhanden ist. Wenn ja, kehrt es zu True zurück. Ansonsten kehrt es zu False zurück. Der Str_Extract () wird verwendet, um zu überprüfen, ob das Muster im angegebenen Objekt vorhanden ist. Wenn ja, gibt es das Muster zurück. Ansonsten wird NA zurückgegeben.