R - Spalten des Datenrahmens nach Namen Drop -Datumsrahmen

R - Spalten des Datenrahmens nach Namen Drop -Datumsrahmen
Wenn Sie mit R -Datenrahmen arbeiten, müssen Sie möglicherweise die im Datenrahmen vorhandenen Spalten fallen lassen. In diesem Artikel sehen wir, wie Sie Spalten in einem Datenrahmen fallen lassen oder entfernen können, indem Sie den Spaltennamen angeben. Um Spalten in einem Datenrahmen fallen zu lassen, müssen wir einen Datenrahmen mit einigen Zeilen und Spalten erstellen.

Wir können einen Datenrahmen als Datenerfassung in Form von Zeilen und Spalten definieren. Einfach werden Daten in Zeilen und Spalten gespeichert. In der R -Sprache wird ein Datenrahmen mit Daten erstellt.Frame () Funktion.

Syntax:

Daten.Rahmen (Werte)

Wir können die Parameterwerte übergeben. Dies kann eine Liste, ein Vektor oder ein Array sein.

Erstellen Sie zunächst einen Datenrahmen mit vier Zeilen und fünf Spalten im Zusammenhang mit dem Markt.

Code:

#create einen DataFrame-Market mit 4 Zeilen und 5 Spalten.
Markt = Daten.Frame (markt_id = c (1,2,3,4), markt_name = c ('M1', 'M2', 'M3', 'M4'),
markt_place = c ('Indien', 'USA', 'Indien', 'Australien'), markt_type = c ('Lebensmittelgeschäft', 'Bar', 'Lebensmittelgeschäft' ',
'Restaurantent'), markt_squarefeet = c (120.342,220,110))
#Display der Marktdatenrahmen
Druck (Markt)

Ergebnis:

Sie können den Marktdatenrahmen hier sehen:

Es gibt verschiedene Ansätze, um die Spalten im Datenrahmen mit Namen zu fallen. Lassen Sie uns sie einzeln sehen.

Ansatz 1: Verwenden von Namen ()

Die Methode names () in R -Programmierung enthält Spaltennamen aus dem Datenrahmen. Hier geben wir die Spaltennamen in einem Vektor an, das fallen gelassen werden soll, und überprüfen diese Namen im Datenrahmen mit Namen (). Schließlich werden wir verwenden '! Operator ', um die Spalten zu fallen, indem die Spalten durch den Vektor durch [] ausgewählt werden. Auf diese Weise können wir die Spalten mit dem Namen im Datenrahmen abgeben, indem wir die Spaltennamen über einen Vektor auswählen.

Syntax:

DataFrame_Object [,!(Namen (DataFrame_Object) % in % column_names)]]]]

Hier,

  1. Das DataFrame_Object ist der Name des Datenrahmens.
  2. Die Namen () ist die Methode, die den Eingabedatenrahmen nimmt.
  3. Die Column_Names ist ein Vektor, der Spaltennamen speichert, die aus dem Datenrahmen fallen gelassen werden sollen.

Beispiel 1

In diesem Beispiel lassen wir eine einzelne Spalte fallen: markt_name. Daher müssen wir diese Spalte in einem Vektor angeben.

#create einen DataFrame-Market mit 4 Zeilen und 5 Spalten.
Markt = Daten.Frame (markt_id = c (1,2,3,4), markt_name = c ('M1', 'M2', 'M3', 'M4'),
markt_place = c ('Indien', 'USA', 'Indien', 'Australien'), markt_type = c ('Lebensmittelgeschäft', 'Bar', 'Lebensmittelgeschäft' ',
'Restaurantent'), markt_squarefeet = c (120.342,220,110))
#consider 1 Spalte - markt_name
column_name = c ('markt_name')
#Display verbleibende Spalten, indem die oben ausgewählte Spalte mit names () mit fallengelassen wird !
drucken (Markt [,!(Namen (Markt) % in % column_name)]))

Ergebnis:

Aus dem Ergebnis können wir sehen, dass die Spalte Market_Name fallen gelassen wird und die verbleibenden Spalten in einem Datenrahmen zurückgegeben wurden.

Beispiel 2

In diesem Beispiel löschen wir mehrere Spalten: markt_name, markt_place und markt_squarefeet. Daher müssen wir diese drei Spalten in einem Vektor angeben.

#create einen DataFrame-Market mit 4 Zeilen und 5 Spalten.
Markt = Daten.Frame (markt_id = c (1,2,3,4), markt_name = c ('M1', 'M2', 'M3', 'M4'),
markt_place = c ('Indien', 'USA', 'Indien', 'Australien'), markt_type = c ('Lebensmittelgeschäft', 'Bar', 'Lebensmittelgeschäft' ',
'Restaurantent'), markt_squarefeet = c (120.342,220,110))
#Consider Die 3 Spalten - Market_Name, markt_place, markt_squarefeet
column_names = c ('markt_name', 'markt_place', 'markt_squarefeet')
#Display verbleibende Spalten, indem die obigen ausgewählten Spalten mit names () mit fallen lassen !
drucken (Markt [,!(Namen (Markt) % in % column_names)])))

Ergebnis:

Aus dem Ergebnis können wir sehen, dass die Spalten Market_Name, Market_Place und Market_Squarefeet fallen gelassen wurden und die verbleibenden Spalten in einem Datenrahmen zurückgegeben wurden.

Ansatz 2: Verwenden Sie select () aus der dplyr -Bibliothek

Die in der DPLYR -Bibliothek verfügbare Select () -Methode wird verwendet, um Spaltennamen aus dem DataFrame zu nehmen. Hier wird der Datenrahmen als erster Parameter verwendet, und wir werden die Spaltennamen in einem Vektor angeben, der als zweiter Parameter fallen gelassen wird. Es verwendet das minus (-) Zeichen, um diese ausgewählten Spaltennamen in einem Vektor fallen zu lassen. Auf diese Weise können wir die Spalten mit dem Namen im Datenrahmen abgeben, indem wir die Spaltennamen über den Vektor auswählen.

Syntax:

select (DataFrame_Object,- column_name)

Parameter:

Es dauert zwei Parameter:

  1. Das DataFrame_Object ist der Name des Datenrahmens.
  2. Die Column_Names ist ein Vektor, der Spaltennamen speichert, die aus dem Datenrahmen fallen gelassen werden sollen.

Um diese Methode zu verwenden, müssen wir die dlyr -Bibliothek laden. Wir können dies tun, indem wir die Funktion Library () verwenden.

Bibliothek ("Dplyr")

Beispiel 1

In diesem Beispiel lassen wir eine einzelne Spalte fallen: markt_name. Daher müssen wir diese Spalte in einem Vektor angeben.

#LOAD Library Dplyr
Bibliothek ("Dplyr")
#create einen DataFrame-Market mit 4 Zeilen und 5 Spalten.
Markt = Daten.Frame (markt_id = c (1,2,3,4), markt_name = c ('M1', 'M2', 'M3', 'M4'),
markt_place = c ('Indien', 'USA', 'Indien', 'Australien'), markt_type = c ('Lebensmittelgeschäft', 'Bar', 'Lebensmittelgeschäft' ',
'Restaurantent'), markt_squarefeet = c (120.342,220,110))
#consider 1 Spalte - markt_name
column_name = c ('markt_name')
#Display verbleibende Spalten durch Ablegen der obigen ausgewählten Spalte mit select ()
print (select (markt, -column_name)))

Ergebnis:

Das Ergebnis zeigt, dass die Spalte Market_Name fallen gelassen wird und die verbleibenden Spalten in einem Datenrahmen zurückgegeben wurden.

Beispiel 2

In diesem Beispiel löschen wir mehrere Spalten: markt_name, markt_place und markt_squarefeet. Wir müssen also alle diese drei Spalten in einem Vektor angeben.

#LOAD Library Dplyr
Bibliothek ("Dplyr")
#create einen DataFrame-Market mit 4 Zeilen und 5 Spalten.
Markt = Daten.Frame (markt_id = c (1,2,3,4), markt_name = c ('M1', 'M2', 'M3', 'M4'),
markt_place = c ('Indien', 'USA', 'Indien', 'Australien'), markt_type = c ('Lebensmittelgeschäft', 'Bar', 'Lebensmittelgeschäft' ',
'Restaurantent'), markt_squarefeet = c (120.342,220,110))
#Consider Die 3 Spalten - Market_Name, markt_place, markt_squarefeet
column_names = c ('markt_name', 'markt_place', 'markt_squarefeet')
#Display verbleibende Spalten, indem die obigen ausgewählten Spalten mit select () fallen gelassen werden
print (select (markt, -column_names)))

Ergebnis:

Aus dem Ergebnis können wir sehen, dass die Spalten Market_Name, Market_place und Market_Squarefeet fallen gelassen wurden und die verbleibenden Spalten in einem Datenrahmen zurückgegeben wurden.

Ansatz 3: Verwenden von Subset ()

Die Subset () -Methode entnimmt Spaltennamen aus dem Datenrahmen. Hier wird der Datenrahmen als erster Parameter verwendet, und im zweiten Parameter werden wir die Spaltennamen über den ausgewählten Parameter ausgewählt, der fallen gelassen werden soll. Es verwendet das minus (-) Zeichen, um diese ausgewählten Spaltennamen in einem Vektor fallen zu lassen. Auf diese Weise können wir die Spalten mit dem Namen im Datenrahmen abgeben, indem wir die Spaltennamen über den Parameter auswählen.

Syntax:

Subset (DataFrame_Object, select = - column_names)

Parameter:

Es dauert zwei Parameter:

  1. Das DataFrame_Object ist der Name des Datenrahmens.
  2. Die Column_Names ist ein Vektor, der Spaltennamen aus dem Datenrahmen speichert, der über den Parameter ausgewählten Parameter weitergeleitet wird.

Beispiel 1

In diesem Beispiel lassen wir eine einzelne Spalte fallen: markt_name. Daher müssen wir diese Spalte in einem Vektor angeben und sie der Auswahl zuweisen.

#create einen DataFrame-Market mit 4 Zeilen und 5 Spalten.
Markt = Daten.Frame (markt_id = c (1,2,3,4), markt_name = c ('M1', 'M2', 'M3', 'M4'),
markt_place = c ('Indien', 'USA', 'Indien', 'Australien'), markt_type = c ('Lebensmittelgeschäft', 'Bar', 'Lebensmittelgeschäft' ',
'Restaurantent'), markt_squarefeet = c (120.342,220,110))
#Display verbleibende Spalten, indem Sie den Market_Name mit Subset () fallen lassen,)
print (subset (markt, select = - c (markt_name))))

Ergebnis:

Das Ergebnis zeigt, dass die Spalte Market_Name fallen gelassen wird und die verbleibenden Spalten in einem Datenrahmen zurückgegeben wurden.

Beispiel 2

In diesem Beispiel löschen wir mehrere Spalten: markt_name, markt_place und markt_squarefeet. Daher müssen wir alle diese drei Spalten in einem Vektor angeben und dem SELECT zuweisen.

#create einen DataFrame-Market mit 4 Zeilen und 5 Spalten.
Markt = Daten.Frame (markt_id = c (1,2,3,4), markt_name = c ('M1', 'M2', 'M3', 'M4'),
markt_place = c ('Indien', 'USA', 'Indien', 'Australien'), markt_type = c ('Lebensmittelgeschäft', 'Bar', 'Lebensmittelgeschäft' ',
'Restaurantent'), markt_squarefeet = c (120.342,220,110))
#Display verbleibende Spalten, indem Sie den Market_Name mit Subset () fallen lassen,)
print (subset (markt, select = - c (markt_name, markt_place, markt_squarefeet))))

Ergebnis:

Aus dem Ergebnis können wir sehen, dass die Spalten Market_Name, Market_place und Market_Squarefeet fallen gelassen wurden und die verbleibenden Spalten in einem Datenrahmen zurückgegeben wurden.

Ansatz 4: Verwendung innerhalb ())

Die Methode innerhalb () entnimmt Spaltennamen aus dem Datenrahmen. Hier wird der Datenrahmen als erster Parameter verwendet, und im zweiten Parameter werden wir die Spaltennamen angeben, die durch die RM () -Methode fallen gelassen werden. Die RM () -Methode entfernt die darin angegebenen Spalten. Auf diese Weise können wir die Spalten mit Namen im Datenrahmen fallen lassen.

Syntax:

Innerhalb (DataFrame_Object, RM (column_names))

Parameter:

Es dauert zwei Parameter:

  1. Das DataFrame_Object ist der Name des Datenrahmens.
  2. Der RM () nimmt Spaltennamen auf, die durch ein Komma getrennt sind.

Beispiel 1

In diesem Beispiel lassen wir eine einzelne Spalte fallen: markt_name. Daher müssen wir diese Spalte in einem Vektor angeben und sie der Auswahl zuweisen.

#create einen DataFrame-Market mit 4 Zeilen und 5 Spalten.
Markt = Daten.Frame (markt_id = c (1,2,3,4), markt_name = c ('M1', 'M2', 'M3', 'M4'),
markt_place = c ('Indien', 'USA', 'Indien', 'Australien'), markt_type = c ('Lebensmittelgeschäft', 'Bar', 'Lebensmittelgeschäft' ',
'Restaurantent'), markt_squarefeet = c (120.342,220,110))
#Display verbleibende Spalten, indem die Spalte Market_Name verwendet wird, in innerhalb ())
drucken (innerhalb (Markt, RM (markt_name)))

Ergebnis:

Das Ergebnis zeigt, dass die Spalte Market_Name fallen gelassen wird und die verbleibenden Spalten in einem Datenrahmen zurückgegeben wurden.

Beispiel 2

In diesem Beispiel löschen wir mehrere Spalten: markt_name, markt_place und markt_squarefeet. Daher müssen wir diese drei Spalten in einem Vektor angeben und dem SELECT zuweisen.

#create einen DataFrame-Market mit 4 Zeilen und 5 Spalten.
Markt = Daten.Frame (markt_id = c (1,2,3,4), markt_name = c ('M1', 'M2', 'M3', 'M4'),
markt_place = c ('Indien', 'USA', 'Indien', 'Australien'), markt_type = c ('Lebensmittelgeschäft', 'Bar',
'Lebensmittelgeschäft', 'Restaurant'), markt_squarefeet = c (120.342,220,110))
#Display verbleibende Spalten, indem Sie den Market_Name unter Verwendung von () fallen lassen,)
print (innerhalb (markt, rm (markt_name, markt_place, markt_squarefeet))))

Ergebnis:

Aus dem Ergebnis können wir sehen, dass die Spalten Market_Name, Market_place und Market_Squarefeet fallen gelassen wurden und die verbleibenden Spalten in einem Datenrahmen zurückgegeben wurden.

Abschluss

In diesem Artikel wurden die vier Ansätze zum Abnehmen oder Entfernen der Spalten von einem R -Datenrahmen per Spaltenname erörtert. Basierend auf der Anforderung in Ihrer Anwendung können Sie eine der Methoden aus den folgenden vier Methoden verwenden: names (), select (), subset () und innerhalb ().