Spalten in r entfernen

Spalten in r entfernen
„Ein Datenrahmen enthält häufig Spalten, die für Ihre Untersuchung nicht relevant sind. Um das Hervorheben der verbleibenden Spalten zu erleichtern, müssen solche Spalten aus dem Datensatz entfernt werden. Durch die Lieferung von Etikettennamen und zugehörigen Achsen oder durch direkte Definieren von Index- oder Spaltennamen können die Spalten beseitigt werden. Etiketten auf mehreren Stufen können mit einem Multi-Index entfernt werden, indem die Ebene bezeichnet wird.

In R müssen Sie gelegentlich eine oder mehrere bestimmte Spalten aus einem Datenrahmen beseitigen. Glücklicherweise gibt es eine integrierte Methode aus dem R-Modul, die das einfach macht. Das Ablegen von Spalten aus einem Datensatz ist einfach eine Methode, um unnötige Spalten aus dem Datenrahmen zu entfernen. In diesem Beitrag werden wir verschiedene unterschiedliche Methoden zum Entfernen von Spalten nach dem Titel aus einem Datensatz in R untersuchen.”

So entfernen Sie die Spalten von Datenrahmen im R in Ubuntu 20 aus Datenrahmen.04?

Mit dem Spaltenabfallmechanismus in R können Sie nicht benötigte Spalten aus einem Datenrahmen entfernen. In R können Sie eine Spalte auf verschiedene Weise nach ihrem Namen fallen lassen. Dieser Artikel zeigt, wie eine Spalte aus einem Datenrahmen durch verschiedene Fälle in vielen verschiedenen Methoden entfernt werden kann.

Beispiel Nr. 1: Verwenden der Subset -Methode zum Entfernen von Spalten in R in Ubuntu 20.04

Die Verwendung der Subset () -Methode mit dem Symbol „-“, das die Ablagerungsvariablen bedeutet, ist eine der einfachsten Möglichkeiten, Spalten fallen zu lassen. Diese Funktion in der R -Programmiersprache wird verwendet, um Teilmengen eines Datenrahmens zu erstellen und Spalten aus einem Datenrahmen zu entfernen. Die Syntax der Untergruppe in R ist wie folgt: Untergruppe (df, expr). Wobei DF der Datenrahmen ist und der EXPR als Ausdruck für die Teilmenge bezeichnet wird.

Im Beispiel -Skript haben wir den Datenrahmen „Data1“ erstellt, der vier Spalten X1, X2, X3 und X4 enthält. Der Datensatz wird in diese Spalten eingefügt. Bei der Ausführung des Datenbefehls von Data1 wird der Datenrahmen gedruckt, wodurch die Spaltennamen mit den Einträgen angezeigt werden, die sie haben. Danach haben wir eine variable Data2 erstellt und die Teilmengemethode darin aufgerufen. Die Teilmengemethode nimmt die Daten1 als Eingabe und die Auswahlbedingung aus, um die Spalten x1 und x3 zu fallen.

Wenn der Data2 ausgeführt wird, generiert er den neuen Datenrahmen, der alle Spalten mit Ausnahme des X1 und X3 enthält, da diese Spalten mit der Teilmenge -Methode entfernt werden.

Beispiel Nr. 2: Verwenden der Namensmethode zum Entfernen von Spalten in R in Ubuntu 20.04

Diese Technik erstellt einen Drop -Charakter -Vektor, in dem Spaltennamen gespeichert werden. Später weisen wir R an, alle Variablen auszuwählen, mit Ausnahme der im Säulenabfall angegebenen Variablen. Negation wird durch das bezeichnet!Symbol. Die methode namens () in R wird zum Abholen oder Ändern des Namens des Objekts verwendet. Diese Methode akzeptiert das Objekt als Parameter, bei dem es sich um eine Matrix-, Vektor- oder Datenrahmen handelt, sowie den Wert, der zum Namen des Objekts verwendet wird. Die Länge des gelieferten Wertvektors muss genau mit der zu benannten Länge des Objekts übereinstimmen, und es gibt alle Spaltennamen zurück.

Im obigen R -Skript haben wir den Datenrahmen in der Variablen „DF) erstellt.Der Datenrahmen wird auf dem Bildschirm gedruckt, und wie Sie sehen können, verfügt dieser Datenrahmen über vier Felder mit unterschiedlichen Einträgen. Dann haben wir den Drop -Befehl eingeschlossen und die Spaltennamen im Vektor angegeben. Die neue Variable wird als "new_df" erstellt, bei dem die Namensmethode aufgerufen wird, und zur Methode name () haben wir unseren Datenrahmen „DF übergeben.Beachten.

Die Ausführung des obigen Codes generiert den folgenden Datenrahmen, in dem die Spalten Y2 und Y3 entfernt wurden.

Beispiel Nr. 3: Verwenden der Methode auswählen, um Spalten in R in Ubuntu 20 zu entfernen.04

Wir werden Select () in dieser Methode verwenden, indem wir das DPLE -Paket in R importieren und das Argument angeben, um die Spalten des Datensatzes wegzulassen. Im Wesentlichen speichert diese Funktion lediglich die von Ihnen angegebenen Variablen.

Wir haben das DPLYR -Paket aufgenommen, um auf die Auswahlmethode zuzugreifen. Außerdem haben wir den Datenrahmen konstruiert, aus dem wir die Spalten entfernen können. Der Datenrahmen wird in der tabellarischen Form nach Ausführen des Befehls mydata generiert, da der Datenrahmen in dieser Variablen gespeichert ist. Danach haben wir im nächsten Eingabeaufforderung die Auswahlmethode bereitgestellt, wobei der Datenrahmen als Argument angegeben ist, und auch der Spaltenname A1 mit dem Minuszeichen bereitgestellt wird.

Die R -Eingabeaufforderung interpretiert diesen Befehl aus ausgewählter Methode und gibt den Datenrahmen aus, in dem Spalte A1 gelöscht wird.

Beispiel Nr. 4: Verwenden der Methode, um Spalten nach den Spaltenpositionen in R in Ubuntu 20 zu entfernen.04

Wir werden die Spaltenindexposition als Vektor an die Auswahlmethode mit einem negativen Vorzeichen übergeben, um die Position der Spalte von Säulen zu entfernen, wie nachstehend zu sehen ist.

Hier haben wir zuerst das DPLYR -Modul aufgenommen. Und dann haben wir den R-integrierten Datenrahmen „Iris“ eingefügt.”Der Iris -Datenrahmen wird angezeigt und hat mehrere Spalten, wie in der R -Eingabeaufforderung gezeigt. Wir können alle Spalten im IRIS -Datenrahmen entfernen, indem wir den Index der Spalte angeben. Hierzu haben wir die Select () -Methode, an die wir den Datenrahmen und den Indexwert an den Vektor übergeben haben. Spalte 3,4 und 5 werden aus dem unten angezeigten Datenrahmen -Iris entfernt, der unten angezeigt wird.

Beispiel Nr. 5: Verwenden der Select -Methode zum Entfernen von Spalten mit dem Start- und Endzeichen der Spalte in R in Ubuntu 20.04

Wir können auch Spalten auswählen, die hier abhängig von ihren Anfangs- und Beendungsfiguren hier ausgewählt werden. Die Funktion startet_with () gibt die Spalte zurück, die mit dem bereitgestellten Zeichen beginnt. Um die Methode start_with () zu verwenden, müssen wir der von der R-Sprache bereitgestellten Syntax befolgen, die ausgewählt ist (DataFrame, -starts_With („Substring“)). Wo DataFrame die Quelle, DataFrame und Substring bezeichnet.

Wir haben in diesem Beispiel den Datenrahmenzahnwachstum ausgewählt, da er drei Spalten auf dem Bildschirm enthält. Jetzt, im nächsten Schritt. Die Start_with () -Methode mit einem Minuszeichen nimmt den Spaltennamen, der mit der "Dosis" im Zahnwusstatenrahmen beginnt. Es wurde die Spalte „Dosis“ aus dem Datenrahmen entfernt, als dieser ausgewählte Befehl ausgeführt wurde.

Das onds_with () ist eine Funktion, die die Spalte zurückgibt, die das angegebene Zeichen am Ende enthält. Die Syntax, die wir für die Methode end_with () verwenden, lautet: SELECT (DataFrame, -end_with („Substring“)). Wenn sich DataFrame auf den Eingabedatenrahmen bezieht und Substring auf das folgende Zeichen oder die folgende Zeichenfolge bezieht.

Wie die obige Start_with () -Methode haben wir die Spalte „Supp“ aus dem Datenrahmen -Zahnwässern an die Methode adend_with () mit dem Minus -Zeichen übergeben. Diese Methode hat auch die Spalte entfernt, die das endet, mit dem „Supp.”

Abschluss

Die R -Programmiersprache wurde verwendet, um den Ansatz des Entfernens von Spalten aus einem Datenrahmen zu demonstrieren. Wir haben die integrierte Untergruppe und Namensmethode des R gesehen, die die Spalten entfernt hat. In R können Sie eine Spalte fallen lassen, indem Sie den Minus -Operator vor der Auswahlmethode verwenden. Außerdem wird die Select () -Methode im DPLYR -Modul in R verwendet, um Spalten basierend auf den Bedingungen wie Starts mit, endet mit und ab fallen, und die Spalten basierend auf dem Standort werden mit Beispielen angezeigt.