Kombinieren Sie Spalten in r

Kombinieren Sie Spalten in r
„Es gibt eine Vielfalt von Szenarien, in denen Datensätze in zahlreiche Tabellen und eine Vielzahl von Gründen aufgeteilt werden, warum dies möglicherweise der Fall ist. Es ist manchmal einfacher, Informationen in kleineren Stücken zu sammeln, während es in einigen Situationen besser ist, die Größe der Datei zu minimieren. Unabhängig davon, warum Datensätze in getrennte Tabellen fragmentiert werden, müssen sie so strukturiert sein, dass zwischen beiden Tabellen mindestens eine Spalte ähnlich sind, sodass sie bei Bedarf kombiniert werden können.Es gibt drei wichtige Strategien, die wir ansehen werden, um Ihre Arbeitsbelastung zu reduzieren und sicherzustellen, dass jede wichtige Spalte und jeder Parameter aus Ihren verschiedenen Datensätzen angemessen integriert ist.Nachdem Sie alle Techniken und ihre entsprechenden praktischen Beispielcodes durchlaufen haben, können Sie das Konzept des Kombinierens von Spalten in R stark in den Griff bekommen.”

Kombinieren Säulen in r

R bietet uns verschiedene Möglichkeiten, Spalten eines Datenrahmens zu kombinieren. In diesem Artikel werden wir Sie mit 3 von ihnen vertraut machen; Durch die Verwendung der Funktion "paste ()", durch Verwendung der Funktion "Unite ()" und durch Verwendung der Funktion "str_c ()".

Kombinieren Sie Spalten mit der Funktion "paste ()"

Eine der Methoden zum Kombinieren von Spalten eines Datenrahmens in R ist die Verwendung der Funktion „paste ()“. Diese Funktion kombiniert Spalten aus zwei verschiedenen Datenrahmen sowie innerhalb desselben Datenrahmens.

Bevor wir uns auf seine Implementierung konzentrieren, müssen wir zunächst die Syntax für die Funktion „paste ()“ verstehen.

# Einfügen (Daten $ C1, Daten $ C2, Sep = "")

Die Syntax für die Funktion "paste ()" hat 3 Parameter. "Daten" ist der Name des Datenrahmens, den Sie eingeben würden, und "C1" ist der Spaltenname dieses Datenrahmens. "C2" bezieht sich auf einen anderen Spaltennamen im Datenrahmen, den Sie mit dem ersten kombinieren müssen. Während „SEP“ ein Separator bedeutet, das zwei Spalten trennt und („“) bezieht. Hier wird es verwendet, um Platz zwischen beiden Spalten hinzuzufügen, während Sie sich ihnen anschließen.

Wir haben einen Datenrahmen mit 3 Spalten erstellt. "FirstName", "Lastname" und "Alter.Durch die Verwendung der Funktion „c ()“ weisen Sie allen Spalten Werte zu, die Werte zuweisen. Der "FirstName" und "LastName" haben Werte des Zeichendatentyps, während die Spalte "Alter" die Werte des numerischen Datentyps gespeichert hat. Wir haben einen Datenrahmen mit dem Namen "Info" erstellt und die Werte der "Daten" gespeichert.Frame () ”Funktion darin. Die Anweisung "Print ()" zeigt den gerade erstellten Datenrahmen an, den wir gerade erstellt haben.

Im Ausgabebildschirm können Sie eine Tabelle mit 3 Spalten sehen.

Jetzt werden wir die Funktion „paste ()“ verwenden. Schreiben Sie zunächst den Namen des Datenrahmens, in dem Sie Werte gespeichert haben. Wenn wir es "Info" bezeichneten, fügen Sie dann einen "$" -Operator daneben hinzu, mit dem wir eine Spalte auswählen oder einer Spalte einen neuen Wert zuweisen können. Weiter fahren Sie eine neue Spalte mit dem Namen „FullName“, dem wir die kombinierten Werte der 2 verschiedenen Spalten zuweisen. Erwähnen Sie in der Funktion „paste ()“ den Namen des Datenrahmens mit einem „$“ -Operator und der Spalte, die Sie auswählen möchten. Nachdem Sie ein Komma eingestellt haben, schreiben Sie den Namen des DataFrame, den „$“ -Operator und die zweite Spalte, die Sie zusammenführen möchten. "(Sep =" ")" fügt Platz zwischen beiden Spalten hinzu, während sie kombiniert werden.

Das Bild unten zeigt beide Tabellen; der erste mit dem anfänglichen Datenrahmen und der andere mit einer kombinierten Spalte „Vollname.”

Sie können den vorherigen Datenrahmen entfernen, indem Sie die erste Anweisung "Print ()" beseitigen.

Die Ausgabe kann im Bild unten gefunden werden.

Kombinieren Sie die Spalten mit der Funktion „Unite ()“

Eine andere Methode, um die Spalten in der R -Programmierung zu verbinden, ist die Verwendung der Funktion „Unite ()“. Wir müssen das Paket laden, das diese Funktion enthält, die das „Tidyr“ -Paket ist.

Für die Verwendung der Funktion „Unite ()“ ist die Syntax, die wir folgen werden,:

# UNITE (DataFrame -Name, kombinierter Spaltenname, C (Spalte1, Spalte2))

Wobei „DataFrame -Name“ der Datenrahmen ist, den Sie eingeben. "Kombinierter Spaltenname" ist der Name der Spalte, in der Sie die fusionierten Daten speichern möchten. Und innerhalb der Funktion „C ()“ befinden sich „Spalte1“ und „Spalte2“, die Spalten, die Sie kombinieren müssen.

Im Beispiel in der Hand haben wir zuerst das "Tidyr" -Paket aus der R -Bibliothek installiert. Erstellt einen Datenrahmen genauso wie wir ihn im obigen Beispiel erstellt haben. Wir wollen 2 Spalten kombinieren; "Vorname und Nachname.In der Funktion „Unite ()“ schreiben wir den DataFrame -Namen, nämlich "Info".Dann Name der Spalte, in der die kombinierten Spaltenwerte als „Vollname“ gespeichert werden.Verwenden Sie die Funktion „c ()“, um die 2 zu kombiniert zu aufrufen. Schließlich zeigt die Anweisung „Print ()“ die Ausgabe an.

Eine neue Spalte mit dem Namen "Fullname" speichert die Verschmelzungswerte von "FirstName" und "LastName" -Spalen.

Kombinieren Spalten mit "str_c ()" -Funktion

Jetzt verbinden wir mehrere Spalten mit der Str_c () -Methode. Zu diesem Zeitpunkt müssen wir zunächst das Paket „Stringr“ installieren.”

Die Funktion "str_c ()" funktioniert mit dieser Syntax:
STR_C (DataFrame $ column1, "", DataFrame $ column2)

"DataFrame" ist der Datenrahmen, den wir erstellt haben. "Spalte1" und "Spalte2" sind die 2 Spalten, die wir verkettet möchten. Wenn Sie es bemerkt haben, gibt es Platz zwischen den Spaltennamen. Wenn wir diesen zusätzlichen Platz nicht hinzufügen, verschmelzen dies beide Spalten ohne Platz.

Hier ist ein Beispiel für das, was wir getan haben.

Zu Beginn haben wir ein Paket "StringR" geladen, mit dem wir die Funktion "str_c ()" verwenden können. Wir haben den in den obigen Beispielen erstellten DataFrame verwendet und mit den gleichen Schritten, wie bereits erwähnt, seine Werte in einem neuen Datenrahmen mit dem Namen „Info“ gespeichert.”

In der Funktion „str_c ()“ haben wir beide Spalten -Namen als "info $ FirstName" und "info $ lastname" genommen und Platz zwischen ihnen hinzugefügt, damit sie sich bei der Verkettung nicht mischen.

Sie können die resultierende kombinierte Spalte des oben gezeigten Beispiels sehen.

Abschluss

Die Kombination von Spalten in der R -Programmierung ist ein super einfaches und nützliches Konzept. Dies kann durch verschiedene Techniken mit RSTUDIO in Ubuntu 20 erfolgen.04. Wir haben uns bemüht, Sie in die Methoden und Techniken vorzustellen, die für die Verkettung von Säulen in R verwendet werden können. Durch die Demonstration von Beispielcodes und die Ausarbeitung jedes kleinen Details darüber ist unser absichtliches Ziel und Zweck, Sie am einfachsten und zuverlässig zu leiten, um die Kombination von Spalten in R -Programmierung zu lernen und zu genießen.