Ein Datenrahmen muss einige Merkmale erfüllen, die wir in diesem Absatz erwähnt haben. Die Spalten im Datenrahmen müssen benannt und nicht leer gelassen werden. Jede Zeile im Datenrahmen muss einzigartig benannt werden.
Erstellen von Datenframe in R
Die R -Programmierung bietet verschiedene Methoden zum Erstellen eines Datenrahmens. Wir können einen Datenrahmen erstellen, indem wir die Vektoren aus einem anderen Datenrahmen und durch Importieren einer Datei verwenden. In diesem Artikel werden wir diese Techniken diskutieren, mit denen Sie das Konzept des Erstellens eines Datenrahmens in R. erlernen können.
Verwenden von Vektoren, um einen Datenrahmen in r zu erstellen
Mit der Programmierung können Sie einen Datenrahmen mithilfe von Vektoren erstellen, die gleich groß sind. Zu diesem Zweck bietet R Ihnen eine integrierte Funktion „Daten.rahmen()".Diese Funktion kann so viele Vektoren fangen, wie wir möchten.
Das Folgende ist die Syntax für das Aufrufen dieser Funktion:
df <- data.frame(v1, v2, v3, v4)In jedem Datenrahmen, Eine Spalte wird von jedem Vektor dargestellt, und die Anzahl der Zeilen wird durch die Länge eines Vektors bestimmt.
Es gibt zwei Möglichkeiten, einen Datenrahmen mithilfe von Vektoren zu generieren, indem Sie die erforderlichen Vektoren erstellen und dann an die Daten weitergeben.Frame () ”Funktion. Und der weitere Ersatz besteht darin, die Vektoren direkt den „Daten zu versorgen.Frame () ”Funktion und zuweisen sie Werte in den Funktionsklammern.
Wir werden Ihnen helfen, beide Methoden zu verstehen, indem wir praktische Beispiele in RSTUDIO in Ubuntu 20 nachweisen.04.
Wir werden ein Beispiel geben, um einen Datenrahmen aus Vektoren zu erstellen. Wir werden zuerst Vektoren erstellen und dann alle als Parameter der „Daten“ übergeben.rahmen()".
In dem Programm, das wir im obigen Bild gezeigt haben, haben wir vier Vektoren verwendet. Alle Vektoren werden mit der Funktion „C ()“ erstellt. Der erste Vektor, den wir generiert haben. Der zweite Vektor ist „Sprache“ und speichert die Namen von 3 Programmiersprachen. Es werden auch Zeichendatentypen gespeichert. Unser dritter Vektor ist „Alter“, der numerische Datentypen speichert. Der letzte Vektor, „Geschlecht“, speichert auch 3 Werte des Zeichendatentyps. Alle 4 Vektoren werden an die „Daten übergeben. Frame () ”Funktion als Parameter. Der DataFrame „DF“ speichert die Ausgabe der „Daten.Frame () ”Funktion darin. Im allerletzten Schritt des Codes haben wir die Anweisung „Print ()“ verwendet, um die Ausgabe anzuzeigen.
Der resultierende Datenrahmen verfügt über 4 Spalten, jeweils die gleiche Größe von Vektoren.
Die andere alternative Methode zum Generieren eines Datenframe.Frame () ”Funktion.
Dieser Code -Snippet hat einfach Vektoren erstellt und ihnen Werte im Körper der „Daten“ zugewiesen.Frame () ”-Funktion und gespeichert diese Funktion in DataFrame„ DF."Print ()" zeigte die Ausgabe an.
Die resultierende Tabelle ergibt den gleichen Ausgang, der im Bild unten angezeigt werden kann.
Es lohnt sich zu wiederholen, dass jeder Vektor in der Liste die gleiche Menge an Elementen haben muss, um einen Datenrahmen aus einer Liste von Vektoren zu generieren. Andernfalls meldet das Skript einen Fehler.
Verwenden anderer Datenrahmen zum Erstellen eines Datenrahmens
Das Erstellen eines Datenrahmens mit zwei oder mehr Datenrahmen ist eine weitere Technik, die in der R -Programmierung angewendet wird. Wir können für die Gruppierung von Spalten eines Datenrahmens an einen anderen und für die Beitrittszeile der Zeilen tun.
Wir werden hier zwei Programme ausführen, eines für die horizontale Gruppierung und die andere für die vertikale Gruppierung.
Für die Spalten ist die Funktion, die wir verwenden, „CBind ().Erstellen wir zuerst 2 Datenrahmen und kombinieren Sie sie dann mit der Funktion „CBind ()“.
Im ersten Code -Stück werden 2 Spalten konstruiert und die Werte werden in DataFrame "DF1" gespeichert, die gespeichert sind.
Die resultierende Tabelle ergibt den gleichen Ausgang, der im Bild unten angezeigt werden kann.
Ein weiterer Datenrahmen, "DF2", wird mit 2 Spalten erzeugt, "Alter" und "Geschlecht".”
Die resultierende Tabelle ergibt den gleichen Ausgang, der im Bild unten angezeigt werden kann.
Ein DataFrame „DF3“ wird konstruiert und verwendet die Funktion „CBind ()“, um die "DF1" und "DF2" zu kombinieren.
Die ultimative Ausgabe zeigt eine Tabelle, die aus dem Zusammenführen der 2 Datenrahmen generiert wird.
Um die DataFrame -Zeilen zu erstellen, können wir die Funktion „rbind ()“ verwenden. In der Funktion „rbind ()“ werden wir die 2 Datenrahmen als Parameter übergeben. Diese Funktion verkettet die 2 kleineren vertikalen Datenrahmen in eine ganze Tabelle. Beachten Sie, dass die Anzahl der Zeilen für alle Datenrahmen, die Sie erstellen, gleich sein müssen.
Lesen Sie eine Datei in einen Datenrahmen
Abgesehen von der Generierung eines Datenrahmens können Sie noch einige weitere Dinge tun. Wir können einen tabellarischen Datensatz importieren und als Datenrahmen speichern. Es ist die häufigste Methode zum Erstellen eines Datenrahmens in der R -Programmierung.
Wir haben eine CSV -Datei erstellt, gespeicherte Werte im tabellarischen Format und "Tabelle" genannt.CSV.”Wir haben diese Datei in unserem Ordner" Dokumente "gespeichert. In RSTUDIO werden wir es mit dem „Read lesen.CSV () ”Funktion als neuer Datenrahmen mit dem Namen„ Tabelle.”
Um eine CSV -Datei in RSTUDIO zu lesen, müssen Sie als erstes Ihr aktuelles Arbeitsverzeichnis einrichten. Durch die Verwendung der Funktion "getWd ()" können Sie Ihr aktuelles Arbeitsverzeichnis finden. Im nächsten Schritt müssen Sie Ihr Verzeichnis so festlegen, an dem Sie das gespeichert haben.CSV ”Datei. Wenn Sie diese Schritte nicht berücksichtigen, erhalten Sie einen Fehler, während Sie Schwierigkeiten haben, die Datei zu lesen.
Sobald Sie den Pfad des aktuellen Arbeitsverzeichnisses in das Verzeichnis, in dem Sie Ihre CSV -Datei gespeichert haben.csv () ”Funktion. Schreiben Sie die ".CSV -Dateiname mit einem Anführungszeichen („“) innerhalb der „Lesen.csv () ”und verwenden einen Datenrahmen mit jedem Namen, den Sie für die Werte speichern möchten.
Die Daten, die wir in unserer CSV -Datei gespeichert haben, werden hier angezeigt.
Abschluss
Im heutigen Thema haben wir die Erstellung von Datenrahmen untersucht. Datenrahmen sind notwendige Strukturen der R -Programmierung. Wir haben verschiedene Möglichkeiten besprochen, Ihre Datenrahmen in RSTUDIO in Ubuntu 20 zu konstruieren.04 Umgebung, indem sie jeweils mit einem praktischen Beispiel ausarbeiten. Wenn Sie diese Beispielcodes praktisch praktizieren.