Streuplot in r

Streuplot in r
„Visuelle Darstellungen von Daten enthalten Grafiken und Diagramme. Ihr Ziel als Datenwissenschaftler ist es, ein umfassendes Gefühl für große Mengen an Informationen zu verdeutlichen. Drei Verfahren sind an der Datenanalyse beteiligt. Das Erhalten von Daten, Reinigung und Änderung der Daten ist ein wichtiger Bestandteil des Prozesses. Um die Daten weiter zu bewerten, erstellen Sie eine visuelle Anzeige daraus. Datenvisualisierungen mit dem Diagramm sind enorme Tools, um komplizierte Analysen leichter zu verstehen. Aber zuerst gehen wir zuerst einige grundlegende Plot -Prinzipien wie Streudiagramme durch. Ein Streudiagramm ist ein Diagramm, das die Ebenen von zwei numerischen Variablen in einer Reihe von Daten als geometrische Punkte innerhalb eines kartesischen Diagramms aufweist.”

Was ist die Streuhandlung in der R -Programmiersprache in Ubuntu 20.04?

Der Vergleich von Variablen erfolgt unter Verwendung von Streudiagrammen. Wenn wir wissen müssen, was eine weitere Variable von einem anderen beeinflusst wird, müssen wir die beiden Variablen vergleichen. Das Streudiagramm ist eine Gruppe von gepunkteten Punkten auf den X- und Y -Achsen, die unterschiedliche Datenstücke darstellen. Das Layout der erzeugten Punkte zeigt eine Korrelation zwischen zwei Variablen, wenn ihre Werte entlang der x-Achse und der y-Achse angezeigt werden.

Syntax des Streudiagramms in der R -Programmiersprache in Ubuntu 20.04

In R können Sie in einer Vielzahl von Methoden einen Streudiagramm erstellen. Das Diagramm (x, y), in dem x- und y -Parameter numerische Vektoren sind, die die (x, y) -Positionen zum Diagramm angeben, ist die grundlegendste Funktion.

Diagramm (X, Y, Main, Xlab, Ylab, Xlim, Ylim, Achsen)

Wie oben erwähnt, sind x alle X -Parameter obligatorisch, um das Streudiagramm zu gratschen, aber das Streudiagramm unterstützt auch einige optionale Parameter, die wie folgt beschrieben werden:

X: Die horizontalen Koordinaten werden mit dieser Option festgelegt.

y: Die vertikalen Koordinaten werden mit dieser Option festgelegt.

xlab: Das Etikett für die horizontale Achse.

ylab: Die vertikale Achsenbezeichnung.

hauptsächlich: Das Thema des Diagramms wird durch die Parameter Main definiert.

xlim: Der XLIM -Parameter wird verwendet, um x -Werte darzustellen.

Ylim: Die ylim -Option wird verwendet, um Werte von y zu zeichnen.

Achsen: Diese Option bestimmt, ob das Diagramm beide Achsen enthalten soll.

So konstruieren Sie das Streudiagramm im R in Ubuntu 20.04?

Schauen wir uns ein Beispiel an, um zu zeigen, wie wir mit der Handlungsfunktion eine Scatterplot erstellen können. Wir werden den Beispieldatensatz in unseren Beispielen verwenden, ein vorkonfiguriertes Datensatz in der R -Umgebung.

Beispiel Nr. 1: Verwenden der Plot -Methode zum Erstellen des Streudiagramms R in Ubuntu 20.04

Die Plot () -Methode in der R -Programmiersprache kann verwendet werden, um ein Streudiagramm zu erstellen.

Um das Streudiagramm zu konstruieren, benötigen wir den Datensatz. Hier haben wir den Datensatz Usarrests aus der R -Sprache eingefügt. Wir haben die beiden Spalten aus diesem Datensatz ausgewählt, um das Streudiagramm zu erstellen. Die ersten Einträge werden vom Datensatz Usarrests angezeigt. Dann haben wir die Plotfunktion, in der die beiden Eingänge x und y eingestellt sind. Für X -Input wird die Spalte „Mord“ ausgewählt, und für die Y -Input haben wir die Spalte „UrbanPop“. Einige optionale Eingänge werden in der Funktion übergeben, wie die Etiketten für x und y werden mit XLAB und YLAB eingestellt. Innerhalb des XLIM- und YLIM -Bereichs werden die Werte der X- und Y -Parameter festgelegt. Außerdem wird der Titel des Streudiagramms festgelegt, indem die Option „Main" aufgerufen wird.”

Der Ausgang des Streuplots wird unten erzeugt.

Beispiel Nr. 2: Verwenden der Paarmethode zum Erstellen der Streudiagrammmatrizen R in Ubuntu 20.04

Wir verwenden eine Streuplotmatrix, wenn wir mehrere Variablen haben und eine Variable mit den anderen korrelieren möchten. Streuplotmatrizen werden mit der Pairs () -Methode erstellt.

Hier haben wir den Beispieldatensatz Iris aus der R -Sprache ausgewählt. Drucken Sie dann die sechs Top -Einträge des IRIS -Datensatzes aus. Auf die Spalten des Datensatzes Iris haben wir die Paarmethode angewendet. Jede Spalte wird mit der verbleibenden Spalte in der Paarfunktion gepaart.

Die Streuplotmetriken sind in der folgenden Abbildung sichtbar gemacht.

Beispiel Nr. 3: Verwenden Sie angepasste Werte in einem Streudiagramm in R in Ubuntu 20.04

Sie können das Diagramm erweitern, indem Sie eine neue Datenebene hinzufügen. In der linearen Regression können Sie den angepassten Wert visualisieren. Zum Bau einer Streuung verwenden wir die GGPLOT2 -Paket -GGPLOT () und Geom_Point () -Methoden.

Beginnen Sie mit diesem Beispiel; Wir haben das GGPlot2 -Modul aus r importiert. Dann haben wir die GGPlot -Methode verwendet, bei der der Datensatzname „mtcars“ angegeben ist. Die Funktion „AES“ wird in der GGPlot -Methode zum Erstellen der Protokolle für die X- und Y -Parameter verwendet. Für die lineare Regression wird ein zusätzlicher Satz von Funktionen, "STAT_Smooth", verwendet. Die Glättungsmethode wird von der Option STAT_ SHAFT () gesteuert. Der Standardfehler (SE) wird falsch gehalten, und die Linie der Größe wird auf den Wert 1 gesetzt.

Beispiel Nr. 4: Verwenden eines dynamischen Namens für den Streudiagrammtitel in R in Ubuntu 20.04

Wir haben noch keine Daten zu den Diagrammen gesetzt. Informationsdiagramme sind erforderlich. Ohne auf zusätzliche Dokumentation zurückzugreifen, sollte der Leser in der Lage sein, die Nachricht hinter der Analyse von Daten zu verstehen, indem er nur auf die Handlung blickt. Infolgedessen sind bei der Verwendung von Diagrammen gute Etiketten erforderlich. Etiketten können mit der Funktion Labs () hinzugefügt werden.

Wir haben hier eine Variable als Scatter_Graph, der die GGPlot -Methode zugewiesen ist. Der GGPLOT -Parameter setzt wie das obige Beispiel, jedoch für einen anderen Datensatz. Der hier verwendete Datensatz ist die Iris. Dann haben wir erneut die Variable scatter_garph verwendet, und diesmal haben wir die dynamischen Namen auf das Scatter -Diagramm gesetzt.

In der folgenden Abbildung können Sie die zusätzlichen Informationen zum Scatterplot sehen.

Beispiel Nr. 5: Verwenden der 3DScatterplot -Methode zum Erstellen des Streudiagramms in R in Ubuntu 20.04

Mit dem ScatterPlot3D-Paket können Sie eine dreidimensionale Streuung erstellen. ScatterPlot3D ist eine nützliche Technik, die (x, y, z) Syntax verwendet.

Wir haben das ScatterPlot3D -Modul in unserem R -Skript oben aufgenommen. Jetzt können wir die ScatterPlot3D -Funktion verwenden. An die ScatterPlot3D -Funktion haben wir drei Parameter übergeben, nämlich die Spalten, die aus dem Dataset -Zahnwässern ausgewählt wurden.

Der 3D -Streudiagramm wird im folgenden Grafik -Snap gerendert.

Abschluss

Dieser Artikel zielt darauf ab, Sie über die Streuhandlung in R zu informieren. Streudiagramme sind Dispersionsgraphen, mit denen Datenpunkte aus Parametern angezeigt werden (normalerweise zwei, aber drei sind möglich). Der Hauptzweck des R -Streudiagramms besteht darin, die Daten zu visualisieren und ob numerische Variablen eine Beziehung haben. Wir haben verschiedene Ansätze gesehen, die uns helfen, den Streuplot auf die einfachste Weise zu schaffen. Jede Methode hat ihre Funktionalität und ist sehr leicht zu verstehen.