Boxplot in r

Boxplot in r
„Ein Boxplot, der allgemein als Box und Whisker -Diagramm bekannt ist, ist eine Art von Diagramm in R. Es ist eine grafische Darstellung, mit der Sie die wesentlichen Funktionen der Daten zusammenfassen und feststellen können, ob Ausreißer existieren. Boxplot kann auch verwendet werden, um die Ausbreitung in der Datenerfassung zu vergleichen, indem ein Boxplot für jeden. Die Bewertung von Bereichen ist einfach mit einem Kastendiagramm. Da die zentralen, verteilten und allgemeinen Bereiche sofort sichtbar sind.

Boxplots sind eine Art von Grafik, die zeigt, wie einheitliche Daten in einem Datensatz verteilt sind. Der Datensatz ist infolgedessen in drei Quartile aufgeteilt. Dieses Diagramm zeigt die minimalen, maximalen, durchschnittlichen, ersten, zweiten und dritten Quartile des Datensatzes des Datensatzes.

Eine Boxplot -Box beginnt im ersten Quartil (25 Prozent) und endet im dritten (75 Prozent). Infolgedessen spiegelt die Box die Hälfte (50 Prozent) der Mitteldaten über eine Linie innerhalb des Durchschnitts wider. Trotz des Aufnehmens von Boxplot -Ausreißern wird eine Teilung auf beiden Seiten der Box zu den äußersten Daten geformt, falls sie existieren, durch Kreise dargestellt werden.

In diesem Tutorial werden Sie aufgeklärt, wie Sie R verwenden, um Boxplots zu erstellen.”

Erstellen eines Boxplot in R

Eine Box und ein Whisker -Diagramm können mit Rs "Boxplot ()" -Funktion erstellt werden. Verschiedene Eingaben können verwendet werden, um dieses Diagramm zu erstellen, einschließlich Vektoren und Datenrahmen. Im äquivalenten Diagramm können Sie auch eine Formel als Eingabe eingeben, wenn Sie Boxplots für zahlreiche Gruppen erstellen.

Erstellen eines Boxplotes mit einem Vektor in R

Wenn Sie von einem Vektor ein Box -Diagramm in R erstellen möchten, übergeben Sie einfach den Vektor an die Funktion „Boxplot ()“.

Hier haben wir einen Vektor „S“ erstellt und ihm eine Liste numerischer Werte zugewiesen. Geben Sie diesen Vektor „S“ als Parameter mit der Funktion „boxplot ()“ diesen Vektor „S“ über. Der Boxplot in R wird standardmäßig vertikal eingestellt. Wenn Sie ihn jedoch in horizontal ändern möchten, können Sie dies tun, indem Sie den „horizontalen“ Ausdruck „True“ festlegen.”

Eine aus einem Vektor erstellte horizontale Boxplotplot wird unten angezeigt.

Es ist wichtig zu beachten, dass Boxplots die zugrunde liegende Verteilung der Daten verdecken. Um dieses Problem zu beheben, kann die Funktion „Stripchart ()“ in R verwendet werden, um Punkte in eine Boxplot einzulegen.

Hier haben wir die Methode „Jitter."PCH" bedeutet Handlungzeichen. Der Standard -PCH in R ist 1, der einen leeren Kreis erzeugt, während „PCH = 19“ feste Kreise bedeutet. Was wir also verwendet haben, sind feste Kreise mit einer orangefarbenen Farbe. Ausreißer werden nicht überliegend, wenn die Datenpunkte bejittert sind.

Erstellen eines Boxplot mit "Notch" in R

Wir können auch einen Boxplot mit einer Kerbe in r machen. Es hilft uns bei der Bestimmung, wie gut die Medianer verschiedener Datengruppen miteinander interagieren. Indem Sie das Notch -Argument für True angeben, können Sie die 95 -Prozent -Konfidenzintervalle für den Median im R -Boxplot veranschaulichen. Die Box repräsentiert die oberen und unteren Grenzen, während die Mittellinie den Median sehen kann.

Ein „Kerbe“ oder ein Schrumpfen der Box wird in gekerbten Boxplots um den Median verwendet. Kerben können dazu beitragen, die Bedeutung einer Diskrepanz bei den Medianen zu bestimmen. Wenn es keine Überlappung zwischen dem Einkerben von 2 Kisten gibt, besteht eine gute Chance, dass die Medianer nicht dasselbe sind.

Der aus der „Notch“ gezogene Boxplot ist unten dargestellt.

Erstellen eines Boxplot mit einem Datensatz in R

Um einen Boxplot in R zu erstellen, können Sie auch die Datenrahmen in der Funktion „BoxPlot ()“ verwenden. In diesem Fall verwenden wir die von R Basis bereitgestellte integrierte Datensatz „Chaosht.”

Hier sehen Sie den Datensatz in der Tabelle „Micherergewicht“. Es enthält 4 Säulen Gewicht, Zeit, Küken und Ernährung. Alle Spalten sind in ihnen numerische Werte gespeichert.

Wir werden 2 Spalten wählen, ich.e., Gewicht und Ernährung aus dem Datensatz. Mit der Funktion „boxplot ()“ zeichnen wir Boxplots für das ausgewählte Datum.

Im obigen Code -Stück haben wir eine Boxplot mit „Gewicht“ gegen die „Ernährung“ entworfen.Wir haben die Namen der Variablen mit dem Datensatznamen angegeben. In den Zahnspangen der Funktion „boxplot ()“ haben wir den DataFrame -Namen „Chobengewicht“, „$“ -Operator verwendet, um die Spalte anzugeben, und den Spaltennamen „Gewicht“, dann die Spalte mit dem DataFrame -Namen „Chickweight $ $ diet.”

Der resultierende Boxplot zeigt deutlich die Dispersion des Outliner.

Um diesen Boxplot optisch besser und detaillierter zu machen, können Sie Punkte hinzufügen. Sie können dies mit der Funktion „Stripchart ()“ erfüllen.

Sie können die Punkte sehen, die wir erstellt haben, um die Essential Data Division in jedem Boxplot anzuzeigen.

Erstellen mehrerer Boxplot in R

Das Erstellen mehrerer Boxplots ist eine weitere Technik, die in der R -Programmierung verwendet werden kann. Um diese Methode zu implementieren, verwenden wir einen integrierten Datensatz in der R-Basis.

Der Datensatz, den wir hier verwendet haben. Wir können dem Boxplot auch Farben hinzufügen. In der Funktion "Boxplot ()" setzen wir die Farbe "Col" als "Regenbogen", die in unterschiedliche Boxplot in verschiedene Farben steckt.

Wenn Sie einen bestimmten Boxplot für jede Spalte in Ihrem R -Datenrahmen zeichnen möchten, können Sie dies mit der Verwendung der Funktion „Lapply ()“ tun.

Wir werden die Grafik "Par" in einer Zeile sowie in der Anzahl der Spalten im Datensatz in diesem Beispiel aufteilen. Einzelne Diagramme hingegen können aufgetragen werden. Die Funktion „Invisible ()“ verhindert, dass der Ausgangstext der „Lapply“ sichtbar ist.

Das folgende Bild zeigt den Boxplot für jede Datenspalte einzeln erstellt.

Abschluss

R -Programmierung bietet eine Vielzahl von Operationen, die ausgeführt werden können. Das Erstellen einer Boxplot ist eine weitere nützliche und einfache Methode, um Daten in Diagrammen visuell anzuzeigen. In diesem Artikel haben wir diskutiert, welche Boxplots sind und wie sie Daten anzeigen. Wir haben vier verschiedene Techniken erklärt, die zum Zeichnen von Boxplots in R mit RSTUDIO in Ubuntu 20 verwendet werden können.04. Einschließlich der Verwendung einfacher Vektoren zum Erstellen von Boxplots, der Verwendung von „Notch“, mithilfe von DataFrames und Erstellen mehrerer Boxplots. Wir haben jede Methode demonstriert, indem wir verschiedene Beispiele für Codes erläuterten. Dies wird das Erstellen von Boxplots für Sie erleichtern.