Statistische Analysen werden unter Verwendung der unterschiedlichen eingebauten Funktionen in r durchgeführt. Diese Funktionen sind in den Basispaketen von R enthalten. Um die Ergebnisse in R zusammen mit den Argumenten zu generieren, werden Vektoren als Eingabe genommen. Diese integrierten Funktionen sind Mittelwert, Median und Modus, aber wir werden nur über den Mittelwert in diesem Beitrag diskutieren. Der Mittelwert spielt eine wichtige Rolle, wenn wir herausfinden müssen, wo sich der zentrale Wert eines Datensatzes befindet. Der Mittelwert eines Datensatzes hält auch die Informationen zu allen Daten innerhalb des Satzes bei.
Im Allgemeinen ist der Mittelwert als die Summe der Daten/Elemente/Beobachtungen geteilt durch die Gesamtzahl der Daten/Elemente/Beobachtungen.
Was ist die R -Mittelfunktion in Ubuntu 20.04
Der Mittelwert kann nicht sowohl die numerischen Zeichen als auch die numerischen Daten wie den Modus enthalten. Es kann nur Ergebnisse als numerische Wert generieren. Der Berechnungsmodus ist ein integriertes Merkmal von R, was bedeutet, dass er eine definierte Funktionalität in der R-Programmiersprache hat. Diese vordefinierten Funktionen akzeptieren einen Vektor als Eingabe und erzielen ein Ergebnis als numerischen Wert.
Die Syntax der mittleren Funktion lautet wie folgt:
1 | Gemein (x, na.rm) |
Wobei x der Eingangsvektor und Na ist.RM ist ein boolescher Wert, um die fehlenden Werte des Eingangsvektors zu ignorieren.
Wie funktioniert das R -Mittel in Ubuntu 20.04?
In R wird der eingebaute Funktionsmittelwert () zur Berechnung des arithmetischen Mittelwerts der Elemente des numerischen Vektors verwendet und zeigt das Ergebnis in der numerischen Form, damit sie als Argument übergeben werden kann.
Wir zeigen Ihnen, wie Sie den Mittelwert in der R -Programmiersprache in Ubuntu 20 berechnen können.04 In diesem Tutorial. Es gibt zahlreiche Beispiele für die verschiedenen Datenszenarien.
Beispiel Nr. 1: Einfacher Mittelwert eines Vektors
Um den Mittelwert eines Vektors zu finden, müssen wir einen Vektor mit den numerischen Daten einnehmen. Erstellen wir einen Vektor X, um Ihnen beizubringen, wie wir die mittlere Funktion verwenden können, wenn wir den Mittelwert eines Vektors finden müssen.
Wenn der Mittelwert auf den Vektor X angewendet wird.
Wie wir sehen können, nimmt der Mittelwert den Vektor X als Eingabe und erzeugt einen numerischen Wert, der 12 ist.66667. Dies war einfach, da an den Daten keine Nullwerte beteiligt waren. Wenn ein Nullwert enthalten war, ist das Ergebnis unterschiedlich.
Beispiel Nr. 2: Mittelwert des numerischen Vektors mit NA -Werten in r
Dann ein.RM ist eine Option, mit der die Null- oder NA -Werte ignoriert werden. Es handelt sich um einen logischen Parameter, der der Funktion hilft, zu entscheiden, ob die NA -Werte entfernt werden oder nicht. Daher beeinflusst dies das Ergebnis nach Berechnungen möglicherweise nicht. In einer mittleren Funktion, wenn na.rm = true, es eliminiert die Na -Werte. Dann ein.RM ist weder eine Operation noch eine Funktion. Es handelt sich um einen Parameter, der von den verschiedenen Funktionen der Rahmendaten verwendet wird.
Um den Mittelwert eines Vektors zu finden, an dem Na -Werte beteiligt sind, könnten wir einem typischen Problem konfrontiert sein.
Nachdem wir dem Vektor X1 einen Na -Wert hinzugefügt haben, haben wir ihn dem Vektor X2 zugewiesen, der uns das folgende Ergebnis ergibt:
Der Vektor X2 sieht genauso aus wie der Vektor X1. Aber jetzt wird der NA -Wert am Ende hinzugefügt. Wenn wir den Mittelwert auf den Vektor X2 anwenden, tritt das folgende Problem auf:
Das Ergebnis, Mean (x2) kehrt NA zurück, ist nicht das, was wir erwartet haben. Wie bereits erwähnt, kann die mittlere Funktion in R nur numerische Daten enthalten. Da der Na -Wert keine numerische Daten ist, ist die NA.RM wird verwendet, um die NA -Werte zu ignorieren, um dieses Problem zu vermeiden.
Es ist klar dargestellt, dass die NA.Die RM -Option hat das Na -Wert -Problem beseitigt und den richtigen Mittelwert des Vektors x2, der 4 ist.625.
Beispiel Nr. 3: Mittelwert des numerischen Vektors mit Trimoption
Genau wie die NA.RM, Trim ist auch ein logischer Parameter, der von den Funktionen des Datenrahmens verwendet wird. Im Allgemeinen ist die Trimmoption im Mittelwert der Mittelwert des Datensatzes nach dem Löschen eines bestimmten Prozentsatzes aus den kleinsten und größten Werten aus dem Datensatz. Sie können auch sagen, dass vor dem Finden des Mittelwerts eines Datensatzes ein bestimmter Prozentsatz der kleinsten und größten Werte entfernt werden.
Die Syntax des beschnittenen Mittelwerts lautet wie folgt:
1 | Mittelwert (x, trim = 0) |
Versuchen wir eine 20 -prozentige Ausstattung an unseren vorherigen Vektor X1.
Wie Sie im vorherigen Bild sehen können, beträgt der Mittelwert von V1 ohne Trim 4.625. Aber was ist, wenn wir eine 20% ige Trim auf sie anwenden??
Nach dem Anbringen einer Trim von 20% werden die 20% aus dem größten und kleinsten Wert des Datensatzes und dem Wert der mittleren Änderungen an 4 entfernt.8333333.
Beispiel 4: Mittelwerte in R aus dem Beispieldatensatz
Um Ihnen ein realistischeres Beispiel zu bieten, werden wir die mittlere Funktion in einer Datenrahmenspalte aus einem realen Datensatz implementieren. Hier haben wir einen Datenrahmen „Iris“ ausgewählt. Zunächst müssen wir die Datendatei herunterladen, damit wir die mittlere Funktion darauf implementieren können.
Die Daten (IRIS) holen die Daten der Iris ab.CSV -Datei zu unserer Konsole. Das Aufrufen des Head () holt die Kopftitel in unsere Iris -Daten ab. Der Datensatz wird uns wie im Folgenden angezeigt:
Um den Mittelwert der ersten Spalte aus der vorherigen Tabelle des Datensatzes zu finden, kann das folgende Skript verwendet werden:
Wie in der ersten Spalte finden Sie auch den Mittelwert für die anderen Spalten (i.e. Kelchblatt.Breite, Blütenblatt.Länge und Blütenblatt.Breite). Wie bereits in diesem Thema erläutert, kann der Mittelwert keine Zeichendaten enthalten. Ein Problem tritt immer dann auf, wenn wir versuchen, den Mittelwert der 5. Spalte zu finden.
Sie können sehen, dass das Ergebnis keine numerische Daten ist. Stattdessen zeigt es eine Warnmeldung, dass das Argument nicht numerisch oder logisch ist.
Abschluss
Nachdem Sie dieses Tutorial behandelt haben, sollten Sie jetzt ein besseres Verständnis für den Mittelwert haben. Sie sollten auch in der Lage sein, den Mittelwert mit der R -Skriptsprache in Ubuntu 20 zu berechnen.04. Der Mittelwert ist eines der wichtigsten Metriken in der statistischen Forschung. Wenn Sie sich der Stufe bewusst sind, kann er sich für uns in der weiteren Forschung als hilfreich erweisen. Die Fähigkeit, den Mittelwert zu bewerten, bedeutet jedoch nicht, dass Sie die statistische Forschung und das Prinzip des Mittelwerts verstehen. Um den Mittelwert eines Datensatzes zu finden, haben wir die mehrere Beispiele des Mittelwerts mit Vektoren, logischen Parametern und Datensätzen praktisch implementiert.