Zahlreiche voreingestellte Funktionen können verwendet werden, um die Daten anhand statistischer Techniken in r zu analysieren. Das Basismodul von R enthält diese Techniken. Der Mittelwert, der Median und der Modus sind nur einige der statistischen Funktionen, die in R für die Datenanalyse verfügbar sind. In diesem speziellen Beitrag präsentieren wir Sie, wie Sie die Werteweise in den Variablen eines Datensatzes erhalten können.
Obwohl der Modus keine der zentralen Tendenzen ist, kann dies eine sehr nützliche Menge in der statistischen Forschung sein. Viele methodische Ansätze erfordern die Festlegung der Verteilungsweise oder den am häufigsten auftretenden Wert. Sie können den R verwenden, um herauszufinden, welche numerischen Vektoren am häufigsten in den erfassten Daten erscheinen, wodurch Sie in Zukunft Empfehlungen zu den neuen Daten erstellen können. Trotz der Tatsache, dass die R-Programmiersprache eine integrierte Methode zum Finden des Modus hat, können einige Codezeilen dieses Problem schnell beheben.
Was ist der Modus in der R -Programmiersprache in Ubuntu 20.04
Wie der Mittelwert und der Median kann der Modus sowohl die numerischen als auch die Charakterdaten enthalten. Der Berechnungsmodus ist kein integriertes Merkmal von r. Infolgedessen erstellen wir eine R -Benutzerfunktion, um die Methode zur Datenerfassung zu bestimmen. Diese Funktionen akzeptieren einen Vektor als Eingabe und erzeugen ein Ergebnis als Vektor.
Wie funktioniert der Modus in der R -Programmiersprache in Ubuntu 20.04?
Die Modusfunktion akzeptiert einen R -Vektor und die Argumente als Eingabe und gibt die Ausgabe zurück. Die Daten in einer Statistik, deren Häufigkeit in einer Variablen so viel ist wie alle anderen Daten in einer Variablen, ist der Modus der Einträge dieser Variablen in einem Datensatz.
Wir zeigen Ihnen, wie Sie den Modus in der R -Programmiersprache in diesem Tutorial berechnen können. Es gibt mehrere Fälle verschiedener Datenszenarien.
Beispiel 1: Erstellen einer benutzerdefinierten Funktion für den Modus in r
Benutzerdefinierte Funktionen im Gegensatz zu integrierten Funktionen in R sind benutzerdefinierte Funktionen. Die Mittelwert () () zum Beispiel ist vorinstalliert und berechnet den Durchschnitt der angegebenen Daten. Wenn wir etwas wiederverwendbares brauchen, das aber in R nicht existiert, können wir unsere Funktion implementieren. Da es in der R-Programmiersprache keine Modusfunktion gibt, haben wir eine benutzerdefinierte Funktion erstellt.
Im folgenden R -Skript haben wir den Namen einer neuen Funktion als R_Mode definiert, was ein willkürlicher Name ist. Der Zuordnungsoperator wird hier aufgerufen, der die Beschreibung der folgenden Funktion angibt. Die Funktion (x) gibt an, dass der R_Mode eine Funktion mit einem einzelnen Parameter oder Eingang ist, der „x“ als Argument nimmt. Innerhalb der lockigen Klammern haben wir eine Operation gegeben, die das Argument x erbringt. Wir verwenden diese manuelle benutzerdefinierte Funktion im gesamten Artikel für den Modusvorgang.
Beispiel 2: Modus der numerischen Vektordaten in r
In diesem Beispiel haben wir einfach die Modusfunktion demonstriert. Hier haben wir die manuelle benutzerdefinierte Funktion beigefügt und dann eine Variable „Daten“ erstellt, die die Definition einer Vektorliste enthält. Es gibt einige wiederholte Zahlen im Vektorlistenformular, in dem die Modusfunktion ausgeführt wird.
In der Funktion r_mode haben wir die Variable „Daten“ übergeben. Wenn Sie in den R -Skript -Compiler die Eingabetaste drücken, wird die Ausgabe angezeigt. Der Modus ist „5“ aus den vorherigen Daten der Vektorliste „5“.
Beispiel 3: Erhalten Sie den Modus der mehrfachen numerischen Vektordaten
Im vorhergehenden R-Beispiel haben wir einen Einzelmodus aus dem Vektoren-Datensatz zurückgegeben. In einigen Szenarien kann ein Datenvektor jedoch zahlreiche Zahlen mit dem gleichen Wiederauftreten enthalten. Lassen Sie uns ein neues Vektorbeispiel erstellen, um die Funktionsweise der Modusfunktion in dieser Situation zu beobachten.
Zunächst haben wir eine manuelle benutzerdefinierte Funktion aufgerufen. Wir haben dann einen Datensatz der numerischen Vektoren definiert, der mehr als einen Modus enthält und in der Variablen „Daten“ gespeichert ist.
Die darin enthaltenen „Daten“, in denen Vektoren gespeichert sind. Diese beiden Modi erscheinen in einem Vektor -Datensatz. Der folgende Screenshot zeigt den Modus, der von der Funktion r_mode zurückgegeben wurde:
Beispiel 4: Erhalten Sie den Modus der Zeichenvektordaten
Beide früheren Beispiele gaben den Modus aus den numerischen Vektordaten zurück. Wir können auch den Modus des Zeichenvektorendatensatzes berechnen. Die gleichen Regeln werden auch auf die Charaktervektoren angewendet.
Zunächst haben wir die benutzerdefinierte Funktion verwendet. Dann haben wir im nächsten Schritt einen Datensatz der Zeichenvektoren in der Variablen „String_Data“ erstellt. Der Zuordnungsoperator wird zwischen der Variablen „String_ Data“ und dem Vektor der Zeichen verwendet, der zeigt, dass die „String_Data“ die Definition der Zeichenvektoren hat. Wir haben hier sechs Zeichenzeichen.
Anschließend haben wir die Funktion r_mode angerufen, an die die "String_Data" für den Betriebsmodusbetrieb übergeben wird. Wir haben den Modus "Stars String" aus dem Vektor der angegebenen Zeichen erhalten. Diese Zeichenfolge erscheint am häufigsten in der Zeichenzeichenfolge des Vektors. Die Ausgabe wird in der folgenden R -Konsolen -Snapshot angezeigt:
Beispiel 5: Den Modus aus dem Beispieldatensatz abrufen
Um Ihnen ein realistischeres Beispiel zu bieten, werden wir die Modusfunktion in einer Datenrahmenspalte aus einem realen Datensatz implementieren. Hier haben wir uns für einen Datenrahmen "Iris" entschieden. Zunächst haben wir eine manuell benutzerdefinierte Funktion beigefügt, die wir im vorherigen Exapel erstellt haben. Anschließend haben wir einer Datenfunktion als Parameter einen Datenrahmen „Iris“ zugewiesen.
Wir haben The Head () angerufen und den Datenrahmen „Iris“ an ihn übergeben. Der Datensatz ist im folgenden Snap -Shot angezeigt:
Dann haben wir das „Blütenblatt bestanden.Breite ”Spalte aus dem Datenrahmen„ Iris “zur Funktion R_MODE. Der Modus ist 0.2, die meistens im „Blütenblatt erscheint.Breite ”-Säule.
Abschluss
Sie sollten jetzt in der Lage sein, den Modus mit der R -Skriptsprache in Ubuntu 20 zu berechnen.04. Die Fähigkeit, den Modus andererseits zu bewerten, bedeutet nicht, dass Sie die statistische Forschung und das Prinzip des Modus verstehen. In R auf der Suche nach dem Datenerfassungsmodus haben wir ein Handbuch der benutzerdefinierten Funktionen erstellt. Die Methode akzeptiert die Vektoren, ob die numerischen oder Zeichenzeichenfolgen, als Argument und gibt den Moduswert aus.