Lineare Regression in r

Lineare Regression in r
Eine der am häufigsten verwendeten Datenanalysemethoden ist die Regression. Maschinelles Lernen wird voranschreitet und damit ein bekannter Algorithmus: die lineare Regression. In diesem Artikel informiert Sie sich über die Verwendung der linearen Regressionsfunktion von R. Regressionsmodelle passen Linien an die beobachtbaren Daten, um Assoziationen mit den Variablen zu interpretieren. Sie können die Technik verwenden, um festzustellen, wie sich eine abhängige Variable als unabhängige Variablen ändert.

Die Erforschung der Regression ist eine populäre statistische Technik, um ein Modell der Beziehung zwischen zwei Variablen aufzubauen. Eine dieser Variablen wird als Prädiktorvariable bezeichnet und ihr Wert wird durch Studien bestimmt. Die Antwortvariable ist die andere Variable, und die Variable der Prädiktor erlaubt es, einen Wert zu erhalten.

Was ist die lineare Regression in der R -Programmiersprache in Ubuntu 20.04?

Die beiden Variablen werden durch eine Gleichung in der linearen Regression verknüpft, bei der die exponentielle Leistung beider Variablen eins ist. Bei der Darstellung als Diagramm zeigt eine lineare Verbindung eine gerade Linie in der Mathematik an. Eine Kurve wird durch eine nichtlineare Verbindung gebildet.

Syntax der linearen Regression in der mathematischen Gleichung:
Die lineare Regression hat die nachfolgende rundum mathematische Gleichung:

y = ax+b

Syntax der linearen Regression in R -Programmiersprache:
In R lautet die grundlegende Syntax für die Durchführung einer Regressionsanalyse wie folgt:

lm (y ~ x)

Wobei y das Element ist, das die zu vorhergesagte Variable enthält, die abhängig ist, und x die Formel des mathematischen Modells. Der Befehl LM () gibt die X -Koeffizienten zurück, hat jedoch keine anderen statistischen Daten. Wir können die LM () -Funktion verwenden, um ein Beziehungsmodell unter dem Prädiktor und der Antwortvariablen zu erstellen.

Wie lineare Regression in R in Ubuntu 20 verwendet wird.04

Im Folgenden sind die vier Schritte zur Aufstellung einer Beziehung aufgeführt:

  • Erstellen Sie mit den LM () -Methoden in R ein Beziehungsmodell.
  • Sammeln Sie die Koeffizienten zuerst aus dem von Ihnen konstruierten Modell und erstellen Sie sie, um die mathematische Gleichung zu erstellen.
  • Um die durchschnittliche Ungenauigkeiten bei der Vorhersage herauszufinden, erhalten Sie eine Zusammenfassung des Beziehungsmodells, auch als Residuen bezeichnet.
  • Verwenden Sie die Funktion Predict () in R, um den neuen Wert für den X-Schnittpunkt vorherzusagen.

Beispiel 1: Holen Sie sich die Regressionskoeffizienten, indem Sie ein Beziehungsmodell erstellen

Hier haben wir das einfache Beziehungsmodell der beiden Variablen erstellt, um die Regression durch die LM () -Funktion durchzuführen. Dies bringt uns die Koeffizienten des Beziehungsmodells. Zeigen wir dies mit dem folgenden Skript:

Wie im vorherigen Beispiel gezeigt, haben wir eine Variable „A“ deklariert, die mit einer zufälligen Zahl als Vektordarstellung initialisiert wird. Dann haben wir eine andere Variable erstellt, der wir auch mit der Sammlung der Zufallszahlen zugeordnet haben. Die LM () -Funktion wird in der neuen variablen Beziehung aufgerufen. Zu dieser LM () -Funktion haben wir die Variablen „A“ und „B“ übergeben, um die Beziehungen zwischen ihnen zu erzeugen. An die Druckfunktion wird die Beziehungsvariable übergeben, um die Ausgabe anzuzeigen.

Wenn der vorherige Regressionscode ausgeführt wird, zeigt er die Regression der Koeffizientenergebnisse der Variablen „A“ an.

Beispiel Nr. 2: Erhalten Sie eine Zusammenfassung der Beziehung

Die Zusammenfassung () -Methode in R kann verwendet werden, um die Ergebnisse des Modells anzuzeigen. Diese Funktion erstellt eine Tabelle mit den wichtigsten Eingaben aus dem linearen Modell.

Hier haben wir die Variable „A“ erstellt, der wir die Sammlung einiger Zahlen zugewiesen haben. Es gibt eine andere Variable „B“, die auch eine zufällige Zahl hat. Diese Variablen werden nun innerhalb der LM () -Funktion aufgerufen, die in der variablen Beziehung gespeichert ist. Hier ist die Variable „B“ die abhängige Variable, die vorhergesagt werden soll. In der Druckfunktion haben wir eine Zusammenfassungsfunktion für die Regressionsbeziehung. Wir haben die Beziehungsvariable innerhalb der Zusammenfassungsfunktion als Eingabe übergeben.

Diese Ausgangstabelle fasst die Formel zusammen, die die Ergebnisse generiert hat („Aufruf“) und die Modellreste („Residuen“) beschreibt, die darstellen, wie das gesamte Modell zu den tatsächlichen Daten passt. Der Tisch „Koeffizienten“ kommt als nächstes. Die erste Zeile zeigt die y-Schnurschätzungen, während die zweite Zeile den Regressionskoeffizienten des Modells zeigt.

Beispiel 3: Verwenden der Vorhersagefunktion für neue Werte

Wir verwenden die Vorhersagefunktion in der linearen Regression für die neuen Werte. Diese Funktion nimmt zwei Parameter für das Objekt und die neu erstellten Daten, die der Vektor sind. Die Formel, die bereits mit der LM () -Funktion hergestellt wurde, wird als Objekt bezeichnet. Die neuen Daten von Vektor umfassen den neuartigen Wert für die Prädiktorvariable.

Wie sich im vorherigen Bild widerspiegelt, haben wir zunächst zwei Vektoren erstellt, "V1" und "V2". Dann haben wir diese Vektoren in der LM () -Funktion bezeichnet. Der Vektor "V1" ist die vorhergesagte Variable und die "v2" die Antwortvariable. Dann finden wir mit der neuen Variablen „X“ den neuen Wert mit dem „v1“ gleich 150. Die Vorhersagefunktion nimmt das "X" -Objekt und die LM () -Funktionsergebnisse nimmt.

Wenn das vorherige R -Skript ausgeführt wird, generiert es die folgenden Ergebnisse:

Beispiel Nr. 4: Rendern Sie die lineare Regressionsdiagramme

Wir können auch das Liner -Regressionsdiagramm in R erstellen. Wir haben das lineare Regressionsgraphen aus dem folgenden Skript visualisiert:

Wir haben die Prädiktor- und Antwortvariable als "x" und "y" erstellt. Dann haben wir sie in der LM () -Funktion angerufen. Die PNG -Datei Plot wird erstellt, in der das Diagramm visualisiert wird. Dann haben wir unser lineares Regressionsdiagramm mit einigen Eingängen in der Handlungsfunktion gestylt.

Sie können die lineare Regressionsdiagramme wie folgt sehen:

Abschluss

Der Artikel linearer Regression in R endet hier. Die lineare Regression ist ein sehr großes Thema, aber wir haben alle möglichen Erklärungen abgegeben, die für dieses Thema erforderlich sind. Die Verbindung zwischen zwei Variablen kann unter Verwendung einer linearen Regression geschätzt werden. Hier haben wir einige Beispiele für lineare Regression behandelt. Wir haben die LM () -Funktion in der linearen Regression verwendet. Dann verstanden wir die lineare Regressionsübersichtsfunktion. Die Vorhersagefunktion wird ebenfalls demonstriert und wir haben auch die lineare Regression grafisch dargestellt.