RSTUDIO bietet eine integrierte Entwicklungsumgebung, um die kostenlose Programmiersprache „R“ zu bewältigen, die unter der Lizenz von GNU erhältlich ist. RSTUDIO ist eine ideale Computerumgebung für die Erstellung detaillierter statistischer Visualisierungen und als solche wird von Statistikern auf der ganzen Welt verwendet.
RSTUDIO ist auch als Softwareprogramm und als Serveranwendung verfügbar, die von verschiedenen Linux -Verteilungen sowie für Windows und MacOS verwendet wird.
Download R -Programmiersprache (Voraussetzungen)
RSTUDIO -Desktop -Anwendung benötigt die R -Programmiersprache, um an Linux -Distributionen zu arbeiten. Es ist erforderlich, eine R -Version herunterzuladen, die mit Ihrem Linux -Betriebssystem kompatibel ist. Sie können es mit einem Software -Repository herunterladen.
1- Herunterladen R mit dem Webbrowser
Wenn Sie R nicht aus dem Softwarezentrum erhalten, bedeutet dies, dass das Repository zuerst aktualisiert werden muss. Sie können das alles einfach überspringen und das Web herunterladen, indem Sie diesen Link eingeben:
https: // kran.Studio.com
In das Suchfeld in Ihrem Webbrowser. Ihre Homepage sollte dem folgenden Screenshot ähneln:
2- Herunterladen von R vom Linux Terminal
Starten Sie das CLI -Terminal, geben Sie den folgenden Befehl ein und drücken Sie die Eingabetaste:
Führen Sie dann ein Update mit den folgenden Befehlen aus:
$ sudo apt-Get-Update
Dieser Befehl holt die Aktualisierungen von R ab und erfasst alle relevanten Dateien aus dem Haupt -Ubuntu -Repository.
Geben Sie dann den folgenden Befehl aus, um R zu installieren:
Der obige Befehl durchläuft die Paketauflistung und zeigt, wie viel Speicherplatz er ausfüllt wird, und fordert dann um Bestätigung auf. Drücken Sie die Taste "Y" auf Ihrer Tastatur, um mit der Installation fortzufahren.
Die Ausgabe bestätigt höchstwahrscheinlich die Installation.
Sie können es im Suchfeld nach oben nachschlagen, wie unten dargestellt:
Installieren von RSTUDIO auf Ubuntu 20.04 mit Befehlsterminal
Wenn die Host -Programmiersprache installiert ist, können wir jetzt RSTUDIO installieren. Um die Installation zu demonstrieren, werden wir das Befehlszeilenterminal verwenden.
Starten Sie das Terminal und geben Sie Folgendes aus
$ sudo apt-Get Installieren Sie GDEBI-CORE
Sie werden aufgefordert, das Stammkennwort einzugeben. Sobald Sie das Passwort eingegeben haben, beginnt die Paketinstallation
$ wget https: // download1.RSTUDIO.org/desktop/bionic/amd64/rstudio-1.3.1093-AMD64.Deb
Das RSTUDIO -Online -Paket wurde jetzt verbunden und wird auf Ihre Festplatte übertragen.
Sie werden gebeten, das Stammkennwort erneut einzugeben. Geben Sie das Passwort ein, um die Paketliste zu lesen und geladen zu lassen.
Die installierte Erlaubnis fordert die Erlaubnis, fortzufahren und drücken Sie die Y -Taste auf Ihrer Tastatur.
Die Ausgabe überprüft die Installation, wie unten gezeigt.
Erste Schritte mit RStudio:
Um RSTUDIO zu starten, besuchen Sie das Suchfeld und suchten Sie RSTUDIO. Sie werden es in einer der unten gezeigten Listen sehen:
Klicken Sie auf das RStudio -Symbol, um es zu starten.
Untersuchung von Datensätzen mit RSTUDIO
Mit RSTUDIO können Sie alle Daten in Form von Grafiken, Tabellen und Diagrammen visualisieren.
Um zu verstehen, wie Daten im RSTUDIO visuell dargestellt werden.
Der Prozess der Datenanalyse kann vage auf die folgenden vier Schritte reduziert werden:
1-Import-Rohdaten
Sie können die Rohdaten direkt aus dem Web in RSTUDIO importieren, indem Sie diese systematisch im Konsolenfenster mit dem folgenden Befehl durchführen:
$ cpd <- read.csv(url("https://data.lacity.org/api/views/nxs9-385f/rows.csv?accessType=DOWNLOAD")
Mit dem ausgeführten Befehl erhält RSTUDIO die Daten als CSV -Datei aus dem Web, und der Inhalt wird der CPD -Variablen zugewiesen.
Eine andere Möglichkeit, Daten in RSTUDIO zu importieren.
Gehen Sie in der Registerkarte Umgebung zur Option Dataset -Option importieren. Klicken Sie auf OK und Sie werden im Dialog über den Datensatz angezeigt. Hier geben Sie die Parameter sowie die Namen und Dezimalstellen an. Wenn Sie fertig sind, klicken Sie einfach importieren, und der Datensatz wird dem RSTUDIO hinzugefügt, und eine Variable wird seinem Namen zugewiesen.
Um zu sehen, welche Datensätze verwendet werden, geben Sie den folgenden Befehl mit der Variablen aus, die einem Datensatz zugeschrieben wird:
$ View (CPD)
2 -manipulieren die Daten
Nachdem Sie den Datensatz importiert haben, können Sie eine ganze Menge tun, um diese Daten zu transformieren. Die Daten werden durch Transformationsmerkmale manipuliert. Angenommen, Sie möchten zu einem bestimmten Array innerhalb des Datensatzes touren. Wenn wir in unserem Datensatz zur Spalte der Gesamtbevölkerung gehen würden, geiten wir den folgenden Befehl ein:
$ cpd $ Gesamtbevölkerung
Die Daten können auch in Form eines Vektors abgerufen werden:
$ cpd [1,3]
Mit der Teilmengefunktion im RSTUDIO können wir den Datensatz abfragen. Nehmen wir an, wir müssen die Reihen hervorheben, in denen das Verhältnis von Männern zu Frauen positiv ist. Um diese Zeilen auszuwählen, würden Sie den folgenden Befehl ausgeben:
$ a <- subset(cpd , Total Males > Totale Frauen)
Im obigen Befehl musste der von uns zugewiesene erste Parameter die Variable sein, die dem Datensatz zugeschrieben wird, auf den wir die Funktion angewendet haben. Der boolesche Zustand wird als zweiter Parameter angesehen. Außerdem muss der boolesche Zustand für jede Reihe bewertet werden. Es dient als entscheidender Faktor, ob eine Reihe ein Teil der Ausgabe sein soll oder nicht.
3 -Verwenden der durchschnittlichen Funktionen im Datensatz
RSTUDIO verfügt über spezielle Funktionen, um im Datensatz Durchschnittswerte zu erarbeiten:
$ Mean (CPD $ Gesamt Männer) - berechnet den einfachen Durchschnitt
$ median (CPD $ Total Females) - gibt dem Median für eine Spalte
$ quantile (CPD $ Gesamtpopulation) -gives das Quantil für eine Spalte
$ var (CPD $ Gesamtmänner) -verarbeitet die Varianz für eine Spalte
$ SD (CPD $ Total Females) -Gives Standardabweichung
Um den zusammengefassten Bericht im Datensatz zu erhalten, können Sie auch eine dieser Funktionen im gesamten Datensatz ausführen.
$ Zusammenfassung (CPD)
4 -Erstellen eines Diagramms für den Datensatz
Wenn Sie häufig mit RSTUDIO arbeiten, finden Sie das Visualisierungstool sehr einfallsreich. Sie können ein Diagramm aus jedem importierten Datensatz mit dem Diagramm und anderen Visualisierungsfunktionen im RSTUDIO erstellen.
Um einen Streudiagramm für den Datensatz zu generieren, geben Sie den folgenden Befehl aus:
$ plot (x = s $ Gesamt Männer, y = s $ Gesamtwäsche, Typ = 'P')
Lassen Sie uns nun die hier beteiligten Parameter diskutieren. In jedem Parameter bezieht sich S auf die Teilmenge des ursprünglichen Datensatzes und durch Hinzufügen von „P“ geben Sie an, dass Sie die Ausgabe aufgetragen haben möchten.
Sie können Ihren Datensatz auch in Form eines Histogramms darstellen:
$ HIST (CPD $ Gesamt Haushalte)
In ähnlicher Weise erhalten Sie ein Balkendiagramm des importierten Datensatzes:
$ zählt <- table(cpd$Total Population)
$ barplot (zählt, main = "Gesamtbevölkerungsverteilung",
$ xlab = "Anzahl der Gesamtpopulation")
Verwalten von Daten in ungleichmäßig verteilten Zeitreihen
Um Daten mit ungleichmäßig verteilten Zeitreihen zu verwalten, sollten Sie das Zoo -Paket in RSTUDIO integrieren. Um das Zoopaket zu erhalten. Das Zoo -Paket wandelt die unregelmäßigen Zeitreihendaten in Zooobjekte um. Die Argumente, die zum Erstellen von Zooobjekten eingefügt wurden.
Zooobjekte bieten eine einfache Verwendung von Unterstützung. Alles, was Sie tun müssen, ist ein „Diagramm“ einzugeben, und Sie werden alle Handlungsmethoden angezeigt, die Sie mit diesem Zoo -Paket verwenden können.
Wenn Sie verwirrt sind, was eine bestimmte RSTUDIO -Funktion zu bieten hat, geben Sie den Namen dieser Funktion ein und folgen Sie ihm mit “?”Um die Eingabeaufforderung im Hilfemenü zu sehen. Das Drücken von Strg+Space nach einem Funktionsnamen erzeugt auch das Fenster zur automatischen Vervollständigung.
Einpacken
Dieses Tutorial hat veranschaulicht, wie Sie Rstudio auf Ubuntu 20 einrichten können.04 und deckte die Grundlagen der statistischen Darstellung und Manipulation mit RStudio ab. Wenn Sie RSTUDIO besser einsetzen möchten, sollte sich die Grundlagen von R -Programmierungen vertraut machen. RSTUDIO ist ein leistungsstarkes Werkzeug und verfügt über Anwendungen in vielen Branchen auf der ganzen Welt: künstliche Intelligenz und Data Mining, um nur einige zu nennen.
Das Kennenlernen von R-Programmierkern ist eine kleine Lernkurve, aber es lohnt sich die Mühe.