So installieren und verwenden Sie Orange unter Linux

So installieren und verwenden Sie Orange unter Linux

Orange ist eine Data Mining-Software, die seinen Benutzern einzigartige und fertige Lösungen für alltägliche Datenanalyseprobleme ermöglicht. Es verwendet eine visuelle Programmierschnittstelle, mit der die Benutzer ihre Datenworkflows visuell intuitiv verstehen und steuern können. Im Kern verwendet es Python-basierte Module, mit denen sie ihre Kernfunktionalität erben können. Neben Data Mining -Techniken unterstützt es auch eine hervorragende Unterstützung für Algorithmen für maschinelles Lernen, die den Benutzern helfen, scharfe Erkenntnisse aus ihren Daten zu generieren.

Orange wird im Bildungs- und Forschungsbereich häufig eingesetzt und wird als großartiges Instrument von nicht programmierenden Forschungsgruppen angesehen. Die visuelle Programmierschnittstelle nannte Orangefarbene Leinwand erleichtert es einfach, die Arbeit selbst für Menschen zu erledigen, die keinen umfassenden Hintergrund in der Programmierung haben. Die Leinwand funktioniert, indem die Benutzer Widgets einsetzen können, die eine Kernfunktionalität eines Datenanalyse -Workflows darstellen. Diese Widgets können dann nacheinander gestapelt werden, um eine vollständige Pipeline zu erstellen, durch die sich die Daten bewegt und die erforderliche Ausgabe erzeugt.

Am Ende dieses Artikels können Sie in der Lage sein:

    1. Laden Sie Orange auf Ihrem Linux -Computer herunter und installieren Sie sie
    2. Verstehen Sie, wie wichtig es für die Data Science Community ist
    3. Erfahren Sie, wie unterschiedlich dieses Toolkit für Sie von Vorteil sein kann

Installation

Wie bereits erwähnt, verwendet Orange Python -Module, weshalb es einfach vom Python -Paketmanager namens heruntergeladen werden kann Pip. Um PIP zu verwenden, müssen wir es zuerst herunterladen und installieren.

Befolgen Sie die Schritte für die vollständige Installation von Orange auf Ihrem Linux -Computer.

1. Zunächst müssen wir den Lokalen aktualisieren geeignet Repositorys Verwenden des folgenden Befehls:

$ sudo apt-Get-Update

Sie sollten eine Ausgabe erhalten, die diesem ähnlich ist:

2. Nach dem Aktualisieren der geeignet Lokale Repositories installieren jetzt einige Python -Pakete, mit denen Sie herunterladen und installieren können Orange. Dies geschieht, da Orange im Wesentlichen ein Python -Modul ist, das einige Kernfunktionen von anderen Python -Modulen verwendet, um Ihnen Data Mining- und Analysefunktionen zu bieten.

Führen Sie den folgenden Befehl aus, um die herunterzuladen Pip Paketmanager und Python virtualenv aufstellen:

$ sudo apt-Get Installieren Sie Git Python-Pip Python-Virtualenv

Sie sollten eine ähnliche Ausgabe erhalten:

Führen Sie nun den zweiten Befehl aus, mit dem alle notwendigen Python -Module heruntergeladen werden, die von Orange ordnungsgemäß ausgeführt werden müssen:

$ sudo apt-Get Installieren Sie Git Python3-Dev Python3-Numpy Python3-Scipy
python3-pyqt4 python-qt4-dev python3-SIP-dev libqt4-dev

Notiz: Dieser Befehl kann je nach Ihrer Internetverbindung einige Zeit in Anspruch nehmen, um vollständig zu rennen.

Zweitens werden Sie möglicherweise aufgefordert, die zu drücken Y Schlüssel zur Akzeptanz der Installation anderer Kernpakete.

Sie sollten eine ähnliche Ausgabe erwarten:

3. Wir erstellen jetzt eine virtuelle Umgebung, um alle zu installieren Orange Module und Abhängigkeiten.

Führen Sie die folgenden Befehle aus:

$ mkdir orange3env
$ virtualenv -p python3-System-Site-Packages orange3env


$ source orange3env/local/bin/aktivieren



Notiz: Wenn der vorherige Befehl nicht funktioniert, führen Sie den folgenden Befehl aus:

$ source orange3env/bin/aktivieren

4. Installieren Orange durch Anrufen Pip was wir zuvor heruntergeladen haben.

Führen Sie den folgenden Befehl aus:

$ pip install orange3

Sie sollten die folgende Ausgabe erhalten:

5. Die erfolgreiche Ausgabe des vorherigen Schritts bedeutet das Orange wurde mit dem Python Package Manager heruntergeladen und installiert Pip.

Wir führen jetzt den folgenden Befehl aus, um Orange auszuführen:

$ python -m Orange.Leinwand



Notiz: Wenn der folgende Orange GUI -Bildschirme öffnen sich, das bedeutet, dass alle Ihre Bemühungen erfolgreich waren und Orange installiert und auf Ihrem Linux -Computer geöffnet ist.

Benutzerhandbuch

Orange ist ein praktisches Tool für Data Mining und Analyse, mit dem die Benutzer Datenanalyse -Workflows auf visuelle und interaktive Weise erstellen können. Dies bedeutet, dass Sie komplexe Modelle mit einer einfachen Drag & Drop -Technik erstellen können.

Das Orangenmodul wird mit einer Leinwand geliefert, mit der die Widgets, die die verschiedenen Funktionen darstellen. Wir erstellen eine einfache Pipeline in diesem Handbuch, die die Daten in Orange importiert und dann einige Aktionen für diese Daten ausführen und die Ergebnisse ausgeben.

Zum Beispiel können wir alle verschiedenen Arten im folgenden Bild sehen, in dem die Daten in das Orange -Tool importiert werden können, das das Importieren von SQL -Tabellen, CSV -Dateien, Farbdaten und mehr umfasst.


Wir importieren die Daten für dieses Tutorial aus einer CSV -Datei.

Nachdem wir nun angegeben haben, welches Datenformat wir in unsere Pipeline eingeben, wählen wir eine Aktion aus, die wir für diese Daten ausführen möchten.

Wir gehen jetzt zum Verwandeln Registerkarte und wählen Sie das Randomize -Widget aus, das alle Dateneinträge in unsere Daten einnimmt und deren Bestellung randomisieren.


Nachdem wir nun wissen, was wir mit unseren importierten Daten anfangen möchten, können wir auswählen, wie wir die Ergebnisse dieser Daten anzeigen möchten.

Lassen Sie uns für unseren Leitfaden ein Balkendiagramm der randomisierten Daten erstellen, damit wir sehen können, zu welchen Klassen die Daten gehören und wie viel der Daten in diesen Klassen enthalten ist.


Nachdem die Daten in das von uns erstellte Modell importiert wurden, durchquert es automatisch die gesamte Pipeline, wodurch sich der Import zur Erstellung von Bar -Diagrammen zur Verfügung stellt. Die Ausgabe, die wir auf unseren Daten erhalten, ist im Folgenden zu sehen:


Darüber hinaus können wir die Daten einfach mit dem Widget anzeigen Datentabelle Unter der Kategorie visualisieren.

Abschluss

Wie man sichtbar ist, ist es äußerst einfach und intuitiv, in Orange for Data Science zu arbeiten. Alles, was Sie tun müssen, ist, die verschiedenen Funktionen zu ziehen und zu fallen, die Ihre Daten durchlaufen und die Ausgänge sammeln sollen. Dieses Tool ist besonders hilfreich für Personen, die keinen Programmierhintergrund haben, aber dennoch bestimmte Bewertungen auf ihren Daten durchführen müssen. Die Forschungs- und Akademie -Gemeinschaften nutzen Orange Viele, da es ihnen ermöglicht, die Schlussfolgerung und Erkenntnisse in ihre Daten mit relativ leicht und wenig bis gar keiner vorherigen Programmierkenntnisse zu generieren.