Python Plotly Tutorial

Python Plotly Tutorial
Plotly ist ein Analytikunternehmen. In dieser Lektion werden wir uns grundlegende Beispiele mit Handlungsprotokoll ansehen und einfache und intuitiv. Diese Grafiken können in Präsentationen verwendet werden, da sie vollständig interaktiv und mit dem Spiel bereit sind.

Es gibt auch eine Option, um ein Grafikdesign offline zu sparen, damit sie leicht exportiert werden können. Es gibt viele andere Funktionen, die die Verwendung der Bibliothek sehr einfach machen:

  • Speichern Sie Diagramme für die Offline -Nutzung als Vektorgrafik, die für Druck- und Veröffentlichungszwecke hoch optimiert sind
  • Die exportierten Diagramme befinden sich im JSON -Format und nicht im Bildformat. Dieser JSON kann in andere Visualisierungstools wie Tableau geladen oder mit Python oder r manipuliert werden
  • Da die exportierten Grafiken JSON in der Natur sind, ist es praktisch sehr einfach, diese Diagramme in eine Webanwendung einzubetten
  • Plotly ist eine gute Alternative für Matplotlib für die Visualisierung

Um das Plotly -Paket zu verwenden, müssen wir uns auf der zuvor genannten Website für ein Konto registrieren, um einen gültigen Benutzernamen und einen API -Schlüssel zu erhalten, mit dem wir seine Funktionen verwenden können. Glücklicherweise ist ein Plan für den kostenlosen Preis für Handlung erhältlich.

Plotly installieren

Vor dem Start können Sie eine virtuelle Umgebung für diese Lektion verwenden, die wir mit dem folgenden Befehl gemacht werden können:

Python -m Virtualenv Plotly
Quelle Numpy/bin/aktivieren

Sobald die virtuelle Umgebung aktiv ist, können Sie die Plotly -Bibliothek innerhalb der virtuellen Umwelt installieren, damit Beispiele, die wir als nächstes erstellen, ausgeführt werden können:

Pip Installation Plotly

Wir werden in dieser Lektion Anaconda und Jupyter verwenden. Wenn Sie es auf Ihrem Computer installieren möchten, sehen Sie sich die Lektion an, in der „So installieren Sie Anaconda Python auf Ubuntu 18 installieren.04 LTS “und teilen Sie Ihr Feedback, wenn Sie Probleme haben. Verwenden Sie zum Installieren von Plotly mit Anaconda den folgenden Befehl im Terminal von Anaconda:

Conda install -c Plotly Plotly

Wir sehen so etwas, wenn wir den obigen Befehl ausführen:

Sobald alle benötigten Pakete installiert und durchgeführt wurden, können wir mit der Plotly -Bibliothek mit der folgenden Importanweisung beginnen:

Handlung importieren

Sobald Sie ein Konto auf Plotly erstellt haben, benötigen Sie zwei Dinge: Benutzername des Kontos und eine API -Schlüssel. Es kann nur einen API -Schlüssel zu jedem Konto geben. Halten Sie es also an einem sicheren Ort, als ob Sie es verlieren, Sie müssen den Schlüssel regenerieren, und alle alten Anwendungen mit dem alten Schlüssel werden nicht mehr funktioniert.

Erwähnen Sie in allen Python -Programmen, die Sie schreiben, die Anmeldeinformationen wie folgt, um mit Plotly zu arbeiten:

Handlung.Werkzeug.set_credentials_file (ususername = 'userername', api_key = 'your-api-key')

Beginnen wir jetzt mit dieser Bibliothek.

Erste Schritte mit Plotly

Wir werden die folgenden Importe in unserem Programm verwenden:

Pandas als PD importieren
Numph als NP importieren
importieren Sie Scipy als sp
Handlung importieren.Handlung als py

Wir verwenden:

  • Pandas zum effektiven Lesen von CSV -Dateien
  • Numpy für einfache tabellarische Operationen
  • Scipy für wissenschaftliche Berechnungen
  • Plotly für die Visualisierung

Für einige der Beispiele werden wir die eigenen Datensätze von Plotlys auf GitHub verwenden. Bitte beachten Sie, dass Sie den Offline -Modus auch für Plotly aktivieren können, wenn Sie Plotly -Skripte ohne Netzwerkverbindung ausführen müssen:

Pandas als PD importieren
Numph als NP importieren
importieren Sie Scipy als sp
Handlung importieren
Handlung.offline.init_notebook_mode (Connected = true)
Handlung importieren.offline als py

Sie können die folgende Anweisung ausführen, um die Plotly -Installation zu testen:

drucken (Handlung.__Ausführung__)

Wir sehen so etwas, wenn wir den obigen Befehl ausführen:

Wir werden den Datensatz schließlich mit Pandas herunterladen und ihn als Tabelle visualisieren:

Handlung importieren.Figure_Factory as ff
df = pd.read_csv ("https: // raw.GithubuSercontent.com/plotly/datasets/master/school_
Verdienste.CSV ")
Tabelle = ff.create_table (df)
py.iPlot (Tabelle, Dateiname = 'Tabelle')

Wir sehen so etwas, wenn wir den obigen Befehl ausführen:

Lassen Sie uns nun a konstruieren Balkendiagramm Um die Daten zu visualisieren:

Handlung importieren.Graph_objs als Go
Daten = [Go.Bar (x = df.Schule, y = df.Frauen)]
py.IPlot (Daten, Dateiname = 'Women-Bar')

Wir sehen so etwas, wenn wir den obigen Code -Snippet ausführen:

Wenn Sie oben mit dem Jupyter -Notizbuch die oben genannte Tabelle sehen, werden Sie über einen bestimmten Abschnitt des Diagramms, des Feldes und des Lasso ausgewählt und vieles mehr über verschiedene Optionen von Zoom In/Out eingeführt.

Gruppierte Balkendiagramme

Mehrere Balkendiagramme können zu Vergleichszwecken sehr leicht mit Plotly zusammengefasst werden. Nutzen wir denselben Datensatz dafür und zeigen die Variation der Präsenz von Männern und Frauen an Universitäten:

Frauen = Geh.Bar (x = df.Schule, y = df.Frauen)
Männer = Geh.Bar (x = df.Schule, y = df.Männer)
Daten = [Männer, Frauen]
Layout = Go.Layout (barmode = "Gruppe")
Fig = Go.Abbildung (Daten = Daten, Layout = Layout)
py.IPlot (Abb.)

Wir sehen so etwas, wenn wir den obigen Code -Snippet ausführen:

Obwohl dies gut aussieht, sind die Etiketten oben rechts nicht, richtig, richtig! Lassen Sie uns sie korrigieren:

Frauen = Geh.Bar (x = df.Schule, y = df.Frauen, Name = "Frauen")
Männer = Geh.Bar (x = df.Schule, y = df.Männer, Name = "Männer")

Die Grafik sieht jetzt viel beschreibender aus:

Versuchen wir, den Barmode zu ändern:

Layout = Go.Layout (barmode = "relativ")
Fig = Go.Abbildung (Daten = Daten, Layout = Layout)
py.IPlot (Abb.)

Wir sehen so etwas, wenn wir den obigen Code -Snippet ausführen:

Kreisdiagramme mit Handlung

Jetzt werden wir versuchen, ein Kreisdiagramm mit Plotly zu konstruieren, das einen grundlegenden Unterschied zwischen dem Prozentsatz der Frauen über alle Universitäten herstellt. Der Name der Universitäten werden die Etiketten sein und die tatsächlichen Zahlen werden verwendet, um den Prozentsatz des Ganzen zu berechnen. Hier ist der Code -Snippet für dasselbe:

Trace = Go.Kuchen (Labels = DF.Schule, Werte = df.Frauen)
py.iPlot ([Trace], Dateiname = 'Pie')

Wir sehen so etwas, wenn wir den obigen Code -Snippet ausführen:

Das Gute ist, dass Plotly mit vielen Merkmalen des Ein- und Ausgangs und vielen anderen Werkzeugen mit dem konstruierten Diagramm ausgestattet ist.

Zeitreihendatenvisualisierung mit Plotly

Die Visualisierung von Zeitreihendaten ist eine der wichtigsten Aufgaben, die auf dem Datenanalysten oder Dateningenieur wirken.

In diesem Beispiel werden wir einen separaten Datensatz im selben Github-Repository verwenden, da die früheren Daten keine zeitgestempelten Daten spezifisch betrafen. Wie hier werden wir im Laufe der Zeit die Variation von Apples Marktbestand zeichnen:

finanziell = pd.read_csv ("https: // raw.GithubuSercontent.com/plotly/datasets/master/
Finanz-Charts-Apple.CSV ")
Daten = [Go.Streuung (x = finanziell.Datum y = finanziell ['aAPL.Schließen'])]
py.IPlot (Daten)

Wir sehen so etwas, wenn wir den obigen Code -Snippet ausführen:

Sobald Sie Ihre Maus über die Grafikvariationslinie schweben, können Sie spezifische Punktdetails:

Wir können Zoom -In -and -Out -Schaltflächen verwenden, um auch Daten für jede Woche spezifisch zu sehen.

OHLC -Diagramm

Ein OHLC -Diagramm (Open High -Low -Close -Diagramm) wird verwendet, um eine Variation einer Entität über eine Zeitspanne hinweg zu zeigen. Dies ist leicht mit Pyplot zu konstruieren:

Aus der DateTime -Importdatetime importieren
open_data = [33.0, 35.3, 33.5, 33.0, 34.1]
High_data = [33.1, 36.3, 33.6, 33.2, 34.8]
low_data = [32.7, 32.7, 32.8, 32.6, 32.8]
close_data = [33.0, 32.9, 33.3, 33.1, 33.1]
Daten = [DateTime (Jahr = 2013, Monat = 10, Tag = 10),
DateTime (Jahr = 2013, Monat = 11, Tag = 10),
DateTime (Jahr = 2013, Monat = 12, Tag = 10),
DateTime (Jahr = 2014, Monat = 1, Tag = 10),
DateTime (Jahr = 2014, Monat = 2, Tag = 10)]
Trace = Go.OHLC (x = Daten,
open = open_data,
High = High_Data,
low = low_data,
close = close_data)
Daten = [Trace]
py.IPlot (Daten)

Hier haben wir einige Beispieldatenpunkte bereitgestellt, die wie folgt abgeleitet werden können:

  • Die offenen Daten beschreiben den Aktiensatz beim Öffnen des Marktes
  • Die hohen Daten beschreiben die höchste Aktienrate, die während eines bestimmten Zeitraums erreicht wird
  • Die niedrigen Daten beschreiben die niedrigste Aktienrate, die während eines bestimmten Zeitraums erreicht wird
  • Die schließen Daten beschreiben den Schlussaktiensatz, wenn ein bestimmtes Zeitintervall vorbei war

Lassen Sie uns nun den oben angegebenen Code -Snippet ausführen. Wir sehen so etwas, wenn wir den obigen Code -Snippet ausführen:

Dies ist ein hervorragender Vergleich darüber.

Abschluss

In dieser Lektion haben wir uns eine andere Visualisierungsbibliothek angesehen, die eine hervorragende Alternative zu Matplotlib in den Anwendungen der Produktionsstufe ist, die als Webanwendungen ausgesetzt sind Eine Fähigkeit, die wir unter dem Gürtel haben müssen.

Finden Sie den gesamten Quellcode, der in dieser Lektion auf GitHub verwendet wird. Bitte teilen Sie Ihr Feedback zur Lektion auf Twitter mit @sbmaggarwal und @linuxHint mit.