Python Seeborn Tutorial

Python Seeborn Tutorial
In dieser Lektion über die Python Seaborn -Bibliothek werden wir verschiedene Aspekte dieser Datenvisualisierungsbibliothek untersuchen, die wir mit Python verwenden können, um schöne und intuitive Graphen zu generieren, die Daten in einer Form visualisieren können, die Unternehmen von einer Plattform wünscht. Um diese Lektion zu vervollständigen, werden wir die folgenden Abschnitte abdecken:
  • Was ist Python Seeborn?
  • Arten von Handlungen können wir mit Seeborn konstruieren
  • Arbeiten mit mehreren Handlungen
  • Einige Alternativen für Python Seeborn

Das sieht nach viel zu decken aus. Lassen Sie uns jetzt anfangen.

Was ist Python Seeborn Library?

Die SeaBorn -Bibliothek ist ein Python -Paket, mit dem wir auf der Grundlage statistischer Daten Infografiken erstellen können. Da es auf Matplotlib hergestellt wird, ist es also von Natur aus kompatibel damit. Darüber hinaus unterstützt es die Datenstruktur von Numpy und Pandas, sodass das Auftreten direkt aus diesen Sammlungen erfolgen kann.

Die Visualisierung komplexer Daten ist eine der wichtigsten, die Seeborn sich kümmert. Wenn wir Matplotlib mit Seeborn vergleichen würden, kann Seeborn diese Dinge leicht machen, die mit Matplotlib schwer zu erreichen sind. Es ist jedoch wichtig zu beachten, dass das Seeborn ist keine Alternative zu Matplotlib, sondern eine Ergänzung davon. In dieser Lektion werden wir Matplotlib -Funktionen auch in den Code -Snippets verwenden. Sie werden sich für die Arbeit mit Seeborn in den folgenden Anwendungsfällen auswählen:

  • Sie haben statistische Zeitreihendaten, die mit der Darstellung der Unsicherheit in Bezug auf die Schätzungen aufgetragen werden müssen
  • So visuell die Differenz zwischen zwei Untergruppen von Daten herzustellen
  • Um die univariaten und bivariaten Verteilungen zu visualisieren
  • Mit vielen eingebauten Themen viel mehr visuelle Zuneigung zu den Matplotlib-Diagrammen hinzufügen
  • Maschinelle Lernmodelle durch lineare Regression mit unabhängigen und abhängigen Variablen zu passen und zu visualisieren

Nur eine Notiz vor dem Start ist, dass wir eine virtuelle Umgebung für diese Lektion verwenden, die wir mit dem folgenden Befehl gemacht haben:

Python -m Virtualenv Seeborn
Quelle Seeborn/Bin/aktivieren

Sobald die virtuelle Umgebung aktiv ist, können wir die SeaBorn -Bibliothek innerhalb der virtuellen Umgebung installieren, damit Beispiele, die wir als nächstes erstellen, ausgeführt werden können:

PIP Installieren Sie Seeborn

Sie können auch Anaconda verwenden, um diese Beispiele durchzuführen, was einfacher ist. Wenn Sie es auf Ihrem Computer installieren möchten, sehen Sie sich die Lektion an, in der „So installieren Sie Anaconda Python auf Ubuntu 18 installieren.04 LTS “und teilen Sie Ihr Feedback. Lassen Sie uns nun zu verschiedenen Arten von Handlungen voranschreiten, die mit Python Seeborn konstruiert werden können.

Verwenden von Pokemon -Datensatz

Um diese Lektion praktisch zu halten, werden wir Pokemon-Datensatz verwenden, der von Kaggle heruntergeladen werden kann. Um diesen Datensatz in unser Programm zu importieren, werden wir die Pandas -Bibliothek verwenden. Hier sind alle Importe, die wir in unserem Programm ausführen:

Pandas als PD importieren
von Matplotlib Pyplot als PLT importieren
Importieren Sie Seeborn als SNS

Jetzt können wir den Datensatz in unser Programm importieren und einige der Beispieldaten mit Pandas als:

df = pd.Read_csv ('Pokemon.CSV ', Index_col = 0)
df.Kopf()

Beachten Sie, dass der CSV -Datensatz zum Ausführen des obigen Codes -Snippets im selben Verzeichnis wie das Programm selbst vorhanden sein sollte. Sobald wir das obige Code -Snippet ausgeführt haben, sehen wir die folgende Ausgabe (in Notebook von Anaconda Jupyter):

Lineare Regressionskurve aufnehmen

Eines der Besten an Seeborn sind die intelligenten Handlungsfunktionen, die es bietet, die nicht nur den Datensatz, den wir ihm zur Verfügung stellen, visualisiert, sondern auch Regressionsmodelle um sie herum konstruieren. Zum Beispiel ist es möglich, ein lineares Regressionsdiagramm mit einer einzelnen Codezeile zu konstruieren. Hier erfahren Sie, wie man das macht:

sns.lmPlot (x = 'Angriff', y = 'Verteidigung', data = df)

Sobald wir das obige Code -Snippet ausgeführt haben, werden wir die folgende Ausgabe sehen:

Wir haben einige wichtige Dinge im obigen Code -Snippet festgestellt:

  • In Seaborn ist eine dedizierte Plotfunktion verfügbar
  • Wir haben die Anpassungs- und Plotfunktion von Seeborn verwendet, die uns eine lineare Regressionslinie zur Verfügung stellte, die sie selbst modellierte

Haben Sie keine Angst, wenn Sie dachten, wir können ohne diese Regressionslinie keine Handlung haben. Wir können ! Probieren wir jetzt einen neuen Code -Snippet aus, ähnlich dem letzten:

sns.lmPlot (x = 'Angriff', y = 'Verteidigung', data = df, fit_reg = false)

Dieses Mal werden wir die Regressionslinie in unserer Handlung nicht sehen:

Das ist jetzt viel klarer (wenn wir die lineare Regressionslinie nicht brauchen). Aber das ist noch nicht nur vorbei. Mit Seeborn können wir diese Handlung anders machen, und das werden wir tun.

Konstruktionskastendiagramme

Eines der größten Merkmale in Seeborn ist die Art und Weise, wie es die Pandas -Datenframesstruktur leicht akzeptiert, um Daten zu zeichnen. Wir können einfach einen Datenrahmen an die SeaBorn -Bibliothek weitergeben, damit sie einen Boxplot aus ihm erstellen können:

sns.Boxplot (Data = DF)

Sobald wir das obige Code -Snippet ausgeführt haben, werden wir die folgende Ausgabe sehen:

Wir können die erste Lesung von Summe entfernen, da das etwas umständlich aussieht, wenn wir hier tatsächlich einzelne Spalten planen:

STATS_DF = DF.Drop (['Gesamt'], Achse = 1)
# Neue Boxplot mit STATS_DF
sns.BoxPlot (Data = Statistic_DF)

Sobald wir das obige Code -Snippet ausgeführt haben, werden wir die folgende Ausgabe sehen:

Schwarmhandlung mit Seeborn

Wir können ein intuitives Design Schwarm mit Seeborn errichten. Wir werden den Datenrahmen von Pandas, den wir früher geladen haben. Hier ist der Code -Snippet:

sns.set_context ("Papier")
sns.SWARMPLOT (x = "Angriff", y = "Verteidigung", data = df)
PLT.zeigen()

Sobald wir das obige Code -Snippet ausgeführt haben, werden wir die folgende Ausgabe sehen:

Durch die Verwendung eines Seeborn -Kontext. Es ist möglich, dieses Diagramm noch weiter mit benutzerdefinierter Schriftgröße anzupassen, die für Etiketten im Diagramm verwendet wird, um das Lesen zu vereinfachen. Dazu übergeben wir mehr Parameter an die SET_CONTEXT -Funktion, die genau wie das, was sie klingen. Um beispielsweise die Schriftgröße der Etiketten zu ändern, werden wir Schriftart verwenden.Größenparameter. Hier ist der Code -Snippet, um die Änderung vorzunehmen:

sns.set_context ("Paper", font_scale = 3, rc = "Schriftart.Größe ": 8" Achsen.LabelSize ": 5)
sns.SWARMPLOT (x = "Angriff", y = "Verteidigung", data = df)
PLT.zeigen()

Sobald wir das obige Code -Snippet ausgeführt haben, werden wir die folgende Ausgabe sehen:

Die Schriftgröße für das Etikett wurde basierend auf den von uns bereitgestellten Parametern und dem Wert der Schriftart geändert.Größenparameter. Eine Sache, in der Seeborn Experte ist, ist es, die Handlung für den praktischen Gebrauch sehr intuitiv zu gestalten, und dies bedeutet, dass Seeborn nicht nur ein Python -Paket für Python ist, sondern tatsächlich etwas, das wir in unseren Produktionsbereitstellungen verwenden können.

Hinzufügen eines Titels zu den Diagrammen

Es ist einfach, unseren Handlungen Titel hinzuzufügen. Wir müssen nur eine einfache Prozedur der Verwendung der Funktionen auf Achsenebene befolgen, in denen wir das aufrufen werden set_title () Funktion wie wir im Code -Snippet hier zeigen:

sns.set_context ("Paper", font_scale = 3, rc = "Schriftart.Größe ": 8" Achsen.LabelSize ": 5)
my_plot = sns.SWARMPLOT (x = "Angriff", y = "Verteidigung", data = df)
my_plot.set_title ("lh Swarm Plot")
PLT.zeigen()

Sobald wir das obige Code -Snippet ausgeführt haben, werden wir die folgende Ausgabe sehen:

Auf diese Weise können wir unseren Handlungen viel mehr Informationen hinzufügen.

Seeborn gegen Matplotlib

Da wir uns die Beispiele in dieser Lektion angesehen haben, können wir feststellen, dass Matplotlib und Seeborn nicht direkt verglichen werden können, aber sie können als Komplementation angesehen werden. Eines der Merkmale, die Seeborn 1 Schritt voraus sind.

Um die besten Parameter von Seeborn zu erstellen, empfehlen wir dringend, sich die Dokumentation von Seeborn zu untersuchen und herauszufinden, welche Parameter Sie verwenden sollen, um Ihr Handlung so nahe wie möglich an geschäftlichen Anforderungen zu gestalten.

Abschluss

In dieser Lektion haben wir verschiedene Aspekte dieser Datenvisualisierungsbibliothek untersucht, die wir mit Python verwenden können, um schöne und intuitive Diagramme zu generieren, die Daten in einem Formular visualisieren können, das Unternehmen von einer Plattform wünscht. Der Seaborm ist eine der wichtigsten Visualisierungsbibliothek, wenn es um Daten Engineering und die Präsentation von Daten in den meisten visuellen Formen geht, auf jeden Fall eine Fähigkeit, die wir unter dem Gürtel benötigen, da wir lineare Regressionsmodelle erstellen können.

Bitte teilen Sie Ihr Feedback zur Lektion auf Twitter mit @sbmaggarwal und @linuxHint mit.