SEABORN -Plot -Datenframe

SEABORN -Plot -Datenframe
„Seeborn hilft bei der Datenerforschung und -verständnis. Die Diagrammfunktionen funktionieren mit Datenrahmen und Arrays, die ganze Datensätze enthalten, die erforderliche statistische Aggregation und semantische Zuordnung intern durchführen, um nützliche Grafiken zu erstellen. Die statistischen Assoziationen können mit Hilfe von Seeborn gesehen werden. Die statistische Analyse wird verwendet, um herauszufinden, wie sich Parameter in einem Datensatz miteinander beziehen und wie diese Verbindung durch andere Variablen beeinflusst wird. Diese statistische Analyse unterstützt die Visualisierung von Trends sowie die Identifizierung verschiedener Merkmale im Datensatz.

Standardmäßig wird Pandas DataFrame zum Laden des Datensatzes verwendet. Dieser Datenrahmen wird von jeder Pandas -Datenfunktion verwendet. Datenrahmen sind rechteckige Gitter, die Daten enthalten und die Daten leicht anzeigen können. Jede Spalte des Netzmusters ist ein Vektor, der Daten für eine einzelne Variable aufbewahrt, und jede Zeile des Gitters hat Werte einer Instanz. Dies bedeutet, dass die Werte in den Zeilen eines Datenrahmens nicht vom gleichen Datentyp sein müssen. Sie können arithmetisch, text, logisch oder irgendetwas anderes sein. Datenrahmen sind zweidimensionale kommentierte Datencontainer mit verschiedenen Arten von Spalten, die mit dem Pandas-Modul für Python verpackt sind.

Die Bibliothek in Seeborn enthält einige wichtige Datensätze. Die Datensätze, die nach der Installation von SeaBorn automatisch hochladen. Der benötigte Datensatz kann mit Unterstützung der nachfolgenden Funktion geladen werden.

load_dataset ()

Diese Funktion ermöglicht einen schnellen Zugriff auf eine begrenzte Anzahl von Beispieldatensätzen, mit denen Sie SeaBorn dokumentieren oder wiederholbare Beispiele für die Fehlerberichterstattung erstellen können. Die normale Verwendung erfordert es nicht.”

Beispiel 1

In unserem ersten Beispiel verwenden wir das Box -Diagramm, um sich die Datensätze vorzustellen. Wir haben SeaBorn- und Matplotlib -Module, um das Liniendiagramm zu planen. Dann wird eine Variable als Daten deklariert, und innerhalb dieser Variablen wird der Seeborn load_dataset aufgerufen. Der Load_Dataset nimmt den Tipps -Datenrahmen auf, der standardmäßig in Python vorhanden ist. Jetzt können wir eine der Spalten aus dem Titanic -Datensatz für die Darstellung der Handlung aus aufrufen. Das Box -Diagramm nimmt X als Argument, für das wir die Spalte Total_bill aus dem Beispieldatensatz -Titanic festgelegt haben.

Importieren Sie Seeborn als SNS
Matplotlib importieren.Pyplot als PLT
Daten = SNS.Load_dataset ("Tipps")
sns.Boxplot (Daten ['Total_bill'])
PLT.zeigen()

Der Titanic Data Frame Boxplot wird in der folgenden Abbildung visualisiert.

Beispiel 2

Wir können den Datenrahmen mit einem der Seeborn -Diagramme zeichnen. In diesem Beispiel haben wir ein Geigendiagramm, um das SeaBorn -Datenrahmendiagramm zu machen. Eine Box -Handlung und eine Geigenplot sind vergleichbar. Es vergleicht die Verteilungen zahlreicher quantitativer Datenpunkte zwischen einer oder mehreren Kategoriefaktoren.

Da wir die Funktion von SeaBorn Load_Dataset verwenden, müssen wir das Python Seeborn -Modul importieren, und für die Handlung haben wir ein Matplotlib -Modul. Dort stylen wir den Hintergrund der Handlung zu einem dunklen Netz. Anschließend wird die Funktion load_dataset aufgerufen, wo wir wieder die Beispieldatensatz -Tipps verwendet haben.

Aus den Beispieldatensatz -Tipps nehmen wir zwei Spalten, Total_bill und Zeit, für die x- und y -Achsen des Diagramms ein. Um diese Säulen für die Handlung zu verwenden, haben wir hier eine SeaBorn -Geigenplot, die das X als Total_bill für die Achse und y als Zeit für die y -Achse nimmt. Diese angegebenen Spalten werden im Diagramm miteinander verglichen.

Importieren Sie Seeborn als SNS
Matplotlib importieren.Pyplot als PLT
sns.set (style = 'darkgrid')
df = sns.Load_dataset ("Tipps")
sns.Geigenplot (x = "Total_bill", y = "time", data = df)
PLT.zeigen()

Der Datenrahmen wird in der folgenden Abbildung visualisiert.

Beispiel 3

Hier haben wir das DataFrame -Diagramm mit dem Punktdiagramm gezeigt. Ein Punktdiagramm kann die Schätzung mit Konfidenzintervallen unter Verwendung von Streudiagrammgrafiken angeben. Der Punkt bestimmt eine geschätzte statistische Signifikanz für einen Datenpunkt, der auf dem Punktort des Streudiagramms basiert, und enthält Fehlerbalken, um den Grad der Unsicherheit anzuzeigen.

Im folgenden Skript haben wir das Stil dunkle Gitter für den Hintergrund der Handlung festgelegt. Dann haben wir eine Load_Dataset -Funktion, diesmal haben wir einen IRIS -Datensatz zum Generieren des Diagramms. Wir haben die Spalten sepal_length und sepal_width an den x- und y -Parameter für das Punktdiagramm übergeben.

Gimport Seeborn
Matplotlib importieren.Pyplot als PLT
Seeborn.set (style = 'WhiteGrid')
Daten = Seeborn.load_dataset ("iris")
Seeborn.pointplot (x = "sepal_length", y = "sepal_width", data = data)
PLT.zeigen()

Das Punktdiagramm des Dataset -Iris wird wie folgt angezeigt:

Beispiel 4

Der zweidimensionale PANDAS-Datenframe ist für die statistische Struktur mit markierten Achsen geeignet, die variiert werden können und Größe tiefer sind (Zeilen und Spalten). Um den Datenrahmen des Pandas zu erstellen, müssen die Längen aller Arrays gleich sein. Wenn ein Index definiert ist, sollte er die gleiche Länge wie die Arrays haben. Wenn kein Index in Bereich (n) festgelegt ist, wird standardmäßig das N verwendet, was die Länge des Arrays ist.

Im angegebenen Code -Snippet haben wir das Panda -Modul importiert und dann den Pandas DataFrame Constructor bezeichnet, bei dem die beiden Arrays als List1 und List2 angegeben werden. Wir haben eine Sammlung von Zufallszahlen in einer Reihe gleicher Länge. Um die Grafik der oben genannten Daten zu erstellen, haben wir ein KDE -Diagramm. Es zeigt die Wahrscheinlichkeitsdichte einer kontinuierlichen Variablen auf verschiedenen Ebenen. Wir können auch ein separates Diagramm für mehrere Beispiele erstellen, wodurch die Datenvisualisierung erleichtert wird. Die Dateneigenschaft wird mit den Feldern aufgerufen, die sie im Datenrahmen enthält.

Matplotlib importieren.Pyplot als PLT
Importieren Sie Seeborn als SNS
Pandas importieren
Daten = Pandas.DataFrame ("List1": [23, 30, 14, 15, 20],
"List2": [19, 20, 16, 26, 11])
sns.KDEPLOT (Data ['List1'], Data ['List2'])
PLT.zeigen()

Das KDE -Diagramm zeigt den Vergleich des Pandas -Datenframees innerhalb der Abbildung.

Abschluss

Jetzt haben Sie hier einen kurzen SEABORN -PLO -Datenrahmenartikel. Wir können den Datenrahmen selbst mit dem Datenrahmen des Pandas erstellen. Die Datenrahmen in Pandas sind starke Leserdatensätze, die Sie verwenden sollten, um ein tieferes Verständnis Ihrer Informationen zu erhalten. Wir können auch die integrierten SEABorn-Beispieldatenrahmen verwenden, indem wir die Funktion load_dataset verwenden. Dieser Datenrahmen kann mit jedem Seeborn -Diagramm aufgetragen werden, wie wir die zahlreichen Beispiele gezeigt haben, die die Datenrahmen zeichnen.