Seeborn gruppierte Barhandlung

Seeborn gruppierte Barhandlung
„Seeborn basiert auf Matplotlib, Pythons Kernvisualisierungspaket. Es ermöglicht Programmierern, eine grafische Visualisierung mithilfe von Pythons Handlungssprache zu erstellen, und bietet auch ein Tool zum Laden der Daten in R oder Matplotlib. Sie können die Daten auch verwenden, um zu erfahren, wie Daten verwendet werden, das Geschäft Ihres Analyseprojekts verstehen oder die verschiedenen Wege gründlich erfassen. Sie können zunächst Pandas verwenden, um die Daten zu untersuchen.”

Was ist das Saeborn gruppierte Bar -Grundstück

Das gruppierte Balkendiagramm ist eine Form eines Diagramms, das die Werte zahlreicher Variablen gleichzeitig visualisiert, indem Balken zusammen gruppiert. Dieser Artikel zeigt Ihnen, wie Sie das unten in Python angezeigte gruppierte Barhandlung mithilfe des SeaBorn -Visualisierungspakets entwerfen können. Vor all dem muss man die folgenden Konzepte verstehen:

Wenn wir zwei Parameter haben, von denen eine und die andere kategoriale Anzahl sind, sind Balkendiagramme ideal. Die Korrelation zwischen ihnen kann unter Verwendung einer Barplot aufgedeckt werden. Eine Balkenplot ist eine Visualisierungstechnik, bei der eine Gruppe durch rechteckige vertikale Balken auf der X-Achse und ihre Aktionen auf die y-Achse dargestellt wird. In den meisten Fällen repräsentiert die x-Achse die Aggregation der aufgetragenen Kategorievariablen, während die y-Achse den aggregierten numerischen Wert darstellt. Wir können sehen, wie die y-Achse mit dem Durchschnitt der unterschiedlichen Kategorienmerkmale aufgetragen wird. Ein Balkendiagramm zeigt eine Schätzung der zentralen Tendenz der numerischen Variablen mit zahlreichen abhängigen Variablen.

Bei mehreren Kategorievariablen ist ein gruppierter Barplot nützlich. Gruppierte Barplots sind einfach zu erstellen mit Pythons SeaBorn -Charting -Paket.

Die DataFrame GroupBy () -Methode in Pandas wird verwendet, um Elemente in Cluster zu unterteilen, die aus einer Reihe von Kriterien bestehen. Pandas können entlang jeder Achse aufgeteilt werden. Das abstrakte Konzept der Gruppierung ist die Zuordnung von Etiketten zu Gruppen. Die Pandas GroupBy -Funktion wird verwendet, um Daten in Kategorien zu gruppieren und diese Funktion in jeder Kategorie auszuführen.

Beispiel 1

Hier haben wir die einfache Implementierung einer gruppierten Barhandlung. Anfang. Anschließend haben wir einen Beispieldatensatz „Tipps“ aus den Python-integrierten Datensätzen ausgewählt. Wir haben diesen Datensatz in der Seeborn -Funktion geladen, die SNS darstellt.load_dataset (). Verwendung der Spalten aus dem geladenen Datensatz „Tipp“ in der Gruppe "GroupBy", die die Zwei-Spalt-Größe und das Geschlecht aus dem Tipps-Beispieldatensatz gruppiert haben.

Zusammen mit der GroupBy -Funktion haben wir die Aggregationsfunktion bezeichnet. Die Aggregationsfunktion wird auf die Spalte „Total_bill angewendet.”Die Aggregationsfunktion führt den mittleren Vorgang in der definierten Spalte aus. Anschließend wird die Barplot -Methode hier aufgerufen, die die kategorialen Parameter x und y für die Handlungsachsen nimmt. Wir haben die kategorialen Werte in verschiedenen Farbtönen mit der Hue -Option als Geschlecht.

Matplotlib importieren.Pyplot als PLT
Importieren Sie Seeborn als SNS
df = sns.load_dataset ('tipps')
df = df.GroupBy (['Größe', 'Sex']).Agg (Mean_total_bill = ("Total_bill", 'Mean'))
df = df.reset_index ()
sns.Barplot (x = "Größe",
y = "Mean_total_bill",
Hue = "Sex",
Daten = df)
PLT.zeigen()

Das Folgende ist die gruppierte Barplot -Visualisierung.

Beispiel 2

Wir haben die Säulenfelder geändert, um Ihnen die Visualisierung gruppierter Balken mit den verschiedenen Fällen zu zeigen. Wir haben dieselben Datensatz -Tipps für das gruppierte Balkendiagramm verwendet und es zur Funktion von Seeborn Load_dataset hinzugefügt.

Dann haben wir innerhalb der Gruppe von GroupBy diesmal die Größe und Zeit der beiden Spalten übergeben und den Mittelwert der Spalte Total_bill zusammengefasst. Danach haben wir die Parameter x, y und Farbton für die Barplot gesetzt. Der X-Parameter ist für die X-Achse, die mit der Größenspalte eingestellt ist, und die y-Achse wird mit der Spalte „Mittelwert“ festgelegt, auf die Aggregation angewendet wird. Der Hue -Parameter wird mit der Time -Eigenschaft hier aus dem TIPS -Datensatz festgelegt.

Matplotlib importieren.Pyplot als PLT
Importieren Sie Seeborn als SNS
df = sns.load_dataset ('tipps')
df = df.GroupBy (['Größe', 'Zeit']).Agg (Mean = ("Total_bill", 'Mean'))
df = df.reset_index ()
sns.Barplot (x = "Größe",
y = "Mean",
Hue = "Zeit",
Daten = df)
PLT.zeigen()

Das zweite gruppierte Balkendiagramm wird auch mit der Aggregationsfunktion in der folgenden Abbildung erfolgreich gemacht.

Beispiel 3

Dieser ist das dritte Beispiel für das illustration des gruppierten Balkendiagramms, jedoch mit einer anderen Datenprobe. Wir haben einen Beispieldatensatz von Python genommen, das als „Anagramme“ dargestellt wird.Wir erstellen das gruppierte Balkendiagramm der Anagramm -Datenspalten.

Erstens haben wir es in die variable load_dataset -Funktion des Seeborn -Pakets geladen, das in der Variablen df gespeichert ist. Dann werden innerhalb der Gruppe der Gruppenby -Funktion die NUM1 und die ATTNR -Spalten übergeben, um gruppiert zu werden, und die Aggregationsfunktion hat die Eingangsspalte NUM2, die den Mittelwert aus der Spalte Num2 zurückgibt. Der Barplot wird hier aufgerufen, auf das das Feld Num1 und Attnr für die X- und Y -Eingänge eingestellt sind. Die Hue -Eigenschaft wird mit der AttNR -Spalte festgelegt.

Matplotlib importieren.Pyplot als PLT
Importieren Sie Seeborn als SNS
df = sns.load_dataset ('Anagramme')
df = df.GroupBy (['Num1', 'Attnr']).Agg (Mean_num2 = ("Num2", 'Mean'))
df = df.reset_index ()
sns.Barplot (x = "Num1",
y = "Mean_num2",
Hue = "Attnr",
Daten = df)
PLT.zeigen()

Beispiel 4

Wir verwenden die zusätzlichen Parameter für das gruppierte Balkendiagramm. Dafür haben wir den Beispieldatensatz Titanic zur Generierung des gruppierten Balkendiagramms genommen. Wir haben den Kontext für die Handlung festgelegt, indem wir den Papiereingang an ihn weitergeben. Es wird verwendet, um die Größe und die Etiketten für das Diagramm anzupassen. Dann haben wir eine variable Titanic definiert, auf die der Titanic -Datensatz geladen ist.

Der Barplot wird im Inneren aufgerufen, und wir haben die X- und Y -Parameter zusammen mit der HUE -Option festgelegt, die die WHO -Spaltenwerte enthält. Die Option Palette wird auch verwendet, um die Farben für die Handlung festzulegen. Wir haben hier eine Magma -Palette für die gruppierte Barhandlung. Die Option Kentäure, Sättigung, Errcolor, Errwidth und CI sind auch für die gruppierte Barplot definiert.

Numph als NP importieren
Pandas als PD importieren
Matplotlib importieren.Pyplot als PLT
Importieren Sie Seeborn als SNS
sns.set_context ('Paper')
Titanic = sns.load_dataset ('titanic')
sns.Barplot (x = 'Klasse', y = 'überlebt', hue = 'who', data = titanic,
Palette = 'Magma',
kentern = 0.05,
Sättigung = 8.5,
Errcolor = 'Gray', Errwidth = 2,
ci = 'sd'
)
PLT.zeigen()

Hier wird die Visualisierung des gruppierten Balkendiagramms nach der gesamten Spalte gruppiert, die im Schiff überlebt hat.

Abschluss

Das ist der allgemeine Überblick über den Artikel, den SeaBorn gruppierte Barhandlung. Wir haben in diesem Tutorial zahlreiche Beispiele für die Darstellung einer gruppierten Bar mit Seeborn und Python durchgemacht. Wir begannen mit einfachen Diagrammen, indem wir die verschiedenen Datenrahmen für die gruppierten Balkenplots verwenden und sie weiter an die zusätzlichen Optionen anpassen.