So verwenden Sie Boxplot in Python

So verwenden Sie Boxplot in Python
Ein Box -Diagramm wird verwendet, um Datensätze mithilfe der Methode zum Box- und Whisker -Diagramm zusammenzufassen. Diese Funktion hilft Benutzern, die Datenzusammenfassung ordnungsgemäß zu verstehen. Boxplots können sehr nützlich sein, wenn wir wissen möchten, wie die Daten verteilt und verteilt sind. Drei Arten von Quartilen werden im Box -Diagramm verwendet, um die Daten zu zeichnen. Diese Werte umfassen die statistischen Werte der Median-, Maximal-, Minimal-, Oberquartil- und niedrigerer Quartilwerte. Ein Box -Diagramm fasst diese Daten in der 25 zusammenth, 50th, und 75th Perzentile. In diesem Tutorial werden Ihnen angezeigt Pandas Und Seeborn Bibliotheken von Python.

Voraussetzung

Wenn Sie ein neuer Python -Benutzer sind, müssen Sie zunächst die Umgebung einrichten, um die Ausgabe des Box -Diagramms anzuzeigen. Sie können jeden Python -Interpreter zur Ausführung des Codes verwenden. In diesem Tutorial werde ich verwenden Spyder3 Um den Code auszuführen. Wenn Sie die nicht installiert haben Pandas Und Seeborn Bibliotheken Vorher sollten Sie den folgenden Befehl vom Terminal ausführen, um diese Bibliotheken zu installieren:

$ pip3 Installieren Sie Pandas Seeborn

Boxplots mit Pandas

Der Box-Plot() Methode von Pandas wird verwendet, um Box -Diagramm -Zahlen basierend auf dem Datenrahmen zu generieren. Diese Methode enthält viele Argumente; Einige dieser Argumente werden in den folgenden Beispielen verwendet. In diesem Teil des Tutorials werden zwei Beispiele enthalten, die Ihnen zeigen, wie Sie Boxplots in erstellen Pandas. Sie können zufällig generierte Daten in der Numpy -Bibliothek oder in den Daten einer CSV -Datei verwenden, um ein Box -Diagramm in zu generieren Pandas.

Beispiel 1: Box -Diagramme basierend auf zufälligen Werten

Die Box -Diagramme im folgenden Beispiel wurden mit Verwendung generiert Numpy Und Pandas. Die Numpy-Bibliothek wird im Skript verwendet, um ein Datenrahmenobjekt zu erstellen, indem ein zweidimensionales Array von Zufallswerten erstellt wird, die 5 Zeilen und 5 Spalten enthalten. Der Inhalt des Datenframe der Kopf() Methode. Als nächstes die Box-Plot() Die Methode wird verwendet, um Boxplots mit blauer Farbe, Schriftgröße 10 und einem Drehwinkel von 30 Grad zum Anzeigen der Säulenwerte zu erzeugen.

#!/usr/bin/env python3
# Pandas Library importieren
Pandas als PD importieren
# Importieren Sie die Numpy -Bibliothek, um die Zufallszahlen für das Array zu erstellen
Numph als NP importieren
"
Generieren Sie den Datensatz basierend auf dem zufällig erstellten Numpy Array
und fünf Spaltenwerte
"
DataFrame = Pd.DataFrame (NP.willkürlich.Randn (5,5), Spalten = ['2016', '2017', '2018',
'2019', '2020'])
# Drucken Sie die Werte des DataFrame
drucken (DataFrame.Kopf())
# Zeigen Sie das Box -Diagramm basierend auf den DataFrame -Werten an
Datenrahmen.Boxplot (Grid = 'False', Color = 'Blue', fontsize = 10, rot = 30)

Ausgang

Die folgende Ausgabe wird nach der Ausführung des Codes angezeigt.

Beispiel 2: Boxdiagramme basierend auf CSV -Daten

Die Box -Diagramme im folgenden Beispiel wurden aus CSV -Daten generiert. Erstellen Sie eine CSV -Datei mit dem Namen Bank.CSV Verwenden der folgenden Daten.

Bank.CSV

SL, Client_Name, Account_Type, Geschlecht, Guthaben
1, Maria Hernandez, Rettung, weiblich, 120000
2, Mary Smith, aktuell, weiblich, 40000
3, David Smith, Current, Male, 379000
4, Maria Rodriguez, Rettung, weiblich, 56000
5, Mark Lee, Saving, männlich, 93500
6, Jonathan Bing, aktuell, männlich, 5900
7, Daniel Williams, Rettung, männlich, 2300
8, Mike Brown, Strom, männlich, 124888
9, Paul Smith, Current, Male, 59450
10, Maria Lopez, Rettung, weiblich, 487600

Im folgenden Skript die Matplotlib Die Bibliothek wurde verwendet, um die Figurengröße des Box -Diagramms einzurichten und die Ausgabeinline anzuzeigen. Alle Aufzeichnungen von die Bank.CSV Die Datei wurden mit dem geladen read_csv () Methode von Pandas. Die ersten 8 Datensätze des Datenrahmens wurden dann mit dem gedruckt Kopf() Methode. Der Box-Plot() Die Methode wurde in der folgenden Anweisung verwendet, um die Box -Plot -Figur mit roter Farbe basierend auf 'zu zeichnenKonto Typ' mit der Spalte namens 'Gleichgewicht.''

#!/usr/bin/env python3
# Pandas für das Generieren von Box -Plot importieren
Pandas als PD importieren
# Matplotlib importieren, um die Figurengröße des Box -Diagramms einzurichten
Matplotlib importieren.Pyplot als PLT
# Importieren Sie Get_ipython für das Format der Ausgabeinline
von ipython import get_ipython
get_ipython ().run_line_magic ('Matplotlib', 'inline')
# Richten Sie die Figurgröße ein
PLT.rcparams ['Figur.Figsize '] = (8,4)
# Laden Sie den Datensatz aus einer CSV -Datei
df = pd.read_csv ("Bank.CSV ")
# Drucken Sie die ersten 8 Zeilen der geladenen Daten
drucken (df.Kopf (8))
# Zeigen Sie die Boxplots basierend auf dem verwendeten Parameter an
df.Boxplot (by = 'account_type', grid = 'true', column = ['balance'], color = 'rot')

Ausgang

Die folgende Ausgabe wird nach der Ausführung des Codes angezeigt.

Boxplots mit Seeborn

Eine weitere Bibliothek von Python, die üblicherweise zum Zeichnen von Boxplots verwendet wird, ist die Bibliothek Seeborn. Eine der wichtigsten Merkmale dieser Bibliothek ist, dass sie viele integrierte Beispieldatensätze enthält, um verschiedene Aufgaben zu testen. Die nächsten beiden Beispiele decken die Verwendung von zwei verschiedenen Beispieldatensätzen zum Zeichnen von Box -Diagrammern mit dem ab Seeborn Bibliothek.

Beispiel 3: Boxdiagramme basierend auf X -Parameter

Das folgende Beispiel verwendet einen Beispieldatensatz mit dem Namen 'Diamanten, ' aus der Seeborn Bibliothek zum Generieren des Box -Diagramms. Hier wird der Netzstil mit dem definiert set_style () Methode. Der load_dataset () Die Methode wird verwendet, um die Daten der 'zu ladenDiamanten ' Datensatz. Die ersten fünf Datensätze werden aus dem Datensatz und aus gedruckt Box-Plot() Die Methode wird dann verwendet, um das Box -Diagramm basierend auf der Spalte zu zeichnen, die benannt ist 'Tiefe,'Mit blauer Farbe.

# Importieren Sie die SeaBorn -Bibliothek, um das Box -Plot zu generieren
Importieren Sie Seeborn als SNS
# Matplotlib importieren, um die Figurengröße des Box -Diagramms einzurichten
Matplotlib importieren.Pyplot als PLT
# Importieren Sie Get_ipython für das Format der Ausgabeinline
von ipython import get_ipython
get_ipython ().run_line_magic ('Matplotlib', 'inline')
# Richten Sie den Netzstil ein
sns.set_style ("WhiteGrid")
# Richten Sie die Figurgröße ein
PLT.rcparams ['Figur.Figsize '] = (8,4)
# Laden Sie den Beispieldatensatz
diamond_dataset = sns.load_dataset ('Diamonds')
# Zeigen Sie die ersten 5 Datensätze des Datensatzes an
print (diamond_dataset.Kopf())
# Zeichnen Sie die Box -Diagramm -Abbildung
sns.Boxplot (x = diamond_dataset ['Tiefe'], Color = 'Blue')

Ausgang

Die folgende Ausgabe wird nach der Ausführung des Codes angezeigt.

Beispiel 4: Boxdiagramme basierend auf X- und Y -Parametern

Das folgende Beispiel verwendet den Beispieldatensatz mit dem Namen 'Flüge'Um die Box -Handlung zu zeichnen. Hier sowohl die x als auch die y -Parameter von der Boxplot () Methode wird verwendet, um die Figur zu zeichnen. Die anderen Aussagen ähneln dem vorherigen Beispiel.

# Importieren Sie die SeaBorn -Bibliothek, um das Box -Plot zu generieren
Importieren Sie Seeborn als SNS
# Matplotlib importieren, um die Figurengröße des Box -Diagramms einzurichten
Matplotlib importieren.Pyplot als PLT
# Importieren Sie Get_ipython für das Format der Ausgabeinline
von ipython import get_ipython
get_ipython ().run_line_magic ('Matplotlib', 'inline')
# Richten Sie den Netzstil ein
sns.set_style ("darkgrid")
# Richten Sie die Figurgröße ein
PLT.rcparams ['Figur.Figsize '] = (12,4)
# Laden Sie den Beispieldatensatz
flug_dataset = sns.load_dataset ('Flüge')
# Zeigen Sie die ersten 5 Datensätze des Datensatzes an
print (flug_dataset.Kopf())
# Zeichnen Sie die Box -Diagramm -Abbildung
sns.Boxplot (x = 'Monat', y = 'Passagiere', data = flug_dataset, color = 'blau')

Ausgang

Die folgende Ausgabe wird nach der Ausführung des Codes angezeigt.

Abschluss

Wenn Sie mit einer großen Datenmenge arbeiten, möchten Sie die Daten möglicherweise mit einem Diagramm zusammenfassen, z. B. ein Box -Diagramm. In diesem Tutorial wurde mehrere Beispiele verwendet, um Ihnen zu zeigen, wie Sie Boxplots mit zwei Python -Bibliotheken generieren können.