So zeichnen Sie Daten in Pandas Python auf

So zeichnen Sie Daten in Pandas Python auf
Die Datenvisualisierung spielt eine wichtige Rolle bei der Datenanalyse. Pandas ist eine starke Datenanalyse -Bibliothek in Python für Data Science. Es bietet verschiedene Optionen für die Datenvisualisierung mit .Plot () Methode. Selbst wenn Sie ein Anfänger sind, können Sie Ihre Daten problemlos mit der Pandas -Bibliothek zeichnen. Sie müssen die Pandas und Matplotlib importieren.Pyplot -Paket für die Datenvisualisierung.

In diesem Artikel werden wir verschiedene Datenplottenmethoden unter Verwendung des Pandas Python untersuchen. Wir haben alle Beispiele im Pycharm -Quellcode -Editor mit dem Matplotlib ausgeführt.Pyplot -Paket.

Plotten in Pandas Python

In Pandas die .Plot () verfügt über mehrere Parameter, die Sie basierend auf Ihren Anforderungen verwenden können. Mithilfe des Parameters "Art" können Sie meistens definieren, welche Art von Handlung Sie erstellen werden.

Die Syntax zum Aufstellen von Daten mit Pandas Python

Die folgende Syntax wird verwendet, um einen Datenrahmen in Pandas Python zu zeichnen:

# Pandas und Matplotlib importieren.Pyplot -Pakete
Pandas als PD importieren
Matplotlib importieren.Pyplot als PLT
# Daten vorbereiten, um den Datenrahmen zu erstellen
data_frame =
'Spalte1': ['Field1', 'Field2', 'Field3', 'Field4',…],
'Spalte2': ['Field1', 'Field2', 'Field3', 'Field4',…]

var_df = pd.DataFrame (Data_Frame, Spalten = ['Spalte1', 'Spalte2])
Druck (Variable)
# Diagramm -Balkendiagramm
var_df.Parzelle.bar (x = 'spalte1', y = 'column2')
PLT.zeigen()

Sie können die Plot -Art auch definieren, indem Sie den Art -Parameter wie folgt verwenden:

var_df.plot (x = 'spalte1', y = 'column2', sort = 'bar')

Pandas DataFrames -Objekte haben die folgenden Diagrammmethoden zum Aufzeichnen:

  • Streuungsplotten: Parzelle.streuen()
  • Barhandlung: Parzelle.bar (), Grundstück.Barh (), wobei H horizontale Balkendiagramme darstellt.
  • Zeilenplotten: Parzelle.Linie()
  • Kuchenplotten: Parzelle.Kuchen()

Wenn ein Benutzer nur die Plot () -Methode verwendet, ohne einen Parameter zu verwenden, erstellt er das Standard -Zeilendiagramm.

Mit Hilfe einiger Beispiele werden wir nun einige wichtige Arten von Plotten im Detail näher erläutern.

Streuung in Pandas

In dieser Art von Aufzeichnung haben wir die Beziehung zwischen zwei Variablen dargestellt. Nehmen wir ein Beispiel.

Beispiel

Zum Beispiel haben wir Korrelationsdaten zwischen zwei Variablen GDP_Growth und Oil_price. Um die Beziehung zwischen zwei Variablen zu zeichnen, haben wir das folgende Code -Stück in unserem Quellcode -Editor ausgeführt:

Matplotlib importieren.Pyplot als PLT
Pandas als PD importieren
GDP_CAL = PD.DataFrame (
'GDP_Growth': [6.15.8, 5.7, 5.7, 5.8, 5.6, 5.5, 5.3, 5.2, 5.2],
'Oil_price': [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame (GDP_CAL, Spalten = ['Oil_price', 'GDP_Growth'])
Druck (df)
df.Diagramm (x = 'oil_price', y = 'GDP_Growth', sort = 'scatter', color = 'rot')
PLT.zeigen()

Zeilendiagramme, die in Pandas auftreten

Das Zeilendiagramm -Diagramm ist ein Grundtyp von Plotten, bei dem angegebene Informationen in einer Datenpunktreihen angezeigt werden, die durch Segmente von geraden Linien weiter verbunden sind. Mit den Zeilendiagrammen können Sie auch die Trends von Informationsüberstunden anzeigen.

Beispiel

Im nachstehenden Beispiel haben wir die Daten über die Inflationsrate des vergangenen Jahres genommen. Bereiten Sie zuerst die Daten vor und erstellen Sie dann Datenframe. Der folgende Quellcode ist das Zeilendiagramm der verfügbaren Daten:

Pandas als PD importieren
Matplotlib importieren.Pyplot als PLT
Infl_cal = 'Jahr': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Infl_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (Infl_Cal, Spalten = ['Jahr', 'Infl_Rate'])
Data_frame.Diagramm (x = 'Jahr', y = 'Infl_Rate', sort = 'line')
PLT.zeigen()

Im obigen Beispiel müssen Sie die Sorte = 'Zeile' für das Zeilendiagramm einstellen.

Methode 2# Verwenden von Diagramm.Line () Methode

Das obige Beispiel können Sie auch mit der folgenden Methode implementieren:

Pandas als PD importieren
Matplotlib importieren.Pyplot als PLT
Inf_Cal = 'Jahr': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Inflation_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (Inf_Cal, Spalten = ['inflation_rate'], Index = [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011])
Data_frame.Parzelle.Linie()
PLT.Titel ('Inflationsrate Zusammenfassung der letzten 11 Jahre')
PLT.ylabel ('Inflation_rate')
PLT.xlabel ('Jahr')
PLT.zeigen()

Das folgende Zeilendiagramm wird angezeigt, nachdem der oben genannte Code ausgeführt wird:

Balkendiagramm in Pandas

Das Balkendiagrammdiagramm wird verwendet, um die kategorialen Daten darzustellen. In dieser Art von Handlung werden die rechteckigen Balken mit unterschiedlichen Höhen basierend auf den angegebenen Informationen dargestellt. Das Balkendiagramm kann in zwei verschiedene horizontale oder vertikale Richtungen aufgetragen werden.

Beispiel

Wir haben die Alphabetisierungsrate mehrerer Länder im folgenden Beispiel übernommen. Es werden Datenrahmen erstellt, in denen 'Country_Names' und 'Literacy_Rate' die beiden Spalten eines Datenrahmens sind. Mit Pandas können Sie die Informationen in der Balkendiagrammform wie folgt zeichnen:

Pandas als PD importieren
Matplotlib importieren.Pyplot als PLT
lit_cal =
"Country_Names": ["Pakistan", "USA", "China", "Indien", "Großbritannien", "Österreich", "Ägypten", "Ukraine", "Saudia", "Australien",
'Malaysia'],
'litr_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (lit_cal, columns = ['country_names', 'litr_rate'])
print (data_frame)
Data_frame.Parzelle.bar (x = 'country_names', y = 'litr_rate')
PLT.zeigen()

Sie können das obige Beispiel auch mit der folgenden Methode implementieren. Setzen Sie die Art = "Bar" für das Balkendiagramm in dieser Zeile:

Data_frame.plot (x = 'country_names', y = 'litr_rate', sort = 'bar')
PLT.zeigen()

Horizontales Balkendiagrammdiagramm

Sie können die Daten auch in horizontalen Balken zeichnen, indem Sie den folgenden Code ausführen:

Matplotlib importieren.Pyplot als PLT
Pandas als PD importieren
data_chart = 'litr_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.DataFrame (data_chart, columns = ['litr_rate'], index = ['pakistan', 'USA', 'China', 'Indien', 'UK', 'Österreich', 'Ägypt', 'Ukraine', 'Saudia' , 'Australien',
'Malaysia'])
df.Parzelle.Barh ()
PLT.Titel ("Alphabetisierungsrate in verschiedenen Ländern")
PLT.Ylabel ('Country_Names')
PLT.xlabel ('litr_rate')
PLT.zeigen()

In df.Parzelle.Barh (), der Barh wird für die horizontale Darstellung verwendet. Nach dem Ausführen des oben genannten Code wird das folgende Balkendiagramm im Fenster angezeigt:

Kreisdiagrammplotting in Pandas

Ein Kreisdiagramm repräsentiert die Daten in einer kreisförmigen grafischen Form, in der Daten basierend auf der angegebenen Menge in Scheiben angezeigt werden.

Beispiel

Im folgenden Beispiel haben wir die Informationen zu 'Earth_Material' in verschiedenen Scheiben auf dem Kreisdiagramm angezeigt. Erstellen Sie zunächst den DataFrame, indem Sie die Pandas verwenden, alle Details im Diagramm anzeigen.

Pandas als PD importieren
Matplotlib importieren.Pyplot als PLT
material_per = 'Earth_part': [71,18,7,4]
DataFrame = Pd.DataFrame (Material_Per, Spalten = ['Earth_part'], Index = ['Wasser', 'Mineral', 'Sand', 'Metals'])
Datenrahmen.Parzelle.Kuchen (y = 'Earth_part', AbbSize = (7, 7), autopct = '%1.1f %% ', startangle = 90)
PLT.zeigen()

Der obige Quellcode ist das Kuchendiagramm der verfügbaren Daten:

Abschluss

In diesem Artikel haben Sie gesehen, wie Sie Datenrahmen in Pandas Python zeichnen können. In dem obigen Artikel werden verschiedene Arten von Plotten durchgeführt. Weitere Arten wie Box, Hexbin, Hist, KDE, Dichte, Fläche usw. zu zeichnen., Sie können denselben Quellcode verwenden, indem Sie die Plot -Art ändern.