Histogramm der Pandas -Serie

Histogramm der Pandas -Serie

„Die Frequenzverteilung eines numerischen Arrays wird typischerweise durch ein Histogramm dargestellt, das in diskrete, gleichgroße Behälter organisiert ist. Die Methode „Pandas.Serie.Hist () “und„ Pandas.Serie.plot () ”werden beide weit verbreitet. Sie können verwendet werden, um Histogramme mit der PANDAS -Serie schnell zu zeichnen.”

Die Syntax -Serie.Hist () ”“ folgt:

Syntax für „Serie.plot () ”Funktion:

In diesem Artikel wird die Implementierung dieser beiden Methoden zum Zeichnen von Histogrammen demonstriert.

Beispiel Nr. 1: Verwendung der Serie.HIST () -Methode zur Darstellung eines Histogramms

Wir können eine PANDAS -Serie mit der Verwendung der Pandas „Series verwenden.Hist () ”Methode. Die praktische Ausführung dieser Technik kann in dieser Demonstration beobachtet werden.

Wir haben das "Spyder" -Tool eingebaut, um die Python -Programme in unser System zusammenzustellen. Das Start des Tools bringt uns an die Schnittstelle. Standardmäßig öffnet es eine Datei mit dem Namen „Temperatur“.py ”. Sie können den Namen ändern und “.Py “ist die Erweiterung für die Python -Dateien.

In dieser Python -Datei haben wir das Skript initiiert, indem wir zuerst die erforderlichen Pakete geladen haben. Die Bibliothek, die wir in unsere Python -Umgebung importiert haben, ist die „Pandas“. Diese Frage könnte in Ihrem Kopf auftreten. Warum importieren wir Pandas aus der breiten Palette von Paketen, die Python bietet? Wir haben dieses Toolkit geladen, weil wir daran arbeiten, Histogramme mit der PANDAS -Serie zu zeichnen.

Um eine Serie zu generieren, werden wir eine Pandas -Methode „PD verwenden.Serie () “und um ein Histogramm aus dieser Serie zu zeichnen, eine weitere Pandas -Methode,„ Serie.Hist () ”wird in diesem Leitfaden ausgeübt. Also haben wir "Pandas als PD" in unsere Python -Datei importiert. Jetzt werden wir uns mit dem Skript beginnt.

Für die Darstellung von Pandas -Histogrammen unter Verwendung einer Reihe besteht die anfängliche Anforderung darin, eine PANDAS -Serie zu generieren. Um die PANDAS -Serie zu konstruieren, die „PD.Series () ”-Methode wird aufgerufen. Für diese Funktion haben wir zwei Parameter verwendet: "Daten" und "Name". Die Werte für die Serie werden in den "Daten" enthalten, während der Name dieser Wertliste in "Name" zugewiesen ist. Die Werte „Daten“ sind „12, 32, 45, 65, 76, 32, 19, 34, 76, 89, 45, 35, 76, 89, 90, 44, 14, 33, 56, 69, 65 , 44, 36, 57, 23, 41, 78, 32, 47, 81 ”. Unsere Serie wird also mit 30 Werten generiert. Wir haben diese Liste "Verkäufe" benannt. Der „PD.Series () ”-Funktion erstellt die Serie mit angehängten Werten, enthält jedoch keinen Speicher, um diese Serie für die spätere Verwendung zu halten.

Dafür haben wir ein Serienobjekt erstellt, es "import_report" genannt und das Ergebnis zugewiesen, das aus dem Aufrufen des "PD" generiert wurde.Serie () ”Methode. Die Präsentation dieser neu konstruierten Serie kann durch die Verwendung der Python -Methode „print ()“ ermöglicht werden. Diese Methode erfolgt, indem sie jede Art von Eingabe nimmt und es verarbeitet, um das Ergebnis am Terminal zu zeigen. Hier haben wir die "benutzt".head () ”Methode mit dem Seriennamen, weil der in der Serie gespeicherte Datensatz zu lang ist. Daher haben wir es vorgezogen, nur einige Startwerte zu sehen. Der ".Head () ”methode standardmäßig zeigt die ersten 5 Einträge an.

Das Bild unten zeigt eine im Ausgangsfenster gerendert. Der Name der Liste wird unten erwähnt und auch sein Datentyp als „int64“ identifiziert.

Um ein Histogramm aus einer Pandas -Serie zu kartieren, haben wir die Funktion „Serie“ erhalten.Hist () ”aus dem Pandas -Toolkit. Diese Methode nimmt die Werte einfach aus einer Serie aus und plant ein Histogramm mit ihnen. Für die Implementierung dieser Methode haben wir sie in unserem Python -Programm aufgerufen. Der Name der Serie "Import_Report" wird mit dem geliefert ".Hist () ”Methode. Dann haben wir das Programm gerade ausgeführt, indem wir auf die Option "Datei ausführen" geklappt haben.

Dadurch wird ein Diagramm auf dem Bildschirm erzeugt, das mit Balken angezeigt wird. Die Werte auf der y-Achse stammen von 0-8, was die Frequenz darstellt, während die x-Achse Intervalle von 10-90 aufweist.

Wir können dieses Histogramm anpassen, indem wir die Anzahl der darin enthaltenen Behälter ändern. Dafür haben wir einen Parameter "Bin". Wir haben diesen Parameter an die „Serie übergeben.hist () ”Funktion. Die Pandas erstellen standardmäßig Behälter, aber wir können sie bei Bedarf ändern. Also haben wir die „Behälter“ einen Wert von „8“ zur Verfügung gestellt. Es wird unsere Daten in 8 Balken im Histogramm verteilen.

Sie können beobachten, dass das vorherige Visual 10 Behälter hatte, aber dieser besitzt 8 Bars.

Beispiel Nr. 2: Verwendung der Serie.Plot () Methode zum Aufstellen eines Histogramms

Die andere Technik, die wir in diesem Tutorial verwenden werden, ist die Pandas „Serie“.plot () ”Methode. Standardmäßig erstellt es ein Zeilendiagramm, aber wir können insbesondere die Art von Handlung angeben, mit der wir unsere Daten visualisieren möchten.

Das Programm für diese Methode beginnt mit dem Importieren der Pandas -Bibliothek. Wir haben das Pandas -Modul geladen und seinen Alias ​​als „PD“ erstellt. Wir werden nun auf jede Pandas -Methode zugreifen, die wir brauchen, indem wir „PD“ anstelle von „Pandas“ schreiben. Die erste Methode, die wir aus dem Pandas -Toolkit aufgerufen haben.Serie () ”für den Bau einer Pandas -Serie. Der „PD.Series () ”wird mit zwei Attributen," Daten "und" Name "verwendet, mit zwei Attributen," Daten "und" Name ".

Die Werteliste wird in "Daten" gespeichert und der Titel der Liste ist in "Name" definiert. Die Werte, die wir für die Serienerstellung bereitgestellt haben, sind „20, 34, 45, 67, 64, 78, 98, 72, 12, 34, 17, 92, 56, 77, 63, 37, 29, 11, 20, 80, 44, 21, 37, 65, 48, 88, 24, 37, 33, 19, 74, 26 ”. Die Gesamtzahl der in dieser Liste gespeicherten Werte beträgt 32. Der Name, den wir für die Werteliste definiert haben, lautet "Werte". Die Serie wird in einem Serienobjekt erhalten, damit wir sie später verwenden können. Wir haben ein Serienobjekt "my_series" erstellt und es der neu erstellten Serie zugeteilt.

Da die Serie, die wir erzeugt haben.head () ”Methode innerhalb der Funktion„ print () “.

Name der Serie, Datentyp der Serie und die Serienwerte wurden auf der Python -Konsole ausgestellt.

Jetzt werden wir diese Serie verwenden, um ihre visuelle Darstellung mit Hilfe eines Handels zu erstellen.

Die Serie.Plot () ”-Methode wird aufgerufen. Hier erwähnten wir unseren Seriennamen als "my_Series" mit dem ".plot () ”Funktion. Zwischen den Klammern dieser Methode wird der Parameter „Art“ verwendet. Dieses Attribut definiert die Art des Auszeichnungstyps. Da wir ein Histogramm zeichnen wollen, haben wir die "Art" als "Hist" angegeben.

Unser Histogramm wird auf dem Bildschirm erzeugt, das 10 Behälter für die Werteverteilung enthält.

Wir können die Formatierung unserer Handlung ändern. Dafür haben wir einen Variablen „Container“ erstellt, um das darin enthaltene Histogramm zu speichern. Dann haben wir die "set_xlabe () l" verwendet, um eine Etikett "Liste der Werte" zu identifizieren, die auf der X-Achse angezeigt wird. Um das Etikett des Histogramms festzulegen, haben wir die Methode "set_title ()" verwendet, um eine Handlung als "Dies ist unsere Demo -Handlung" zu testen,.

Sie können die Ergebnisse im folgenden vorgestellten visuellen Histogramm -Diagramm sehen.

Abschluss

Die Visualisierung einer Datenreihe durch Erstellen von Plots ist eine sehr hilfreiche Technik für die schnelle Datenanalyse. Diese Lektion führte Sie mit den beiden Methoden zur Aufteilung des Histogramms mit der PANDAS -Serie ein. Die erste Technik, die wir besprochen haben, ist die „Serie.HIST () ”-Methode, die auch das Konzept der Veränderung von Behältern untersucht. Die zweite Funktion, die ausgeübt wird, ist die "Serie".plot () ”Methode. In dieser Technik haben wir gelernt, die Formatierung der Handlung entsprechend unseren Bedürfnissen zu ändern.