Python Numpy Histogram Tutorial

Python Numpy Histogram Tutorial
Ein Histogramm ist eine Zuordnung von Intervallen auf Frequenzen. Es wird verwendet, um die Wahrscheinlichkeitsdichtefunktion der jeweiligen Variablen zu approximieren. Es ist auch als Balkendiagramm bekannt. Viele Optionen sind in Python zum Aufbau und Zeichnen von Histogrammen erhältlich. Numpy Library of Python ist nützlich für wissenschaftliche und mathematische Operationen. Eine der wichtigsten Merkmale dieser Bibliothek besteht darin, Histogramm mithilfe der Funktion Histogram () zu implementieren. Diese Funktion wird verwendet, um das Histogramm zu erstellen, das die Frequenzverteilung von Daten grafisch darstellt. Im Histogramm werden die Klassenintervalle durch Behälter dargestellt, die wie horizontale Rechtecke aussehen, und die variable Höhe repräsentiert die Frequenzen. Das Wissen über das Erstellen von Numpy Array ist notwendig, um die in diesem Tutorial gezeigten Beispiele zu verstehen.

Syntax:

Numpy.Histogramm (input_array, Bins = 10, Bereich = Keine, Normed = keine, Gewichte = keine, Dichte = keine)

Diese Funktion kann sechs Argumente annehmen, um das berechnete Histogramm einer Datenmenge zurückzugeben. Die Zwecke dieser Argumente werden nachstehend erläutert.

  • input_array: Es ist ein obligatorisches Argument, das zur Berechnung des Histogramm -Datensatzes verwendet wird.
  • Mülleimer: Es ist ein optionales Argument. Es wird verwendet, um die Anzahl der gleichbreiten Mülleimer zu definieren. Eine Reihe von Behälterkanten kann definiert werden, die monoton zunehmen. Es kann auch die rechte Kante umfassen, die ungleichmäßige Behälterbreiten verwenden kann. In der neuen Numpy -Version kann der String -Wert für dieses Argument verwendet werden.
  • Bereich: Es ist ein optionales Argument, das verwendet wird, um die niedrigeren Upper-Bereiche der Mülleimer zu definieren. Der Standard -Bereichswert wird durch Verwendung festgelegt max () Und Mindest() Funktionen. Das erste Element des Bereichs muss weniger oder gleich dem zweiten Element sein.
  • Normed: Es ist ein optionales Argument, das verwendet wird, um die Anzahl der Stichproben in jedem Behälter abzurufen. Es kann die falsche Ausgabe für ungleiche Behälterbreiten zurückgeben.
  • Gewichte: Es ist ein optionales Argument, mit dem das Array definiert wird, das Gewichtswerte enthält.
  • Dichte: Es ist ein optionales Argument, das jeden Booleschen Wert annehmen kann. Wenn der Wert dieses Arguments wahr ist, wird die Anzahl der Stichproben in jedem Behälter zurückgegeben. Andernfalls werden die Werte der Wahrscheinlichkeitsdichtefunktion zurückgegeben.

Diese Funktion kann zwei Arrays zurückgeben. Eines ist das Hist -Array, das den Satz von Histogrammdaten enthält. Ein anderes ist das Kantenarray, das die Werte des Behälters enthält.

Beispiel 1: Drucken Sie das Histogrammarray aus

Das folgende Beispiel zeigt die Verwendung der Histogram () -Funktion mit einem eindimensionalen Array und dem Argument der Bins mit den sequentiellen Werten. Ein Array von 5 Ganzzahl -Zahlen wurde als Eingangsarray verwendet, und ein Array von 5 sequentiellen Werten wurde als Binswert verwendet. Der Inhalt des Histogramm -Arrays und des Bin -Arrays wird als Ausgabe zusammengedruckt.

# Numpy Library importieren
Numph als NP importieren
# Histogram () -Funktion aufrufen, die Histogrammdaten zurückgibt
np_array = np.Histogramm ([10, 3, 8, 9, 7], Behälter = [2, 4, 6, 8, 10])
# Drucken Sie den Histogrammausgang
print ("Die Ausgabe von Histogramm ist: \ n", np_array)

Ausgang:

Die folgende Ausgabe wird nach der Ausführung des obigen Skripts angezeigt.

Beispiel 2: Drucken Sie das Histogramm und die Behälter -Arrays aus

Das folgende Beispiel zeigt, wie das Histogramm -Array und das Bin -Array durch die Verwendung der Funktion Histogram () erstellt werden können. Ein Numpy -Array wurde erstellt, indem die Funktion arrang () im Skript verwendet wird. Als nächstes wurde die Funktion Histogramm () aufgerufen, um das Histogramm -Array- und Bin -Array -Werte getrennt zurückzugeben.

# Numpy Library importieren
Numph als NP importieren
# Numpy Array mit Arange () erstellen
np_array = np.Arange (90)
# Histogrammdaten erstellen
hist_array, bin_array = np.Histogramm (NP_Array, Bins = [0, 10, 25, 45, 70, 100])
# Histogramm -Array aus Druck
print ("Die Daten des Histogrammarrays lautet:", hist_array)
# Druckenbehälter Array
print ("Die Daten des Bin -Arrays lautet:", bin_array)

Ausgang:

Die folgende Ausgabe wird nach der Ausführung des obigen Skripts angezeigt.

Beispiel 3: Drucken Sie das Histogramm- und Bin -Arrays basierend auf Dichteargument

Das folgende Beispiel zeigt die Verwendung von die Dichte Argument der Histogramm () -Funktion, um das Histogrammarray zu erstellen. Eine numpy -Array von 20 Zahlen wird mithilfe der Arange () -Funktion erstellt. Die erste Histogramm () -Funktion wird aufgerufen, indem die festgelegt wird Dichte Wert zu FALSCH. Die zweite Funktion Histogram () wird aufgerufen, indem die festgelegt wird Dichte Wert zu WAHR.

# Numpy Array importieren
Numph als NP importieren
# Erstellen Sie ein numpy Array von 20 sequentiellen Zahlen
np_array = np.Arange (20)
# Berechnen Sie die Histogrammdaten mit falscher Dichte
hist_array, bin_array = np.Histogramm (NP_Array, Dichte = Falsch)
print ("Die Histogrammausgabe durch Einstellen der Dichte auf false: \ n", hist_array)
print ("Die Ausgabe von Bin Array: \ n", bin_array)
# Berechnen Sie die Histogrammdaten mit einer echten Dichte
hist_array, bin_array = np.Histogramm (NP_Array, Dichte = true)
print ("\ nThe Histogrammausgabe durch Einstellung der Dichte auf true: \ n", hist_array)
print ("Die Ausgabe von Bin Array: \ n", bin_array)

Ausgang:

Die folgende Ausgabe wird nach der Ausführung des obigen Skripts angezeigt.

Beispiel 4: Zeichnen Sie ein Balkendiagramm mit Histogrammdaten

Sie müssen die Matplotlib -Bibliothek von Python installieren, um das Balkendiagramm zu zeichnen, bevor Sie das Skript dieses Beispiels ausführen. hist_array Und bin_array wurden unter Verwendung der Funktion Histogram () erstellt. Diese Arrays wurden in der BAR () -Funktion der Matplotlib -Bibliothek verwendet, um das Balkendiagramm zu erstellen.

# notwendige Bibliotheken importieren
Matplotlib importieren.Pyplot als PLT
Numph als NP importieren
# Histogramm -Datensatz erstellen
hist_array, bin_array = np.Histogramm ([4, 10, 3, 13, 8, 9, 7], Behälter = [2, 4, 6, 8, 10, 12, 14])
# Stellen Sie einige Konfigurationen für das Diagramm fest
PLT.Abbildung (Figsize = [10, 5])
PLT.xlim (min (bin_array), max (bin_array))
PLT.Raster (Achse = 'Y', Alpha = 0.75)
PLT.xlabel ('Kantenwerte', fontsize = 20)
PLT.Ylabel ('Histogrammwerte', fontsize = 20)
PLT.Titel ('Histogrammdiagramm', fontsize = 25)
# Erstellen Sie das Diagramm
PLT.bar (bin_array [:-1], hist_array, width = 0.5, color = 'blau')
# Zeigen Sie das Diagramm an
PLT.zeigen()

Ausgang:

Die folgende Ausgabe wird nach der Ausführung des obigen Skripts angezeigt.

Abschluss:

Die Funktion Histogram () wurde in diesem Tutorial mit verschiedenen einfachen Beispielen erläutert, die den Lesern helfen, den Zweck der Verwendung dieser Funktion zu kennen und sie ordnungsgemäß im Skript anzuwenden.