Handlung.äußern.Histogramm

Handlung.äußern.Histogramm
Eine der häufigsten Diagramme in der statistischen Analyse ist ein Histogramm. Es ist eine der effizientesten und einfachsten Möglichkeiten, Art des Diagramms zu implementieren, der die Frequenzverteilung zeigt. Es ist einem Bar -Diagramm mit einigen wichtigen Unterschieden sehr ähnlich. Betrachten Sie es als ein aggregiertes Bar -Diagramm.

In diesem Tutorial erfahren wir, wie wir mit dem Plotly Express -Modul ein Histogramm -Diagramm erstellen können.

Handlung.äußern.Histogramm()

In Plotly Express verwenden wir die Funktion Histogramm (), um Histogrammdiagramme zu erstellen. Die Funktion liefert wie gezeigt eine Syntax:

Handlung.äußern.Histogramm (data_frame = none, x = none, y = keine, color = none, muster_shape = none, facet_row = Keine, facet_col = none, facet_col_wrap = 0, facet_row_spacing = none, facet_col_spacing = none, hover_name = none, Hover_data = Nicht Animation_Frame = None, Animation_Group = Keine, category_orders = none, Labels = Keine, color_discrete_sequence = none, color_discrete_map = none, muster_shape_sequence = none, muster_shape_map = none, marginal = none, Offenkleber, Orientierung = none, barmode = 'relative', barnorm = keine, histnorm = keine, log_x = false, log_y = false, range_x = none, range_y = keine, histfunc = keine, kumulativ = keine, nbins = none, text_auto = false, title = keine, template = keine, width = width = Keine, Höhe = keine)

Im Folgenden sind die nützlichsten Funktionsparameter, die Sie wissen müssen:

  1. Data_Frame - Gibt den Datenrahmen an, der die Spaltennamen enthält. Sie können diesen Wert als Datenrahmen, ein Wörterbuch oder ein Array_ -ähnliches Objekt übergeben.
  2. x - Gibt die Werte an, mit denen die Markierungen entlang der x -Achse entlang der kartesischen Koordinate positioniert werden können. Dies kann ein Spaltenname in einem Datenrahmen oder einer Pandas -Serie sein.
  3. y - Ähnlich wie x, aber die in diesem Parameter angegebenen Werte werden verwendet, um die Markierungen entlang der y -Achse zu positionieren.
  4. Farbe - definiert die Werte, die verwendet werden, um den Markierungen eine eindeutige Farbe zuzuweisen.
  5. Kumulativ - Gibt an, ob die Werte des Histogramms kumulativ sind.
  6. NBINs - Gibt die Anzahl der Behälter an.
  7. Histnrom - Gibt den Modus an, in dem die Behälter erstellt werden. Zu den akzeptierten Werten gehören:
    1. 'Prozent'
    2. 'Wahrscheinlichkeit'
    3. 'Dichte'
    4. "Wahrscheinlichkeitsdichte"

Die Funktion gibt dann ein Histogramm -Diagramm von Typ Graph_Objects zurück.Figur.

Beispiel - Verwenden der GapMinder () -Daten

Wir können ein Histogramm unter Verwendung der Gapminder -Daten in Plotly erstellen. Nehmen Sie den unten angegebenen Beispielcode:

Handlung importieren.als px ausdrücken
df = px.Daten.gapminder ().Abfrage ("Kontinent == 'Europa'")
Abb = Px.Histogramm (df, x = 'gdppercap')
Feige.zeigen()

Im obigen Beispiel verwenden wir die GapMinder () -Daten von Plotly Express. Wir zeichnen dann ein Histogramm auf, das die Verteilung des Pro -Kopf -BIP der Länder auf dem europäischen Kontinent zeigt.

Sobald wir den obigen Code ausführen, sollten wir ein Histogramm wie gezeigt sehen:

Beispiel 2 - Verwenden von kategorialen Daten

Wir können auch ein Histogramm kategorieller Daten erstellen, indem wir die X- und Y -Parameter angeben.

Nehmen Sie den unten angegebenen Beispielcode:

Handlung importieren.als px ausdrücken
df = px.Daten.gapminder ().Abfrage ("Kontinent == 'Europa'")
Abb = Px.Histogramm (df, x = 'Land', y = 'gdppercap')
Feige.zeigen()

In diesem Fall zeigt das Histogramm jedes Land und die Summe des Pro -Kopf -Werts des BIP, wie in der folgenden Abbildung gezeigt:

Beispiel 3 - Spezifikationstyp der Normalisierung angeben

Standardmäßig erzeugt Plotly ein Histogramm mit jeder Probe in jedem Behälter. Wir können jedoch den Modus angeben, in dem wir die Behälter unter Verwendung des Histnorm -Parameters präsentieren möchten.

Schauen wir uns verschiedene Beispiele an:

Wahrscheinlichkeitsdichte

Abb = Px.Histogramm (df, x = 'gdppercap', histnorm = 'Wahrscheinlichkeitsdichte')
Feige.zeigen()

In diesem Beispiel erstellen wir ein Wahrscheinlichkeitsdichte -Histogramm, das eine Summe der Balkenbereiche ist, die 1 entsprechen.

Die resultierende Abbildung ist wie gezeigt:

Überprüfen Sie die Parameterliste, um die verschiedenen Typen zu erfahren, die Sie angeben können.

Beispiel 4 - Geben Sie die Anzahl der Behälter an

Standardmäßig wählt Plotly die Anzahl der Behälter so aus, dass es mit der Anzahl der Stichproben in einem Behälter vergleichbar ist. Wir können jedoch die Anzahl der Behälter unter Verwendung des NBINS -Parameters angeben.

Ein Beispiel ist wie gezeigt:

Abb = Px.Histogramm (df, x = 'gdppercap', nbins = 50)
Feige.zeigen()

Im obigen Beispiel geben wir die Anzahl der Behälter auf 50 an. Dies sollte eine Zahl wie gezeigt zurückgeben:

Beispiel 5 - Geben Sie den Farbparameter an

Wir können auch den Farbparameter angeben. Dadurch wird eine eindeutige Farbe basierend auf dem angegebenen Spaltennamen zugewiesen.

Beispielcode ist wie gezeigt:

Abb = Px.Histogramm (df, x = 'gdppercap', color = 'land')
Feige.zeigen()

Die resultierende Abbildung:

In diesem Fall weist Plotly jedem Land in der Handlung eine eindeutige Farbe zu.

Beispiel 6 - Horizontales Histogramm

Plotly ermöglicht es uns auch, horizontale Histogramme zu erstellen. Schauen Sie sich den folgenden Code an:

Abb = Px.Histogramm (df, x = 'gdppercap', y = 'land', color = 'land')
Feige.zeigen()

In diesem Fall planen wir ein Histogramm der Summe des Pro -Kopf -BIP -BIP jedes Landes. Der obige Code sollte eine Abbildung wie gezeigt zurückgeben:

Beispiel 7 - Sortieren nach Kategorie Reihenfolge

In einigen Fällen möchten wir das resultierende Diagramm möglicherweise basierend auf einem bestimmten Wert sortieren. Zum Beispiel können wir im obigen Histogramm das Histogramm basierend auf dem gesamten Gdppercap in aufsteigender Reihenfolge sortieren.

Mit der Funktion "update_xaxes oder update_yaxes" geben wir an, wie wir die Daten sortieren möchten.

In unserem Beispiel möchten wir die Y -Achse sortieren. Daher verwenden wir die Funktion update_yaxes (). In der Funktion können wir den Parameter und die Methode des KategorieOrders angeben, in dem wir die Daten sortieren möchten. In diesem Fall "total absteigend".

Wir können den Code wie gezeigt ausführen:

Abb = Px.Histogramm (df, x = 'gdppercap', y = 'land', color = 'land').update_yaxes (categoryorder = 'Gesamtabkommen')
Feige.zeigen()

Der obige Code sollte wie gezeigt zu einer Abbildung führen:

Abschluss

In diesem Artikel haben wir untersucht. Die Funktion ermöglicht es uns, Histogramme verschiedener Daten zu erstellen.