Wenn Sie Datenwissenschaftler sind, müssen Sie manchmal die Big Data verarbeiten. In diesen Big Data verarbeiten Sie die Daten, analysieren die Daten und generieren dann den Bericht dazu. Um den Bericht dazu zu erstellen, müssen Sie ein klares Bild der Daten benötigen, und hier sind die Grafiken vorhanden.
In diesem Artikel werden wir erklären, wie man das benutzt Matplotlib -Streudiagramm in Python.
Der Streudiagramm wird von Datenanalysen häufig verwendet, um die Beziehung zwischen zwei numerischen Datensätzen herauszufinden. In diesem Artikel wird die Verwendung der Matplotlib verwendet.Pyplot, um eine Streuung zu zeichnen. In diesem Artikel werden Sie vollständige Details erhalten, die Sie für die Streuung arbeiten müssen.
Der Matplotlib.Pypolt bietet verschiedene Möglichkeiten, die Grafik zu zeichnen. Um die Grafik als Streuung zu zeichnen, verwenden wir die Funktionsstreuung ().
Die Syntax zur Verwendung der Funktion Scatter () lautet:
Matplotlib.Pyplot.Streuung (x_data, y_data, s, c, marker, cmap, vmin, vmax, Alpha, Linienbreiten, EdgeColors)Alle oben genannten Parameter werden wir in den kommenden Beispielen sehen, um besser zu verstehen.
Matplotlib importieren.Pyplot als PLTDie Daten, die wir an der Streuung x_Data weitergegeben haben.
Beispiele
Jetzt werden wir den Scatter () -Grafter mit verschiedenen Parametern zeichnen.
Beispiel 1: Verwenden der Standardparameter
Das erste Beispiel basiert auf den Standardeinstellungen der Funktion Scatter (). Wir haben nur zwei Datensätze übergeben, um eine Beziehung zwischen ihnen zu erstellen. Hier haben wir zwei Listen: Eine gehört zu den Höhen (h), und ein anderer entspricht ihren Gewichten (W).
# Scatter_default_arguments.pyAusgang: Scatter_Default_Arguments.py
In der obigen Ausgabe können wir die Gewichtsdaten (W) auf der y-Achse und den Höhen (h) auf der x-Achse sehen.
Beispiel 2: Scatter () -Plot mit ihren Etikettenwerten (x-Achse und y-Achse) und Titel
In Beispiel_1 zeichnen wir einfach das Streudiagramm direkt mit Standardeinstellungen. Jetzt werden wir die Streudiagrammfunktion eins nacheinander anpassen. Zuallererst werden wir dem Diagramm Labels hinzufügen, wie unten gezeigt.
# LAMEL_TITLE_SCATUMER_PLOT.pyZeile 4 bis 11: Wir importieren die Bibliothek matplotlib.Pyplot und erstellen Sie zwei Datensätze für die X-Achse und die Y-Achse. Und wir übergeben beide Datensätze an die Streudiagrammfunktion.
Zeile 14 bis 19: Wir setzen die X-Achsen- und Y-A-Achse-Etikettennamen. Wir setzen auch den Titel des TO -Streudiagramms.
Ausgang: LABELS_TITLE_SCATUMER_PLOT.py
In der obigen Ausgabe können wir sehen, dass das Streudiagramm Axis -Etikettennamen und den Streudiagrammtitel enthält.
Beispiel 3: Verwenden Sie den Markerparameter, um den Datenstil zu ändern
Standardmäßig ist der Marker eine solide Runde, wie in der obigen Ausgabe gezeigt. Wenn wir also den Stil des Markers ändern wollen, können wir ihn durch diesen Parameter (Marker) ändern, um ihn zu ändern. Auch wir können die Größe des Markers festlegen. Wir werden dies in diesem Beispiel darüber sehen.
# Marker_Scatter_Plot.pyDer obige Code ist der gleiche wie in den vorherigen Beispielen, mit Ausnahme der folgenden Zeile erläutert.
Zeile 11: Wir übergeben den Markerparameter und ein neues Zeichen, das vom Streudiagramm verwendet wird, um Punkte auf die Grafik zu zeichnen. Wir setzen auch die Größe des Markers.
Die folgende Ausgabe zeigt Datenpunkte mit demselben Marker, den wir in der Streufunktion hinzugefügt haben.
Ausgang: Marker_Scatter_Plot.py
Beispiel 4: Ändern Sie die Farbe des Streudiagramms
Wir können auch die Farbe der Datenpunkte gemäß unserer Wahl ändern. Standardmäßig zeigt es eine blaue Farbe. Jetzt werden wir die Farbe der Streudiagrammdatenpunkte ändern, wie unten gezeigt. Wir können die Farbe des Streudiagramms mit jeder gewünschten Farbe ändern. Wir können jedes RGB- oder RGBA -Tupel (Rot, Grün, Blau, Alpha) auswählen. Die Wertebereich jedes Tuple -Elements liegt zwischen [0).0, 1.0], und wir können auch das RGB oder RGBA im hexadezimalen Format wie #ff5733 darstellen.
# Scatter_Plot_Colour.pyDieser Code ähnelt den vorherigen Beispielen, mit Ausnahme der folgenden Zeile, in der wir die Farbanpassung hinzufügen.
Zeile 11: Wir übergeben den Parameter „C“, der für die Farbe ist. Wir haben den Namen der Farbe „rot“ zugewiesen und die Ausgabe in derselben Farbe erhalten.
Wenn Sie das Farbtupel oder Hexadezimal verwenden möchten, übergeben Sie diesen Wert einfach an das Schlüsselwort (c oder Farbe) wie unten:
PLT.Streuung (h, w, marker = "v", s = 75, c = "#ff5733")In der obigen Streufunktion haben wir den hexadezimalen Farbcode anstelle des Farbnamens übergeben.
Ausgang: Scatter_Plot_Colour.py
Beispiel 5: Streudiagramm -Farbänderung gemäß der Kategorie
Wir können auch die Farbe der Datenpunkte entsprechend der Kategorie ändern. In diesem Beispiel werden wir das erklären.
# colour_change_by_category.pyDer obige Code ähnelt den vorherigen Beispielen. Die Zeilen, in denen wir Änderungen vorgenommen haben, werden unten erklärt:
Zeile 12: Wir setzen die gesamten Datenpunkte entweder in die Kategorie von Country_1 oder Country_2 ein. Dies sind nur Annahmen und nicht der wahre Wert, um die Demo zu zeigen.
Zeile 17: Wir haben ein Wörterbuch der Farbe erstellt, das jede Kategorie darstellt.
Zeile 18: Wir kartieren die Kategorie Land mit ihrem Farbnamen. Und in der folgenden Druckanweisung werden Ergebnisse wie diese angezeigt.
["Blau", "Blau", "Orange", "Orange", "Orange", "Orange", "blau", "blau", "orange", "blau"]Zeile 24: Endlich übergeben wir die colour_list (Zeile 18) an die Streufunktion.
Ausgang: colour_change_by_category.py
Beispiel 6: Ändern Sie die Kantenfarbe des Datenpunkts
Wir können auch die Kantenfarbe des Datenpunkts ändern. Dafür müssen wir das Schlüsselwort der Kantefarbe verwenden („EdgeColor“). Wir können auch die Linienbreite der Kante einstellen. In den vorherigen Beispielen haben wir kein EdgeColor verwendet, was standardmäßig keine ist. Es zeigt also keine Standardfarbe an. Wir werden den Datenpunkt Kantenfarbe hinzufügen, um den Unterschied zwischen den vorherigen Beispielen zu sehen.
# EdgeColour_Scatterplot.pyZeile 11: In dieser Zeile fügen wir nur einen weiteren Parameter hinzu, den wir EdgeColor und Linienbreite nennen. Nachdem beide Parameter hinzugefügt wurden, sieht unser Streudiagramm -Diagramm nun wie etwas aus, wie unten gezeigt. Sie können sehen, dass die Außenseite des Datenpunkts jetzt mit der schwarzen Farbe mit Linienbreite = 1 begrenzt ist.
Ausgang: EdgeColour_Scatterplot.py
Abschluss
In diesem Artikel haben wir gesehen. Wir haben alle wichtigen Konzepte erklärt, die zum Zeichnen einer Streuung erforderlich sind. Es könnte eine andere Möglichkeit geben, die Streudiagramme wie attraktivere Weise zu zeichnen, je nachdem, wie wir verschiedene Parameter verwenden. Die meisten der von uns abgedeckten Parameter waren jedoch, die Handlung professioneller zu zeichnen. Verwenden Sie auch nicht zu viele komplexe Parameter, die die tatsächliche Bedeutung des Diagramms verwechseln können.
Der Code für diesen Artikel ist unter dem folgenden GitHub -Link verfügbar:
https: // github.com/shekharpandey89/Streuplot-Matplotlib.Pyplot