Die Kerneldichteschätzung (KDE) ist eine Technik zur Darstellung der bedingten Verteilung der linearen und nichtlinearen Eingabeparameter. Die KDEPLOT () -Methode gibt eine viel weniger komplexe, bessere semantische Grafik zurück, wenn wir zahlreiche Dispersionen anzeigen möchten. Verschiedene Datensätze waren zu sehen, bei denen eine grafische Darstellung in KDE verwendet wurde. Es ist eine viel effektivere Form der visuellen Analyse. Die Kerneldichteschätzung (KDE) ist ein prädiktives Modell für die Berechnung und Visualisierung der hinteren Wahrscheinlichkeit einer diskreten Variablen. Die Analyse ist keine Annahmen bezüglich des Datensatzes, einschließlich der Frage, ob sie die Anforderungen eines Standards oder einer Wahrscheinlichkeit widerspiegelt.
Die Schätzung der Kerneldichte ist eine vereinfachte Histogrammversion, die nicht die Verteilungslinie und die jeweiligen Endpunkte enthält. Das Erstellen verschiedener Zahlen für die Datensätze und das Kombinieren von Personen, um eine vollständige Form zu erstellen.
Seeborn ist ein Programmiergerüst wie Matplotlib. Seeborn könnte zur Visualisierung mit den Pandas und Numpy -Modulen verwendet werden. Datenanalysten verwenden Toolkits, um relevante und ansprechende analytische, grafische Darstellungen vorzunehmen. Mit Hilfe der KDEPLOT () -Methode der Seeborn -Bibliothek können wir beschreibende und inferentielle statistische Grafiken zeichnen.
Wir werden untersuchen, wie man Seeborn nutzt, um die KDE. Um das KDE -Graph -Layout zu veranschaulichen, werden in diesem Artikel einige Instanzen aus den Originaldaten verwendet.
Beispiel 1
Wir können das Modell mithilfe des Seeborn -Pakets validieren, indem wir die Standard -KDEPLOT () -Methode aufrufen. Wir haben im folgenden Szenario 2500 Sequenzdaten mit dem randomisierten Modul gesammelt. Dann hat diese in einem Numpy -Datenrahmen platziert, da das Seeborn -Paket ausschließlich mit dem Numpy -Modul und dem Pandas -Modul interagiert. Der SEABORS -Beispielcode für diese Instanz ist unten angebracht:
Wir beginnen das Programm, indem wir die erforderlichen Header -Dateien integrieren. Die Seeborn -Header -Datei wird als SN, Matplotlib integriert.Pyplot wird als PLT integriert und Numpy wird als NP integriert. Im nachfolgenden Schritt haben wir den Datensatz von 2500 Einträgen angegeben. Dies kann durch die Verwendung der Randn () -Methode der Numpy -Bibliothek erreicht werden.
Wir haben die Funktion kdeplot () verwendet, um ein KDE -Diagramm zu zeichnen. Diese Funktion hängt mit dem Seeborn -Paket zusammen. Wir haben den Datenrahmen, die Farbe und den Schatten als Argumente der Funktion kdeplot () bereitgestellt. Hier setzen wir den Wert des Schattens als "wahr" und den Wert der Farbe als "lila" fest. Dieser Code wird beendet, indem die Funktion show () des Matplotlib aufgerufen wird.Pyplot -Modul. Diese Funktion repräsentiert das endgültige Diagramm.
Beispiel # 2
Durch die Verwendung der Funktion KDEPLOT () und des Seeborn -Frameworks könnten wir den Datensatz diagonal darstellen oder das resultierende Diagramm umkehren. Um die Anzeige umzukehren, haben wir den Graph Parameter vertikal = true verwendet. Der SEABORS -Beispielcode für diese Instanz ist unten angebracht:
Zuerst haben wir die Bibliotheken importiert: Seeborn, Matplotlib.Pyplot und Numpy. Wir müssen die 1000 Datensammlungen definieren. Die Randn () -Funktion der Numpy Library kann verwendet werden, um dies zu erreichen. Um eine KDE -Karte zu erstellen, haben wir die KDEPLOT () -Methode verwendet. Das Seeborn -Modul ist mit dieser Funktion verbunden. Die KDEPLOT () -Methode hat verschiedene Argumente: einen Datenrahmen, eine Farbe und einen Schatten. Wir möchten, dass die Handlung in diesem Fall vertikal gezogen wird. Infolgedessen haben wir das "vertikale" Argument verwendet und seinen Wert auf "wahr" festgelegt.
Wir haben den Schattenwert an "True" und den Farbwert an "Grün" angepasst. Dieser Code würde durch Ausführung des Matplotlibs beendet.show () -Funktion des Pyplot -Moduls. Die endgültige Grafik wurde mit Hilfe dieser Methode dargestellt.
Beispiel # 3
Wir nehmen die beiden Parameter in die KDEPLOT () -Funktion des Seeborn -Pakets ein, um die multivariate Regressions -KDE -Diagramm für abhängige Parameter zu konstruieren. Die Funktion kdeplot () wird verwendet, um Daten zu zeichnen. In dem nachfolgenden Code werden wir zeigen, wie Sie eine multivariate Regressionsplot erhalten. Der SEABORS -Beispielcode für diese Instanz ist unten angebracht:
Die Header -Dateien müssen zu Beginn des Skripts enthalten sein. Die PD würde von der Pandas -Bibliothek importiert, SNS würde von der Seeborn -Bibliothek importiert und PLT mit Hilfe von Matplotlib importiert.Pyplot. Zusammen mit all diesen schließen wir ein Matplotlib -Inline -Modul ein.
Im nächsten Schritt werden wir die Datensätze sowohl für die X-Achse als auch für die y-Achse definieren. Wir definieren die Sets, indem wir die Randn () -Methode der Numpy -Bibliothek aufrufen. Jetzt haben wir die Funktion kdeplot () angerufen, um die KDE -Graphen zu zeichnen. Wir haben die Datensätze beider Achsen als Parameter dieser Methode gegeben. Die Funktion show () wird verwendet, um das resultierende Diagramm zu veranschaulichen:
Beispiel # 4
Unser Code verwendet das "CBAR" in diesem Kontextargument. Wenn der Wert von "CBAR" wahr ist. Leider erlaubt es irgendwie keine Visualisierungen mit einem Farbparameter. Der SEABORS -Beispielcode für diese Instanz ist unten angebracht:
Nach der Einführung der erforderlichen Bibliotheken Pandas, Seeborn, Numpy und Matplotlib.Pyplot wurden sowohl die X-Achse als auch die Y-Achse-Datenrahmen angegeben. Die Sets werden definiert, während die Randn () -Funktion der Numpy Library verwendet wird. Wir haben das Tool KDEPLOT () aufgerufen, um das KDE -Diagramm zu zeichnen. Diese Methode ist eine Komponente des Seeborn -Pakets. Die Parameter dieser Methodik sind die Datensätze aus beiden Achsen. Wir haben das CBAR -Argument an die KDEPLOT () -Methode übergeben. Die messen () -Methode wird verwendet, um die erhaltene Grafik zu visualisieren.
Abschluss
In diesem Artikel haben wir die KDE -Diagrammpräsentation mit dem Pandas -Modul und dem Seeborn -Paket verwendet. In einem 1D -KDE -Diagramm haben wir beobachtet, wie das probabilistische Modell eines und vieler Variablen dargestellt werden kann. Wir haben darüber gesprochen, wie man einen 2D -Datensatz darstellt, indem wir das KDE -Layout mit dem Seeborn -Framework verwenden. Wir haben auch die KDEPLOT () -Methode mit einigen Parametern zur Verfügung gestellt, um zu beobachten, wie sie die Karte beeinflusst haben.