Scipy K-Means

Scipy K-Means
Die Python-Programmiersprache ist heutzutage die am häufigsten verwendete Sprache, da die freien Bibliotheken die Entwickler anziehen. Anfänger und Expertenentwickler arbeiten lieber in Python als in einer anderen Programmiersprache auf hoher Ebene. Scipy ist eine dieser unglaublichen Bibliotheken von Python, die die Programmierung einfacher und einfacher machen. Die Scipy -Bibliothek basiert auf der Numpy -Bibliothek und erweitert ihre Funktionen und Methoden. Hier werden wir die Scipy K-Means-Methode untersuchen. Um Ihnen zu helfen, wie Sie die K-Means-Algorithmusfunktionen in einem Python-Programm verstehen, zeigen wir Ihnen einige klare und praktische Beispiele.

Was ist in Python003f Clustering?

Das allgemeine Konzept des Clustering besteht darin, Gruppen ähnlicher Datenarten zu erstellen. Es ist der Prozess, die Daten mit den gleichen Eigenschaften in verschiedene Arten von Clustern zu trennen. Gesundheitswesen, Finanzen, Einzelhandel und andere Bereiche verwenden die Clustering -Techniken häufig, um die verschiedenen analytischen Aufgaben auszuführen. Das Clustering in Python führt mit Hilfe extrem einfacher Algorithmen dieselben Funktionen durch. In Python gibt es viele Methoden zum Clustering. Wir widmen diesen Artikel dem K-Means-Modul. Mit Hilfe von Beispielen werden wir daher etwas über das K-Means-Clustering der Scipy-Bibliothek erfahren.

Was ist der K-Means-Clustering-Algorithmus?

Es benötigt einen Datensatz und die Anzahl der Cluster, die als Eingabe erstellt werden können, und gibt die angegebene Anzahl von Clustern der angegebenen Daten zurück. Es folgt dem euklidischen Entfernungsmechanismus, um die Cluster zu machen. Zunächst findet der K-Means-Algorithmus das Cluster-Zentroid, kategorisiert dann jedes Element in seinem nächsten Mittelwert, wiederholt den Vorgang für die angegebene Anzahl der Clusterzeiten und erstellt die angegebene Anzahl von Clustern der angegebenen Daten.

Was ist Scipy K-Means Clustering?

Die Scipy-Bibliothek bietet eine K-Means-Clustering-Technik, die den gleichen Partitionierungsansatz ist. Im berechneten Schwerpunkt haben alle Datenpunkte den gleichen durchschnittlichen Abstand von der Mitte des Clusters. Die Scipy Library bietet zwei Clustering -Pakete, VQ und Hierarchie, die unterschiedliche Clustering -Methoden bieten. Der Cluster.Die VQ-Clustering-Verpackung ist das Vektor-Quantisierungsmodul, das die K-Means-Clustering-Methode liefert. Die Quantisierung der Vektor ist sehr hilfreich bei der Verzerrung und Verringerung der Verbesserung der Genauigkeit. Um Cluster mit der K-Means-Methode der Scipy-Bibliothek herzustellen, müssen wir die folgenden Schritte ausführen:

Installieren Sie zunächst das Scipy -Paket mit der folgenden Anweisung:

Es ist sehr wichtig, dass alle Bibliotheken installiert werden, bevor sie eine Funktionsmethode der Bibliothek verwenden. Wenn Sie die Scipy -Bibliothek noch nicht installiert haben, installieren Sie sie mit der PIP Install -SCIPY -Anweisung. Danach geben Sie die Daten an, um den Cluster und die Anzahl des Clusters zu erstellen, der ebenfalls hergestellt werden soll. Normalisieren Sie dann die Daten mit der folgenden Anweisung:

Hier wird die Whiten -Funktion von VQ -Paketen verwendet, um die Daten zu normalisieren. Der Parameter „Daten“ repräsentiert die Eingabedaten und der Parameter „CF“ wird verwendet, um zu überprüfen, ob die Eingabedaten nur endliche Zahlen enthalten oder nicht. Der nächste Schritt besteht darin, den Schwerpunkt der bereitgestellten Daten zu lokalisieren. Die folgende Anweisung wird verwendet, um den Schwerpunkt der Daten zu berechnen:

Die Parameter „Daten“ und „CF“ entsprechen der Whiten -Funktion und stellen dieselben Informationen dar. Die zusätzlichen Parameter sind „K“, „Iterationen“ und „Schwellenwert“, wobei k die Anzahl der zu erstellenden Cluster darstellt, die Iteration die Anzahl der Iterationen darstellt. Lassen Sie uns nun ein Beispiel demonstrieren, damit wir praktisch sehen können, wie die K-Mittelfunktion funktioniert.

Beispiel:

Hier geben wir ein Beispiel, um die Schritte zu demonstrieren, die wir zuvor erklärt haben. Wenn Sie ein vollständiges praktisches Beispiel haben, können Sie das Konzept leicht verstehen. Verweisen wir im folgenden Screenshot auf den angegebenen Code:

Da wir die Scipy -Bibliothek bereits installiert haben, müssen sie nicht explizit wieder installiert werden. Die erste Codezeile wird verwendet, um die Numpy -Bibliothek als „NP“ im Programm zu importieren. Danach die Skipei.Cluster.Das VQ -Paket wird in das Programm importiert, um die Module Whiten, Kmeans und VQ zu verwenden. Die Variable „Daten“ wird mit einem 2-D-Array initialisiert, das dann für die Datennormalisierung an die Whiten-Funktion übergeben wird. Die normalisierten Daten können in der Ausgabe angezeigt werden, da die Druckanweisung zum Anzeigen verwendet wird.

Die Kmeans () -Funktion berechnet den Schwerpunkt der angegebenen Daten. Die angegebenen Daten werden an die KMEANS -Funktion mit der Anzahl der zu erstellenden Cluster übergeben. Der Zentroidwert für jedes Datenelement kann auch in der Ausgabe angezeigt werden, da die Druckanweisung verwendet wird, um sie anzuzeigen. Der Mittelwert der Daten wird auch in der Ausgabe mit der Druckanweisung genommen und angezeigt.

Zum Clustering wird schließlich die VQ -Funktion verwendet. Die angegebenen Daten und berechneten Schwerpunktwerte werden an die VQ -Funktion übergeben und in der Ausgabe unter Verwendung der Druckanweisung angezeigt. Um die vollständige Ausgabe an einem Ort zu erhalten, können Sie sich auf den folgenden Screenshot beziehen:

Wie Sie sehen können, haben wir zuerst die normalisierten Daten, die von der Whiten -Funktion zurückgegeben werden. Dann haben wir die Schwerpunkte für jeden Datenwert. Danach wird der Mittelwert der Daten bereitgestellt, gefolgt von den Cluster -Indizes. Sie können diesen Code in jedem Python -Compiler in Ihrem System wie Spyder, Pypy, Jupiter usw. ausführen. Sie können auch die Online -Compiler wie Collaboratory verwenden, das auch als Colab bekannt ist.

Abschluss

Dieser Artikel ist dem K-Means-Clustering-Algorithmus gewidmet. Hier haben wir etwas über Clustering, K-Means-Clustering und K-Means-Cluster mit der Scipy-Bibliothek gelernt. Zuerst haben wir das grundlegende Konzept des Clustering gelernt. Dann haben wir die spezifische K-Means-Clustermethode untersucht. Schließlich haben wir die vollständige K-Means-Methode der Scipy Library gelernt. Wir haben auch ein Beispiel gezeigt, um jeden Schritt zu erklären.