Was möchten Sie erstellen?? Die wichtige Frage!
Sie sind hierher gekommen, um maschinelles Lernen (ML) zu verwenden . Haben Sie sorgfältig überlegt, wofür? Wenn Sie eine Bibliothek für maschinelles Lernen auswählen, müssen Sie damit beginnen, wie Sie sie verwenden werden. Auch wenn Sie nur am Lernen interessiert sind, sollten Sie überlegen, wo maschinelles Lernen verwendet wird und welches Ihr Hauptinteresse am nächsten liegt. Sie sollten auch überlegen, ob Sie sich darauf konzentrieren möchten, etwas auf Ihrem lokalen Computer in Gang zu bringen, oder ob Sie daran interessiert sind, Ihr Computing über viele Server zu verbreiten.
Beginnen Sie am Anfang an, etwas zum Laufen zu bringen.
Wo maschinelles Lernen verwendet wird
Sie können viele Projekte finden, die ML verwenden, in der Tat so viele, dass jede Kategorie die Seiten lang ist. Die Kurzversion ist "überall", das ist nicht wahr, aber man beginnt sich zu wundern. Die offensichtlichen sind Empfehlungsmotoren, Bilderkennung und Spam -Erkennung. Da Sie bereits in Python programmieren, interessieren Sie sich auch für die Kite -Code -Completion -Software. Dies ist weiterhin verwendet, um Fehler aus manueller Dateneingabe, medizinische Diagnose und Wartung für große Fabriken und andere Branchen zu erkennen
Kurz gesagt die Bibliotheken:
- Scikit-Learn, Von scikit; Routinen und Bibliotheken über Numpy, Scipy und Matplotlib. Diese Bibliothek stützt sich direkt auf Routinen der in Python beheimateten mathematischen Bibliotheken. Sie installieren Scikit-Learn mit Ihrem regulären Python-Paketmanager. Scikit-Learn ist klein und unterstützt keine GPU-Berechnungen, dies kann Sie dazu bringen, aber es ist eine bewusste Wahl. Dieses Paket ist kleiner und leichter zu beginnen mit. In größeren Kontexten funktioniert es immer noch ziemlich gut.
- Scikit-Image Besonders für Bilder! Scikit-Image verfügt über Algorithmen zur Bildanalyse und -manipulation. Sie können es verwenden, um beschädigte Bilder zu reparieren und Farbe und andere Attribute des Bildes zu manipulieren. Die Hauptidee dieses Paket. Auf diese Weise haben Sie die Bilder als Daten zum Ausführen von Algorithmen verfügbar.
- Shogun: C ++ Basis mit klaren API -Schnittstellen zu Python, Java, Scala usw. Viele, vielleicht die meisten Algorithmen zum Experimentieren. Dieser ist in C ++ für Effizienz geschrieben. Es gibt auch eine Möglichkeit, es in der Cloud zu versuchen. Shogun verwendet SWIG, um mit vielen Programmiersprachen, einschließlich Python. Shogun deckt die meisten Algorithmen ab und wird in der akademischen Welt ausgiebig verwendet. Das Paket verfügt über eine Toolbox unter https: // www.Shogun-Toolbox.Org.
- Funken MLLIB: Ist hauptsächlich für Java, ist aber über Numpy Library für Python -Entwickler erhältlich. Das Spark MLLIB wird vom Apache -Team entwickelt, sodass es auf verteilte Computerumgebungen abzielt und mit Master und Arbeitern ausgeführt werden muss. Sie können dies im Standalone -Modus tun, aber die wahre Leistung von Funken ist die Fähigkeit, die Jobs über viele Maschinen zu verteilen. Die verteilte Natur von Spark macht es bei vielen großen Unternehmen wie IBM, Amazon und Netflix beliebt. Der Hauptzweck besteht darin, „Big Data“ abzubauen. Dies bedeutet, dass all diese Brotkrumen, die Sie beim Surfen und Online -Einkaufen hinterlassen haben. Wenn Sie mit maschinellem Lernen arbeiten möchten, ist Spark MLLIB ein guter Ausgangspunkt für den Start. Die von ihr unterstützten Algorithmen sind über den gesamten Bereich verteilt. Wenn Sie ein Hobbyprojekt starten, ist es möglicherweise nicht die beste Idee.
- H2O: Es richtet sich an Geschäftsprozesse. Das Geschäft, H20.AI zielt darauf ab, Datensätze aus verteilten Dateisystemen zu finden und zu analysieren. Sie können es auf den meisten herkömmlichen Betriebssystemen ausführen, aber der Hauptzweck besteht darin, Cloud-basierte Systeme zu unterstützen. Es enthält die meisten statistischen Algorithmen, die daher für die meisten Projekte verwendet werden können.
- Mahout: Ist für verteilte Algorithmen für maschinelles Lernen gemacht. Es ist Teil von Apache aufgrund der verteilten Art der Berechnungen. Die Idee hinter Mahout besteht darin, dass Mathematiker ihre eigenen Algorithmen umsetzen. Dies ist nicht für Anfänger. Wenn Sie nur lernen, können Sie etwas anderes verwenden. Trotzdem kann Mahout eine Verbindung zu vielen Backends herstellen. Wenn Sie also etwas erstellt haben.
- Cloudera oryx: Hauptsächlich zum maschinellen Lernen für Echtzeitdaten verwendet. Oryx 2 ist eine Architektur, die die gesamte Arbeit zum Erstellen eines Systems schichtet, das auf Echtzeitdaten reagieren kann. Die Ebenen arbeiten auch in verschiedenen Zeitrahmen, mit einer Chargenschicht, die das Basismodell erstellt, und eine Geschwindigkeitsschicht, die das Modell modifiziert. Oryx basiert auf Apache Spark und erstellt eine gesamte Architektur, die alle Teile einer Anwendung implementiert.
- Theano: Theano ist eine Python -Bibliotheken, die in Numpy integriert ist. Dies ist Python am nächsten, das Sie bekommen können. Wenn Sie Theano verwenden, wird empfohlen, GCC installieren zu lassen. Der Grund dafür ist, dass Theano Ihren Code in den am besten geeigneten Code kompilieren kann. Während Python großartig ist, ist C in einigen Fällen schneller. So kann Theano zu C konvertiert und kompiliert werden, was Ihr Programm schneller läuft. Optional können Sie den GPU -Support hinzufügen.
- Tensorflow: Der Tensor im Namen zeigt auf einen mathematischen Tensor. Ein solcher Tensor hat 'n' Orte in einer Matrix. Ein Tensor ist jedoch ein mehrdimensionales Array. TensorFlow hat Algorithmen, um Berechnungen für Tensoren durchzuführen, daher können Sie diese von Python anrufen. Es ist in C und C ++ eingebaut, hat aber ein Front-End für Python. Dies erleichtert einfach zu bedienen und schnell zu laufen. TensorFlow kann auf CPU, GPU oder über Netzwerke verteilt werden. Dies wird durch eine Ausführungs -Engine erreicht, die als Ebene zwischen Ihrem Code und dem Prozessor fungiert.
- Matplotlib: Wenn Sie ein Problem entwickelt haben, das Sie mit maschinellem Lernen lösen können, möchten Sie höchstwahrscheinlich Ihre Ergebnisse visualisieren. Hier kommt Matplotlib ins Spiel. Es soll Werte mathematischer Grafiken zeigen und in der akademischen Welt stark eingesetzt werden.
ABSCHLUSS
Dieser Artikel hat Ihnen eine Vorstellung davon gegeben, was für das Programm in maschinellem Lernen verfügbar ist. Um ein klares Bild von dem zu machen, was Sie brauchen, müssen Sie zunächst ein paar Programme erstellen und sehen, wie sie funktionieren. Wenn Sie wissen, wie die Dinge getan werden können, können Sie die perfekte Lösung für Ihr nächstes Projekt finden.