Hotcodierung bezieht sich auf die Konvertierung kategorieller Daten in Modelle, die Algorithmen für maschinelle Lernen verwenden können. In den meisten Fällen umfasst dies die Umwandlung jedes Kategoriewerts in einen Binärwert von 1 oder 0.
Das folgende Bild zeigt eine heiße Codierung.
Quelle: Kaggle
Sie können in der unten stehenden Ressource eine HOT-Codierung untersuchen:
https: // en.Wikipedia.org/wiki/one-hot
Beispieldaten
Beginnen wir mit dem Erstellen von Beispieldaten. Verwenden Sie zunächst den Beispielcode wie unten gezeigt:
Pandas als PD importierenImportieren Sie OneHoTencoder aus dem Sci-Kit-Learn, um eine HOT-Codierung durchzuführen, um wie gezeigt eine HOT-Codierung durchzuführen:
von Sklearn.Vorverarbeitung importieren OneHoTenCoderIm obigen Beispiel beginnen wir zunächst den OneHotenCoder aus Sci-kit-Learn. Anschließend erstellen wir eine Encoderinstanz und übergeben den Parameter von handle_UunkNOWN, um es zu ignorieren.
Schließlich erstellen wir einen neuen Datenrahmen aus den codierten Daten. Der obige Code sollte den neuen Datenrahmen wie gezeigt zurückgeben:
Sie können auch den codierten Datenrahmen mithilfe der Join -Methode als:
df = df.join (e_df)Der obige Code sollte zurückgeben:
Abschluss
Dieser Artikel deckt das Minimum an der Durchführung einer grundlegenden One-Hot-Codierung eines Pandas-Datenfreframe mit der Sci-Kit-Learn-Bibliothek ab.