pandas anwendenmap

pandas anwendenmap
Python ist eine hervorragende Sprache für die Durchführung von Datenanalysen, hauptsächlich aufgrund des starken Ökosystems von Python -Programmen, die sich auf den Umgang mit Daten konzentrieren. Ein solches Tool, Pandas, vereinfacht das Import und Analysieren von Daten erheblich. Jedes Element in einem Datenrahmen wird mit einer Funktion unter Verwendung der Methode applyMap () angewendet, die einen Skalar empfängt und zurückgibt. Der Hauptvorteil von Pandas ist die Fähigkeit, Daten zu transformieren und Analysen anzuwenden. Diese Funktionen (map (), applyMap () und apply ()) werden alle verwendet, um die Daten zu ändern, aber es gibt einige Unterschiede zwischen ihnen und subtil. Wir werden jedoch nur die applyMap () diskutieren.

So verwenden Sie die Funktion applyMap in Windows

Die einzelne Funktion ermöglicht die elementzielle Aktion während des gesamten Datenrahmens ist applyMap (), auf die nur in DataFrame zugegriffen werden kann.

Obwohl einige Szenarien dank der Optimierung schneller als anwenden () abschneiden.

Syntax:

Datenrahmen.ApplyMap (Func)

Parameter

Func: Ein einzelner Wert wird durch einen einzelnen Wert in einer Pythonfunktion zurückgegeben.

Ausgang: Transformierter Datenrahmen.

Nur der DataFrame definiert diese Technik. Der Datenrahmen.ApplyMap () akzeptiert nur Anrufable. Für Datenframes ist applyMap () elementun. ApplyMap () ist effizienter als Apply (). Ein Stück/Element gleichzeitig kann mit der Funktion applyMap () betrieben werden.

Beispiel 1: Verleihen Sie jedem Element des Datenrahmens den Wert mit applyMap ()

Importieren wir zuerst einen Online -Datensatz (IRIS_DATA), damit wir unsere Funktion anwendenmap () anwenden können, um die Ergebnisse anzuzeigen.

Sie müssen die Pandas importieren und das Objekt „PD“ zum Code hinzufügen, um die Pandas zu unterstützen. Einfache mathematische Verfahren sind vergleichsweise einfacher durchzuführen. Gemäß der von Ihnen definierten Achse wird das Funktionsargument bei Apply () für einen Datenrahmen zur gesamten Zeile oder Spalte verwendet. Was ist, wenn Sie eine bestimmte Funktion auf jede Datenrahmenkomponente anwenden möchten, anstatt nur jede Zeile und Spalte? In diesem Fall ist ApplyMap () hilfreich. Betrachten Sie eine Situation, in der ein Fehler begangen wurde, und Sie möchten ihn korrigieren, indem Sie jedes Element in Ihren Daten einfügen, da Sie festgestellt haben. Lassen Sie uns zunächst eine Helferfunktion definieren:

Wir haben eine add_one -Funktion definiert und das Element als Argument übergeben. Es wird Element + 1 zurückgegeben, was bedeutet, dass jeder Dateneingabe im Datensatz eine hinzugefügt wird. Wenden wir es auf jedes Element des ursprünglichen Datenrahmens an, ausgenommen die Zielspalte unter Verwendung von applyMap ().

Wenn Sie diese Ausgabe mit dem Original gegenüberstellen, werden Sie feststellen, dass bei jedem Eintrag einen hinzugefügt wurden. Es demonstriert das Funktionspotential von ApplicationMap ().

Beispiel 2: Berechnung der Länge jedes Elements des Datenrahmens mit applyMap ()

Genau wie beim vorherigen Beispiel werden wir Pandas und einen Datensatz importieren, um mit der Arbeit zu beginnen. Was verwendet nun die Funktion applymap ()? Funktioniert es auf Datenrahmen oder wendet eine Funktion auf jedes einzelne Element des Datenrahmens an? Zum Beispiel haben wir mit diesem Datenrahmen hier erstellt. Wir haben all diese unterschiedlichen Werte. Die Funktion applyMap () erfolgt eine gewisse Funktion und das Element, die sie in diesem gesamten Datenrahmen auf den einzelnen Wert ausführen und dann einen Datenrahmen mit dem Ergebnis dieser Funktion zurückgeben. Da Datenrahmen häufig Daten von verschiedenen Typen über verschiedene Spalten hinweg aufweisen, ist der ApplyMap () eine Funktion etwas seltener als die zu verwendende Funktion als die apply () oder map ().

Wie oben zu sehen, haben wir einige Zahlen in Spalten und einige Zeichenketten. Wenn wir also eine Funktion übergeben wollten, die nur mit Zahlen in applyMap () funktioniert, wird dies einen Fehler werfen, da sie für die Preisspalte gelten kann. Andere Spalten sind jedoch Zeichenfolge. Also würde es nicht daran funktionieren. Wir müssen sicherstellen. Im Folgenden haben wir eine Funktion definiert, die entweder auf Zahlen oder Zeichenfolgen funktionieren sollte:

Das vorherige Skript wandelt diese Zahlen mit der Funktion str () in eine Zeichenfolge um. Anschließend werden nur die Länge mit der Funktion len () überprüft. So können wir diese Funktion definieren. Wenn wir das an applyMap () übergeben, erhalten wir einen Datenrahmen als Ausgabe mit der Länge all dieser verschiedenen Einträge in unserem Datenrahmen.

Beispiel 3: Ändern/Ersetzen Sie die Werte der Datenrahmenelemente mit der Funktion applyMap ()

Die applyMap () -Funktion des Pandas verwendet eine benutzerdefinierte Funktion. Mit einem Wörterbuch können wir eine Lambda -Funktion erstellen, die einen neuen Wert für jedes Element im Datenrahmen als Ausgabe ergibt, um die Werte eines Datenrahmens zu aktualisieren. Wenden wir dieselbe Abbildung auf die Funktionen von Ersatz () und MAP () der Pandas -Bibliothek an, um die Werte in einem Datenrahmen durch diejenigen aus einem Wörterbuch zu ersetzen.

Durch die Verwendung der Funktion sample () im Zufallsmodul werden einige Beispieldaten erzeugt.

Jetzt wird ein Datenrahmen mit einem String -Datentyp erstellt.

Wir möchten einige Werte des Datenrahmens durch neue ersetzen. Hier werden wir ein Wörterbuch mit den neuen Werten aufbauen, die als Wörterbuchwerte und die alten Werte als Schlüssel dienen.

Wir können jetzt Werte Element für Element mit der Funktion pandas applyMap () aktualisieren. Die Lambda -Funktion wird als Eingabe in der Funktion applymap () übergeben. Die Eingabe der Lambda -Funktion ist ein Element, und seine Ausgabe ist das Ergebnis der Verwendung eines Wörterbuchs zur Abfrage des Schlüssels.

Infolgedessen erhalten wir einen Datenrahmen mit aktualisierten Werten.

Beispiel 4: Ändern Sie die Werte/Elemente eines Datenrahmens mithilfe der Funktion applyMap ()

Wir werden zuerst einen Datenrahmen mit bestimmten Zeilen und Spalten erstellen und die Namen seiner Indizes angeben.

Multiplizieren wir jedes Element des Datenrahmens mit 10.

Jede Komponente des DF -Datenframe. Die Funktion applyMap () empfängt eine Lambda -Funktion als Parameter und gibt ein Ergebnis zurück, indem Sie jeden Element oder Wert mit 10 multiplizieren. Infolgedessen werden die Elemente des DataFrame DF alle um 10 skaliert. Wenn für eine kurze Dauer eine namenlose Funktion benötigt wird, werden Lambda -Funktionen verwendet. Normalerweise verwenden wir es als Argument für eine Funktion höherer Ordnung in Python. Zusammen mit integrierten Methoden wie der ApplyMap () und Filter () werden Lambda-Funktionen verwendet.

Wir können verschiedene Vorgänge zusätzlich zu den mathematischen Komponenten des DataFrame -Komponenten anwenden.

Wie Sie im vorherigen Bild sehen können, haben wir das angehängt .99 zu jedem Wert innerhalb des DF -Datenrahmens. Wir können auch Zeichenfolgewerte verwenden, um die Daten anstelle von numerischen Daten anzuhängen.

Abschluss

In diesem Artikel haben wir gelehrt, wie Sie die Funktion applyMap () in Python mit der Pandas -Bibliothek verwenden können. Wir haben gesehen. Dies lehrte uns, wie man den Python Pandas DataFrame verwendet.applyMap () Methode. Wir haben Beispiele für diese Methode im DataFrame durchgearbeitet, um zu verstehen.