Pandas DataFrame Map

Pandas DataFrame Map
Eine bemerkenswert schnelle und effektive Methode zum Verwalten und Erforschen der Daten wird von der Pandas Library angeboten. Pandas kann verschiedene Datensätze effizient kombinieren, damit wir bei der Bewertung der Daten nicht einmal auf Probleme stoßen. Pandas liefert Serien, Diktier und Datenrahmen. Die DataFrame -Spalten sollen auch die Serie sind. Wir verwenden die Methode "map ()", um die Spalte zu verbessern und dem Datenrahmen zurückzuweisen. Die Methode „MAP ()“ wird zum Zuordnen der Serienwerte in ihre entsprechenden Eingänge verwendet. Wir können auch zwei Serien derselben Länge zuordnen. Wir wenden diese Methode „map ()“ nicht an, um zwei Datenrahmen zuzuordnen. In diesem Handbuch wird die Methode „MAP ()“ für Sie untersucht, um zu erfahren, wie diese „map ()“ -Methode in Pandas funktioniert.

Syntax:

# Serie.map (arg, na_action = keine)

Beispiel 1:

Wir verwenden praktisch die Methode „map ()“ in unserem Pandas -Code. Wir importieren die Methode, die Pandas mithilfe des Schlüsselworts „Import“ anbietet, und setzen die "Pandas als PD" fest. Dies hilft uns in unserem Code, wo wir auf die Pandas -Methoden zugreifen müssen. Wir setzen nur „PD“ dazu ein, dies zu tun. Jetzt heißt diese Liste oder Serie, die hier erstellt wird, als "Score_Data" bezeichnet.Wir fügen den "First_Name" ein, der "Emma, ​​Robert, Leonard, Howard und Jessica" enthält. Als nächstes haben wir den "last_name", der "Edward, Samuel, Herry, William und Fowler" enthält. Wir fügen "42, 36, 46, 45 und 39" in der Liste "Alter" hinzu.

Danach haben wir die "Score_1 und Score_2", in der wir "9, 8, 6, 7, 5" bzw. "28, 45, 59, 62, 70" hinzufügen. Wir ändern diese "Score_Data" in den "Score_DF" und erwähnen den "First_Name, last_name, Alter, Score_1 und Score_2" als Spalten. Es wird also als Header des Datenrahmens festgelegt. Wir drucken das "Score_DF" auf dem Terminal. Danach machen wir ein Wörterbuch der „Probanden“ und fügen die Betreffnamen ein, indem wir den First_Name mit dem Betreffnamen erwähnen. Im Wörterbuch fügen wir die "Computer, Chemie, Mathematik, Astronaut und Naturwissenschaften" hinzu, indem wir den „First_Name“ zusammen mit diesem erwähnen. Jetzt kartieren wir dieses Wörterbuch dem zuvor erwähnten "Score_DF".

Wir erstellen eine neue Spalte mit dem Namen "Subjekte". Wir erwähnen die Spalte "First_Name" und verwenden die Methode "map ()", um die Probanden in dieses "Score_DF" zuzuordnen. Nach dem Zuordnen der Subjektspalte in die "Score_DF" zeigen wir den „Score_DF“ an. Dies wird nur angezeigt, wenn wir die Methode „print ()“ verwenden.


Jetzt kompilieren und führen wir diesen Pandas -Code in „Spyder“ zusammen und führen wir aus. Es gibt zwei Möglichkeiten, diesen Code auszuführen. Einer von ihnen besteht darin, die Schlüssel "Shift+ Enter" zu drücken, und der andere ist, den Code auszuführen, indem Sie auf die Schaltfläche "Ausführen" der "Spyder" -App klicken. Nach der Ausführung erhalten wir die angegebene Ausgabe. Der erste Datenrahmen enthält fünf Spalten. Wir haben die Spalte mit Hilfe der Methode „map ()“ auf diese "Score_DF" zugeordnet, die auch in der folgenden Abbildung angezeigt wird:

Beispiel 2:

Jetzt beginnen wir ein neues Beispiel, indem wir die „Pandas als PD“ importieren und eine verschachtelte Liste erstellen, die als "AC_LIST" bezeichnet wird. Diese verschachtelte Liste besteht aus drei Spalten mit dem Namen "AC_NAME, AC_NUM, JETZT". Der "Ac_Name" hat die Namen "James, Melissa, Farnham, Samuel, Bromley, Coghill und Fuller". Das "AC_NUM" enthält die Zahlen des Kontos als "AC4319, AC1234, AC3498, AC4525, AC4439, AC2624 und AC1501". Im Anschluss fügen wir den Monat des Beitritts hinzu, "Juni, April, Mai, August, Februar, Januar und Dezember". Der "AC_LIST" wird in den Datenrahmen "AC_DF" geändert, da wir den "PD" verwenden.DataFrame ”. Wir setzen diese "AC_DF" der Methode "print ()" ein. Es wird gerendert, wenn wir den Code ausführen.

Danach erzeugen wir ein Wörterbuch und speichern es in „Geschlechtern“. Wir setzen die „männlichen und weiblichen“ Geschlechter für die Daten ein, die wir in die vorherige Liste eingefügt haben. Wir haben dieses Wörterbuch auch dem Datenrahmen zugeordnet, den wir erstellt haben. Um die "Geschlechter" in diese "AC_DF" zuzuordnen, erstellen wir zunächst eine neue Spalte namens "Geschlecht", erwähnen Sie die Spalte "Vorname" und verwenden dann die Methode "map ()". In dieser Methode setzen wir die „Geschlechter“ ein. Wir zeigen die "AC_DF" nach dem Zuordnen der Spalte "Geschlecht" darauf an. Dies wird nur angezeigt, wenn wir die Methode „Print ()“ verwenden.


Wir erhalten die angegebene Ausgabe, wenn der oben genannte Code ausgeführt wird. Drei Spalten bilden den ersten Datenrahmen. Anschließend kartieren wir die Spalte "Geschlecht" dieser "AC_DF" mit der "MAP ()" -Technik, die auch hier demonstriert wird. "Nan" wird angezeigt, was darauf hinweist, dass wir keinen Wert eingefügt haben.

Beispiel 3:

In diesem Beispiel erstellen wir die Pandas -Serie nach dem Importieren der Pandas. Wir generieren diese Pandas -Serie mit der „PD.Serienmethode von Pandas. Diese „PD“ greift auf diese "Serien" -Methode zu. Wir setzen einige Daten in diese Serie ein und speichern die Serie in der Variablen „Tiere“. Diese Serie enthält „Kaninchen, Kuh, Ratte, Hund, Maus und Bär“ darin.

Dann zeigen wir diese Serie an. Nachdem wir die Serie „Animals“ angezeigt haben, kartieren wir eine Zeile auf alle Werte der Serie. Wir verwenden die Methode "map ()" und fügen "Ich bin ein " ein,. Fügen Sie den Namen der Tiere einzeln in diesen lockigen Klammern ein. Drucken Sie sie dann aus, was bedeutet, dass diese Zeile mit allen Tiernamen angezeigt wird. Es macht die Serie nach der Zuordnung, wie sie in der Methode „Print ()“ geschrieben ist.


Sie können sehen, dass die Tiernamen in einer Serie gerendert werden. Dann ordnet es die Zeile, die wir zuvor mit allen Tiernamen geschrieben haben.

Beispiel 4:

Jetzt importieren wir die Pandas sowie die Numpy -Bibliothek, da wir in diesem Beispiel die Funktion oder Methode sowohl von Pandas als auch Numpy verwenden. Wir generieren die "c_list", die die "c_fee" und "c_dur" enthält. In der "c_fee" setzen wir "22000, 25000, 23000, NP.Nan und 26000 ”. Hier, „NP.Nan “bedeutet, dass wir diesen Wert aus der Numpy -Bibliothek erhalten. Dann setzen wir die Daten in den „C_Dur“ ein, der „20 Tage, 50 Tage, 40 Tage, 35 Tage und 45 Tage“ beträgt. Diese "c_list" wird in "c_df" konvertiert.

Anschließend wenden wir einige Funktionen in dieser „map ()“ -Methode an. Wir verwenden hier die "Lambda" -Methode und ersetzen 10% aus den Werten "c_fee". Dies wird in einer anderen Spalte gespeichert, die wir hier mit dem Namen "Gebühr" hinzugefügt haben. Wir haben diese "Gebühr" mit der Spalte "c_fee" zugeordnet. Dann verwenden wir die Methode "print ()". Die "c_df" wird angezeigt, sobald die Spalte "Geschlecht" darauf abgebildet ist.


Vor dem Mapping erschienen hier zwei Spalten. Wenn die Methode „map ()“ angewendet wird, wird mit diesen beiden Spalten eine neue Spalte „Gebühr“ eingefügt. Es zeigt den Wert nach dem Ersetzen von 10% aus den Werten „C_fee“. Anstelle von „Nan“ wird auch in der Spalte „Gebühr“ „Nan“ „Nan“ gemacht, da in der "c_fee", auf die die Berechnung angewendet wird, keinen Wert vorhanden ist.

Abschluss

Das Hauptziel dieses Leitfaden.Dieser Leitfaden erläuterte das Konzept der Funktion „MAP ()“ auf wohltemische Weise. Wir haben Ihnen gezeigt, wie Sie die Funktion „MAP ()“ in den Codes verwenden können. Wie wir erläutert haben, wird die Methode „MAP ()“ verwendet, um die Serienwerte in ihre entsprechenden Eingänge zuzuordnen. Wir haben vier Beispiele in diesem Handbuch veranschaulicht, in denen wir die Methode „MAP ()“ verwendet haben. Nachdem wir diesen Leitfaden gründlich gelernt haben, hoffen wir, dass Sie diese „MAP ()“ -Methode in Pandas leicht anwenden können.