So verwenden Sie die Funktion ordnungsgemäß () in Pandas
Um die Funktion ordnungsgemäß () in Pandas zu verwenden, müssen wir zunächst ihre Syntax verstehen.
Syntax: DataFrame.zuweisen (** Schlüsselwortargumente, Selbst)
Wo,
Keyword -Argumente: Die Spaltennamen und Schlagworte dienen als Keyword -Argumente. Wenn die Qualitäten aufgerufen werden können, verarbeitet der DataFrame sie und weist sie den neuen DataFrame -Spalten zu. Auch wenn Pandas es nicht überprüft, kann der Callable den Eingabedatenrahmen nicht ändern. Wenn die Eigenschaften, wie Serien oder Cluster, nicht abrufbar sind. In gewissem Sinne werden sie zugeteilt. Ein Wörterbuch mit Zeichenfolgen oder Listen kann als Schlüsselwortargumente verwendet werden.
selbst: Es gibt einen völlig neuen Datenrahmen mit Spalten zurück, die zu vorhandenen als Ausgabe hinzugefügt wurden.
Wir können jetzt verstehen, wie die Funktion von pandas ordnungsgemäß () funktioniert. In jedem Fall können wir die Größe unseres Datenrahmens nicht wesentlich reduzieren von Blöcken. Wir haben den Prozess der späteren Entmutigung dieser Segmente vereinfacht. Wir haben hier unglaublich wenige Eigenschaften. Wenn wir also eine Fähigkeit erstellen, die eine Teilmenge einer Spaltenuntergruppe einnimmt und versucht, sie in die kleinste Form zu bestimmen, die es annehmen kann, sollte es in der Lage sein, zu arbeiten. Die folgenden Beispiele helfen Ihnen, es besser zu verstehen.
Beispiel 1: Verwenden Sie die Funktion von ordnungsgemäßen () in Pandas
Die Temperatur wird in diesem Beispiel unter Verwendung der Methode AIMISION () berechnet. Während das Numpy -Modul hauptsächlich mit numerischen Daten funktioniert, funktioniert das PANDAS -Modul hauptsächlich mit tabellarischen Daten. Nach dem Importieren der Module erstellen wir einen Datenrahmen, auf den wir die Funktion ordnen () anwenden können.
Die Lambda -Funktion hat das gleiche Potenzial, sich als Standardfunktion zu verhalten, die unter Verwendung des Def -Schlüsselworts von Python angegeben wird. Wir können unseren Datenrahmen mithilfe der Funktion print () sehen und den Namen unseres Datenrahmens nach der Anwendung der Funktion von telizen () (), i.e., "DF_SIGN" als Argument in der Print () -Funktion. Sie können es auch veranschaulichen, indem Sie nur den Namen des Datenrahmens schreiben.
Numpy wird nach Pandas im zuvor erwähnten Skript importiert. Die Temperaturen der beiden Länder werden dann aufgezeichnet, wenn wir den Index von DataFrame und DataFrame für sie generieren. Schließlich verwenden wir die Methode AIMAIL (), um die Temperaturen mithilfe der bereitgestellten Gleichung des Programms zu berechnen. Wenn wir die Druckfunktion zuweisen, berechnet die DF -Variable, die den Datenrahmen darstellt, die mathematische Gleichung und druckt die zuvor angezeigte Ausgabe aus. Die Funktion Astromie () kalibriert die Gleichung, die Variablen berücksichtigt. Um von Grad Fahrenheit in Grad Celsius zu konvertieren, wird 32 zu den Werten dieser Variablen „A“ zusammen mit Lambda hinzugefügt. Dann vervollständigt der Befehl diese Gleichung und gibt die Ergebnisse aus.
Beispiel 2: Neue variable Erstellung und eine konstante Zuordnung
Bevor Sie eines dieser Beispiele ausführen, müssen Sie Pandas importieren und den erforderlichen Datenrahmen erstellen.
Wir haben unseren Datenrahmen "S-DATA" bezeichnet. Dieser Datenrahmen enthält Variablen für Verkauf und Ausgaben sowie simulierte Daten für den Verkauf für jede Person. Hier können wir einige zusätzliche Variablen hinzufügen, indem wir die Methode zuweisen () verwenden ().
Wenn alle Personen in diesem Datensatz von demselben Unternehmen oder Unternehmen verwendet werden, müssen Sie mit diesen Informationen arbeiten. Im Gegensatz zu „S_Data“, die nur Daten von Mitarbeitern enthält, die für dasselbe Unternehmen arbeiten, haben andere Datenrahmen möglicherweise Aufzeichnungen für Verkäufer, die für verschiedene Unternehmen arbeiten. Was ist, wenn wir eine Variable für die Personen in diesem Datenrahmen erstellen wollten, die ihren Firmennamen enthielten?? Mit der Funktion ordnungsgemäß () können wir Folgendes erfüllen:
Wir haben in diesem Fall eine neue Variable mit dem Namen "Business" hinzugefügt. Der Wert der Geschäftsvariablen ist für jede Datenreihe gleich. Es heißt „Hardware“ als Wert. Technisch gesehen ist der Wert für jede Zeile gleich. Es ist ein Stringwert, genauer zu sein. Nachdem wir festgestellt haben, dass wir beim Erstellen von Variablen mit konstanten Werten mit kontinuierlichen numerischen Daten oder Wert eine neue Variable zuweisen können, zusätzlich zum Hinzufügen von Textwerten wie in diesem Beispiel.
Beispiel 3: Fügen Sie eine berechnete Wertvariable mit der Methode von AIMAIL () hinzu
In diesem Beispiel werden wir denselben Datenrahmen "S_DATA" verwenden. Genauer gesagt, wir werden „Gewinn“ als neue Variable, gleiche Umsatzkosten hinzufügen (Finanz- und Buchhaltungsexperten werden wissen, dass dies keine genaue Methode zur Berechnung des Gewinns ist. Wir werden diese verzerrte Berechnung jedoch als Beispiel verwenden.).
Mit diesem Code erhalten wir die folgende Ausgabe:
In diesem Fall haben wir eine neue berechnete Spalte mit dem Namen "Profit" hinzugefügt. Der Gewinn ist, wie man gesehen werden kann. Denken Sie jedoch daran, dass wir die Namen „s_data verwenden müssen.Verkäufe “und„ S_Data.Ausgaben “, um sich auf die Umsatz- und Aufwandsvariablen innerhalb von ASSIGN () zu beziehen (). Wir könnten sie auch als "s_data [" Ausgaben "] und" S_Data ["Sales"] bezeichnen ". Sie können alle auswählen, aber für dieses Beispiel wird die zuvor gezeigte Verwendung verwendet.
Beispiel 4: Hinzufügen mehrerer Spalten mithilfe von AIMISION () -Funktion
Wir werden in diesem Beispiel zwei Variablen gleichzeitig hinzufügen. Die Variablen „Geschäft“ und „Gewinn“ werden hinzugefügt. Wir werden denselben Datenrahmen früherer Beispiele 2 und 3 verwenden, ich.e., s_data.
Die Variablen „Gewinn“ und „Geschäft“ werden in diesem Beispiel gleichzeitig hinzugefügt. Sie werden sehen, dass wir in Bezug auf die Syntax eine neue Codezeile für die zweite Variable gestartet haben. Sie können Ihren gesamten Code in einer einzigen Zeile aufbewahren, wenn Sie möchten, obwohl ich ihn nicht besonders vorschlage. Direktes Überschreiben Ihrer ursprünglichen Daten ist eine weitere Option.
Führen Sie einfach die Methode zu und senden Sie die Ergebnisse an den im Original DataFrame -Namen angegebenen Datenrahmen „S_DATA“. In bestimmten Situationen ist dies völlig angemessen. Möglicherweise möchten Sie Ihre Daten gelegentlich insgesamt ersetzen.
Abschluss
Wir werden zusammenfassen, indem wir sagen, dass die Funktion von teliate () in Pandas es uns ermöglicht, verschiedene Zuordnungen auszuführen, während wir eine Wortreferenz der Abschnittsnamen erstellen. In diesem Tutorial haben wir verschiedene Beispiele implementiert, um Ihnen beizubringen, wie Sie die Funktion von telizen () (), wie Sie eine neue Spalte mit konstantem Wert oder Daten hinzufügen, wie Sie eine Spalte mit berechneten Werten hinzufügen und mehrere Spalten in einem DataFrame hinzufügen, hinzufügen Verwenden Sie die Funktion ordnungsgemäß ().