Mit diesem Tool können wir den Datentyp von: ändern:
So verwenden Sie die Funktion astype () in Pandas
Um die Funktion astype () zu verwenden, müssen wir zunächst ihre Syntax verstehen. Sowohl Serienobjekte als auch Datenrahmen können mit der Astype -Methode verwendet werden. Die Syntax für ASType in der Serie und Astype in den Spalten des Datenrahmens lautet wie folgt:
Syntax der Asttype () -Funktion in Serien
Geben Sie einfach den Seriennamen ein, gefolgt von der „DOT -Syntax“ der Asttype () -Funktion, um die Methode für eine Serie aufzurufen.
Syntax:
Syntax der Asttype () -Funktion in DataFrame -Spalten
Wir müssen zunächst den Namen des Datenrahmens eingeben, bevor wir die Asttype () -Methode „DOT -Syntax“ aufrufen, aufrufen.
Syntax:
Datenrahmen.ASTYPE (DTYPE, COPY = TRUE, ERSTELLUNGEN = "REAL", ** KWARGS)
DTYPE: Das Pandas -Objekt wird mit dem Python -Typ oder Numpy auf denselben Typ gegossen.DTYPE. Eine oder mehrere Datenspalten von DataFrame können auf spaltenspezifische Typen gegossen werden. Es ist auch möglich, col: dType zu verwenden,? als Alternative, wobei Col den Namen der Spalte repräsentiert und DTYPE ein Numpy ist.
Kopieren: Es enthält eine Kopie, wenn Copy = true. Wenn Copy = False ist, müssen wir vorsichtig sein, da sich Änderungen an Werten auf andere Objekte von Pandas ausbreiten können.
Fehler: Wenn Sie versuchen, einen falschen oder ungültigen Datentyp auf das Objekt anzuwenden, erhöht die Technik entweder eine Ausnahme oder nicht, abhängig vom Wert des Fehlerparameters. Die beiden Antworten darauf sind wie folgt:
heben(Wenn es ein Problem gibt, wird eine Ausnahme angelegt)
ignorieren (Wenn es ein Problem gibt, wird es Ausnahmen unterdrücken. Es gibt das ursprüngliche Objekt zurück, wenn ein Fehler vorliegt
In Asttype () function raise = true standardmäßig.
Kwargs: Der Konstruktor erhält ein Keyword -Argument (KWARGS) als Eingabe.
Jetzt haben wir die Syntax gesehen. Wir werden in den folgenden Beispielen die Verwendung der Funktion astype () unterrichten.
Beispiel 1: Änderung des Datentyps der Pandas -Reihe
Zunächst werden wir PANDAS -Module importieren und dann die Funktion DataFrame () verwenden, um den Datensatz zu erstellen und es ein Wörterbuch mit Spaltennamen und einigen Listen zu übergeben, die die Informationen enthalten, die die Variablen erhalten sollen:
Darüber hinaus erstellen wir eine Serie, in der die Kosten des DataFrame ausschließlich die Variable des DataFrame enthält:
Um unseren Datenrahmen zu veranschaulichen, werden wir die Funktion print () verwenden.
Es gibt vier Variablen: Name, Land, Verkäufe und Ausgaben. Infolgedessen enthält der Datenrahmen für einige Personen aus verschiedenen Ländern Beispiel- oder Dummy -Verkaufs- und Ausgabeninformationen.
Überprüfen Sie den Datentyp unserer Serie namens E_Variable mit DTYPE.
Dies zeigt an, dass unsere E_Variable -Serie den Datentyp „Objekt“ enthält. Wir werden nun den Seriendatenatyp mit Pandas ASType in INT64 ändern.
Der Datentyp des Ausgangs ist dTYPE: INT64, da Sie sehen können, ob Sie genau auf den Hintern der Ausgabe achten. Denken Sie daran, dass die E -Variable dadurch nicht direkt geändert wurde. Da die Ausgabe von Astype () in die Konsole gedruckt wurde, hat die Serie E_Variable noch den Datentyp „Objekt“. Wir müssten die Ausgabe mit dem folgenden Code dem tatsächlichen variablen Namen zuweisen, wenn wir die Daten dauerhaft ändern wollten:
Jetzt wird der Datentyp unserer Serie dauerhaft verändert.
Beispiel 2: Datentyp der DataFrame -Spalte ändern
Wir werden nun in der Spalte eines DataFrame arbeiten. Der Vergleich dieser mit Beispiel 1, wo wir mit einer Pandas -Serie zusammengearbeitet haben, wird etwas anders sein. In diesem Fall werden wir mit einem Datenrahmen arbeiten. Daher unterscheidet sich die Syntax ein wenig. Zunächst werden wir den aktuellen Datentyp unseres DataFrame S_Data überprüfen. Um den Datentyp des Datenrahmens zu überprüfen, verwenden wir DTYPE.
Um die Datensorten der Ausgabe zu untersuchen, werden wir zusätzlich die verwenden .DTYPES -Attribut.
Sie werden sehen, dass der Datentyp dieses Verkaufs in der Ausgabe an INT64 geändert wurde. Um dies zu erreichen, haben wir die Astyp -Funktion verwendet und ein Argument eines Wörterbuchs bestanden. Der Name der Spalte wird auf der linken Seite des Wörterbuchs angezeigt, und der neue Datentyp wird rechts angezeigt. Ändern wir den Datentyp einer anderen Spalte unseres Datenrahmens.
Der Datentyp der Nation -Spalte wurde vollständig in „String“ umgewandelt, wie Sie sehen können.
Beispiel 3: Ändern mehrerer Spaltendatenatypen in einem Datenrahmen
Ändern wir nun den Datentyp einer Reihe der Spalten unseres Datenrahmens. Dies kann auf eine Weise erfolgen, die der Art und Weise, wie wir die Spalte in Beispiel 2 verändert haben. Wir werden in diesem Beispiel ein anderes Wörterbuch einsetzen.
Lassen Sie uns noch einmal die ursprünglichen Datentypen unter Verwendung der untersuchen .DTYPE -Attribut vor der Operation:
Beachten Sie noch einmal, dass das Objekt der Datentyp jeder Spalte im DataFrame ist.
Wir werden nun den Datentyp mehrerer Spalten ändern. Um dies zu erreichen, werden wir ein Wörterbuch mit dem Namen und dem Datentyp der Variablen als "Schlüssel" und "Wert" -Paare erstellen. Nach dem Attribut Asttype werden wir das zusätzlich aufrufen .DTYPES -Attribut, damit wir die neuen Datenatypen beobachten können.
Sie werden sehen, dass sich die Datenatypen von drei Spalten in der Ausgabe geändert haben. Der Datentyp der Länderspalte wird in Zeichenfolge geändert, der Datendatenkörper wird in INT64 geändert und der Datenatyp der Ausgaben in INT32 geändert.
In der Klammer haben wir ein Wörterbuch hinzugefügt und die Astyp -Methode aufgerufen. Einige Schlüssel-/Wertpaare mit der Format "Spalte": "DataType" befanden sich im Wörterbuch. Die neuen Datentypen und die Spaltennamen müssen nur in einem Wörterbuch bereitgestellt werden.
Beispiel 4: Datenatypen aller Spalten in einem Datenrahmen aufgeben
Die Methode Pandas Asttype () versucht Standardeinstellung, jede Datenrahmenspalte auf die Python -Typen (int, Text, Float, Datum und DateTime) oder Numpy zu geben.DTYPE, die geliefert werden. Die Operation schlägt fehl. Lassen Sie uns für dieses Beispiel einen neuen Datenrahmen aus Wörterbüchern erstellen.
Alle Namen und DTypes der DataFrame -Spalte werden vom DataFrame zurückgegeben.DTYPES -Funktion. Denken Sie daran, dass jede Spalte einen Objekttyp im oben gezeigten Datenrahmen hat. Jetzt werden wir den Datentyp an die String geben.
Wie bereits zu sehen, wird der DTYPE für alle Spalten des DF -Datenframees aktualisiert.
Abschluss
In diesem Tutorial versuchten wir Ihnen beizubringen, wie Sie den Python Pandas DataFrame verwenden können.Asttype () -Methode. Wir haben den Datentyp der DataFrame -Spalte in einen anderen Datentyp geändert und dann den DataFrame untersucht. In diesem Artikel haben wir einige Beispiele implementiert, sodass Sie möglicherweise den Datentyp der Serie und den Datentyp der Data Frame -Spalte unter Verwendung der Pandas -Astype -Methode in Python ändern können.