Pandas ändern den Spaltentyp

Pandas ändern den Spaltentyp
Im Kontext der Programmierung ist eine Spalte eine Gruppe von Datenwerten, die alle die gleichen Typen sind und in einer Tabelle, Serie, Datenrahmen usw. enthalten sind. wenn diskutiert. Die Daten werden vertikal in einer Spalte von oben nach unten angeordnet. Während der Verwendung des Pandas -Datenfreame. Der Zweck dieses Artikels besteht darin, zu erklären, wie der Datentyp der Spalte in PANDAS -Datenframes geändert werden kann. Wir werden die verschiedenen Funktionen verwenden, um den Datentyp einer oder mehrere Spalten im Pandas -Datenfream zu ändern.

So ändern Sie den Datenatyp der Spalte in Pandas

Verschiedene Funktionen in Pandas können verwendet werden, um den Datenatyp von Spalten in einem Datenrahmen zu ändern. In den folgenden Beispielen erläutern wir ausführlich, wie Sie die Datenatypen von Spalten im DataFrame ändern können.

Beispiel 1: Verwenden des DataFrame.Astype () -Funktion

Um einen Beispieldatenrahmen zu erstellen, importieren wir zuerst die Pandas als PD, um die von ihm bereitgestellten Funktionen zu verwenden. Um die Arbeit der Funktion astype () zu demonstrieren, erstellen wir einen Datenrahmen mit drei Spalten verschiedener Datentypen. Verwenden des Datenrahmens.Asttype () -Methode, wir können ein Pandas -Objekt in einen erforderlichen DType umwandeln. Darüber hinaus ermöglicht diese Methode den Benutzern, eine Spalte (geeignet) des Datenrahmens in einen Kategoriestyp zu ändern.


Wie in der vorherigen Abbildung zu sehen ist, haben wir drei Spalten erstellt: x, y und z. Wobei die x -Spalte aus int und String -Werten ['2', 4, 6, '8' und 10] besteht 'T'] und die Z -Spalte besteht aus Float- und Stringwerten. Um den Datenatyp jeder Spalte in unserem Datenrahmen anzuzeigen, wird das DTypes -Attribut verwendet. Das Attribut „DTypes“ kann verwendet werden.


Wie in der peviösen Abbildung zu sehen ist, wird der Datentyp jeder Spalte als "Objekt" angezeigt. Wie Sie vielleicht bemerken, gibt es in jeder Spalte (x, y und z) des Datenrahmens mindestens einen Stringwert (x, y und z). Das DTYPE -Attribut betrachtet also den Datenatyp jeder Spalte als "Objekt". Ändern wir nun den Datentyp der Spalte X mit der Funktion astype () anhand der Funktion astype ().


Wir haben den Int -Datentyp in Spalte X unseres "DF" -Datenrahmens zugewiesen und den neuen Datenrahmen der Variablen mit dem Namen "DF" zugewiesen. Jetzt können wir überprüfen, indem wir das Attribut von DTypes verwenden, ob der Datentyp der Spalte x geändert wird oder nicht.


Es ist ersichtlich, dass der Datentyp der Spalte X vom Objekt in „INT32“ geändert wird. Sie können einen einzelnen Datentyp für den gesamten Datenrahmen oder separat für jeden Spaltendatenrahmen unter Verwendung eines Python -Wörterbuchs definieren. Geben wir die verschiedenen Datenatypen für jede Spalte des Datenrahmens mit einem Wörterbuch an.


Im vorherigen Wörterbuch haben wir den Datentyp "int" zu X -Spalte, der Spalte "String" und "String" und Datentyp "Float" zur Z -Spalte "DF" des Datenrahmens angegeben "Float" zur Z -Spalte "Float". Überprüfen Sie mithilfe des Attributs von DTYPES die aktuellen Datenatypen von X-, Y- und Z -Spalten in unserem Datenfeld.


Die Datenatypen jeder Spalte werden erfolgreich geändert. Wir können auch die Funktion astype () verwenden, um einen einzelnen Datenatyp für alle Spalten unseres Datenrahmens anzugeben.


Wir haben die Asttype () -Methode mit unserem DataFrame "DF" verwendet und den "String" -Datenatyp als Argument übergeben, um den Datentyp jeder Spalte in "Objekt" zu ändern.

Beispiel 2: Verwenden der Funktion to_numeric ())

Apply () ermöglicht es uns, den Datentyp spezifischer oder aller Spalten in INT/Float, DateTime oder Time Delta zu konvertieren, indem die Optionen „Pandas“ übergeben werden.to_numeric, "Pandas.to_datetime "und" pandas.to_timedelta ”. Abhängig von den in der Spalte vorhandenen Werten ändert die Funktion to_numeric () den Datentyp einer Datenrahmenspalte in einen INT oder Float. Der Datenatyp der Spalte wird in "INT64" geändert, wenn sie nur Ganzzahlnummern enthält. Der Datentyp der Spalte wird unter Verwendung des to_numeric () in "Float64" konvertiert, wenn sie Werte mit Dezimalpunkten enthält. Um dies mit Hilfe eines Beispiels zu erklären, erstellen wir einen Datenrahmen mit String Datentype, verwenden jedoch die Ganzzahlwerte als „Zeichenfolgen“.


Wir importieren zuerst die Pandas und Numpy -Module. Anschließend erstellen wir den Datenrahmen mit der PD.DataFrame () -Funktion. In der PD.DataFrame -Funktion bestehen die drei Listen: ['1', '2', '3'], ['4', '5', '6'] und ['7', '8', '9' ]. Die Namen der Spalten werden als "x", "y" und "z" angegeben. Das DTYPES -Attribut wird verwendet, um die Datenatypen von X-, Y- und Z -Spalten anzuzeigen.


Derzeit ist der Datentyp jeder Zeile "Objekt". Wir verwenden jetzt die Funktion to_numeric (), um ihren Datentyp zu ändern.


Wie bereits erwähnt, ändert die Funktion to_numeric (), wenn die Spalten Dezimalzahlen enthalten, den Datentyp automatisch in "INT64". Überprüfen Sie, ob die Datentypen geändert werden oder nicht.


Als wir die Dezimalzahlen als "String" -Werte im Datenrahmen "DF" verwendeten, konvertierte die Funktion to_numeric () sie erfolgreich in "int64". Was ist, wenn es eine Spalte mit Float -Werten als "Zeichenfolge" im Datenrahmen "DF" gibt? Wird die Funktion to_numeric () ihren Datentyp in "Float64" ändern? Um diese Frage zu beantworten, fügen wir im kürzlich erstellten "DF" -Datenrahmen eine weitere Spalte mit Float -Werten als "String" hinzu.


Wir haben unserem Datenrahmen eine weitere Spalte hinzugefügt und die Spaltennamen als W, X, Y und Z angegeben. Die neu hinzugefügte Z -Spalte besteht aus nur Dezimalpunktwerten als "String". Wenden wir die Funktion to_numeric () an, um die Ergebnisse anzuzeigen.


Der Datentyp von Spalten mit Zahlen ohne Dezimalzahl wird in „INT64“ und die Dezimalzahl in „Float64“ konvertiert, indem die Funktion to_numeric () verwendet wird.

Beispiel 3: Verwenden der Funktion convert_dtypes ()

In den beiden vorherigen Beispielen haben wir den Datentyp der DataFrame -Spalten mithilfe der Funktionen ASType () und to_numeric () geändert. Wir können auch den Datenatyp der Spalten in unserem Datenrahmen ändern, indem wir die Funktion convert_dtypes () verwenden. Nach der Bewertung der Daten gibt die Methode convert_dtypes () einen neuen Datenrahmen zurück, wobei der Datentyp jeder Spalte in den am besten geeigneten (optimierten) Datentyp konvertiert wird. Um die Funktion convert_dtypes () zu verstehen, erstellen wir zunächst einen Beispieldatenrahmen.


Nach dem Import des Pandas -Moduls haben wir zwei Listen erstellt - "Name" und "Student". In der Liste "Name" haben wir einige String- und Nullwerte ("Tom", PD.Na, "Max", "Tony"). Während wir in der Liste der „Schüler“ die booleschen Werte mit einigen Nullwerten haben (True, PD.Na, falsch, PD.N / A). Wir haben beide Listen der Variablen „Daten“ zugewiesen. Die PD.DataFrame () -Funktion wird verwendet, um einen Datenrahmen innerhalb des Datenvariablen als Argument zu erstellen. Anschließend haben wir das DTYPES -Attribut verwendet, das die Datenatypen aller Spalten in unserem Datenrahmen ergab. Wie in der vorherigen Abbildung zu sehen ist, ist der Datentyp jeder Spalte in unserem Datenrahmen „Objekt“. Verwenden wir die Funktion convert_dtypes (), um die Datenatypen von Spalten mit geeigneten Datentypen zu ändern.


Wie zu sehen ist, hat die Funktion convert_dtypes () die Datentypen von Spalten mit dem am besten geeigneten (optimierten) Datentyp geändert. Der Datentyp der Spalte "Name" wird in "String" geändert und der Datentyp der Spalten "Student" wird in boolean geändert.

Abschluss

In diesem Tutorial haben wir verschiedene Möglichkeiten durchgemacht, um den Datenatyp der Spalte des DataFrame mithilfe verschiedener Funktionen zu ändern. Wir haben versucht, Sie in der Lage zu machen, den Datentyp der Spalte eines Datenrahmens selbst mithilfe der Funktionen Asttype (), to_numeric () und convert_dtypes () zu ändern. Wir haben mehrere Beispiele implementiert, um Ihnen beizubringen, wie Sie den Datenrahmen verwenden.Asttype () -Funktion, Verwendung der Funktion to_numeric () und wie die Funktion convert_dtypes () verwendet, um den Spaltentyp zu ändern.