Pandas konvertieren die Spalte in int int

Pandas konvertieren die Spalte in int int
„Die Datenverarbeitung und -bewertung werden vom Python -Softwarepaket als Pandas zur Verfügung gestellt. Ein Datentyp ist ein zugrunde liegender Baustein, mit dem Computersprachen das Speichern und Ändern von Daten verwenden können. Wenn ein Pandas -Datenrahmen mit Außendaten erstellt wird, werden numerische Spalten typischerweise als Datentyp -Objekte anstatt in INT oder Float bezeichnet, was es schwierig macht, numerische Berechnungen durchzuführen.

Wir zeigen Ihnen, wie Sie eine Pandas -Spalte in ein int in diesem Stück konvertieren, und diskutieren verschiedene Methoden, um die gewünschte Ausgabe in diesem Stück Schreiben zu erzielen.”

Beispiel 1: Konvertieren Sie die Pandas -Spalte in die Verwendung der Funktion pandas astype () in die Funktion

Der erste Ansatz, den wir hier verwenden werden, um Pandas DataFrame in INT umzuwandeln, besteht darin. Wir könnten jeden Datentyp von Python-, Numpy- oder Pandas -Datentypen angeben, um den Typ aller Spalten in einem Datenrahmen zu ändern.

Hier ermöglicht die Asttype () -Methode, den von uns benötigten Datentyp anzugeben. Es ist ziemlich anpassungsfähig, da Sie möglicherweise versuchen, von einer Art zur anderen zu wechseln.

Die Syntax der Asttype () -Funktion, mit der das Konvertieren des Spaltentyps in INT ermöglicht werden kann, lautet wie folgt.

Lassen Sie uns die Parameter dieser Funktion eins nacheinander verstehen.

Der erste Parameter hier ist "DTYPE", der sich auf den Datentyp bezieht. Das gesamte PANDAS -Objekt kann mithilfe von DTYPE- oder Python -Typ in den entsprechenden Typ konvertiert werden. Umgekehrt können Sie ein einzelnes oder mehrfaches der Spalten in einem Datenrahmen in einen bestimmten Typ für diese Spalte konvertieren, indem Sie die Syntax „[colmn: dType,…]“ verwenden, wobei die Spalte der Name der Spalte ist, während DTYPE ein NP ist.DTYPE oder sogar Python -Typ. Der zweite Parameter ist "kopieren". Es dauert boolesche Werte als Eingabe. Im Standard wird True verwendet. Der Kopiewert muss treu sein, um eine Kopie zurückzugeben. Der letzte Parameter der Asttype () -Methode ist "Fehler". Sowohl "Raise" als auch "Ignore" sind möglich. "Erhöhung" ist jedoch die Standardeinstellung für diesen Parameter.

Umwandlung einer einzelnen Spalte eines Pandas -Datenfreame

In dieser Abbildung ändern wir den Datentyp einer einzelnen Spalte des Datenfrequers in int int int. Schauen wir uns an, wie es funktioniert.

Importieren Sie zuerst die Pandas -Bibliothek in die Python -Datei und weisen Sie PD den Alias ​​zu, um die Pandas -Funktionen in Anspruch zu. Wenn wir damit fertig sind, haben wir jetzt ein DataFrame -Objekt erstellt und es einen „Frame“ genannt und es die Ausgabe des Aufrufens der DataFrame -Funktion zugewiesen, mit der ein Pandas -Datenframe generiert wird. Die PD.Die mit drei Spalten initiierte Datenfunktion mit drei Spalten, "Student", "Marks" und "Punkte" werden aufgerufen. Wir haben für jede Spalte des Datenrahmens die gleiche Wertelänge zugewiesen. Die Funktion print () wird zum Drucken des Pandas -Datenframe.

Sie können den DataFrame mit drei Spalten im Bild unten sehen:

Sobald der Datenrahmen erfolgreich erstellt wurde, werden wir die Datentypen für alle Spalten überprüfen.

Der Datentyp des Pandas -Datenfreame. Um diese Eigenschaft aufzurufen, schreiben Sie den Namen des oben erstellten Datendrame -Objekts mit dem “.DTYPE ”Eigentum; In unserem Beispiel ist es „Rahmen.DTYPES ”. Daher werden die Datentypen für den angegebenen Datenrahmen überprüft. Da wir die Datentypen anzeigen möchten, müssen wir „Frame.DTYPES ”innerhalb der Klammern der Print () -Funktion.

In der Funktion print () mit der DTYPES -Eigenschaft werden US -Datentypen aller Spalten des Datenrahmens "Frame" erhalten.

Sie können das Ausgabebild anzeigen, das drei Spalten mit dem Datentyp „Objekt“ zeigt.

Wir werden nun lernen, den Datentyp des Datenrahmens zu ändern, indem wir den vordefinierten Datentyp in int konvertieren. Um den gewünschten Datentyp zu erreichen, müssen wir die Methode „Astype ()“ anwenden. Zwischen seinen Klammern geben wir den Datentyp an, in den wir den früheren Datentyp konvertieren möchten. Hier führen wir die Datenanlage für nur eine Spalte durch.

Die Syntax zur Verwendung dieser Methode besteht darin, den Namen des DataFrame -Objekts mit dem Namen der Spalte in den langen Klammern „[]“ zu schreiben. Setzen Sie den Zuordnungsoperator "=" ein, dann das DataFrame -Objekt mit demselben Spaltennamen mit dem ".Asttype () ”-Funktion und innerhalb ihrer Zahnspangen geben den erforderlichen Datenatyp an. Wie in der obigen Instanz haben wir "Rahmen [" Marks "].Astype (int) ”. Das bedeutet. Zuletzt werden wir den aktualisierten Datentyp für den Datenrahmen „Frame“ anmelden, indem wir die Eigenschaft "DTYPE" in den Klammern der Print () -Funktion verwenden.

Dies ergibt uns die folgende Ausgabe:

Umwandlung von mehr als einer Spalte eines Pandas -Datenfreframe in eine Int -Verwendung von Asttype () -Methode

Da wir gelernt haben, die PANDAS -Einzelspalte eines Datenrahmens in ein INT umzuwandeln, lernen wir jetzt lernen, die Datenatyp -Konvertierung mehrerer Spalte in INT umzuwandeln.

Wir werden denselben Datenrahmen verwenden, den wir im ersten Beispiel für diese Instanz erstellt haben. Zum Zweck der Überprüfung des Datentyps des Datenframe. Im vorherigen Beispiel haben wir eine Spalte zur Verfügung gestellt, die wir in ein INT konvertieren wollten. Wo wir jedoch den Datentyp von mehr als einer Spalte ändern mussten. Die Spalten, die wir ausgewählt haben, um den Datentyp von „Marks“ und „Punkten“ zu ändern, sind zu ändern.

Mit dem DataFrame -Objekt haben wir den Namen beider Spalten angegeben. Und hat es als Ausgabe zugewiesen, die Funktion „Astype ()“ aufzurufen. Wir haben den Datentyp in der Asttype () -Methode auf INT gesetzt. Sie können auch 3 oder mehr Spalten auswählen, gemäß Ihrer Anforderung, den Datentyp zu ändern. Wenn wir die Print () -Methode ausführen, haben wir den Namen des DataFrame -Objekts mit der DTYPE -Eigenschaft angegeben, damit der neue Datentyp der Spalten des DataFrame "Frame" angezeigt wird.

Das Terminal zeigt eine Ausgabe an, die einen Datenrahmen, den anfänglichen und tatsächlichen Datenatyp jeder Spalte des Datenrahmens enthält, und dann den aktualisierten Datentyp der Spalten „Markierungen“ und „Punkte“ angezeigt.

Beispiel 2: Konvertieren Sie die Pandas -Spalte in die Verwendung der Funktion pandas to_numeric ()

Die Verwendung von Pandas to_numeric -Funktion ist eine der besten Techniken zum Konvertieren einzelner oder mehr Spalten in einem Datenrahmen in numerische Werte. Diese Methode versucht, Strings oder andere nicht numerische Elemente in akzeptable Ganzzahl- oder Gleitpunktwerte umzuwandeln.

Lassen Sie uns seine praktische Umsetzung sehen.

Für die Demonstration dieser Methode haben wir zunächst ein Wörterbuch „Daten“ erstellt, das drei Zeichenfolgen enthält: „Name“, „Punktzahl“ und „Versuch“. Wir haben die Pandas beschäftigt.DataFrame () -Methode zum Umwandeln dieses Dikts in einen Datenrahmen und speichern Sie diesen Datenrahmen in ein DataFrame -Objekt "Demo". Anschließend haben wir den Datentyp dieses DataFrame durch die DTYPE -Eigenschaft in der Funktion print () überprüft. Wir haben die Spalte „Punktzahl“ ausgewählt, deren Datenatype wir zu int ändern möchten. Wir haben dann die Funktion pandas to_numeric () verwendet, und in seinen Klammern haben wir das DataFrame -Objekt mit dem Spaltennamen bereitgestellt. Schließlich wird in der Print -Anweisung mit der DTYPE -Eigenschaft den aktualisierten Datentyp des Datenrahmens angezeigt.

Dies ist das Ausgabebild:

Abschluss

In diesem Artikel haben wir versucht, Sie mit dem Konzept vertraut zu machen, den Datentyp eines Datenrahmens in INT zu konvertieren. Wir haben zwei Pandas -Funktionen für den genannten Zweck verwendet. Für den ersten Ansatz haben wir zwei praktische Codes im Spyder -Tool sowie für die zweite Abbildung implementiert. Die Praxis wird Ihre Konzepte stark machen und Ihr Wissen wird besser wachsen.