Pandas konvertieren die Spalte in int int

Pandas konvertieren die Spalte in int int
Pandas ist eine kostenlose und Open-Source-Python-Bibliothek, die schnelle, flexible und ausdrucksstarke Datenstrukturen bietet, die die Arbeit mit wissenschaftlichen Daten erleichtern.

Pandas ist eine der wertvollsten Datenanalyse- und Manipulationspakete von Python.

Es bietet Funktionen wie benutzerdefinierte Datenstrukturen, die auf Python aufgebaut sind.

In diesem Artikel werden die Konvertierung einer Spalte von einem Datentyp in einen Int -Typ in einem PANDAS -Datenframe konvertiert.

Pandas einrichten

Bevor wir uns mit der Durchführung des Konvertierungsvorgangs befassen, müssen wir Pandas in unserer Python -Umgebung einrichten.

Wenn Sie die Basisumgebung im Anaconda -Dolmetscher verwenden, können Sie Pandas installiert.

Bei einer nativen Python -Installation müssen Sie sie jedoch manuell installieren.

Sie können dies tun, indem Sie den Befehl ausführen:

$ pip install Pandas

Unter Linux rennen Sie

$ sudo pip3 installieren Sie Pandas

In Anaconda oder Miniconda -Umgebungen Pandas mit Conda installieren.

$ conda installieren pandas
$ sudo conda installieren pandas

Pandas erstellen Beispieldatenrahmen

Lassen Sie uns in diesem Tutorial einen Beispieldatenframe für Illustrationszwecke einrichten. Sie können den folgenden Code kopieren oder Ihren Datenrahmen verwenden.

Pandas als PD importieren
df = pd.DataFrame ('ID': ['1', '2', '3', '4', '5'],
'Name': ['Marja Jérôme', 'Alexios Shiva', 'Mohan Famke', 'Lovrenco ilar', 'Steffen Angus'],
'Punkte': ['50000', '70899', '70000', '81000', '110000'])

Sobald der Datenrahmen erstellt wurde, können wir die Daten überprüfen.

Pandas anzeigen Spaltentyp

Es ist gut zu wissen, ob der vorhandene Typ auf einen int gegossen werden kann, bevor eine Spalte von einem Typ zu einem int konvertiert wird.

Beispielsweise kann der Versuch, eine Spalte mit Namen zu konvertieren, nicht in ein int konvertiert werden.

Wir können den Typ eines Datenrahmens mithilfe der DTYPES -Eigenschaft anzeigen

Verwenden Sie die Syntax:

Datenrahmen.Dtypes

In unserem Beispieldatenrahmen können wir die Spaltentypen als:

df.Dtypes
ID -Objekt
Nennen Sie Objekt
Punktobjekt
DTYPE: Objekt

Aus der obigen Ausgabe können wir sehen, dass keine der Spalten einen Int -Typ enthält.

Pandas konvertieren die Spalte von String nach int int.

Um eine einzelne Spalte in ein INT umzuwandeln, verwenden wir die Funktion astype () und übergeben den Zieldatentyp als Parameter.

Die Funktionssyntax:

Datenrahmen.ASTYPE (DTYPE, COPY = TRUE, ERSTELLUNGEN = 'RAISE')
  1. DTYPE - Gibt den Python -Typ oder einen numpy dype an, zu dem das Objekt konvertiert wird.
  2. Kopie - Ermöglicht Ihnen eine Kopie des Objekts zurück, anstatt zu handeln.
  3. Fehler - Gibt die Aktion im Fehlerfall an. Standardmäßig erhöht die Funktion die Fehler.

In unserem Beispieldatenrahmen können wir die Spalte ID unter Verwendung der Funktion astype () wie im folgenden Code gezeigt in den Int -Typ konvertieren:

df ['id'] = df ['id'].Astype (int)

Der obige Code gibt die Spalte 'ID' als Zielobjekt an. Wir übergeben dann einen int als Typ an die Asttype () -Funktion.

Wir können den neuen Datentyp für jede Spalte im DataFrame überprüfen:

df.Dtypes
ID INT32
Nennen Sie Objekt
Punktobjekt
DTYPE: Objekt

Die ID -Spalte wurde in ein INT konvertiert, während der Rest unverändert bleibt.

Pandas konvertieren mehrere Spalten in int int um

Mit der Funktion astype () können wir mehr als eine Spalte konvertieren und in einen bestimmten Typ konvertieren.

Zum Beispiel können wir den folgenden Code ausführen, um die Spalten der ID und den Punkten in den Int -Typen umzuwandeln.

df [['id', 'Punkte']] = df [['id', 'Punkte']]].Astype (int)

Hier geben wir mehrere Spalten mit der Square Bracket Notation an. Auf diese Weise können wir die Spalten in den in der astype () -Funktion angegebenen Datentyp konvertieren.

Wenn wir den Spaltenentyp überprüfen, sollten wir eine Ausgabe sehen:

df.Dtypes
ID INT32
Nennen Sie Objekt
Punkte int32
DTYPE: Objekt

Wir können jetzt sehen, dass die Spalte ID und Punkte in den Typ int32 konvertiert wurde.

Pandas konvertieren mehrere Spalten in mehrere Typen

Mit der Funktion astype () können wir eine Spalte und einen Zieltyp als Wörterbuch angeben.

Angenommen, wir möchten die ID -Spalte in INT32 und die Punktspalte in Float64 konvertieren.

Wir können den folgenden Code ausführen:

convert_to = "id": int, "Punkte": float
df = df.Asttype (convert_to)

Im obigen Code definieren wir zunächst ein Wörterbuch, das die Zielspalte als Schlüssel und den Zieltyp als Wert hält.

Wir verwenden dann die Funktion astype (), um die Spalten im Wörterbuch in die festgelegten Typen umzuwandeln.

Das Überprüfen der Spaltentypen sollte zurückgeben:

df.Dtypes
ID INT32
Nennen Sie Objekt
Punkte float64
DTYPE: Objekt

Beachten Sie, dass die ID -Spalte INT32 ist und die Spalte Punkte vom Typ Float32 -Typ ist.

Pandas konvertieren die Spalte in int - to_numeric ()

Pandas bietet uns auch die Funktion to_numeric (). Diese Funktion ermöglicht es uns, eine Spalte in einen numerischen Typ umzuwandeln.

Die Funktionssyntax ist wie gezeigt:

Pandas.to_numeric (arg, fehler = 'raise', downcast = keine)

Um die ID -Spalte beispielsweise in unserem Beispieldatenrahmen in numerische Konvertiten zu konvertieren, können wir ausführen:

df ['id'] = pd.to_numeric (df ['id'])

Der Code sollte die ID -Spalte aufnehmen und in einen INT -Typ umwandeln.

Pandas konvertieren den Datenframe in den bestmöglichen Datentyp

Mit der Funktion convert_dtypes () in Pandas können wir einen gesamten Datenrahmen in den nächstgelegenen möglichen Typ konvertieren.

Die Funktionssyntax ist wie gezeigt:

Datenrahmen.convert_dtypes (infer_objects = true, convert_string = true,
convert_integer = true, convert_boolean = true, convert_floating = true)

Sie können die Dokumente in der folgenden Ressource überprüfen:

https: // pandas.Pydata.org/docs/referenz/api/pandas.Datenrahmen.convert_dtypes.html

Zum Beispiel können wir ausführen, um unseren Beispieldatenrahmen in den nächstgelegenen möglichen Typ umzuwandeln:

df = df.convert_dtypes ()

Wenn wir den Typ überprüfen:

df.Dtypes
ID INT32
Name Zeichenfolge
Punkte int64
DTYPE: Objekt

Sie werden feststellen, dass jede Spalte in den nächsten entsprechenden Typ konvertiert wurde. Beispiel.

Ebenso wird die Spalte der Namen in den String -Typ konvertiert, da sie Stringwerte enthält.

Da die Spalte der Punkte größere Ganzzahlen enthält, wird sie schließlich in einen INT64 -Typ umgewandelt.

Abschluss

In diesem Artikel haben wir detaillierte Methoden und Beispiele für die Konvertierung eines Pandas -Datenframes von einem Typ in einen anderen angegeben.