Spalten in einem Pandas -Datenfreame umbenennen

Spalten in einem Pandas -Datenfreame umbenennen

Jeden Tag behandeln die Leute große Daten, die wir Big Data nannten. In diesen Big Data enthält es manchmal Spaltennamen oder manchmal ohne die Spaltennamen. Die Spaltennamen sind da, aber sie enthalten einen irrelevanten Namen oder einige unerwünschte Zeichen wie Leerzeichen usw. Wir müssen diese riesigen Daten zunächst vor dem Start der Analyse vorbereiten. Zuallererst benötigen wir die Umbenennung der Spaltennamen.

Datenrahmen ist zeilenorientierte tabellarische Daten mit Zeilen und Spalten. Wir können auch sagen, dass DataFrame eine Sammlung verschiedener Spalten ist und jede Spalte unterschiedliche Typen wie String, Numeric usw. enthält.

$ pandas.Datenrahmen

Ein Pandas Datenrahmen kann mit dem folgenden Konstruktor erstellt werden

$ pandas.DataFrame (Data = None, Index = Keine, Spalten = Keine, dType = None, Copy = False)

Methode 1: Verwenden von Rename () -Funktion:

Syntax:

df.umbenennen (Spalten = D, inplace = false)

Wir haben a geschaffen Datenrahmen (df), mit dem wir verschiedene Methoden umbenennen () () zeigen werden.

In obigem Datenrahmen, Wir können sehen, dass wir vier Spalten haben ['Name', 'Alter', 'favorit_color', 'grade'].

Die Pandas haben eine eingebaute Funktion namens Rename (), die den Spaltennamen sofort ändern kann. Um dies zu verwenden, müssen wir einen Schlüssel (den ursprünglichen Namen der Spalte) und einen Wert (den neuen Namen der Spalte) über die Umbenennennunktion unter dem Spaltenattribut übergeben. Wir können auch eine andere Option für true verwenden, die direkt an die vorhandenen ändert Datenrahmen standardmäßig ist inplace falsch.

Aus dem obigen Ergebnis können wir sehen, dass sich die Namen der Spalten geändert haben.

Methode 2: Verwenden der Listenmethode

Pandas Datenrahmen hat auch eine Spalte des Attributnamens gegeben, in der wir auf alle Spaltennamen von a zugreifen können Datenrahmen. Durch die Verwendung dieses Spaltenattributs können wir auch den Spaltennamen umbenennen. Wir müssen eine neue Liste von Spalten übergeben und dem unten gezeigten Spaltenattribut zuweisen:

Der Hauptnachteil bei der Verwendung der Listenmethode, um den Namen einer Spalte umzubenennen, besteht darin, dass wir alle Spaltennamen übergeben müssen, auch wenn wir nur wenige Spaltennamen ändern möchten.

Methode 3: Benennen Sie den Spaltennamen mit der Datei read_csv um

Wir können die Spalten auch während des Read_csv selbst umbenennen. Dafür müssen wir eine Liste von Spalten erstellen und diese Liste als Parameter an das Namensattribut des Namens übergeben, während wir das CSV lesen.

Wir verwenden den One Attribut -Header = 0, was bedeutet, dass wir die vorherigen Spalten der Überschreibung überschreiben .CSV -Datei mit den neuen Spalten, die wir das Namensattribut durchgeben.

In obigem .CSV. Aber manchmal müssen wir nur wenige Spalten umbenennen. Anschließend müssen wir das USECOLS -Attribut verwenden und die Indexwerte dieser Spalten innerhalb dessen wie unten gezeigt erwähnen:

Im obigen Besten benennen wir nur die erste und letzte Spalte der CSV.

Methode 4: Verwenden der Spalten.str.ersetzen()

Diese Methode wird im Grunde genommen verwendet, wenn wir einige Phrasen in einige andere Phrasen ändern möchten und die vollständige Spalte nicht wie Platz in Unterstrich usw. ändern möchten, usw.

Aus dem obigen Ergebnis können wir sehen, dass jetzt Platz mit dem Unterstrich überschreibt.

Die obige Methode hat auch die Einrichtung des Index (df.Index.str.ersetzen()).

Methode 5: Spalten mit set_axis umbenennen ()

Diese Methode wird verwendet, um den Index zusammen mit der Spalte wie unten gezeigt umzubenennen:

Abschluss

In diesem Artikel zeigen wir verschiedene Methoden zum Umbenennen der Spalten. Die beste Methode, die ich betrachte, ist die Methode umbename (), bei der wir nur die Spalten übergeben müssen. Das Attribut der Spalten ist die einfachste Methode, aber der Hauptnachteil davon ist, dass wir alle Spalten übergeben müssen, auch wenn wir nur wenige Spalten umbenennen möchten. Wir können auch Spalten umbenennen, während wir die CSV -Datei selbst lesen, was auch eine gute Option ist. Die Spalten.str.ersetzen () ist die beste Option nur, wenn wir einige Zeichen durch andere Zeichen ersetzen möchten.