Pandas -Spalten

Pandas -Spalten
Ein rechteckiges Gitter namens Pandas DataFrame wird verwendet, um Daten zu speichern. Die Daten, die in einem Datenrahmen gespeichert werden, sind einfach zu visualisieren und zu manipulieren. Der Datenrahmen kann aus mehreren Zeilen und Spalten darin bestehen. Jede Zeile stellt eine Messung einer einzelnen Instanz dar, während jede Spalte ein Vektor ist, der die Daten eines bestimmten Attributs oder einer bestimmten Variablen enthält. Die DataFrame -Zeilen können in einer bestimmten Zeile heterogene oder homogene Daten aufweisen, aber jede Datenfrequenzspalte enthält homogene Daten in einer bestimmten Spalte. Die Achsen eines Datenrahmens in Pandas sind im Gegensatz zu einem zweidimensionalen Array gekennzeichnet. In diesem Artikel diskutieren wir die verschiedenen Methoden zum Hinzufügen, Ändern und Löschen der Pandas -Spalten oder -Werte in den Spalten eines Datenrahmens in Pandas. Dies kann durch verschiedene Methoden erfolgen. Lassen Sie uns einige dieser Methoden im Detail sehen.

So fügen Sie einer Spalte in Pandas Spalten oder Werte hinzu

Spalten können mit den verschiedenen Methoden zu einem Datenrahmen hinzugefügt werden. Im folgenden Beispiel verwenden wir die Funktionen apply () und insert (), um unserem DataFrame Spalten hinzuzufügen.

Beispiel 1: Fügen Sie den DataFrame mit apply () -Funktion die Spalte hinzu
Sie können einem Datenrahmen mehrere Spalten mit den Pandas hinzufügen.Datenrahmen.Zuordnung () Methode. Zunächst erstellen wir einen Beispieldatenrahmen mit der PD.DataFrame () -Funktion mit einigen Zeilen und Spalten. Die "Pandas" -Bibliothek wird zuerst importiert, um den Pandas -Datenfreame zu erstellen.

Wir haben den "DF" -Datenframe erstellt, indem wir ein Wörterbuch mit zwei Schlüssel - "C1" und "C2" - mit Werten ["A", "B", "C" und ["D", "E", "F", "F", übergeben haben "] bzw. Durch die Übergabe des Wörterbuchs in PD.DataFrame, die Tasten werden zur Beschriftung der Spalten und die Werte in der Liste werden zu den Daten jeder Zelle in Spalten des Datenrahmens.

Wie zu sehen ist, haben wir jetzt einen Datenrahmen mit zwei Spalten erstellt. Verwenden der Funktion von telicen () addieren wir unserem Datenrahmen weitere Spalten oder Spalten "DF".

Die Funktion enthält einen neuen Datenfreame "new_df", der sowohl die zusätzliche (neu hinzugefügte "C3") als auch alle alten Spalten ("C1" und "C2") als Ergebnis enthält. Denken Sie daran, dass, wenn aktuelle Spalten neu zugewiesen werden, alle überschrieben werden.

Beispiel 2: Die Spalte zum DataFrame mithilfe von Insert () hinzufügen
Der „DataFrame.Inise () ”kann auch verwendet werden, um Spalten zu einem Datenrahmen hinzuzufügen. Erstellen wir zuerst einen Datenrahmen mit einigen Zeilen und Spalten.

Um unseren DF -Datenrahmen anzuzeigen, wird die Funktion print () verwendet.

Unser DataFrame hat zwei Zeilen - a und b - mit Werten ["1", "2", "3"] bzw. ["4", "5", "6"]. Jetzt verwenden wir die Methode Insert (), um eine weitere Spalte im Datenrahmen „DF“ hinzuzufügen.

Vor der Verwendung der Funktion Insert () haben wir eine Liste mit Werten erstellt ["7", "8", "9"]. Die Indexierung von Spalten durch das DataFrame beginnt bei Null. Wenn wir die Funktion Insert () mit dem Datenrahmen „DF“ angewendet haben, haben wir den Index 1 angegeben, um die neue Spalte „C“ zu platzieren. Wir haben auch die Liste "Werte" in den Parametern der Funktion Insert () übergeben, um die Werte der Spalte "C" zu speichern.

Sie können feststellen, dass unsere neue Spalte am 2 hinzugefügt wirdnd Spaltensposition zwischen „A“ und „B“, da wir den Index „1“ in den Parametern der Funktion Insert () angegeben haben.

So wählen Sie Spalten in Pandas aus

Spalten können durch ihre Indexpositionen, Bezeichnungen oder Datenatypen ausgewählt werden. In den folgenden Beispielen werden die spezifischen und mehrere Spalten ausgewählt.

Beispiel 1: Wählen Sie eine bestimmte Spalte mit den Spaltennamen/Beschriftungen aus
Wir erstellen einen Beispieldatenrahmen, um Ihnen anzuzeigen, wie Sie eine bestimmte Spalte des DataFrame auswählen können.

Wir haben den DataFrame mit Spalten "Col1" und "Col2" erstellt. Der einfachste Weg, um eine bestimmte Datenrahmenspalte zu erhalten, besteht darin, den Spaltennamen als Zeichenfolge mit Zitaten in Klammern [] zu schreiben [].

Im angegebenen DataFrame haben wir zwei numerische Spalten - "col1" und "col2" - die Werte (3, 1, 5) bzw. (7, 2, 6).

Durch die Verwendung einer Liste mit mehreren Namen der DataFrame -Spalten in den Klammern „[]“ können Sie mehrere Spalten auswählen.

Wie zu sehen ist, haben wir eine Liste mit beiden Spaltennamen „Col1“ und „Col2“ in den Klammern übergeben, die beide Spaltennamen enthielten.

Beispiel 2: Wählen Sie eine bestimmte Spalte nach ihrem Datentyp aus
Wir erstellen einen Datenrahmen mit Spalten mit unterschiedlichen Datenatypen.

Die Spalte "Name" speichert die Namen von Personen ("Tim", "Alex", "Joe", "Rick"). Während die Spalte „Alter“ das Alter von Personen speichert (12, 11, 11, 13). Überprüfen Sie die Datentypen unserer Datenfreamespalten mithilfe des Attributs "DTYPES".

Der Datentyp der Spalte "Name" ist "Objekt" und "int64" ist der Datentyp der Spalte "Alter". Jetzt wählen wir die Spalten nach ihrem Datentyp mit der Funktion „loc []“ aus.

Im DF.LOC [] Funktion haben wir die DTypes == 'INT64' angegeben. Die Werte werden zurückgegeben, bei denen der Datentyp "int64" verwendet wird.Werte ”Attribut mit DF.loc [:, (df.DTYPES == 'INT64') Funktion.

Beispiel 3: Wählen Sie nach ihren Indizes mehrere Spalten aus
Wir erstellen einen neuen Beispieldatenrahmen, um Ihnen anzuzeigen, wie Sie mehrere oder alle Spalten des Datenrahmens mit der Methode „Iloc []“ auswählen können.

Da wir unseren Datenrahmen erstellt haben, verwenden wir jetzt die Iloc [] -Methode, um mehrere Spalten aus unserem DataFrame auszuwählen. Wenn eine einzelne Spalte ausgewählt ist, gibt die ILOC [] -Methode ein Serienobjekt zurück. Wenn mehr als 1 Spalte ausgewählt ist.

Wir haben den Indexbereich von Spalten von 0 bis 3 angegeben. Beachten Sie, dass die Spalte am Index 3 nicht Teil der Gruppe ist. Nur die Spalten von Index 0 bis 2 werden ausgewählt.

Wie zu sehen ist, werden die Spalten "W", "X" und "Y" ausgewählt, indem der Bereich 0: 3 angegeben wird.

So ändern Sie die Spaltennamen und Spaltenwerte

Im folgenden Beispiel ändern wir die Spaltennamen mit der Funktion umbename () und die Werte mit der Funktion Ersatz () ändern.

Beispiel 1: Ändern Sie die Spaltenbezeichnung mit der Funktion umbename () umbename ()
Zunächst erstellen wir einen Datenrahmen mit einer oder mehreren Spalten.

Sobald der DataFrame erstellt wurde, können wir seine Spalte umbenennen, indem wir die Funktion pandas rename () verwenden. In der Funktion umbename () verwenden wir ein Wörterbuch wie original_label: new_label. Und wir geben das aktuelle Etikett und das neue Etikett an (das wir hinzufügen möchten).

Wie Sie beobachten können, haben wir den Namen der Spalte "A" in "Name" und den Namen der Spalte "B" in "Betreff" geändert.

Beispiel 2: Ändern Sie die Spaltenwerte mit der Funktion Ersatz () ersetzt ()
Wir erstellen einen Datenrahmen mit der Anzahl der Spalten, die Werte speichern. Anschließend ändern wir die Werte von Spalten mithilfe der Funktion Ersatz ().

Seit wir unseren DataFrame erstellt haben, ändern wir nun die Werte seiner Spalte mit der Funktion Ersatz (). Die Methode ersetzt () tauscht den Wert in der Spalte DataFrame mit dem neuen angegebenen Wert aus.

Die Funktion ersetzen () ersetzte den Wert der Spalte "x" von Spalte "5" bis 9.

So entfernen Sie die Pandas -Spalten

Die DataFrame -Spalten können mit der DROP () und Del -Methode in Pandas gelöscht werden.

Beispiel: Löschen einer Spalte aus einem PANDAS -Datenframe
Erstellen wir zunächst einen Datenrahmen, aus dem wir die spezifischen Spalten mit DROP () und DEL -Methoden löschen werden.

Wir haben einen Datenrahmen "DF" mit 4 Spalten ("A", "B", "C", "D"). Die Drop () -Methode des DataFrame löscht die Zeilen oder Spalten basierend auf entsprechenden Achsen und angegebenen Spaltennamen (Beschriftung). Lassen Sie uns die Spalte "A" mit der Funktion Drop () löschen.

Die Achse = 1 bedeutet, dass wir die Spalte entfernen, nicht die Zeile.

Die Funktion Drop () hat die Spalte „A“ erfolgreich entfernt. Verwenden wir nun die Methode "Del" in der Spalte "D".

Die Spalte "D" wird mit der Methode "DEL" aus dem DataFrame entfernt.

Abschluss

In diesem Tutorial haben wir über Spalten im Pandas DataFrame diskutiert. Wir haben die verschiedenen Funktionen verwendet, um Spalten aus unserem Datenrahmen hinzuzufügen, zu ändern und zu löschen. Dieses Tutorial lehrt die unterschiedlichen Operationen, die Sie in der Spalte eines Datenrahmens in Pandas ausführen können. Wir haben mehrere Beispiele implementiert, um Ihnen beizubringen, wie Sie Spalten oder Werte in einer Spalte hinzufügen können.