Bei der Arbeit mit DataFrames ist häufig erforderlich. Manchmal sind bestimmte Spalten nicht nützlich für Ihre Analyse. Sie müssen verstehen. Spalten werden von maschinellen Lernmodellen verworfen, wenn sie irrelevant sind oder das Modell nicht verbessern.
Pandas Drop () -Methode
In Pandas kann die Säulenmanipulation auf verschiedene Weise auftreten. Zum Beispiel mit dem „DataFrame.Drop ”-Methode, angegebene Spalten können beseitigt werden. Es ist die am häufigsten verwendete Methode zum Entfernen mehrerer Spalten in Pandas. Wie der Name schon sagt, wurde diese Methode so konzipiert, dass sie einfach einzelne oder mehrere Spalten oder Zeilen fallen ließ. In diesem detaillierten Tutorial untersuchen Sie, wie Sie einzelne oder mehrere Spalten aus einem Pandas -Datenframe fallen lassen können.
Die Syntax für diese Funktion ist unten bereitgestellt:
Hier, "Spaltenname" ist der Name der Spalte, die wir fallen lassen möchten. Der "Achse" Gibt an, welche Achse entfernt werden soll. Achse 1 repräsentiert Spalten, während Achse 0 Zeilen darstellt. Der "an Ort und Stelle" Gibt an, dass der Dropbetrieb im selben Datenrahmen stattfinden sollte, anstatt eine Kopie des Datenrahmens nach dem Tropfen zu generieren.
Sie werden lernen, diese Methode zu verwenden, um Spalten in diesem Tutorial mit Namen zu fallen.
Beispiel Nr. 1: Verwendung von Pandas “DataFrame.Drop () ”Methode, um eine einzelne Spalte mit Namen fallen zu lassen
In diesem Beispiel werden wir eine praktische Implementierung dieser Methode zur Beseitigung einer einzelnen Spalte mit Namen aus dem DataFrame durchführen.
Um das Python -Skript für die Ausführung dieses Beispiels zu schreiben, müssen wir einen relevanten Assembler haben, auf dem wir den Code zusammenstellen können. Wir haben eine Vielzahl von Auswahlmöglichkeiten, aber das, das wir ausgewählt haben. Sie müssen den „Spyder-ide“ öffnen.org ”Website und Herunterladen des„ Spyder “-Tools pro Anforderungen Ihres Betriebssystems. Wir haben das Windows -Betriebssystem verwendet, also haben wir das entsprechende Spyder -Setup heruntergeladen. Dann haben wir es einfach installiert, und sobald der Installationsprozess abgeschlossen ist, finden wir eine Benutzeroberfläche des Tools. Wir haben eine neue Datei geöffnet, indem wir auf die Option "Neue Datei" klicken, oder Sie können sogar das "Strg+N" drücken, um das neue Verzeichnis zu öffnen.
Jetzt müssen wir die für das Skript erforderlichen Voraussetzungsbibliotheken laden. Die für die Ausführung dieser Methode benötigte Bibliothek ist die „Pandas“.
Wir haben die „PD.DataFrame () ”-Methode, die von der Pandas -Bibliothek bereitgestellt wird. Wie wir bereits erwähnt haben, ist „PD“ ein Alias für Pandas, während der „DataFrame“ das Schlüsselwort zum Generieren des Datenrahmens ist. Daher haben wir diese Methode verwendet, um unseren grundlegenden Datenrahmen zu konstruieren. Dieser Datenrahmen verfügt über drei Spalten "Anlage", "Preis" und "Verfügbarkeit". Die "Pflanzen" -Säule enthält die Namen verschiedener Pflanzen, die "Morina", "Oleander", "Acacia", "Olive", "Hopbush" und "Mango" sind. In der Spalte „Preis“ speichert die Preise für die Pflanzen, die „500“, „700“, „1300“, „600“, „800“ und „1150“ sind. Die letzte Spalte "Verfügbarkeit" zeigt, ob die Anlage derzeit verfügbar ist oder nicht als „y“, „n“, „y“, „y“, „n“ und „y“. Hier repräsentiert „y“ „Ja“ und „N“ „Nein“. Die Wertelänge in jeder Spalte des Datenrahmens muss gleich gehalten werden, was in dieser Instanz sechs ist. Wir benötigen jetzt ein DataFrame -Objekt, um den Inhalt in diesem Datenrahmen darin zu behalten. Also haben wir ein Datenfassobjekt „Wald“ erstellt und ihm das Ergebnis gegeben, das aus dem Aufruf "PD.DataFrame () ”Methode. Wir können den Datenrahmen mit dem Objekt „Wald“ verwenden. Um diesen neu erstellten Datenrahmen anzuzeigen, haben wir nun eine Python -Methode, um die Ausgabe anzuzeigen, nämlich "print ()". Wir haben die Methode „Print ()“ aufgerufen und den Namen des Datenrahmens zwischen seinen Klammern hinzugefügt.
Um dieses Skript von Python Pandas auszuführen, müssen wir die Option "Datei ausführen" drücken. Alternativ können Sie die Schlüssel „Shift+Enter“ drücken, um das Programm auszuführen. Hier sehen wir den Datenrahmen, den wir gerade mit drei Spalten und sechs Zeilen erstellt haben, die auf der Konsole des Spyder Tools angezeigt werden.
Unser Datenrahmen wurde konstruiert, und jetzt können wir die erforderlichen Vorgänge darauf ausführen. Die Hauptaufgabe wird ausgeführt, bei der eine einzelne Spalte mit Namen unter Verwendung der PANDAS -Datenfream abgelegt wird.Drop () ”Methode. Zunächst müssen wir den Namen unseres Datenrahmens schreiben, der „Wald“ ist, dann das “.Drop () ”Die Funktion wird damit aufgerufen. Wir verwenden die Methode "Drop ()" mit drei Parametern hier "Column_Name", "Achse" und das "Innen". Der Spaltenname, den wir angegeben haben, dass wir fallen möchten, ist die Spalte "Preis". Die "Achse" ist auf "1" eingestellt, was darauf hinweist.
Und der letzte Parameter, „Inplace“, impliziert, dass alle Manipulationen, die wir gemacht haben. Die Spalte, die wir fallen lassen. Zuletzt haben wir die Methode „Print ()“ verwendet, um den originalen aktualisierten Datenrahmen anzuzeigen, nachdem wir eine Spalte abgelegt haben.
Das vorherige Code -Snippet bietet uns beim Ausführen in Python den Originaldatenrahmen mit einer Änderung. Wir können beobachten, dass dieser Datenrahmen nur zwei Spalten hat, während der anfängliche One drei Spalten hatte. Aus diesem Grund wurde die Spalte „Preis“ aus dem Datenrahmen weggelassen.
Beispiel Nr. 2: Verwendung von Pandas “DataFrame.Drop () ”Methode zum Ablegen mehrerer Spalten mit Namen
Wir haben auf der Technik ausgearbeitet, um eine einzelne Spalte mit dem Namen mit dem PANDAS -DataFrame abzugeben.Drop () ”Methode. Wir werden nun das Ablegen mehrerer Spalten mit der gleichen Technik untersuchen.
In diesem Beispiel haben wir den in der vorherigen Instanz konstruierten Datenrahmen verwendet. Wie wir Ihnen gezeigt haben, verfügt der DataFrame "Forest" über drei Spalten "Anlage", "Preis" und "Verfügbarkeit". Nach dem Drucken des Datenrahmens haben wir den „Datenrahmen angewendet.Drop () ”Funktion. Wir haben den Namen des DataFrame "Forest" mit dem "erwähnt".Drop () ”Methode.
Der Titel dieser Illustration besagt, dass wir hier mehr als eine Spalte fallen lassen. Die Spalten, die wir aus dem DataFrame zum Abnehmen ausgewählt haben, sind „Preis“ und „Verfügbarkeit“. Zwischen den Klammern des „Waldes“.DROP () ”-Funktion, wir haben die Spaltenliste geliefert,„ Achse “für Spalten auf„ 1 “festgelegt, und„ Inplace “wird„ True “festgelegt, um die Änderungen im Originaldatenrahmen darzustellen. Schließlich haben wir die Methode "print ()" bezeichnet, um das Ergebnis anzuzeigen.
Im Ausgabebild können Sie sehen, dass der DataFrame jetzt nur mit einer Spalte angezeigt wird, da der Rest der beiden Spalten fallen gelassen wurde.
Abschluss
Das Ablegen einer Spalte mit ihrem Namen ist eine sehr nützliche und effektive Strategie in Python Pandas. Die Datenanalyse erleichtert und frei von Komplikationen frei und frei von Komplikationen. Dieser Artikel hilft Ihnen dabei, dieses Konzept zu verstehen und Ihnen die besten Ansätze zur Verfügung zu stellen, um das gewünschte Ergebnis zu erzielen. In diesem Schreiben haben wir die Technik erklärt und implementiert, eine einzelne Spalte mit Namen zu eliminieren und mehrere Spalten mit Namen zu fallen. Wir haben den Beispiel -Python -Code im Tool "Spyder" ausgeführt. Lernen, die PANDAS -Datenframe zu nutzen.Drop () ”” Methode wäre vorteilhaft und praktisch für Ihre Datenanalyseprojekte.