Pandas Drop () -Methode
Die PANDAS -Methode „Drop ()“ hilft uns, die angegebenen Spalten aus dem bereitgestellten Datenrahmen zu verwerfen und gleichzeitig die ausgewählten im resultierenden Datenrahmen zu behalten. Dies kann mit der folgenden Syntax erfolgen:
Wir werden seine praktische Demonstration mit den Python -Programmen in diesem Artikel sehen.
Beispiel 1: Verwendung von Pandas Drop () -Funktion, um alle Spalten mit Ausnahme der angegebenen einzelnen Spalte im tatsächlichen Datenrahmen fallen zu lassen
In diesem Beispiel werden Sie die praktische Ausführung der PANDAS -Methode „Drop ()“ verstehen.
Wir benötigen Software oder ein Tool, um das Programm zu kompilieren, das wir für das Beispiel generieren werden. Aus den Auswahlmöglichkeiten, das wir als das am besten geeignete Werkzeug für unsere Demonstrationen gefunden haben, ist das „Spyder“ -Tool. Eine neue Projektdatei wird im Tool geöffnet und dann beginnen wir das Skript. Wir haben das benötigte Modul, das hier Pandas ist. Die Pandas -Bibliothek wurde in die Python -Datei importiert und wird als „PD“ aliaiert.
Anschließend müssen wir einen Datenrahmen mit der Methode dieses Pandas -Toolkits erstellen. Pandas hat eine sehr einfache Methode „PD.DataFrame () “, um einen Datenrahmen zu erstellen. Hier ist „PD“ der Alias für Pandas, während der "DataFrame", wie der Name zeigt. Wir haben diese Methode genannt und angewiesen, einen Datenrahmen mit 5 Spalten zu erstellen. Wir haben die Beschriftungen für die Spalten angegeben und für jede Spalte die gleiche Wertelänge geliefert.
Die Beschriftungen, die wir für die Kolumnen definiert haben, sind "Januar", "Februar", "March", "April" und "May". Die Werte, die wir in der Kolumne "Januar" gespeichert haben, sind "1", "2", "3", "4", "3" und "5". Die Spalte "Februar" enthält Werte "7", "8", "9", "10", "11" und "12". Der "Marsch" hält Einträge als "13", "14", "15", "16", "17" und '18 ". Wir haben der Spalte "April" als "19", "20", "21", "22", "23" und "24" Werte geliefert. Die letzte Spalte im DataFrame "May" trägt diese Werte "25", "26", "27", "28", "29" und "30". Wir haben die gleiche Spaltengröße für jede Spalte im DataFrame bereitgestellt.
Wie Sie beobachten können, enthält jede Spalte 6 Werte. Wenn Sie die Länge einer Spalte innerhalb eines bestimmten Datenrahmens ändern, erhalten Sie einen Fehler der ungleichen Spaltenlänge. Wenn die PD.DataFrame () ”-Funktion wird mit den bereitgestellten Spalten aufgerufen. Sie generiert einen Datenrahmen. Es erfordert nun ein Objekt oder eine Variable, in der es diesen Datenrahmen platzieren kann. Daher wird dieser Datenrahmen nicht verloren gehen. Auch wenn wir mit diesem bestimmten Datenrahmen arbeiten müssen. Das hier erstellte DataFrame -Objekt heißt "Monate". Wir haben ihm das Ergebnis der „PD“ zugewiesen.DataFrame () ”Methode.
Die Funktion „print ()“ druckt alles aus, was Sie daran weitergeben werden. Wir haben es mit unserem DataFrame -Objekt „Monate“ zur Verfügung gestellt, um den von ihm erhaltenen Inhalt anzuzeigen.
Ausführen des oben ausgelabten Python-Skripts, indem Sie die Taste „Datei ausführen“ ausführen.
Jetzt werden wir sehen, wie die Methode „Drop ()“ verwendet wird.
Wir haben den „DF angerufen.Drop () ”Methode durch Lieferung der„ DF.Säulen.Differenz () ”Methode zusammen mit zwei anderen Parametern„ Achse “und der„ Innenstadt “. Der ".Diffence () ”Methode bietet uns die Ergänzung der Daten, die wir als Parameter eingeben werden. In diesem Fall haben wir die Spalte "März" zur Verfügung gestellt. Wenn die Methode "Drop ()" aufgerufen wird, um die Spalten im Datenrahmen "Monate" abzuwerfen, wird die Werte der Spalte "March" aufbewahrt.
Der Parameter „Achse“ ist auf „1“ eingestellt, der sich auf die Spalten bezieht. Und der „Eingang“ wird als „wahr“ bewertet, wodurch alle Änderungen im Originaldatenrahmen durchgeführt werden. Nach dem Aufrufen dieser Funktion müssen wir den aktualisierten Datenrahmen anzeigen. Wir haben die Methode „Print ()“ verwendet, um den tatsächlichen Datenrahmen mit geänderten Inhalten auf dem Bildschirm anzuzeigen.
So sieht unser tatsächlicher Datenrahmen jetzt aus. Wir haben alle Spalten fallen gelassen, aber die Spalte „March“ im aktualisierten Datenrahmen beibehalten.
Beispiel 2: Verwendung von Pandas Drop () -Funktion, um alle Spalten abzugeben, mit Ausnahme der angegebenen Spalten in der Kopie des DataFrame
Für diese Demonstration sehen wir, wie Sie alle Spalten mit Ausnahme der ausgewählten mehrere Spalten fallen lassen und die Änderungen in der Kopie des Datenrahmens anstelle des tatsächlichen Datenrahmens vornehmen können.
In diesem Beispiel werden wir den Datenrahmen verwenden, den wir in der obigen Instanz konstruiert haben. Nachdem wir den Datenrahmen angezeigt haben, haben wir die Methode „Drop ()“ aufgerufen. Zwischen den Klammern der „DF.Drop () ”-Funktion, wir haben die„ DF “bezeichnet.Differenz () "Funktion und wir haben zwei Spalten" Januar "und" March "bereitgestellt. Daher werden diese beiden Spalten im DataFrame aufbewahrt und alle verbleibenden Spalten werden in den Datenrahmen „Monate“ fallen gelassen. Der Parameter „Achsen“ wird bei „1“ bewertet. Dies wird Python anweisen, die Funktionszeile anzuwenden.
Hier ist der dritte Parameter „inplace“ auf "Falsch" gesetzt. Wenn Sie dieses „falsche“ behalten, bedeutet dies, dass die Funktion die Änderungen in der Kopie des Datenrahmens anstelle des tatsächlichen Datenrahmens vornimmt. Um diese geänderte Kopie des DataFrame "Monate" zu speichern, haben wir eine Variable "Kopie" erstellt. Diese Variable hält den aktualisierten Datenrahmen, nachdem alle Spalten abgelegt wurden, mit Ausnahme der beiden, die wir angegeben haben, die "Januar" und "März" sind, und "März". Zuletzt haben wir die Methode „Print ()“ verwendet, um das Ergebnis des „DF“ zu zeigen.Drop () “-Methode am Terminal durch Übergeben der Variablen„ Kopie “.
Die Methode „Print ()“ zeigt zwei Datenrahmen, wenn wir das oben geschriebene Python-Skript ausführen. Hier ist der erste angezeigte Datenrahmen der tatsächliche Datenrahmen ohne Änderungen, während der zweite Datenrahmen die Kopie des tatsächlichen Datenrahmens ist, nachdem alle Spalten abgelegt wurden, mit Ausnahme der beiden angegebenen angegeben.
Abschluss
Die Entscheidung, welche Daten zu behalten sind und welche Sie während der Analyse der Datensätze weglassen sollten, ist ein sehr wesentliches Konzept, um zu lernen. In diesem Artikel haben wir uns auf die „DF“ ausgearbeitet.Drop () ”Funktion mit seiner Syntax. Wir haben diese Methode im Spyder -Tool implementiert. Das erste Beispiel lehrt Sie, den tatsächlichen Datenrahmen zu ändern, während der zweite Datenrahmen erklärt.