Pandas lassen eine Reihe fallen

Pandas lassen eine Reihe fallen
Im Umgang mit Python -Datensätzen reinigen die Ingenieure die Daten nach Bedarf für die Aufgabe. Die Tropfenfunktion wird häufig verwendet, um Spalten und Zeilen zu beseitigen, die für die Aufgabe möglicherweise nicht relevant sind.

Pandas Drop -Funktion:

Die Methode „Drop ()“ im PANDAS -Datenframe entzieht die bereitgestellten Beschriftungen aus den Spalten und Zeilen. Die Funktion Drop () beseitigt Zeilen und Spalten entweder durch Angeben von Beschriftungsnamen sowie entsprechende Achsen oder durch explizites Angeben der Indizes oder Spaltennamen.

Wenn wir Multi-Index verwenden, eliminieren wir Etiketten auf verschiedenen Ebenen, indem wir den Niveau angeben. Es wird verwendet, um den Datenrahmen zu entfernen, den wir nicht in unsere Analyse einbeziehen müssen.

Die Syntax für diese Funktion lautet wie folgt:


Die Funktion „Drop ()“ enthält insgesamt sieben Parameter, von denen einige optional sind. Lassen Sie uns kurz alle Parameter diskutieren.

Der erste Parameter es "Etiketten" ist entweder der Index oder besser gesagt der Spaltenname, der beseitigt werden muss. Es ist normalerweise als eine einzelne Etikett oder eine Liste angegeben. Der "Achse" hat zwei mögliche Werte: 0 und 1. Wenn wir aus dem Index/Zeile fallen müssen, schreiben wir 0 in den Parameter, und wenn wir aus den Spalten entfernen müssen, setzen wir 1 ein 1. Es ist standardmäßig auf 0 gesetzt. "Index" Kann verwendet werden, anstatt die Achse anzugeben (Etiketten, Axis = 0 ist gleich insexeraler Punkte).

Der nächste Parameter ist "Säulen". Es wird verwendet, um Spalten anzugeben. Indizes und Spalten sind Äquivalente der Achse, die nicht in Verbindung verwendet werden können. "Ebenen" ist ein optionales Argument für die Verwendung von Multiindex, und es gibt die Ebene an, aus der die Etiketten fallen gelassen werden würden. "an Ort und Stelle" ist ein boolescher Argument, das die Funktion, wenn sie wahr ist. Die Standardeinstellung ist falsch. Der letzte Parameter ist "Fehler". Wenn es so konfiguriert ist, dass es „ignorieren“, werden nur bereits bestehende Etiketten verworfen und der Fehler wird ignoriert. Es hat zwei mögliche Werte. Das erste ist "ignorieren", während der zweite "erhöhen" ist. Standardmäßig ist es auf "Erhöhte" festgelegt.

In diesem Artikel werden wir Ihnen seine praktische Implementierung mit Beispielcodes demonstrieren. Schauen wir uns an, wie wir es in Python machen können.

Beispiel Nr. 1: Verwendung von Pandas Drop () -Methode, um eine einzelne Zeile nach Index abzugeben

Wir werden in dieser Abbildung lernen, eine einzelne Zeile durch den Index des bereitgestellten Datenrahmens mithilfe der Pandas „DataFrame“ fallen zu lassen.Drop () ”Methode.

Mit der praktischen Implementierung von Python Code zur Implementierung des „DataFrame“ zu beginnen.Drop () ”Funktion auf Pandas -Datenrahmen, wir müssen zunächst ein gutes Tool oder eine gute Software auswählen, mit der unsere Python -Programme ausgeführt werden können. Hier haben wir das Tool "Spyder" ausgewählt und heruntergeladen. Wir haben das Setup für das "Spyder" -Tool installiert und dann das Tool gestartet. Sobald Sie die Schnittstelle des "Spyder" -Tools sehen, öffnen Sie eine neue Datei, indem Sie auf die Option "Neue Datei" klicken oder die Tasten „Strg+n“ drücken. Es wird eine neue Python -Datei mit der Erweiterung auf den Markt bringen.Py “, der sich auf" Python "bezieht. Wir haben jetzt alles, mit dem wir arbeiten können.

Der Hauptcode beginnt mit dem Laden der erforderlichen Bibliotheken in das Python -Programm. Wie der Titel unseres Artikels beschreibt, werden wir an einigen Modulen an „Pandas“ arbeiten. Aus diesem Grund können wir verstehen, dass unsere Voraussetzung zur Implementierung dieses Code darin besteht, die "Pandas" -Bibliothek in die Python-Datei zu importieren. Um dies zu erhalten, müssen wir ein Python -Skript „Pandas als PD importieren“ schreiben. Auf diese Weise können wir die Funktionen von Pandas in unserem Programm verwenden, und ermöglicht es uns, auf sie zugreifen zu können, indem wir jedes Mal „PD“ anstelle von „Pandas“ verwenden. Jetzt müssen wir einen Pandas -Datenrahmen erstellen. Pandas uns mit einer sehr einfachen Methode zum Erstellen eines Datenrahmens, der „PD“ ist.DataFrame () ”.

Hier ist "PD" Pandas und "DataFrame" ist das Schlüsselwort zum Erstellen eines Datenrahmens. Wir haben einen Datenrahmen erstellt, der drei Spalten enthält: „Produkt“, „Kosten“ und „Menge“. Den allen diesen Spalten wurden einige Werte zugewiesen. Die Spalte "Produkt" enthält Zeichenfolgenwerte, die "Telefon", "Laptop", "CPU", "Drucker", "Maus", "Tastatur" und "Lautsprecher" sind. Die "Kosten" -Spalten speichern ganzzahlige Werte "5000", "7000", "4300", "8150", "1050", "2150" und "1500". Die letzte Spalte, "Menge", enthält Werte "3", "2", "1", "5", "1", "2" und "4". Beachten Sie beim Erstellen des Datenrahmens, den alle Spalten in einem Datenrahmen haben müssen.

Wir haben also alle Säulen von Länge sieben. Um diesen Datenrahmen zu speichern, haben wir ein Datenrahmenobjekt „Elektronik“ erstellt und die Ausgabe zugewiesen, die aus dem Aufrufen des „PD“ generiert wurde.DataFrame () ”-Funktion. Um diesen Datenrahmen anzuzeigen, haben wir die Methode „Print ()“ verwendet, indem wir das Objekt „Elektronik“ als Parameter angeben, sodass sie nun den Inhalt in diesem Datenrahmen -Objekt drucken wird.


Für die Ausführung des oben geschriebenen Python-Programms müssen wir die Schaltfläche "Datei ausführen" im Tool "Spyder" drücken, oder Sie können auch die Tasten „SHIFT+ENTER“ drücken, um das Skript auszuführen. Wir haben einen Datenrahmen mit drei Spalten und sieben Werten, die jeweils auf dem Terminal angezeigt werden.


Von hier aus beginnt unsere Hauptaufgabe. Wir müssen jetzt erfahren.Drop () ”Methode. Wir müssen lediglich den Namen des oben erstellten Datenrahmens angeben, der mit dem “.Drop () ”-Funktion und da wir eine Zeile fallen lassen müssen, ist der Parameter, den wir hier verwendet haben,„ Index “. Wir haben die Indexnummer „3“ zur Verfügung gestellt, die wir aus dem Datenrahmen entfernen wollten. Dadurch wird die gesamte Zeile mit "index = 3" gelöscht.

Um die Ausgabe dieser Funktion zu speichern, haben wir eine Variable „new_electronics“ erstellt,. Wir haben die Methode "print ()" bezeichnet, um einen zwischen seinen Klammern angegebenen Text anzuzeigen, und dann den aktualisierten Datenfreame angezeigt, der in der Variablen „new_electronics“ gespeichert ist, indem die Methode „print ()“ aufgerufen wird.


Das Ausführen des oben genannten Code-Snippets erhält uns einen aktualisierten Datenrahmen, nachdem wir die 3. Zeile aus dem zuvor generierten Datenrahmen fallen gelassen haben.


In diesem Ausgabebild können Sie feststellen, dass die 3. Zeile aus dem Datenrahmen beseitigt wird.

Beispiel Nr. 2: Verwendung von Pandas Drop () -Methode zum Ablegen mehrerer Zeilen nach Index

Wir haben bereits gelernt, eine einzelne Zeile aus dem Datenrahmen mithilfe der Pandas „DataFrame" zu beseitigen.Drop () ”Methode. Jetzt werden wir sehen, was wir tun können, wenn wir mehr als eine Zeile aus dem Datenrahmen verwerfen müssen. Für diese Abbildung haben wir den Datenrahmen verwendet, der im obigen Beispiel erstellt wurde. Wir werden direkt an der Hauptaufgabe arbeiten, wie alle anderen Dinge in der obigen Instanz erklärt wurden. Um mehrere Zeilen fallen zu lassen, haben wir den „DataFrame" verwendet.Drop () ”Funktion als„ Elektronik.Drop () ”, der Name unseres zuvor erstellten Datenrahmens ist.

Wir haben den Parameter "Index" verwendet und ihm die Indexnummern zugewiesen, die wir aus dem Datenrahmen als "Index = [1, 3, 5]" fallen möchten, was bedeutet, dass wir die Zeilen "1", "3" verwerfen mussten und „5“ aus dem Datenrahmen. Anschließend rufen wir einfach die Methode „Print ()“ auf, um den aktualisierten Datenrahmen anzuzeigen.


Dies gibt uns die folgende Ausgabe, wobei die Zeilen 1, 3 und 5 aus dem Datenrahmen beseitigt werden.

Abschluss:

Dieser Leitfaden beschreibt und erläutert das Pandas -Modul „DataFrame.Drop () ”, um Zeilen aus dem Datenrahmen zu fallen. Wir haben die verschiedenen Parameter dieser Funktion definiert und kurz erklärt. Wir haben Sie in das Konzept eingeführt, eine einzelne Zeile nach Index aus dem Datenrahmen sowie die Löschung mehrerer Zeilen nach Index zu löschen. Wir haben beide Konzepte praktisch mit Python -Codes im Tool „Spyder“ implementiert und die resultierenden Datenrahmen angezeigt, die aus den Programmen generiert wurden. Dieses Schreiben ist nur ein Leitfaden, aber Ihre Praxis mit praktischen Codes wird es zu Ihrer Fähigkeit machen.