Pandas entfernen Zeilen mit Zustand

Pandas entfernen Zeilen mit Zustand
In diesem Artikel wird erläutert, wie die Funktion Pandas Drop () verwendet wird, um Zeilen zu löschen, die mit einer bestimmten Bedingung übereinstimmen.

Beispieldatenrahmen

In diesem Tutorial werden wir einen Beispieldatenfreame mit den folgenden Daten verwenden, die in Filmen gespeichert sind.CSV -Datei:

,Titel, Release_year, IMDB_RATING
0, Iron Man, 2008,7.9
1, The Incredible Hulk, 2008,6.6
2, Iron Man 2,2010,6.9
3, Thor, 2011, 7.0
4, Captain America: The First Avenger, 2011,6.9
5, The Avengers, 2012, 8.0
6, Iron Man 3.2013,7.1
7, Thor: The Dark World, 2013,6.8
8, Captain America: The Winter Soldier, 2014,7.8
9, Guardians of the Galaxy, 2014,8.0
10, Avengers: Alter von Ultron, 2015,7.3
11, Ant-Man, 2015,7.3
12, Captain America: Bürgerkrieg, 2016,7.8
13, Doktor Strange, 2016, 7.5
14, Wächter der Galaxie: Band 2.2017,7.6
15, Spiderman: Homecoming, 2017,7.4
16, Thor: Ragnarok, 2017,7.9
17, Black Panther, 2018,7.3
18, Avengers: Infinity War, 2018,8.4
19, Ant-Man und The Wasp, 2018,7.0
20, Captain Marvel, 2019,6.8
21, Avengers: Endgame, 2019,8.4
22, Spider-Man: weit weg von zu Hause, 2019,7.4
23, schwarze Witwe, 2021,6.7
24, Shang-Chi, 2021,7.4
25, Spiderman: Kein Weg nach Hause, 2021,8.4
26, Doktor Strange: Im Multiversum des Wahnsinns, 2022,7.5
Laden Sie nach dem Herunterladen die CSV -Datei wie unten gezeigt:
Pandas als PD importieren
df = pd.Read_csv ('Filme.CSV ', Index_col = [0])
df

Zeilen basierend auf der Spaltenbedingung löschen

Um Zeilen basierend auf einer einzelnen Bedingung in einer angegebenen Spalte zu löschen, können wir die Funktion Drop () verwenden. Wenn wir beispielsweise Zeilen löschen möchten, bei denen das Release_year unter 2012 liegt, können wir dies tun:

df = df.Drop (df [df ['release_year'] < 2012].index, inplace=False)
df

In diesem Beispiel befehlen wir die Drop -Funktion, um alle Zeilen zu löschen, in denen der Wert in der Spalte 'Release_year' kleiner als 2012 ist. Der Parameter "Inplace" verhindert, dass die Funktion den Originaldatenrahmen ändert. Dies sollte zurückkehren:

Wenn Sie es bemerkt haben, haben die Zeilen in der obigen Ausgabe einen Release_year -Wert von 2012 und höher.

Zeilen basierend auf mehreren Bedingungen löschen.

Wir können auch mehr als eine Bedingung beim Entfernen von Zeilen kombinieren. Zum Beispiel, um die Zeilen zu entfernen, bei denen die Bewertung größer als 7 ist.3 und das Veröffentlichungsjahr ist größer als 2018, wir können es tun:

df.Drop (df [(df ['release_year']> 2018) & (df ['imdb_rating']> = 7.3)].Index, inplace = false)
df

Der obige Code ermöglicht es uns, den Ampersand -Operator zu verwenden, um mehrere Bedingungen zu kombinieren.

Schließen

Der Artikel zeigt, wie die Funktion Pandas Drop () verwendet wird, um Zeilen zu entfernen, die in einem PANDAS -Datenframe mit einzelnen oder mehreren Bedingungen übereinstimmen.