Filter Nan Pandas

Filter Nan Pandas

Während der Arbeit mit einer großen Anzahl von Datensätzen stoßen Benutzer häufig auf mehrere Null- oder NAN -Werte. Die Nullwerte repräsentieren die Nullwerte in einem Datensatz. In Python stoßen Entwickler auch auf NAN -Werte, wenn sie mit Pandas in Python arbeiten. Um diese Nullwerte zu filtern, enthält Python verschiedene Funktionen.

Die Ergebnisse aus diesem Blog sind:

  • Was ist "Pandas" in Python?
  • Was sind NAN -Werte??
  • So filtern Sie eine bestimmte Zeile aus dem Datensatz, die den NAN -Wert mithilfe von Pandas DataFrame in Python enthält?
  • So filtern Sie mehrere Zeilen aus dem Datensatz, der den NAN -Wert mithilfe von Pandas DataFrame in Python enthält?
  • So filtern Sie alle Zeilen aus dem Datensatz, der den NAN -Wert mithilfe von Pandas DataFrame in Python enthält?

Was ist "Pandas" in Python?

In Python, “PandasIst die am weitesten verbreitete Bibliothek für die Arbeit mit Float, DateTime, String usw., Arten von Datensätzen. Es verfügt über mehrere Funktionen zum Erforschen, Analysieren, Reinigen und Manipulieren der gewünschten Daten. Mit anderen Worten, können Benutzer die Zeilen mit den NAN -Werten mithilfe der “herausfilternDatenrahmen"Funktionen wie" wie "Datenrahmen.Dropna ()", Und "Datenrahmen.nicht null()”Funktionen.

Was sind NAN -Werte??

Fast jeder Datensatz hat Nullwerte, der Null ist ein bestimmter Schwimmpunktwert, für den es stehtKeine Nummer”. Die Daten sind in mehreren Formen und Formen enthalten, einschließlich leerer/fehlender Werte, die als NAN dargestellt werden. Wie andere Entwicklungssprachen hat Python auch mehrere Möglichkeiten, die fehlenden Werte in den Datensätzen darzustellen.

So filtern Sie bestimmte Datenzeilen aus dem Datensatz, der den NAN -Wert enthält, indem Sie den Pandas -Datenframe in Python verwenden?

Um bestimmte Zeilen aus dem Datensatz zu filtern, der NAN -Werte enthält, erstellen wir zunächst einen Datensatz mit NAN -Werten. Um dies zu tun, importieren Sie die “Numpy", Und "PandasBibliotheksmodule und erstellen Sie einen neuen Datensatz. Überprüfen Sie dann den neu erstellten Datensatz:

Pandas als PD importieren
Numph als NP importieren
DataFrame = Pd.DataFrame ('Autoren': ['Maria', 'Henry', 'Marry', NP.Nan, 'Alex'],
'Benutzername': ['fmn018', np.Nan, 'fm012', 'mg002', 'ma025'],
'Erfahrung': ['1 Jahr', '2 Jahr', NP.Nan, '6 Monate', '9 Monate']
)
Datenrahmen

Wie Sie sehen können, enthält der erstellte Datensatz mehrere NAN -Werte:

Verwenden Sie nun die “nicht null()Funktion zum Filtern der spezifischen Zeile aus der bestimmten Spalte, die NAN -Werte enthält:

DataFrame [DataFrame ['Experience'].nicht null()]

Ausgang

So filtern Sie mehrere Datenzeilen aus dem Datensatz, der den NAN -Wert enthält, indem Pandas DataFrame in Python verwendet wird?

Manchmal müssen Benutzer die mehreren Zeilen aus dem bereitgestellten Datensatz aus mehr als einer Spalte herausfiltern. Geben Sie dazu die gewünschten Spaltennamen an und verwenden Sie dann die “alle()”Funktion mit der“nicht null()Funktion:

Spalten = ['Erfahrung', 'Benutzername']
DataFrame [DataFrame [Spalten].nicht null().alle (1)]

Es kann beobachtet werden, dass mehrere Zeilen aus dem Datensatz filtriert werden, das NAN -Werte aus den angegebenen Spalten enthält:

So filtern Sie alle Zeilen aus dem Datensatz, der den NAN -Wert mithilfe von Pandas DataFrame in Python enthält?

Wenn Benutzer alle Zeilen aus dem Datensatz filtern möchten, der NAN -Werte mit dem Pandas -Datenframe in Python enthalten, enthält das “Dropna ()”Funktion kann verwendet werden:

Datenrahmen.Dropna ()

Ausgang

Wir haben die einfachsten Möglichkeiten zusammengestellt, die NAN -Werte in Python zu filtern.

Abschluss

Um die Zeilen mit den NAN -Werten in Python herauszufiltern, die “, die“Datenrahmen"Funktionen wie" wie "Datenrahmen.nicht null()", Und "Datenrahmen.Dropna ()Funktionen werden verwendet. Dieser Blog bot die unterschiedlichen Möglichkeiten, die NAN -Werte in Python zu filtern.