Pandas, um den Zellwert zu überprüfen, ist NAN

Ansgar Radtke

Die Hauptdokumentation der Pandas sagt, dass Nullwerte fehlende Werte fehlen. Wir können die fehlenden oder Nullwerte als NAN in den Pandas bezeichnen, wie es die meisten Entwickler tun. Die NAN- und keine Schlüsselwörter werden von Entwicklern verwendet, um die fehlenden Werte im DataFrame anzuzeigen. Das Beste in den Pandas ist, dass es sowohl NAN als auch keine ähnlich behandelt. Um den fehlenden Wert einer Zelle zu überprüfen, Pandas.Notnull wird in beiden Fällen von NAN und keiner falsch zurückkehren, wenn die Zelle NAN oder keine hat.

In diesem Artikel werden wir also verschiedene Methoden untersuchen, um zu überprüfen, ob ein bestimmter Zellwert null ist oder nicht (NAN oder keine).

Die verschiedenen Methoden, die wir diskutieren werden, sind:

ist Null
isnan
Isna
nicht null

Lassen Sie uns jede Methode im Detail diskutieren.

Methode 1: Verwenden der ISNull -Funktion

Bei dieser Methode werden wir eine sehr einfache Methode namens isnull () verwenden, um herauszufinden, ob die bestimmte Zelle einen NAN -Wert hat.

# Python isnull.py
Pandas als PD importieren
Numph als NP importieren
Data = 'x': [1, 2, 3, 4, 5, NP.Nan, 6, 7, NP.Nan, 8, 9, 10, NP.Nan],
'y': [11, 12, np.Nan, 13, 14, NP.Nan, 15, 16, NP.Nan, NP.Nan, 17, NP.Nan, 19]
df = pd.DataFrame (Daten)
Druck (df)
nan_in_df = df.isnull (df.Iloc [5, 0])
print (nan_in_df)

Ausgang: Python isnull.py

x y
0 1.0 11.0
1 2.0 12.0
2 3.0 nan
3 4.0 13.0
4 5.0 14.0
5 Nan Nan
6 6.0 15.0
7 7.0 16.0
8 Nan Nan
9 8.0 nan
10 9.0 17.0
11 10.0 nan
12 Nan 19.0
WAHR

Zeile 3 bis 4: Wir importieren die Bibliothek Pandas und Numpy.

Zeile 6: Wir erstellen ein Wörterbuch mit X- und Y -Tasten und ihren Werten mit etwas NP.Nan.

Zeile 8 bis 10: Wir konvertieren das Wörterbuch in den Datenrahmen und drucken dann diesen Datenrahmen, den wir in der obigen Ausgabe sehen können.

Zeile 12 bis 13: Wir nennen die DataFrame -Methode iSnull und überprüfen bestimmte Zellen [5, 0]. Der Datenframewert ist null oder nicht. In diesem Fall prüfen wir nicht auf den gesamten Datenrahmen und den Einzelzelldatenframe-Wert. Daher gibt es den Ausgang true, was in der obigen Ausgabe gezeigt wird. Der erste Wert 5 [5, 0], der die Indexposition darstellt, und der andere Wert 0 repräsentiert den Spalten -Indexnamen.

Methode 2: Verwendung von isnan () Methode

Im obigen Beispiel haben wir den NAN -Wert mithilfe der ISNull -Methode des Datenrahmens überprüft. Jetzt werden wir eine andere Methode namens Isnan verwenden. Diese Methode gehört zum Numpy und nicht zum Datenrahmen. Das folgende Programm ist für das, was nur auf die jeweilige Zelle prüft.

# Wir können auch den Mobilfunk -Nan -Wert im DataFrame überprüfen
Data = 'x': [1, 2, 3, 4, 5, NP.Nan, 6, 7, NP.Nan, 8, 9, 10, NP.Nan],
'y': [11, 12, np.Nan, 13, 14, NP.Nan, 15, 16, NP.Nan, NP.Nan, 17, NP.Nan, 19]
df = pd.DataFrame (Daten)
Druck (df)
Wert = df.bei [5, 'x'] # nan
isnan = np.isnan (Wert)
print ("==============="))
print ("ist Wert bei DF [5, 'x'] nan:", isnan)

Ausgang:

x y
0 1.0 11.0
1 2.0 12.0
2 3.0 nan
3 4.0 13.0
4 5.0 14.0
5 Nan Nan
6 6.0 15.0
7 7.0 16.0
8 Nan Nan
9 8.0 nan
10 9.0 17.0
11 10.0 nan
12 Nan 19.0
===============
Ist Wert bei df [5, 'x'] nan: true

Zeile 2: Wir erstellen ein Wörterbuch mit X- und Y -Tasten und ihren Werten mit etwas NP.Nan.

Zeile 4 und 5: Wir konvertieren das Wörterbuch in den Datenrahmen und drucken dann diesen Datenrahmen, den wir in der obigen Ausgabe sehen können.

Zeile 6: Wir haben den bestimmten Zellwert unter Verwendung des Index- und Spaltennamens [5, 'x'] gefiltert und diesen Wert dem variablen Wert zugewiesen. Der erste Wert 5, der die Indexposition darstellt, und 'x' repräsentiert den Spaltennamen.

Zeile 7: Wir überprüfen, ob der Wert Nan ist oder nicht.

Zeile 9: Wir drucken endlich unsere Ausgabe, die zeigt, dass der Wert Nan wahr ist.

Methode 3: Zell -Nan -Wert in einer Serie mit ISNAN

Wir haben im vorherigen Beispiel den NAN -Wert in einem Zelldatenrahmen überprüft. Wir können auch innerhalb der Pandas -Serie überprüfen, ob ein Zellwert NAN ist oder nicht. Mal sehen, wie wir das implementieren können.

# Wir können auch den Mobilfunk -Nan -Wert in der DataFrame -Serie überprüfen
Serie_DF = PD.Serie ([2, 3, NP.Nan, 7, 25])
Print (Serie_DF)
value = series_df [2] # nan
isnan = np.isnan (Wert)
print ("==============="))
print ("ist Wert bei df [2] nan:", isnan)

Ausgang:

0 2.0
1 3.0
2 Nan
3 7.0
4 25.0
DTYPE: Float64
===============
Ist Wert bei df [2] nan: true

Zeile 3: Wir haben die Pandas -Serie erstellt.

Zeile 6: Wir weisen den Zellwert zu, den wir an eine andere Variable überprüfen möchten.

Zeile 7: Wir prüfen entweder den Wert in dieser Variablen ist NAN oder nicht.

Methode 4: Verwenden von Pandas.Isna

Eine andere Methode, die wir verwenden können, besteht darin, zu überprüfen.ISNA -Methode.

Data = 'x': [1,2,3,4,5, NP.Nan, 6,7, NP.Nan, 8,9,10, NP.Nan],
'y': [11,12, np.Nan, 13,14, NP.Nan, 15,16, NP.Nan, NP.Nan, 17, NP.Nan, 19]
df = pd.DataFrame (Daten)
Druck (df)
print ("NAN -Wert in der Zelle überprüfen [5, 0]")
PD.ISNA (df.Iloc [5,0])

Ausgang:

x y
0 1.0 11.0
1 2.0 12.0
2 3.0 nan
3 4.0 13.0
4 5.0 14.0
5 Nan Nan
6 6.0 15.0
7 7.0 16.0
8 Nan Nan
9 8.0 nan
10 9.0 17.0
11 10.0 nan
12 Nan 19.0
Überprüfen Sie den NAN -Wert in der Zelle [5, 0]
WAHR

Linie 1: Wir erstellen ein Wörterbuch mit X- und Y -Tasten und ihren Werten mit etwas NP.Nan.

Zeile 3 bis 5: Wir konvertieren das Wörterbuch in den Datenrahmen und drucken dann diesen Datenrahmen, den wir in der obigen Ausgabe sehen können.

Zeile 8: Wir prüfen, ob der Wert der Zelle [5, 0] Nan ist oder nicht. Der erste Wert 5, der die Indexposition darstellt, und 0 den Spaltennamen darstellt. Wir drucken endlich unsere Ausgabe, die zeigt, dass der Wert Nan wahr ist.

Methode 5: Verwenden von Pandas.Notnull -Methode

Eine andere Methode, mit der wir entweder einen bestimmten Zellwert überprüfen können, ist NAN oder nicht die Notnull -Methode. Wenn der Zellwert Nan oder fehlt, gibt er bei dieser Methode ein boolescher Falsch zurück, wie im folgenden Programm gezeigt.

Ausgang:

x y
0 1.0 11.0
1 2.0 12.0
2 3.0 nan
3 4.0 13.0
4 5.0 14.0
5 Nan Nan
6 6.0 15.0
7 7.0 16.0
8 Nan Nan
9 8.0 nan
10 9.0 17.0
11 10.0 nan
12 Nan 19.0
Überprüfen Sie den NAN -Wert in der Zelle [5, 0]
FALSCH

Linie 1: Wir erstellen ein Wörterbuch mit X- und Y -Tasten und ihren Werten mit etwas NP.Nan.

Zeile 3 bis 5: Wir konvertieren das Wörterbuch in den Datenrahmen und drucken dann diesen Datenrahmen, den wir in der obigen Ausgabe sehen können.

Zeile 8: Wir überprüfen, ob der Wert der Zelle [5, 0] nicht NAN ist. Der erste Wert 5, der die Indexposition darstellt, und 0 den Spaltennamen darstellt. Wir drucken endlich unsere Ausgabe, die zeigt, dass der Wert Nan hat und als falsch zurückkehrt, weil wir überprüfen, ob die Zelle nicht ist, aber die Zelle tatsächlich null ist.

Abschluss

In diesem Blog haben wir verschiedene Methoden gesehen. Deshalb ist dieser Blog speziell für den Zellwertfokus. Wir haben Pandas und Numpy gesehen, beide Methoden, um fehlende Werte zu überprüfen. Wir konzentrieren uns nur auf das Konzept, um einfache Tutorials zu zeigen und keine Iterationsschleife zu verwenden. Alle oben diskutierten Methoden sind schnell in der Ausführung, auch wenn Sie den gesamten Datenrahmen überprüfen möchten.

Der Code für diesen Blog ist unter dem GitHub -Link verfügbar.

Python

Pandas read_csv multiprocessing

Verbesserung der Datenbelastungsgeschwindigkeit, einschließlich ihrer Vorteile und Einschränkungen d...

Christopher Lammert

Python

Python Chmod

Das “os.CHMOD () ”Die Funktion des Betriebssystemmodul....

Lars Daub

Docker

Was ist der Zweck eines Docker-Composes?.YML -Datei in Docker?

Der Hauptzweck eines „Docker-Composes.Die YML-Datei soll den Prozess der Bereitstellung und Verwaltu...

Jessica Schimmer