Pandas füllen Nan mit 0

Pandas füllen Nan mit 0

Datenwissenschaft beinhaltet normalerweise fehlende Daten. Entweder kann die gesamte Zeile verworfen werden oder der Zeilen-Spalte-Kombination kann ein Wert hinzugefügt werden. Das Ablegen der Zeile/Spalte wäre absurd, da sie für jede Zeile eine bestimmte Metrik beseitigt. Nan, das für „nicht eine Zahl“ steht, ist eine der typischen Möglichkeiten, um einen Wert zu zeigen, der in einer Reihe von Daten fehlt. Um die beabsichtigten Ergebnisse zu erzielen, ist der Umgang mit Nan sehr wichtig. Lassen Sie uns herausfinden, wie Sie die NAN -Werte in einer Zeile oder Spalte eines Pandas -Datenframes auf 0 ändern können.

Methode 1: Verwenden von fillna ()

Die Na/NAN -Werte werden mit dem bereitgestellten Ansatz unter Verwendung der Funktion „fillna ()“ gefüllt. Es kann unter Berücksichtigung der folgenden Syntax verwendet werden:

Wenn Sie die NAN -Werte für eine einzelne Spalte füllen möchten, lautet die Syntax wie folgt:

Pandas.DataFrame_OBJ ['Spalte'].fillna (0)


Wenn Sie die NAN -Werte im gesamten DataFrame füllen möchten, lautet die Syntax wie folgt:

Pandas.DataFrame_OBJ.fillna (0)


Beispiel 1: Einzelspalte

Erstellen wir einen Datenrahmen mit dem Namen "Dokumente" mit zwei Spalten, die einige NAN -Werte enthält. Wir erstellen sie mit Numpy. Füllen wir nun die NAN -Werte mit 0 in beiden Spalten separat füllen.

Pandas importieren
Numpy importieren
# Betrachten Sie den Datenrahmen
Dokumente = Pandas.DataFrame ('Farbe': ["Red", "Blue", Numpy.Nan, Numpy.Nan, Numpy.Nan],
'Größe': [Numpy.Nan, 45,60,78, Numpy.nan])
drucken (Dokumente, "\ n")
# Füllen Sie Nan mit 0 in der Spalte Größe.
drucken (Dokumente ['Größe'].fillna (0), "\ n")
# Füllen Sie Nan mit 0 in der Farbspalte.
drucken (Dokumente ['Farbe'].fillna (0))


Ausgang:

Farbgröße
0 rote Nan
1 Blau 45.0
2 Nan ​​60.0
3 Nan 78.0
4 Nan Nan
0 0.0
1 45.0
2 60.0
3 78.0
4 0.0
Name: Größe, DTYPE: Float64
0 rot
1 Blau
2 0
3 0
4 0
Name: Farbe, DTYPE: Objekt


Erläuterung:

Zunächst füllen wir die NAN -Werte mit 0 in der Spalte „Größe“ aus. Dann füllen wir die NAN -Werte mit 0 in der Spalte "Farbe".

Beispiel 2: Mehrere Spalten

Füllen wir die NAN -Werte mit 0 im gesamten Datenrahmen aus.

Pandas importieren
Numpy importieren
# Betrachten Sie den Datenrahmen
Dokumente = Pandas.DataFrame ('Farbe': ["Red", "Blue", Numpy.Nan, Numpy.Nan, Numpy.Nan],
'Größe': [Numpy.Nan, 45,60,78, Numpy.nan])
# Füllen Sie NAN mit 0 im gesamten Datenrahmen aus
drucken (Dokumente.fillna (0))


Ausgang:

Farbgröße
0 rot 0.0
1 Blau 45.0
2 0 60.0
3 0 78.0
4 0 0.0


Erläuterung:

Zunächst füllen wir die NAN -Werte mit 0 im gesamten Datenrahmen aus. Jetzt gibt es im Datenrahmen „Dokumente“ keine NAN -Werte.

Methode 2: Verwendung von Ersatz ()

Um eine einzelne Spalte von NAN -Werten zu ersetzen, lautet die bereitgestellte Syntax wie folgt:

Wir müssen die NAN -Werte übergeben, die durch den ersten Parameter und 0 als zweiter Parameter ersetzt werden müssen, der die NAN -Werte ersetzt:

Pandas.DataFrame_OBJ ['Spalte'].ersetzen (Numpy.Nan, 0)


Um die NAN -Werte des gesamten Datenrahmens zu ersetzen, verwenden wir die folgende Syntax:

Pandas.DataFrame_OBJ.ersetzen (Numpy.Nan, 0)


Beispiel 1: Einzelspalte

Erstellen wir einen Datenrahmen mit dem Namen "Bestellungen" mit drei Spalten, die einige NAN -Werte enthält. Wir erstellen sie mit Numpy. Lassen Sie uns nun die NAN -Werte in den Spalten „Preis“ und „Produkt“ durch „Produkt“ getrennt ersetzen.

Pandas importieren
Numpy importieren
# Betrachten Sie den Datenrahmen
Bestellungen = Pandas.DataFrame ('Produkt': ["One", "Two", Numpy.Nan, Numpy.Nan, Numpy.Nan],
'Preis': [Numpy.Nan, 45,60,78, Numpy.Nan],
'id': [1,2,3,4,5])
drucken (Bestellungen, "\ n")
# Ersetzen Sie die NAN mit 0 in der Preisspalte.
drucken (Bestellungen ['Preis'].ersetzen (Numpy.Nan, 0), "\ n")
# Ersetzen Sie die NAN mit 0 in der Produktspalte.
Print (Bestellungen ['Produkt'].ersetzen (Numpy.Nan, 0))


Ausgang:

Produktpreis -ID
0 ein Nan 1
1 zwei 45.0 2
2 Nan ​​60.0 3
3 Nan 78.0 4
4 Nan Nan 5
0 0.0
1 45.0
2 60.0
3 78.0
4 0.0
Name: Preis, dType: float64
0 eins
1 zwei
2 0
3 0
4 0
Name: Produkt, DTYPE: Objekt


Erläuterung:

In der Spalte „Preis“ und zwei Werte in der Spalte „Produkt“ enthält drei Werte. Zunächst ersetzen wir die NAN -Werte durch 0 in der Spalte "Preis". Anschließend ersetzen wir die NAN -Werte durch 0 in der Spalte „Produkt“.

Beispiel 2: Mehrere Spalten

Erstellen wir einen Datenrahmen mit dem Namen "Bestellungen" mit drei Spalten, die einige NAN -Werte enthält. Wir erstellen sie mit Numpy. Lassen Sie uns nun die NAN -Werte in den Spalten „Preis“ und „Produkt“ durch „Produkt“ getrennt ersetzen.

Pandas importieren
Numpy importieren
# Betrachten Sie den Datenrahmen
Dokumente = Pandas.DataFrame ('Farbe': ["Red", "Blue", Numpy.Nan, Numpy.Nan, Numpy.Nan],
'Größe': [Numpy.Nan, 45,60,78, Numpy.nan])
# Ersetzen Sie die NAN mit 0 im gesamten Datenrahmen
drucken (Dokumente.ersetzen (Numpy.Nan, 0), "\ n")


Ausgang:

Farbgröße
0 rot 0.0
1 Blau 45.0
2 0 60.0
3 0 78.0
4 0 0.0


Der Datenrahmen „Bestellungen“ enthält fünf NAN -Werte. Danach ersetzen wir die NAN -Werte durch 0.

Abschluss

Der Umgang mit den fehlenden Einträgen in einem Datenrahmen ist eine grundlegende und notwendige Anforderung, die Komplexität zu verringern und die Daten trotzig im Datenanalyseprozess zu verarbeiten. Pandas bietet uns einige Möglichkeiten, um dieses Problem zu bewältigen. Wir haben zwei praktische Strategien in diesem Leitfaden eingebracht.