Pandas interpolieren

Pandas interpolieren
Die Interpolation ist eine Möglichkeit, die unbekannten Daten zwischen den beiden bekannten Werten der Daten abzuschätzen. Die PANDAS -Methode „Interpolieren“ wird verwendet, um die fehlenden Qualitäten im DataFrame zu füllen. Es ist nicht die beste Version des Findens der fehlenden oder unbekannten Daten, da sie manchmal die Genauigkeit der Daten beeinflussen und kurzfristige Fehler aufweisen können. Aber es gibt ein „Polynom“, das eine Art von Pandas -Interpolat ist, das in vielerlei Hinsicht verwendet wird. Pandas 'Python ist eine sehr hilfreiche Sprache für Informationsdatenbezogene Arbeiten. Wir werden das Tool „Spyder“ für die Implementierung der Codes verwenden, eine in Python sprachbasierte freundliche Software. Die Pandas -Interpolation kann in verschiedenen Methoden durchgeführt werden. Wir müssen wissen, welche Arbeiten wir erledigen müssen. Mit diesem Wissen werden wir die Methode entsprechend implementieren, die wir mit vollständigen Beispielen und Erklärungen diskutieren werden.

Arten von Pandas interpolieren

Im Folgenden finden Sie die drei Möglichkeiten, wie die Pandas -Interpolation durchgeführt werden kann:

  • Lineare Pandas -Interpolation (vorwärts, rückwärts, sowohl Einzelsäule, Achse, Polsterung und Polynom).
  • Polynom -Pandas -Interpolation.
  • Pandas -Interpolation durch die Polsterung.

Es gibt einige Parameter, die wie folgt sind:

limit_direction

"Vorwärts", "rückwärts", "beide"

Die Grenzrichtung ist standardmäßig als „Vorwärts“ festgelegt, was bedeutet, dass, wenn wir die Methode nicht angegeben haben.

Erstellen des Datenframe

Erstens werden wir uns darauf konzentrieren, den DataFrame "DF" zu erstellen. Wir haben die Pandas -Bibliothek als „PD“ importiert, eine Open -Source -Bibliothek zur Manipulation der Daten. Dann werden wir mit der Software "Spyder" die "DF" erstellen, in der wir die Daten wie in vier Variablen namens "W", "X", "Y" und "Z" haben. Alle von ihnen haben getrennte Werte wie "W", die die Werte "18", "5", "9", "3", "None" enthält, "keine". "X" hat die Werte "keine", "89", "4", "8" und "keine". "Y" hat die Werte "30", "keine", "7", "9", "12". In ähnlicher Weise "Z" mit den Werten "11", "keine", "66", "5" und "8".

Hier wird im obigen Code der Datenrahmen erstellt, der als „DF“ geschrieben werden kann. In der ersten Codezeile wird die Pandas -Bibliothek als „PD“ importiert. Dann wird der Datenrahmen erstellt, in dem wir die Variablen "W", "X", "Y" und "Z" zugewiesen haben, da sie jeweils fünf Werte zugewiesen haben. Die "Nan" im Code steht für "nicht eine Nummer".

Die Ausgabe zeigt die Datenframewerte, wie wir sie im Code zugewiesen haben. Es gibt die Seriennummern, dann die Variablen, die die zugewiesenen Werte fallen lassen.

Beispiel 01: Linear Pandas Interpolation Methode vorwärts

Bei der linearen Interpolation funktioniert die Interpolat () -Methode als Punkte in der Nähe des linken und rechts, nachdem die Schätzung durchgeführt wurde. Es wird angenommen, dass diese Punkte auf dem unbekannten Treffpunkt liegen. Wie oben in den Parametern erwähnt, wird der Parameter, wenn wir nicht angeben. Der folgende Code ist ein klares Beispiel für den Standard. Hier haben wir die Variablen als "S", "T", "u" und "V" mit ihren Werten für den Datenrahmen genommen. Wenn wir jedoch selbst angeben möchten, können wir mit demselben Code gehen. Fügen Sie einfach nach der letzten Codezeile DF hinzu. Interpolat () kann mit der Grenzrichtung geschrieben werden, in der sie als „Vorwärts“ angegeben ist, damit es so aussieht: „DF.Interpolat (limit_direction = 'Forward') ”.

Die folgende Ausgabe zeigt die Vorwärtsinterpolation des obigen Code. In Bezug auf die angegebenen Details funktioniert die Standardeinstellung als „Interpolation vorwärts“, weshalb der T (0) den Nullwert anzeigt.

Beispiel 02: Lineare Pandas -Interpolationsmethode rückwärts

Wenn wir die lineare Rückwärts -Interpolation durchführen wollen, können wir dies ähnlich tun, wie wir es oben in der Vorwärts -Interpolation getan haben. Wir müssen die Grenze als „rückwärts“ als „rückwärts“ angeben, diesmal, wie im Code gezeigt. Hier sind die Variablen, an denen wir für den DF arbeiten, „D”, “q”, ”, B“ und „J“ mit ihren zugewiesenen Werten.

Die Ausgabe der Rückwärts -Interpolation () -Methode (4) ist aufgrund der nach hinten durchgeführten Interpolationsmethode null.

Beispiel 03: Beide linearen Pandas -Interpolationsmethoden

Was ist hier, wenn wir den Vorwärts und rückwärts sowohl auf demselben Code machen wollen? Es ist möglich und wir können es einfach mit der Interpolationsmethode „beide“ tun. Hier haben wir für die "DF" die Variablen "P", "U", "O" und "M" mit ihren entsprechenden Werten zugewiesen.

Die folgende Ausgabe besteht aus beiden, der Vorwärts- und der Rückwärts -Interpolationsmethode.

Beispiel 04: Einzelspalte -Pandas -Interpolationsmethode

Wir können die Interpol -Methode wie gewünscht auch auf eine einzelne Spalte anwenden. Für die Erstellung von DataFrame haben wir die Variablen „N“, „M“, „O“ und „P“ mit den zugewiesenen Werten verwendet. Die Spalte "n" wird aus der "DF" ausgewählt, um mit der Interpolat () -Methode angezeigt zu werden.

Die Ausgabe hier zeigt die einzelne Spalten -Pandas -Interpolation an.

Beispiel 05: Achse -Pandas -Interpolationsmethode

Manchmal möchten wir nach Bedarf nach Säulen und manchmal durch Zeilen interpolieren, damit das Attribut „Achsen“ von seiner besten Seite funktioniert. Diese Funktion ist die Standardeinstellung als Spalte 1, während wir, wenn wir möchten, dass die Zeilen interpolieren, der Achse explizit als 1 folgen müssen. Die "L", "F", "I" und "T" sind Variablen, die in diesem "DF" mit ihren Werten entsprechend zugewiesen sind.

Die Ausgabe der Achse interpolieren ():

Beispiel 06: Polynom -Pandas -Interpolationsmethode

In der Mathematik ist ein Polynom ein Ausdruck, der aus Unbestimmungen besteht, die auch als Variablen und Koeffizienten bezeichnet werden, die die arithmetischen Operationen ausführen. Bei der Interpolation gibt es einige Chancen von Fehlern, die hier und da manchmal auftreten können. Während die Polynominterpolation die Best Practice ist, die über die Seriendaten unternommen wird. Die hier aufgenommenen Daten sind in Serie: "4", "5", "6", "NP". Nan “,„ 8 “und„ 9 “folgen mit der Interpolatmethode des Polynoms. Np.Nan wird als NP aus der Panda -Bibliothek definiert und "Nan" wird als "nicht als Zahl" bezeichnet.

Das Ergebnis zeigt die Polynom -Pandas -Interpol -Methode an:

Beispiel 07: Pandas -Interpolation mit Polsterung

Die Panda -Interpolation mit Polsterung ist definiert als „Schreiben oder Kopieren eines Wertes vor einem fehlenden Punkt“. Bei dieser Methode muss die Spezifikation der Grenze angesprochen werden. Die Grenze sollte die maximale Anzahl von „NANs“ sein, da sie diese kontinuierlich erfüllt. Diese Methode funktioniert nur in die Vorwärtsrichtung und auch in den Seriendaten. Das "DF" für diese Methode ist in der Serie als "2", "3", "NP". Nan ”,„ 5 “,„ 6 “,„ 7 “und„ 8 “folgen der Methode 'Pad' für die Polsterung.

Die Ausgabeergebnisse zeigen die Pandas -Interpolation durch „Polsterung“.

Abschluss

Die PANDAS -Interpatmethode ist eine sehr bequeme Methode zum Auffüllen der „NAN“ oder der fehlenden Werte. In diesem Artikel haben wir verschiedene Arten von Interpolation in Pandas DataFrame gelernt- sei es vorwärts, rückwärts oder beides mit Achse, Polynom- und zuletzt die Polstermethode. Alle von ihnen werden für einen bestimmten Zweck und die Leichtigkeit der Benutzer verwendet, die an großen Datenmengen arbeiten.