Pandas Nlargest

Pandas Nlargest
Die „Pandas“ ist die Bibliothek, die uns dabei hilft, mehrere Aufgaben einfach und effizient auszuführen. Wir können die "Pandas" -Bibliothek verwenden, wenn wir die Daten manipulieren und analysieren müssen. "Pandas" bietet auch die Möglichkeit, den Datenrahmen zu erstellen. Der DataFrame wird mit der Methode "Pandas" generiert. Wir können auch den größten Wert der Spalten des DataFrame finden. Wenn wir einige numerische Daten in die Spalte des DataFrame eingeben, finden wir auch die größten Werte in dieser Spalte mit Hilfe der „Pandas“ -Methode. Die Methode, die wir verwenden können, um die größten Werte in den Spalten des Datenrahmens zu finden, ist die Methode „nlargest ()“. Wir werden diese „nlargestig“ -Methode in den „Pandas“ -Codes in diesem Leitfaden verwenden und ihre Arbeit hier erläutern.

Syntax:
Datenrahmen.nlargest (N, Spalten, keep = "First")

Das „N“ repräsentiert die Anzahl der größten Werte, die wir aus den Spalten des DataFrame erhalten möchten. Anstelle des Parameters „Spalten“ setzen wir den Namen der Spalte, aus der wir die größten Werte erhalten möchten. Dann können wir im Parameter "Keep" "zuerst" oder "zuletzt" hinzufügen. Das „erste“ wird verwendet, um den ersten Wert der doppelten Werte anzuzeigen, und das „letzte“ wird verwendet, um den letzten Wert der doppelten Werte anzuzeigen.

Beispiel 1:

Der erste Code dieses Handbuchs ist hier. Alle Skripte, die wir in diesem Handbuch behandeln, werden mit dem Tool „Spyder“ durchgeführt. Wir importieren jedes Mal ein paar „Pandas“ -Module, wenn wir einen neuen „Pandas“ -Coder schreiben möchten. Diese können importiert werden, indem einfach die „Pandas als PD“ nach dem Schlüsselwort „Import“ geschrieben werden, was wir hier tun. Wenn wir nun die „PD“ in diesen Code einfügen, erhalten wir Zugriff auf die Funktionen von „Pandas“. Jetzt entwerfen wir den Datenrahmen hier, indem wir „PD“ setzen.DataFrame () ”.

Wir entwerfen den Datenrahmen "num_df" und setzen drei Spalten hinein. Die "Cola" ist die erste Spalte, die wir in diesem Datenrahmen erstellen. Die "Cola" enthält "10, 4, 6, 9 und 18". Nach „Cola“ fügen wir die zweite Spalte „Colb“ hinzu, in der wir auch einige Zahlen hinzufügen, die „13, 28, 48, 12 und 11“ sind. Dann ist die letzte Spalte, die wir hier einfügen, die Spalte "colc". In der Spalte „colc“ setzen wir "21, 24, 31, 44 und 59". Alle Spalten zusammen mit einigen Daten werden in den Datenrahmen „num_df“ eingefügt.

Jetzt verwenden wir die "print ()" und übergeben "num_df" an diese Funktion. Dadurch werden die "num_df" am Terminal angezeigt. Wir möchten die drei größten Werte aus der Spalte „Cola“ dieses Datenrahmens erhalten. Zu diesem Zweck verwenden wir also die Methode „nlargest ()“ und bestehen „3“ als erster Parameter, der die Anzahl der größten Werte darstellt, die wir erhalten möchten. Dann schreiben wir "Cola", weil wir die größten Werte der Spalte "Cola" erhalten und diese größten Werte in der "großen" Variablen speichern wollen. Dann drucken wir diese Werte aus. Wir verwenden also wieder "print ()", das die "große" Variable darin enthält. Diese drei größten Werte von „Cola“ werden am Terminal angezeigt.

Nachdem wir auf die Tasten "Shift+Enter" oder auf das Run -Symbol gedrückt wurden, können wir leicht das Ergebnis der "Pandas" -Codes im "Spyder" erzielen. Der DataFrame ist hier in diesem Ergebnis, das alle Daten enthält, die wir ihm hinzufügen. Dann werden im folgenden Datenframe drei Zeilen angezeigt. Dies sind die „3“ größten Werte der „Cola“, die hier in absteigender Reihenfolge wiedergegeben werden.

Beispiel 2:

Das "Gym_DF" ist in diesem Code gestaltet, in dem wir den "Weight_Loser" und "Gewichte" als Spalten hinzufügen. In der Spalte "Weight_Loser" werden "Theo, Harper, Oscar, Sue, Grace, Jayden, Larry und Taylor" hinzugefügt. Dann haben wir die "Gewichte" -Säule, in der wir die Gewichte "99, 101, 119, 89, 102, 85, 86 und 120" platzieren, die sind. Jetzt nennen wir den "print ()" und geben das Argument "Gym_Df" an. Dies führt dazu, dass das Terminal den „Gym_ DF“ zeigt. Wir möchten die größte Anzahl der "4" der Spalte "Gewichte" dieses Datenrahmens erhalten.

Um dies zu erreichen, verwenden wir die Methode „nlargest ()“ und bestehen die Zahl „4“ als erster Parameter, der für die Anzahl der größten Werte steht, die wir erhalten möchten. Dann tippen wir "Gewichte", um die größten Werte der Spalte "Gewichte" zu erwerben. Wir sparen auch diese größten Werte in der Variablen „Large_weight“. Die Werte müssen dann gedruckt werden. Daher verwenden wir den "print ()" noch einmal. Es enthält die Variable "Large_weights". Das Terminal zeigt die größten vier Werte „Gewichte“.

Nach den ursprünglichen Daten werden die größten vier Werte der Spalte „Gewichte“ in Form eines anderen neuen Datenrahmens angezeigt. Wir erhalten diese vier größten Werte mit der „nlargest ()“ -Methode von „pandas“ im Code.

Beispiel 3:

In diesem Beispiel lesen wir die CSV -Datei mit Hilfe der Methode „Read_csv“ von „Pandas“ und erstellen den Datenrahmen aus der CSV -Datei. Wir speichern diesen Datenrahmen in der Variablen "data_df". Jetzt verwenden wir die Methode "Dropna ()", bei der wir den Parameter "Inplace" an "wahr" anpassen. Dadurch wird diese Zeilen entfernt, bei denen der Nullwert erscheint. Danach erhalten wir die "nlargest ()" -Methode und fügen "5" hinzu, da wir die ersten fünf größten Werte der Spalte „Einheiten“ erhalten möchten. Diese fünf größten Werte werden in der Variablen „größte 5“ gespeichert. Dieser „größte5“ wird in "print ()" zum Anzeigen eingesetzt.

Es zeigt alle Daten der CSV -Datei hier als Datenrahmen nach dem Lesen an. Dann erhält es die ersten fünf größten Werte von „Einheiten“ und verdrängt sie in diesem Ergebnis.

Beispiel 4:

Dieser Code erstellt den "sales_df" und fügt die Spalten "Verkäufer" und "Vertrieb/Tag" hinzu. "ABC, ABD, Abe, ABF, ABG, ABH, ABI, ABJ, ABK und ABL" sind jetzt in der Spalte "Verkäufer" aufgeführt. Die Spalte „Verkauf/Tag“ folgt, wo wir die folgenden Verkaufspreise auflisten: „60000, 25000, 30000, 18000, 29000, 21000, 40000, 54000, 33000 und 41000“. Jetzt platzieren wir das Argument "sales_df" mit "print ()" mit dem Argument "Sales_df". Dieser Datenrahmen "Sales_DF" wird im Terminal als Ergebnis angezeigt. Die größten Zahlen „4“ in der Spalte „Verkauf/Tag“ dieses Datenrahmens sind das, was wir von diesem Datenrahmen erhalten möchten.

Die Methode „nlargest ()“ wird dazu verwendet. Der erste Parameter, der die Anzahl der größten Werte darstellt, die wir erhalten möchten, ist „4“, was hier hinzugefügt wird. Dann fügen wir den Namen der Spalte hinzu, aus der wir auf die größten Werte zugreifen möchten. Der Name dieser Spalte ist die Spalte "Verkauf/Tag". Wir fügen diese "nlargest ()" -Methode in die "print ()" hinzu, sodass es auch auf dem Terminal angezeigt wird.

Dieses Ergebnis enthält den Datenrahmen mit allen Daten, die wir dazu im Code beigetragen haben. Dann werden im folgenden Datenrahmen vier Zeilen angezeigt. Dies sind die größten Werte der Spalte "Verkauf/Tag". Sie werden in der folgenden Abbildung in absteigender Reihenfolge angezeigt:

Abschluss

In diesem Leitfaden wurde die „nlargest ()“ -Methode von „Pandas“ im Detail vollständig beschrieben. Wir haben die Syntax dieses Leitfadens im Detail sowie die Verwendung dieser Methode gelernt. Wir haben die Parameter dieser Methode ausführlich diskutiert und diese "nlargest ()" -Methode im "pandas" -Coder auch verwendet, um die Arbeit dieser "nlargest ()" -Methode anzuzeigen. Wir haben erklärt, wie wir die Anzahl der größten Werte erwähnen, die wir erhalten möchten, sowie den Spaltennamen, um die größten Werte „N“ aus der Spalte des DataFrame zu erhalten. Wir haben auch erklärt, wie Sie die größten Werte aus der CSV -Datei erhalten, nachdem Sie die Daten aus der CSV -Datei in diesem Handbuch gelesen haben.