Pandas Sortierindex

Pandas Sortierindex
"Pandas" ist eines der Pakete der Python -Sprache, die Daten besser analysiert. Die Arbeit mit einer großen Auswahl an Daten ist hektisch und schwer zu verwalten. Da es viele Faktoren gibt, die Daten durchlaufen, ist einer von ihnen „sortieren“. Einer der wichtigsten Jobs ist die Datensortierung. Pandas haben eine Funktion, um Daten im Datenrahmen mithilfe ihrer Werte zu sortieren. Die Funktion ist pandas "sort_value". Dies hilft, Millionen von Daten in wenigen Minuten zu sortieren. Im Pandas -Sortierwert werden die Daten durch die Auswahl der Spalten in aufsteigender oder absteigender Reihenfolge sortiert. Wir werden alle so abdecken, wie die Pandas -Sort -Werte durchgeführt werden können. Wir werden das Tool „Spyder“ für die Implementierung des Code verwenden. Es hat eine Python -Sprachumgebung.

Syntax

df.sort_values

Das "DF" in der Syntax ist eine Abkürzung des "DataFrame". Die obige Syntax sortiert die Spalte nach dem Wert im Datenrahmen. Anstatt den gesamten DataFrame zu verwenden, arbeitet er mit einer bestimmten Beschriftung des DataFrame. Im Folgenden werden die Methoden des Pandas -Sort -Werts angezeigt, den wir mit Beispielen implementieren werden:

  • Pandas Reihenfolgewerte in aufsteigender Reihenfolge nach den angegebenen Spalten.
  • Pandas sortieren Werte nach mehreren Spalten (Fall I).
  • Pandas sortieren Werte nach mehreren Spalten (Fall II).
  • Pandas sortiert zuerst Nan -Werte nan.

Erstellen eines Datenrahmens für die Implementierung von Pandas -Sortierwerten in Beispielen

Importieren Sie die Pandas -Bibliothek als „PD“, nachdem Sie die Software „Spyder“ geöffnet haben, die Pandas -Bibliothek importieren. Erstellen Sie nun einen Datenrahmen. Der Datenrahmen besteht aus "Autos" -Daten. Wir haben die Namen der Marke: "BM", "uns", "HC" und "ZX". Wir haben auch die Preise dieser Autos, als "44000", "32000", "52000" und "23000" mit ihrem Herstellung von "2018", "2019", "2019" und "2020".

Die Ausgabe zeigt den Datenrahmen, der mit den Spalten der Automarken, ihren Preis und ihres Jahresjahres erstellt wurde.

Beispiel 01: Pandas Reihenfolgewerte in aufsteigender Reihenfolge nach den angegebenen Spalten

In diesem Beispiel verwenden wir die Pandas -Sort -Wertfunktion, um die Datenwerte zu bestellen. Der DataFrame hier besteht aus den Automodellen als "ww", "xx", "nn" und "tt" mit ihren Preisen "45000", "22000", "33000" und "55000" und ihre Produktionsjahre sind "2018" "," 2019 "," 2020 "und" 2021 ". Die Pandas -Sort -Werte funktionieren basierend auf ihrer angegebenen Spaltenauswahl. Hier werden wir die Sortierung basierend auf der Spalte „Marke“ durchführen, wie Sie im Code sehen können. Wir haben den Aufstieg im Code nicht geschrieben, da Sie nicht erwähnen müssen.

Der DataFrame zeigt die Sortierung der Spalte „Marke“ in aufsteigender Reihenfolge an.

Beispiel 02: Pandas sortieren Werte nach ausgewählter Spalte in absteigender Reihenfolge

Im letzten Beispiel haben wir gesehen, wie Werte in aufsteigender Reihenfolge sortiert werden können. Wir möchten nicht, dass die Daten immer aufsteigend sortiert sind. Manchmal wollen wir es in absteigender Reihenfolge. Jetzt werden wir tun, wie die Werte in absteigender Reihenfolge sortiert werden können. Wir haben den DataFrame mit den Cars -Daten wie seinen Marken: "YY", "QQ", "PP" und "BB" mit ihren Preisen "38000", "45000", "22000" und "12000". Wir haben sowohl die Produktionsjahre als auch "2019", "2020", "2021" und "2020". Wir haben dieselbe „Spalte„ Marke “ausgewählt, um ihre Daten zu sortieren, wobei die Namen in absteigender Reihenfolge einfach eine Bedingung„ ASSION = FALSE “hinzufügen, indem wir einfach eine Bedingung hinzufügen. Das "in Place = true" im Code ist ein Schlüsselwort, das das Standardverhalten in der Pandas -Methode ändert.

Die Ausgabe zeigt die DF -Sortierung der Säulenmarke in absteigender Reihenfolge.

Beispiel 03: Pandas sortieren Werte nach mehreren Spalten (Fall I)

Jetzt werden wir ein Beispiel für den Pandas -Sort -Wert in mehreren Spalten geben. Die Daten, die wir als Markennamen von Autos "LL", "KK", "HH" und "GG" haben. Ihre Preise betragen "45000", "14000", "13000" und "56000" und die Produktionsjahre "2019", "2020", "2021" und "2018". Hier haben wir die Spalte „Preis“ und „Jahr“ ausgewählt, da wir die Sortierung mehrerer Spalten durchführen müssen. Wir haben die Funktion "sort_value" mit der "DF" und den für die Sortierung ausgewählten Spalten verwendet.

In der Ausgabe können wir hier sehen, dass die Spalte „Preis“ und „Jahr“ erfolgreich sortiert ist.

Beispiel 04: Pandas sortieren Werte nach mehreren Spalten (Fall II)

Im letzten Beispiel haben wir die Sortierung von Daten in mehreren Spalten durchgeführt. Was ist, wenn die zwei Jahre das gleiche Herstellung „Jahr“ haben,? Hier werden wir diese Situation anerkennen. Die Daten sind von Autos als "xx", "bb", "ee" und "dd" mit ihren Preisen als "12000", "15000", "19000" und "17000". Die Jahre des hergestellten Autos sind „2021“, „2019“, „2020“ und „2020“. Wie wir sehen können, erscheint der „2020“ zweimal in der Herstellung. In dieser Situation sollte in welchem ​​Jahr diese Frage der erste in den Daten sein sollte? Einfach wird es das Jahr durchlaufen, wenn beide gleich sind. Dann würde es den Preiswert überprüfen. Derjenige, der den niedrigsten Preis hat, wird an erster Stelle sein und der höchste wird danach danach gehen. Basierend auf den zugewiesenen Werten funktioniert es, wenn diese Art von Bedingung auftritt. Im Code haben wir die Spalte „Jahr“ und „Marke“ ausgewählt, um sie nach Pandas -Sort -Wert zu sortieren.

Das Display ist der sortierte Wert sowohl der Marke als auch des Jahres. Hier sehen wir, dass das Jahr „2020“ zweimal erscheint; Zuerst mit dem Preis „17000“ und dann mit dem Preis „19000“.

Beispiel 05: Pandas sortieren zunächst nan nan

Wir werden den Numpy in diesem Fall als NP importieren. Der Numpy wird für die numerischen Berechnungen der Daten verwendet. "Nan" steht für "nicht eine Nummer". Wenn in den Daten keine Nummer zugewiesen ist, wird es als "Nan" angezeigt. Wir werden das Beispiel tun, damit die NAN -Werte im DataFrame zuerst angezeigt werden. Die Pandas -Sortierfunktion wird mit der "Na_Position" = 'First' "verwendet. Dies bedeutet, dass die Position als erste der nicht verfügbaren oder Nullwerte in der" DF "festgelegt wird. Wir haben die Spalte "Jahr" ausgewählt, um ihre "NAN" -Werte ganz oben auf dem DataFrame zu haben.

Die Ausgabe zeigt den NAN -Wert zuerst in der Spalte des Jahres.

Abschluss

Pandas -Sortwert ist eine effiziente und sehr vorteilhafte Methode. Wir haben jede mögliche Methode zur Sortierung von Werten in Pandas in diesem Artikel behandelt: die aufsteigende und absteigende Reihenfolge der ausgewählten Datenfalle -Spalte. Wir haben die Mehrfachspalten -Sortierung durchgeführt, die wir auf zwei Arten gemacht haben: die normale Weise und die ähnliche Erscheinungssituation für das Jahr. Zuletzt haben wir die "NAN" -Werte zuerst im DataFrame sortiert. Jede Methode des Pandas -Sort -Wertes ist für sich allein würdig, da die Arbeit in einer großen Auswahl an Datensortierung schwierig und fast unmöglich ist.