Pandas wählen Zeile nach Index

Pandas wählen Zeile nach Index
Die Auswahl von Zeilen aus einem Datenrahmen kann für eine Vielzahl von Datenanalyseaufgaben erforderlich sein. Bei der Auswahl bestimmter Zeilen und der erneuten Abtastung von PANDAS-Datenrahmen und -serien wird die PANDAS-Technik für die integer-basierte Indexierung verwendet.

Sie können es verwenden, indem Sie der angegebenen Syntax folgen:

Nur ganzzahlige Eingaben werden von der Eigenschaft „Iloc []“ behandelt. Diese Eingaben können jedoch auf verschiedene Weise übergeben werden.

Sie lernen verschiedene Ansätze für die Sub-Seting-PANDAS-Datenrahmen unter Verwendung der Eigenschaft „Iloc []“ in diesem Tutorial kennen.

Beispiel 1:

Um eine einzelne Zeile im DataFrame nach Index auszuwählen, werden wir uns mit der praktischen Demonstration des „DF befassen.Iloc [] ”-Methode von Pandas bereitgestellt.

Zusammenstellung und Ausführung der Beispiele werden im Tool „Spyder“ durchgeführt. Also haben wir das Tool gestartet und nach den erforderlichen Bibliotheken gesucht. Wir haben festgestellt, dass das "Pandas" -Toolkit das ist, was wir mit Methoden arbeiten müssen, um die Zeilen auszuwählen. Die Pandas -Bibliothek wird in das Programm importiert und „PD“ wird als Alias ​​festgelegt. Wo immer im Code, müssen wir Pandas anrufen, "PD" anstelle von "Pandas" verwenden, verwenden Sie "PD".

Die erste Verwendung des Pandas -Toolkit.DataFrame () ”Methode. Wir nennen die „PD.DataFrame () ”-Funktion und geben Werte dafür an. Wir wollten, dass es einen Datenrahmen mit 3 Spalten erstellt: "Berge", "Höhe" und "Kontinent". Die Werte wurden für jede Spalte identifiziert und die Säulenlänge wird für alle Spalten gleich gehalten.

Die Spalte „Berge“ hält die Namen der Bergketten, die „Karakoram“, „Hindu Kush“, „Alaska Range“, „Himalaya“ und „Anden“ sind. Die zweite Spalte „Höhe“ speichert die Länge in Metern dieser Bergbereiche. Die Werte für diese Spalte sind "8611", "7708", "6194", "8848" und "6961". Die letzte Spalte "Kontinent" hat den Namen des Kontinents, in dem sich diese Berge befinden: "Asien", "Asien", "n_america", "Asien" und "s_america".

Der DataFrame -Konstruktor erstellt bei Aufruf einen Datenrahmen mit den mitgelieferten Daten. Aber wenn wir es im selben Programm mit neuen Daten erneut anrufen, wird es den vorherigen verlieren. Dies liegt daran. Wir müssen einen Raum schaffen, um ihn zu erhalten. Um den DataFrame so zu halten, dass wir ihn anschließend verwenden können, haben wir ein DataFrame -Objekt "Fakten" erstellt. Es wird den DataFrame mit angegebenen Spalten und Zeilen gespeichert.

Um das Ergebnis anzuzeigen, gibt Python uns eine einfache Methode, bei der die Methode „print ()“ ist. Es nimmt nur die Eingabe an und zeigt ihn am Terminal aus. Die Eingabe kann eine Funktion, eine Variable/Objekt, ein mathematischer Operation oder eine Zeichenfolge sein, die angezeigt wird. Da wir unseren neu erstellten DataFrame anzeigen möchten, haben wir das DataFrame -Objekt „Fakten“ als Eingabe für die „Print ()“ -Methode von Python bereitgestellt.

Um das Skript auszuführen, haben wir die Tasten "Shift+Enter" gedrückt. Hier finden Sie unseren Datenrahmen mit 3 Spalten und 5 Zeilen, die auf dem Terminal präsentiert werden und im Snapshot unten zu sehen sind.

Jetzt wird das Abrufen einer einzelnen Zeile in dem bereitgestellten Datenrahmen untersucht. Die Auswahl basiert auf dem Index. Dafür hat der Pandas DataFrame die Eigenschaft „DF.Iloc [] ”. Es können nur ganzzahlige Werte für die Auswahl an diese Methode übergeben werden.

Wir haben die „DF.ILOC [] ”Eigenschaft direkt nach der Anzeige des Datenrahmens. Der Name unseres Datenrahmens "Fakten" wird mit der "Iloc []" -Methode bereitgestellt. Zwischen den quadratischen Klammern der Eigenschaft wird die Indexnummer der Zeile, die wir extrahieren möchten, angegeben. Hier haben wir die Indexnummer "3" zur Verfügung gestellt. Die Eigenschaft "Iloc []" untersucht also den Datenrahmen "Fakten" und sucht die Zeile mit Indexnummer 3. Es entspricht dem Index, den wir mit jedem Index des Datenrahmens geliefert haben, und wählt die Zeile aus, die gleich der Eingabe -Indexnummer entspricht. Nach dem Abrufen der Zeile wird sie in die "Box" -Variable eingefügt, die wir erstellt haben, um das Ergebnis der Eigenschaft "iloc []" zu speichern. Schließlich wird das Ergebnis auf der Konsole unter Verwendung der Methode „Print ()“ angezeigt.

Die Zeile mit Index 3 wird abgerufen. Sie können es im Bild unten sehen. Die Reihe mit Index Nummer 3 hat einen Berg namens Himalaya, die Höhe beträgt 8848 und der Kontinent ist Asien. Außerdem ist der Datentyp für diese erwähnte Zeile „Objekt“.

Beispiel # 2:

In der obigen Abbildung haben wir gelernt, eine einzelne Zeile durch den Index auszuwählen, indem wir die Pandas DataFrame -Eigenschaft „ILOC []“ verwenden. In dieser Instanz wird über die Auswahl mehrerer Zeilen in einem Datenrahmen per Index gesprochen.

Wir haben die „DF angestellt.Iloc [] ”Eigentum. In diesem Fall verwenden wir auch den oben erstellten Datenframe. Der DataFrame -Name "Fakten" wird mit der Eigenschaft "Iloc []" geschrieben, und in seinem Einweisbetreiber haben wir eine andere Quadratklammer verwendet, um mehrere Indizes anzugeben. Wenn Sie die 2. Quadratklammer nicht hinzufügen, wirft dies einen Fehler auf. Die Indizes, die wir zur Anzeige ausgewählt haben, sind "0", "2" und "4". So extrahiert es Zeilen 1, 3 und 5. Das Ergebnis wird in der "multiplen" Variablen gespeichert. Die Funktion „print ()“ zeigt die Ausgabe.

Die 3 ausgewählten Zeilen wurden am Terminal angezeigt.

Neben der Auswahl mehrerer Zeilen in einem Datenrahmen können Sie auch auswählen, welche Spalten mit den Zeilen angezeigt werden sollten.

Innerhalb der Quadratklammern der „Iloc []“ -Methode haben wir die Indizes für die Zeilen und die Indizes der ausgewählten Spalte definiert. Im ersten Indexbetreiber haben wir Indizes für Zeilen als "1", "2" und "3" und Spaltenindizes in der 2. als "0" und "2" erwähnt, und "3" und "2". Die Ausgabe wird unter Verwendung der Methode „Print ()“ dargestellt.

Drei Zeilen mit 2 Spalten wurden im resultierenden Datenrahmen ausgewählt.

Beispiel # 3:

Die letzte Technik, um die Eigenschaft „Iloc []“ auszuüben, besteht darin, die Zeilen nach Indexwert auszuwählen.

Wenn es darum geht, eine große Anzahl von Zeilen in einem Datenrahmen durch die Indexwerte auszuwählen. Hier ermöglicht die Pandas DataFrame -Eigenschaft „Iloc []“, einen Wertebereich bereitzustellen.

Wir haben das „DF) ausgeübt.Iloc [] ”Eigenschaft mit dem in erster Instanz generierten Datenrahmen. Der Bereich der Indexwerte wird als "1: 4" angegeben. Hier ist „1“ die Startindexnummer und „4“ ist der letzte Indexwert. Es wird die Werte zwischen diesem Bereich einschließlich des Startindexwerts ausgewählt, jedoch ohne den letzten angegebenen Indexwert ausgeschlossen. Die Variable „Range“ wird erstellt, um die Ausgabe zu halten. “. Die Funktion „print ()“ wird aufgerufen, um das Ergebnis anzuzeigen.

Dies gibt uns den Datenrahmen, der im unten angehängten Ausgangsbild angezeigt werden kann.

Abschluss

In diesem Artikel haben wir die Auswahl der Zeilen in einem Datenrahmen mit den Indexwerten erörtert. Wir haben den Pandas DataFrame „DF verwendet.Iloc [] ”Eigenschaft, um die gewünschten Ergebnisse zu erzielen. Verschiedene Techniken zur Verwendung der Eigenschaft „Iloc []“ wurden mit den Beispielcodes erklärt und implementiert. Das erste Beispiel zeigt uns die Möglichkeit, eine einzelne Zeile nach Index zu extrahieren, die zweite Abbildung bei der Auswahl mehrerer Zeilen nach Index und ausgewählten Zeilen mit angegebenen Spalten, und die letzte Instanz ergab eine Vorstellung von der Eingabe des Bereichs der Indexwerte.