Pandas erhalten Index

Pandas erhalten Index
„Es ist erforderlich, die Zeilenindizes zu finden, was für die Feature Engineering von entscheidender Bedeutung ist. Diese Fähigkeiten können Ihnen helfen, Ausreißer oder aberrante Zahlen aus einem Datenrahmen zu beseitigen. Ein wichtiges Tool zum Abholen bestimmter Zeilen oder Spaltendaten aus dem Pandas -Datenfreame wird als Pandas -Index bezeichnet. Es ist verantwortlich für die Einrichtung der Daten für schnellen Zugriff und Organisation. Ein anderer Name für den Index ist die Subset -Auswahl. Der jeweilige Indexwert wird als Etikett bezeichnet. Die Indexwerte sind fett geschrieben. Bei der Untersuchung realer Datensätze, die häufig sehr groß sind, müssen wir die Zeilen- oder Indexnamen abrufen. Wir werden demonstrieren, wie die Indizes aus den Pandas -Datenrahmen in diesem Artikel extrahiert werden können.”

So erhalten Sie die Indizes aus dem DataFrame in Pandas?

Unter Verwendung verschiedener Funktionen und Eigenschaften gibt es verschiedene Möglichkeiten, Indizes aus dem DataFrame in Pandas abzurufen. Wir werden erklären, wie Sie in den folgenden Beispielen Datenframe -Indizes mit verschiedenen Techniken extrahieren können.

Erstens werden wir den Datenrahmen sehen.Indexeigenschaft. Die Indexeigenschaft eines Pandas -Datenframe. Die Zeilenkennzeichnung des DataFrame wird vom DataFrame als Objekt zurückgegeben.Indexfunktion.

Beispiel Nr. 1: Erhalten Sie die Indizes, indem Sie über die Indizes des Datenrahmens iteriert werden

Um den Index zu extrahieren, erstellen wir zunächst einen Datenrahmen, damit wir seine Zeilenindizes durchführen können. Wir müssen das PANDAS -Modul zuerst laden, indem wir es importieren, um seine Funktionen zu verwenden. Wir erstellen unseren Datenrahmen mit der PD.DataFrame () Methode.

Der Datenrahmen "DF" wurde erstellt. Der „PD.DataFrame () ”-Methode hat das Python -Wörterbuch mit Schlüssel und Werten als Argument genommen. Die Funktion print () wird verwendet, um den Datenrahmen zu veranschaulichen. Im DataFrame "DF" haben wir drei Spalten "Col1", "Col2" und "Col3", die die Werte (3, 4, 5, 6, 7, 8, 9) (9, 8, 7) gespeichert haben , 6, 5, 4, 3) und (1, 3, 5, 7, 8, 0, 11). Der Python -Konstruktor erstellt auf der linken Seite jeder Zeile einen Standard -Integer -Zeilenindex (beginnt mit 0). Lassen Sie uns nun die Indizes durchlaufen, um die Indizes des Datenrahmens mit dem DataFrame zu erhalten.Indexeigenschaft.

Die Indexeigenschaft hat die Indizes erfolgreich aus dem DataFrame abgerufen. Wie Sie sehen können, begannen die Zeilenindizes in unserem Datenrahmen bei 0 und endeten bei 6.

Beispiel Nr. 2: Erhalten Sie die Indizes als Listenobjekt

Zunächst erstellen wir einen Datenrahmen mit maßgeschneiderten Indizes. Wir werden die nicht numerischen Beschriftungen für die Zeilenindizes in unserem Datenrahmen angeben.

Es ist ersichtlich, dass der Zeilenindex kein ganzzahliger Index mehr ist, da wir die Liste der Labels als ["R1", "R2", "R3", "R4", "R5", "R6", "R7" angegeben haben ”] Zum Indexparameter von PD.DataFrame () -Funktion. Wir haben drei Spalten "C1", "C2" und C3 "erstellt, um Dummydaten (33, 45, 12, 78, 34, 86, 23) (26, 37, 76, 25, 97, 53, 31) zu speichern (33, 45, 12, 53, 31). und (17, 74, 95, 63, 54, 56, 19). Jetzt werden wir die Funktion List () verwenden, um die Liste der Indexbezeichnungen zu erhalten. Ein Listenobjekt kann mit der Funktion List () erstellt werden. Eine geordnete veränderbare Sammlung wird als Listenobjekt bezeichnet.

In der Funktion "List ()) haben wir die Indexeigenschaft verwendet, um die Indizes des Datenrahmens abzurufen. Die Funktion "List ()) speichert sie dann als Elemente eines Listenobjekts.

Beispiel Nr. 3: Erhalten Sie das Array des Index mithilfe des Index.Werte () Methode

In diesem Beispiel der Index.Die Wertemethode wird verwendet, um die Indizes des Datenrahmens abzurufen. Ein von dem unveränderbarer NDarray namens Pandas Index implementierter Slicable Set Set, der implementiert ist. Die Achsennamen für alle Objekte von Pandas werden in diesem grundlegenden Objekt gespeichert. Der Index.Werte Attribut von Pandas gibt ein Array zurück, das die Daten im angegebenen Indexobjekt enthält.

Wir haben den angepassten Index erstellt, indem wir eine Liste von Label ['I', 'II', 'III', 'IV', 'V', 'VI', 'VII'] im Indexparameter definiert haben. In unserem Datenrahmen enthält drei Spalten. Die Spalte "x" speichert Werte ('A', 'B', 'C', 'D', 'E', 'F', 'G'), Spalte „Y“, die die Datenwerte ('H' enthält , 'i', 'j', 'k', 'l', 'm', 'n') und die Spalte „Z“ mit den Werten ('o', 'p', 'q', 'R. ',' s ',' t ',' u '). Jetzt werden wir den Index verwenden.Werte Methode, um die Indizes aus dem DataFrame "DF" zu erhalten.

Wir können auch die Funktion Tolist () mit dem Index verwenden.Werte Methode zum Abrufen der Indizes des Datenrahmens.

Ein angegebenes Array kann mit denselben Werten, Elementen oder Elementen in ein reguläres Listenobjekt umgewandelt werden.

Beispiel 4: Erhalten der Indizes mithilfe von query () und tolist () Methoden

Diese Technik ermöglicht es uns, nur die spezifischen PANDAS -Datenframe -Objektindizes abzurufen, die bestimmte Kriterien erfüllen. Verwenden der „PD.DataFrame () ”-Methode und die Methode query () der Pandas, ein Pandas -Datenfreame, wird in dieser Methode erstellt. Anwenden der Query () -Methode auf einen Datenrahmen und über das Übergeben einer Bedingung führt dazu. Anschließend verwenden wir die Methode Tolist () zusammen mit dem Indexattribut, das eine Liste zurückgibt, die die Indexwerte des DataFrame enthält. Lassen Sie uns den Python -Code untersuchen, der verwendet wird, um diese praktische Technik zum Abrufen der Indizes des DataFrame -Objekts zu erreichen, die die angegebenen Bedingungen erfüllen.

Wir haben einen Datenrahmen mit Indexbezeichnungen als ['01', '02', '03', '04', '05', '06' erstellt. Die Spaltenbezeichnungen von DataFrame werden als "Name", "Alter" und "Höhe" mit Werten ("Alexa", "Mark", "Ryan", "Bob", "Tom", "Joe") angegeben (21 , 20, 21, 24, 22, 23) und (5).4, 5.8, 5.7, 6.15.9, 6.2) jeweils.

In der Funktion query () haben wir eine Bedingung angegeben, um diese Zeilen abzurufen, in denen der Wert in der Spalte „Höhe“ größer als 5 ist.7. Dann verwendeten wir das Indexattribut, um die Indizes von abgerufenen Zeilen zu extrahieren, während die Funktion Tolist () die zurückgegebenen Indizes in eine Liste i konvertierte.e. ['02', '04', '05', '06].

Beispiel Nr. 5: Erhalten Sie den Indexwert der Spalte durch get_loc () -Funktion mit Spaltenattribut

In den vorherigen Beispielen haben wir gesehen. Der Indexwert eines bestimmten Spaltennamens innerhalb eines Pandas -Datenframees wird in diesem Beispiel zurückgegeben. Das Attribut der Spalten und die Funktion get_loc () werden beide für diese Aufgabe verwendet. Der variable Name, den wir auswählen möchten.

Durch die Verwendung eines Python -Wörterbuchs innerhalb der PD.DataFrame () -Funktion haben wir unseren Datenrahmen erstellt. Es kann beobachtet werden, dass in unserem Datenrahmen 5 Spalten mit Namen "A", "B", "C", "D" und "E" mit Namen "A", "B", "C" enthalten sind. Verwenden wir das Spaltenattribut mit der Funktion get_loc (), um den Indexwert der Spalte "D" zu erhalten.

Dafür werden wir den Namen der Spalte setzen, ich.e., "D", als Zeichenfolge in der Funktion get_loc ().

Die Spalte "D" wird zum Indexwert 3 platziert.

Abschluss

In diesem Tutorial haben wir versucht zu lehren, wie Sie die Indizes des Pandas DataFrame in Python erhalten können. Wir haben besprochen, welche Indizes in Pandas sind und wie Sie sie mit verschiedenen Funktionen und Attributen abrufen können. Wir haben verschiedene Beispiele implementiert, um Ihnen zu vermitteln.