Die Indizes von Zeilen werden als DataFrame -Indizes bezeichnet, während Spalten -Indizes als allgemeine Spaltennamen bezeichnet werden. Indizes werden hauptsächlich verwendet, um die Daten abzurufen oder die Daten im Datenrahmen zu speichern. Wir können jedoch auch den Index selbst durch die Verwendung des .Indexeigenschaft. In diesem Tutorial bringen wir Ihnen bei, wie Sie einen Index als Listenobjekt erhalten, wie Sie den Index in eine Datenfream -Spalte umwandeln können, um ihn abzurufen, und wie Sie den Index mit mehreren Bedingungen und der Indexeigenschaft von Pandas erhalten können.
So erhalten Sie Indexwerte in Pandas?
Der Datenrahmen.Die Indexeigenschaft kann verwendet werden, um den Index eines Pandas DataFrame zu erhalten. Ein Indexlistenobjekt, das den Index des DataFrame enthält.Indexeigenschaft.
Syntax:
Pandas.Index (data = keine, dType = keine, copy = false, name = none, tupleSe_cols = true, ** kwargs)Wo:
Daten: Array-ähnlich (eindimensional)
DTYPE: Numpy DTYPE. Es ist standardmäßig 'Objekt'. Wir werden den DTYPE auswählen, der für die Daten geeignet ist, wenn DTYPE "keine" ist. Wenn ein DTYPE angegeben und sicher ist, wird DTYPE gezwungen. Wenn nicht, wird eine Warnung angezeigt.
Kopieren: bool. Eine Kopie des angegebenen NDarray wird gemacht.
Name: Objekt. Der Name, der im Index gespeichert wird.
tupleSe_cols: bool. Standardmäßig ist es wahr. Wenn wahr, wird versucht, einen MultiIndex zu erstellen.
Die Methoden zum Erhalten des Index des Datenrahmens werden in den folgenden Beispielen gezeigt.
Beispiel # 01: Extrahieren Sie den DataFrame -Zeilenindex mit der NDEX -Eigenschaft
Erstellen wir zunächst einen Datenrahmen mit mehreren Zeilen, damit wir demonstrieren können. Vor dem Erstellen des Datenrahmens importieren wir das PANDAS -Modul, um seine Funktionen zu verwenden.
Pandas als PD importierenDurch die Verwendung einer Liste innerhalb der PD.DataFrame () -Funktion haben wir unseren Datenrahmen erstellt. In unserem Datenrahmen befinden sich zwei Spalten: Name und Alter. Die Spalte "Name" speichert die Namen einiger zufälliger Personen ("Tyson", "Jack", "Bruce", "Peter", "Nick", "Haris", "Randy"). Während die Säule "Alter" aus den Altersgruppen jeder Person besteht (23, 25, 25, 24, 21, 26, 25). Zu Beginn jeder Zeile gibt es einen Indexwert für jede Zeile, die vom Pandas Constructor standardmäßig erstellt wurde. Jetzt werden wir die Indexeigenschaft verwenden, um diese Indexspalte zu extrahieren.
df.IndexDie Ausgabe zeigt, dass die Zeilen ab 0 beginnen, inkrementiert um 1 und endet mit dem Index vor 7.
Um jeden Indexwert zu drucken, können wir einen Iterator und in ihm oder in der Funktion print () verwenden.
i = df.IndexJetzt haben wir alle Werte von Index 0 bis 7 gedruckt.
Beispiel Nr. 02: Extrahieren Sie den DataFrame -Zeilenindex mit einer Bedingung
Die Indexwerte können abgerufen werden, indem eine Bedingung angegeben wird. Die Indexeigenschaft holt die Indexwerte des Datenrahmens ab, die die angegebene Bedingung erfüllen. Dann verwenden wir die Funktion Tolist (), um die abgerufenen Werte als Liste zurückzugeben. Verwenden der PD.DataFrame () -Funktion, erstellen wir zunächst unseren Datenrahmen.
Pandas als PD importierenDurch die Verwendung eines Python -Wörterbuchs innerhalb der PD.DataFrame () -Funktion haben wir einen Datenrahmen erstellt. Unser Datenrahmen besteht aus drei Spalten und 8 Zeilen von 0 bis 7. Die Spalte 'Elemente' speichert die Datenwerte als String ('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'). Die Spalte 'Preis' enthält die numerischen Werte, die das Stück jedes Elements darstellen (100, 200, 150, 100, 200, 320, 100, 100). Der Spaltencode mit den Datenwerten ('q', 'w', 'e', 'r', 't', 'y', 'u', ","), "). Lassen Sie uns nun die Indexwerte mit dem folgenden Skript abrufen.
i = df.IndexMithilfe der Indexeigenschaft haben wir die "DF" -Datenframe -Indizes abgerufen. Dann haben wir eine Bedingung angegeben, um Daten zu extrahieren, bei denen die Werte in der Preisspalte gleich 100 sind. Nachdem wir die Daten erhalten hatten, haben wir die Indexwerte von Zeilen abgerufen, die den angegebenen Zustand erfüllen. Am Ende wird die Funktion tolist () verwendet, um die Ausgabe in ein Listenobjekt umzuwandeln. Die Funktion hat eine Liste mit vier Indexwerten abgerufen, [0, 3, 6, 7].
Beispiel Nr. 03: Extrahieren Sie den Spaltenindex des DataFrame -Spaltens mit der Funktion get_loc ()
Wir haben gesehen, wie Sie die Werte der Zeilenindizes eines Datenrahmens abrufen können. Wir können jedoch auch die Werte der Spaltenindizes eines DataFrame abrufen. Um den Indexwert der Spalte eines Datenframe zu erhalten, kann die Funktion GET loc () verwendet werden. Um den Index zu finden, liefern wir lediglich die Spaltenbezeichnung für die Funktion get_loc (). Erstellen wir einen Datenrahmen, der aus mehr als einer Spalte besteht.
Pandas als PD importierenIn unserem Datenrahmen haben wir vier Spalten erstellt: Klasse, Mitglieder, Gehalt und Kosten. Die Klassenspalte speichert die Datenwerte ('A', 'A', 'B', 'B', 'C', 'C', 'D', 'D'). Die Säulenelemente enthält Werte (5, 4, 5, 5, 4, 6, 4, 4), während das Säulengehalt und die Kosten die numerischen Datenwerte (30000, 28000, 32000, 31000, 30000, 26000, 27000, 28000) enthält ) und (12000, 11000, 11500, 13000, 10000, 12500, 10500, 13000). Angenommen, wir müssen den Indexwert des Spaltengehalts finden:
df.Säulen.get_loc ("Gehalt")Die Funktion hat den Index der angegebenen Spalte 2 abgerufen, 2.
Beispiel Nr. 04: Extrahieren Sie die angegebenen Zeilenindexwerte mit der Funktion get_loc ()
Wir können auch den Indexspeicherort der Zeilenindizes mit der Funktion get_loc () abrufen, wenn die Beschriftungen für Zeilenindizes angegeben sind. Wir können die Beschriftungen in unserem Zeilenindex angeben, indem wir eine Liste verwenden, die Namen für jeden Wert des Zeilenindex enthält. Fügen wir die Indexbezeichnungen zu dem Datenrahmen hinzu, den wir in Beispiel Nr. 3 erstellt haben.
Pandas als PD importierenIn der PD.DataFrame () Funktion haben wir den Indexparameter als Liste mit Etiketten von R1 bis R8 angegeben. Die Etiketten 'R1', 'R2', 'R3', 'R4', 'R5', 'R6', 'R7' und 'R8' haben den standardmäßigen Integer -Index von DataFrame ersetzt. Lassen Sie uns nun den Standort des Index für eine bestimmte Etikette abrufen.
drucken (df.Index.get_loc ("r5"))Erstens wird die Indexeigenschaft auf den Datenrahmen angewendet, um die Indizes zu erhalten. Dann, get_loc () Die Funktion wird angewendet, um die Indexposition der angegebenen Indexkennzeichnung der Zeile zu extrahieren.
Beispiel Nr. 05: Extrahieren Sie die Zeilenindexwerte mit der Funktion numpy WO ():
Wir können auch die Indexwerte erhalten, indem wir eine Bedingung innerhalb der Angabe des Zustands angeben Wo() Funktion von Numpy. Lassen Sie uns zunächst einen DataFrame erstellen. Wir werden die Pandas sowie die Numpy -Bibliothek so importieren, um ihre Funktionen zu verwenden.
Pandas als PD importierenNach dem Import der erforderlichen Bibliotheken haben wir unseren Datenrahmen erstellt. In unserem Datenrahmen haben wir drei Spalten (ID, Preis und Rabatt). Die Spalten -ID, Preis und Rabatt speichern die Datenwerte ('001', '002', '003', '004', '005', '006', '007', '008'), (100, 150 , 130, 200, 120, 170, 120, 140) und (30, 40, 10, 20, 60, 10, 30, 60). Lassen Sie uns nun den Zeilenindexwert mit dem finden Wo() Funktion in der Funktion "list ()).
Liste (NP.wo (df ["Rabatt"]> 30))Wir haben eine Bedingung in der Funktion WOLLE () angegeben, um die Zeilen zu erhalten, in denen der Wert in der Spalte 'Rabatt' größer als 30 ist. Um eine Liste aus den zurückgegebenen Werten herauszufinden, haben wir die List () -Methode verwendet.
Abschluss
In diesem Artikel wurde behandelt, wie Datenframe -Indexwerte in Pandas abgerufen werden. Wir haben verschiedene Funktionen verwendet, um den Zeilen- und Spaltenindex des Datenrahmens abzurufen. Wir haben mehrere Beispiele implementiert, um Ihnen beizubringen, wie Sie den DataFrame -Zeilenindex mithilfe der Indexeigenschaft, unter Verwendung von Bedingungen und mit der Funktion get_loc () extrahieren können. Außerdem haben wir besprochen, wie Sie Spaltenindexwerte mit der Funktion get_loc () erhalten können.