Pandas DataFrame loc

Ein zweidimensionales, potenziell gemischtes Tabellendatenformat mit markierten Achsen wird als "Pandas DataFrame" bezeichnet. Die Zeilen- und Feldbezeichnungen entsprechen den arithmetischen Operationen. Die Hauptdatenstruktur der Pandas wird dadurch dargestellt. Um auf eine Reihe von Zeilen und Spalten nach Indizes oder einem Booleschen Array zuzugreifen, verwenden wir den Pandas -Datenfreame.LOC -Eigentum. Wann immer wir auf eine Zeile oder eine Spalte oder mehrere Zeilen und Spalten zugreifen möchten, verwenden wir den „DataFrame.loc () ”Eigenschaft. Wir können auch nur auf einen Wert der Zelle zugreifen, indem wir die Zeile und die Spaltenbezeichnung oder den Index in diesem „DataFrame" bestimmen.loc () ”Methode. Dieser Leitfaden verwendet den „DataFrame.loc () ”Methode und greift mit dieser Methode auf die Zeile, jede Spalte oder einen beliebigen Zellwert zu.

Syntax:

# DataFrame.loc

Beispiel 1:

Während wir den Pandas -Code ausführen. Wir erhalten die PANDAS -Funktion oder die Methoden, die wir anstelle von „Pandas“ mit „PD“ benötigen. Wir erstellen hier einen Datenrahmen, der "boys_df" ist. Das „PD“ wird hier verwendet, da der Datenrahmen die Methode von "Pandas" ist. Wir setzen den Spaltennamen als den Header dieser Spalte ein und setzen die Werte in alle Spalten.

Hier ist die erste Spalte von "boys_df" "b_height", in der wir die Höhe der Jungen einfügen. Diese Höhen sind „5.5, 6.0, 5.7, 5.8, 5.4, 6 und 5.9 ”. Die zweite Spalte der "boys_df" ist "b_name", die die Namen der Jungen enthält. Die Namen der Jungen, die wir hier einfügen, sind "Sam, Rishi, Alexander, Robin, Thomas, Samuel und Taylor". Die nächste Spalte, die wir in der "Boys_DF" haben, ist "B_AGE", das das Alter der Jungen enthält - "19, 25, 27, 18, 21, 22 und 28". Wir fügen drei Spalten im Datenrahmen "boys_df" hinzu.

Wir setzen auch die Indexwerte der Zeilen der "boys_df". Diese Indexwerte sind "R#1, R#2, R#3, R#4, R#5, R#6 und R#7". Diese Werte werden als Index jeder Zeile angezeigt, weil wir diese Werte als „boys_df) festlegen.Index". Jetzt zeigen wir diese "boys_df" auf der Konsole. Wir verwenden hier die Funktion „print ()“. Wir wenden den Datenrahmen nicht an.LOC -Methode noch, sodass der gesamte Datenrahmen in der Sypder -Konsole angezeigt wird.

Wenn wir die Taste "SHIFT+ ENTERN" drücken, wird die Ausgabe hier angezeigt. Alle Spalten und Zeilen des Datenrahmens werden in der Ausgabe erscheinen. Jetzt wenden wir den Datenrahmen an.LOC -Methode zu dieser folgenden "Boys_DF":

Wir haben gerade den Namen des DataFrame und die LOC -Methode als „boys_df.loc ”. Wir greifen nur auf einen Wert aus dem Boys_DF zu. Wir erwähnen den Indexwert der Zeile und den Spaltennamen, dessen Wert wir erhalten möchten. Wir platzieren den "R#2", der der Indexwert der Zeile und "B_Name" als Name der Spalte ist. Auf den Wert, auf den in dieser Zelle erscheint, wird also zugegriffen. Wir speichern diesen Wert in „Junge“ und drucken diesen Wert auf der Konsole.

Der Wert erscheint in der Zelle, deren Zeilenindex "R#2" lautet. Der Spaltenname "B_Name" wird auf dem Konsolenbildschirm angezeigt. Wir erhalten diesen „Rishi“ -Wert mit Hilfe des „DataFrame“.loc ”Methode.

Beispiel 2:

In unserem zweiten Beispiel machen wir nach dem Importieren der „Pandas“ -Methoden als „PD“ einen Datenrahmen, während wir das „PD“ einstellen.DataFrame ”. Dieser Datenrahmen heißt "customer_df". Es enthält die unterschiedlichen Spalten, die "Cust_Name, Cust_location, Product_ID und DIC_PER" sind. All dies sind die Namen jeder Spalte, die wir in diesem Datenrahmen erstellt haben. Wir haben die Kundennamen in die Spalte "Cust_Name" eingestellt, die "Joseph, Jacob, Edward, Ronica, Ryan, Simon, Nick, Patrick und John" sind. Wir fügen den Ort jedes Kunden hinzu, der "Delhi, Banglore, Pune, Delhi, Baljiam, Birmingham, Mexiko, Kanada und New York" in der Spalte "Cust_location" sind.

Dann kommt die Spalte „product_id“, die die ID der Produkte als „B112, B1213, B2214, B1255, B1116, B797, B7620, B3490 und B2912 enthält“. Die letzte Spalte, die wir im „Customer_DF“ haben, ist „dis_per“, in dem wir den Prozentsatz des Rabattpreises einfügen, der 2%, 3%, 10%, 5%, 4%, 1%, 7%, 8%, sind. und 2%". Der Datenrahmen ist abgeschlossen. Wir setzen den Zeilenindex durch Initialisierung der Variablen „Index_“ mit den Indexwerten. Diese Werte reichen von „R1 bis R9“ wie gezeigt.

Fügen Sie nun diese Indizes dem DataFrame hinzu, indem Sie das „Customer_DF“ platzieren.Index ”unten. Danach zeigen Sie den „Customer_DF“ an. Diese Indizes werden in diesen Datenrahmen eingefügt. Jetzt müssen wir von diesem Datenrahmen nur auf zwei Spalten zugreifen. Dafür verwenden wir die „loc“ -Methode und platzieren die Namen beider Spalten, auf die wir von diesem „Customer_DF“ zugreifen möchten, auf die wir zugreifen möchten. Die Spalten, auf die wir hier zugreifen, sind "Cust_Name und dis_per". Speichern Sie diese beiden Spalten in der Variablen "Kunden". Zeigen Sie nur die Spalten an, die wir erhalten, indem wir die Methode „Loc“ anwenden.

Der Datenrahmen befinden sich vier Spalten, wie in der folgenden Abbildung gezeigt. Wir greifen aus diesem Datenrahmen auf zwei Spalten zu, die auch unter diesem Datenrahmen angezeigt werden. Mit Hilfe der „Loc“ -Methode zugreifen wir auf diese Spalten.

Beispiel 3:

Hier erstellen wir die verschachtelte Liste mit dem Namen "Account_Holder_List". Es enthält das "AH_Country", das den Ländernamen enthält. Der "Account_Holder" enthält die Namen der Kontoinhaber, die "Callahan, Finchley, Farnham, Fuller, Bromley, Coghill und Fuller" sind. Das "Account_NO" enthält die Kontonummer der Kontoinhaber, die "253448, 120849, 272450, 234525, 294439 und 201501" sind ".

Dann fügen wir das „Mitglied seit“ hinzu, wo wir den Monat und das Jahr der Mitglieder als „Juni 2020, Juli 2021, Mai 2022, August 2022, Januar 2022, Mai 2022, Dezember 2021“ hinzufügen. Danach erstellen wir die Spalte "new_amount" und fügen die darin enthaltenen Beträge ein, die "180 US -Dollar, $ 260, $ 190, $ 550, $ 450, 320 und 500 US -Dollar" sind. Wir fügen auch den Index als "R_1, R_2, R_3, R_4, R_5, R_6 und R_7" hinzu. Jetzt konvertieren wir die "Account_Hholdern_List" in die "Account_Hholdern_DF", indem wir die PANDAS -Methode verwenden. Passen Sie die Zeilenindizes an diese “Account_Hilden_df" an.

Wir machen den "Account_Holder_df". Danach greifen wir auf die Zeilen zu, indem wir den Bereich der Zeilen erwähnen. Wir wollen vier Zeilen abrufen, die von "R_2: R_5" reichen,. Wir platzieren diesen Bereich in der „Loc“ -Methode. Es greift auf die Zeilen zu "R_2, R_3, R_4 und R_5". Rendern Sie sie auf der Konsole, während wir diese Methode in die Druckanweisung einfügen.

Der gesamte Datenrahmen enthält die Zeilen von "R_1" zu "R_7". Wie Sie sehen können, greift es nur vier Zeilen unter diesem Datenrahmen zu, deren Bereich in der Methode „Loc“ erwähnt wird. Es macht auch diese Reihen hier in der Konsole. Gleich wie dies können wir auch auf die Spalten zugreifen, indem wir den Bereich der Spalten in der Methode „loc“ erwähnen.

Abschluss

Dieser Leitfaden ist für Sie geschrieben, damit Sie erfahren, wie diese „LOC“ -Methode funktioniert und wie diese „loc“ -Methode in Pandas verwendet wird. Wir haben diese „LOC“ -Methode im Detail erläutert und eine praktische Demonstration der „LOC“ -Methode vorgelegt, indem wir diese Methode in unserem Pandas -Code verwenden. Wir haben die Ausgabe zusammen mit dem Codeskript gezeigt. Wir haben besprochen, dass die „loc“ -Methode uns beim Zugriff auf die Zeile oder Spalte oder einen Wert hilft. Wir hoffen, dass dieser Leitfaden für Sie leicht zu lernen und zu verstehen ist, da alle Konzepte und Codes hier im Detail erläutert werden.

Windows OS

Was ist Windows Package Manager

Windows Package Manager oder Winget ist ein leistungsstarkes Tool zum Installieren und Verwalten von...

Prof. Dr. Julien Plank

Python

Seeborn Tsllot

In Python die „Seeborn.Lineplot () ”Methode wird verwendet, um mehrere Zeilen in einem einzelnen Dia...

Lars Daub

Python

Matplotlib 2D -Histogramm

In Python das „PLT.Hist2d () ”-Funktion des„ Pyplot “-Moduls in der Bibliothek„ Matplotlib “wird ver...

Christopher Lammert