Pandas Übungen zum Lernen

Pandas Übungen zum Lernen
Das "Pandas" -Modul ist das wichtigste Tool, das Python -Datenanalysten und Forschern heutzutage zur Verfügung steht. Die Python Data Analyse Library Pandas konzentriert sich hauptsächlich auf tabellarische Daten. Es ist eine kostenlose und Open-Source-Bibliothek, die unter der BSD-Lizenz verteilt ist. Pandas haben so viele Anwendungen, dass es möglicherweise einfacher sein kann, das aufzulisten, was sie nicht erreichen können als das, was sie können.

Es hat in erster Linie zwei Formen: Serie und Datenframe. Die „Serie“ enthält Daten zu einer einzelnen Variablen und kann als Vektor mit indizierten Informationen angesehen werden, während „DataFrame“ eine tabellarische Datenstruktur ist.

In diesem Tutorial werden wir kurz einige der am häufigsten verwendeten Pandas -Übungen für Anfänger durchlaufen. Sie erhalten einen Schnappschuss des Python -Skripts mit der entsprechenden Ausgabe für jede Übung.

Bibliothek importieren

Um an Pandas -Übungen zu arbeiten, müssen wir zunächst die "Pandas" -Bibliothek in unsere Projektdatei laden. Das Tool, das wir für die Implementierung der Pandas -Übungen verwenden, ist „Spyder“. Wir haben das Tool gestartet und die Pandas -Bibliothek in die Python -Datei geladen, indem wir das Skript „Pandas als PD importieren“ schreiben. Wir haben Pandas als "PD" aliased. Jetzt kann „PD“ während des gesamten Programms anstelle von „Pandas“ verwendet werden.

Übung 1: Konvertieren einer Liste in Serien

Die erste Übung, die wir unterrichteten, besteht darin, die PANDAS -Serie aus einer Liste zu generieren.

Wir haben eine Variable "Dummy" erstellt und ihm eine Liste von Werten als "1", "2", "3", "4", "5", "6" und "7" zugewiesen. Wir haben die „PD“ angerufen.Serie () ”Funktion und übergab die Liste„ Dummy “als Parameter dafür. Die resultierende Serie wird in der Variablen „Convert“ gespeichert. Um den Inhalt auf dem Bildschirm auszustellen, bieten Pandas uns eine Methode von „print ()“. Wir haben die "Convert" -Serie mit der Funktion "print ()" angezeigt.

Der entsprechende Ausgangs -Snapshot zeigt, dass eine Serie mit Standardindizes generiert wurde.

Übung 2: Konvertieren einer Liste mit angegebenen Indizes in eine Serie konvertieren

Die erste Übung demonstrierte genau die Umwandlung einer Liste in eine PANDAS -Serie. Wir haben im Ausgabebild gesehen, dass der Liste mit der Standardliste der Indizes angezeigt wurde. Wenn Sie nicht möchten, dass Ihre Serie mit diesen Indizes angezeigt wird, können Sie sie ändern, indem Sie bestimmte Indizes bereitstellen.

Wir haben die Liste aus der obigen Instanz verwendet. Um die Liste in Serien umzuwandeln und die Indizes zu definieren, haben wir „PD“ bezeichnet.Serie () ”Funktion. Es wurden zwei Parameter an diese Funktion übergeben: List_name und Index. Der Name der Liste "Dummy" wird geliefert. Das Argument „Index“ wird verwendet, um die Standardindexliste mit derjenigen zu ändern, die der Benutzer gegeben hat. Wir haben die Indexliste mit den Werten "A", "B", "C", "D", "E", "F" und "G" angepasst. Die Serie mit einer aktualisierten Indexliste wird in der Variablen „Konvertieren“ gespeichert und dann über die Funktion „print ()“ ausgestellt.

Im resultierenden Bild wurden die Standardindizes durch die von der Benutzer bereitgestellte Liste der Indizes ersetzt.

Übung 3: Konvertieren von Listen in einen Datenrahmen konvertieren

In der ersten Übung haben wir gelernt, eine Liste in eine PANDAS -Serie umzuwandeln. Jetzt werden wir sehen, wie man Listen in einen Pandas -Datenframe umwandelt.

Im Skript wurden drei Listen generiert. Diese Listen haben Werte "[" Harry ", 25," Ingenieur "," ["Roma", 32, "Doctor"] und "[" Elizia, 22, "Künstler"] ". Wir haben diese Listen in einem 2D -Listenobjekt "L1" gespeichert. Um "L1" in einen Pandas -Datenfreame umzuwandeln, haben wir eine Pandas -Funktion "PD".DataFrame () ”. Diese Funktion wurde aufgerufen und die 2D -Liste wird als Parameter zusammen mit einem anderen Parameter „Spalten“ bereitgestellt. DataFrame zeigt Daten in Form von Tabellen mit Zeilen und Spalten an. Jede Liste enthält 3 Werte, dh wir haben 3 Spalten im DataFrame. Wir haben die Etiketten als "Name", "Alter" und "Beruf" angegeben. Der DataFrame wird im DataFrame -Objekt "Demo" gespeichert.

Das Ausführen des Programms gibt uns einen Datenrahmen mit 3 Spalten mit den angegebenen Beschriftungen und Werten, die aus der bereitgestellten 2D -Liste generiert wurden.

Übung 4: Konvertieren eines Wörterbuchs in DataFrame

Ein Pandas -Wörterbuch ist eine Sammlung von Listen. Um die Konvertierung eines Diktats in einen Datenrahmen zu lernen, müssen wir zunächst ein Wörterbuch erstellen. Es wurde ein Wörterbuch „sample_dict“ mit 3 Wertenlisten erstellt. Die erste Liste "Col1" enthält Werte "Harry", "Roma" und "Elizia". Die Liste "Col2" speichert Daten "25", "32" und "22". Die "Col3" -Liste enthält Einträge "Ingenieur", "Doktor" und "Künstler". Um einen Datenrahmen aus dem dikten "sample_dict" zu konstruieren, haben wir den „PD“ aufgerufen.DataFrame () ”Methode und bestanden das Wörterbuch als Parameter. Wenn die PD.DataFrame () ”-Methode wird ausgeführt, sie wird den Inhalt des Wörterbuchs erfordern und es am DataFrame ändern. Der konvertierte Datenrahmen wird im DataFrame -Objekt "Änderung" gespeichert und auf der Konsole unter Verwendung der Methode "print ()" angezeigt.

Dieses Programm gibt uns bei der Ausführung die in der folgende Snapshot gezeigte Ausgabe aus.

Übung 5: Angebenin des Index im DataFrame

Wenn wir den DataFrame oder eine Serie auf dem Terminal ausstellen, ist er hauptsächlich mit der Standardindexliste ausgestattet, die von „0“ bis zur Länge des Datensatzes beginnt. Wir haben gelernt, es in der Serie zu ändern, und Sie können es auch im DataFrame ändern.

Wir haben den in der obigen Übung generierten Datenrahmen verwendet. Sie können sehen, dass der DataFrame einen Index von "0", "1" und "2" hat. Wir werden dieses Standardverhalten ändern, indem wir unsere Indexliste bereitstellen. Zwischen den Zahnspangen der „PD.Die DataFrame () ”-Methode, der Name des Wörterbuchs„ Sample_Dict “und„ Index “wird bereitgestellt. Die Indizes wurden als "x", "y" und "z" angegeben.

Der Datenrahmen mit der aktualisierten Indexliste wird auf dem Bildschirm angezeigt.

Übung 6: Extrahieren der angegebenen Spalte in einem Datenrahmen

Um eine bestimmte Spalte in einem Datenrahmen auszuwählen, verwenden wir den vorherigen Datenrahmen mit den Standardindizes. Nach dem Drucken des anfänglichen Datenrahmens verwendeten wir das „DF.LOC [Index, Spalte] ”Methode. Während wir eine Spalte auswählen möchten, haben wir den "Index" -Port gelassen, indem wir ":" darin versorgt und den Spaltennamen "col2" zwischen seinen Klammern angegeben haben. Die ausgewählte Spalte ist in der Variablen „Auswählen“ erhalten und mit Hilfe der Funktion „print ()“ vorgestellt.

Dies ist das Ergebnis des obigen Skripts:

Übung Nr. 7: Extrahieren bestimmter Zeilen in einem Datenrahmen

Bestimmte Zeilen können auch in einem Datenrahmen ausgewählt werden. Für die Zeilenauswahl müssen wir den Index in der „PD“ bereitstellen.loc [] ”Methode und Colon„: “an der Spalte Stelle setzen. Die von uns ausgewählten Reihen sind „1“ und „2“.

Die beiden ausgewählten Zeilen wurden ausgestellt.

Übung 8: Füllen Sie fehlende Werte in einem Datenrahmen aus

Wir haben einen Datenrahmen mit einigen fehlenden Werten erstellt und ihn auf dem Bildschirm gedruckt. Um diese Werte zu füllen, haben wir den „DF) aufgerufen.fillna () ”Methode. Der Wert, den wir durch die Nulleinträge ersetzt werden möchten, lautet "0". Also haben wir es in die „DF) gestellt.fillna () ”-Funktionsstreben. Die Variable „Füllung“ speichert das Ergebnis und die Methode „print ()“ zeigt es an.

Hier können Sie ansehen, dass die Nullwerte jetzt durch 0 ersetzt werden.

Abschluss

Pandas bieten uns eine Vielzahl von Auswahlmöglichkeiten, um Probleme mit der realen Datenanalyse zu lösen. Es funktioniert hauptsächlich mit Datenrahmen und Serien. Einige häufigste Übungen wurden in diesem Artikel über die Serienfunktionen von Pandas sowie die Datenfunktionen von Pandas erörtert. Wir haben 8 grundlegende Lerntechniken von Pandas ausgearbeitet. Die Konzepte werden durch die praktische Demonstration des Python -Skripts im Spyder -Tool verstanden. All diese Übungen sind der beste Anfänger, um mit Python Pandas DataFrames und Serien zu beginnen.