Pandas DataFrame aus dem Diktat

Pandas DataFrame aus dem Diktat
Ein Pandas-Datenfreame kann mit einem Python-Diktat (Wörterbuch) generiert werden, das ein Schlüsselwertpaar ist. In Echtzeit erzeugen wir normalerweise einen Pandas-Datenfreame, indem wir eine CSV-Datei oder eine andere Ressource importieren.

Python Pandas werden häufig sowohl in Datenwissenschafts-/Datenverarbeitung als auch in maschinellen Lernaufgaben bereitgestellt. Es wird auf der Grundlage von Numpy entwickelt, einer weiteren prominenten Python -Bibliothek, die die wissenschaftlichen Berechnungen unterstützt. In Python sind PANDAS-Datenrahmen für die Arbeit mit 2D-Daten (zweidimensionale) Daten äußerst nützlich. Ein Pandas -Datenfreame kann in einer Vielzahl von Methoden konstruiert werden. Eine davon besteht darin, die Daten aus einem bestimmten Wörterbuch zu extrahieren.

Beispiel 1: Verwendung des Standardkonstruktors PD.DataFrame (), um einen Datenrahmen aus einem Wörterbuch zu generieren

Dieser Ansatz beginnt damit, ein Python -Wörterbuch mit Listen zu erzeugen, das wir dann an die PD übergeben.DataFrame () Methode. Die letzte but not least die PD.DataFrame () -Methode gibt ein PANDAS -Datenframe -Objekt aus, das den Inhalt aus dem Wörterbuch der Listen enthält.

Lassen Sie es uns nun mit dem Python -Skript in die Praxis umsetzen.

In der Python -Datei importieren wir zuerst die erforderliche Bibliothek, die in dieser Abbildung Pandas ist, da wir die Pandas -Funktionen hier verwenden werden.

Anschließend erstellen wir ein Wörterbuch „Daten“ und initialisieren es mit drei Listen mit den Titel 'Name', 'Age' und 'Institute'. Wir weisen jede Liste mit vier Werten zu. Wir rufen die Print () -Methode auf, um das Wörterbuch auf dem Terminal anzuzeigen.

Die Ausgabe, die wir erhalten, indem wir den vorherigen Code ausführen, ist hier beigefügt:


Wir konvertieren nun dieses Pandas -Wörterbuch in einen Pandas -Datenframe.

Um den Datenrahmen aus einem Wörterbuch zu generieren, verwenden wir die einfachste Methode. Hier verwenden wir den PANDAS -Standardkonstruktor, um einen Datenrahmen zu generieren. Ein DataFrame -Objekt mit dem Namen "Ausgabe" wird erstellt und wird als Ausgabe des Aufrufens der PD zugewiesen.DataFrame () -Funktion. Das zuvor erstellte dikte „Daten“ wird als Parameter an die PD übergeben.DataFrame () -Funktion. Die Anweisung print () mit dem Objekt „Ausgabe“ als Argument führt aus, um den aus dem angegebenen Wörterbuch erstellten Datenrahmen anzuzeigen.

Dies ergibt uns den folgenden daraus resultierenden Pandas -Datenframe:

Beispiel 2: Verwendung der benutzerdefinierten Indizes, um einen Datenrahmen aus einem Wörterbuch zu generieren

Mit einem Wörterbuch mit den benutzerdefinierten Indizes könnten wir ein Pandas DataFrame-Objekt in Python erstellen. Diese Technik beginnt mit der Erzeugung eines Python -Wörterbuchs, das dann gleichzeitig mit der Indexliste auf die PD übergeben wird.DataFrame () Methode. Die PD.Die DataFrame () -Methode gibt letztendlich ein PANDAS -Datenframe -Objekt zurück, das den Inhalt des Wörterbuchs zusammen mit den Indizes aus der bereitgestellten Indexliste enthält.

Wir werden hier untersuchen, wie der Python -Code verwendet wird, um ihn auszuführen.

Um einen Datenrahmen aus einem DICT zu erstellen, der benutzerdefinierte Indizes verwendet, müssen wir zunächst eine Wörterbuchliste haben. Da wir im vorherigen Beispiel ein Wörterbuch generiert haben, werden wir auch in diesem Fall das gleiche Wörterbuch verwenden.

Um den Datenrahmen aus dem DICT zu konstruieren. Wir verwenden den Parameter „Index“ in der Klammung mit dem Namen des Dikts, das durch ein Komma getrennt ist. Wir weisen die Werte dem Parameter „Index“ unter Verwendung des Zuweisungsoperators "=" zu und setzen die Werte in die Klammern ein. Zuletzt verwenden wir die Print () -Methode, um das Ergebnis des Programms zu zeigen.

Das folgende Bild zeigt den Ausgangsdatenfreame mit benutzerdefinierten Indizes „R, X, Y, Z“ anstelle der 0-Indexierungsmethode.

Beispiel 3: Generieren Sie einen Datenrahmen aus einem Wörterbuch mit den benötigten Spalten

In der dritten Instanz werden bestimmte Spalten ignoriert, wenn wir einen Datenrahmen aus einem Wörterbuch generieren. Der Parameter der Spalten macht die Erfüllung dieser Aufgabe vereinfacht. Als Parameter akzeptiert dieses Argument eine Liste, die Elemente, die die angegebenen Spalten sind. Es gibt den DataFrame nur mit den ausgewählten Spalten zurück.

Schauen wir uns einfach den Weg zum Schreiben eines Python -Skripts an, um einen Datenrahmen mit den ausgewählten Wörterbuchspalten zu generieren.

In diesem Beispiel haben wir dem zuvor erstellten Diktat "Daten" als "Roll" einen neuen Datensatz hinzuge. Jetzt haben wir gemeinsam ein Diktat mit 4 Datensätzen. Wenn wir die Print () -Methode ausführen, erhalten wir diesmal ein Wörterbuch mit vier Datensätzen.

Dies ist die Ausgabe:

Jetzt untersuchen wir, wie wir einen Datenrahmen aus einem Wörterbuch mit einigen bestimmten Spalten konstruieren können.

Die Funktion Pandas DataFrame bietet uns einen Parameter „Spalte“, um die Namen der Spalten anzugeben, die Sie insbesondere in Ihrem DataFrame gewünscht haben. Zwischen den Zahnspangen der PD.DataFrame () -Methode haben wir das Argument „Spalten“ übergeben und die Namen der Spalten in den Klammern zugewiesen. Hier haben wir zwei Spalten ausgewählt, "Name" und "Institut". Die Anweisung Print () wird am Terminal als Datenrahmen angegeben, der nur die zuvor genannten Spalten enthält.

Wir haben unseren Datenrahmen mit zwei ausgewählten Spalten erhalten.

Beispiel 4: Generieren Sie einen Datenrahmen aus einem Wörterbuch mit einer geänderten Orientierung, indem Sie die Funktion von _dict () verwenden

Ähnlich wie vorangegangene Wege generieren wir zunächst ein Python -Wörterbuch mit Listen und übergeben es dann an den DataFrame.Von_Dict () Methode. Schließlich wird ein PANDAS -Datenframeobjekt, das die Informationen zum Wörterbuch der Listen enthält, vom DataFrame zurückgegeben.Von_Dict () Methode. Es gibt verschiedene Alternativen, wenn sie die Funktion von dict () spezifisch verwenden, um einen Datenrahmen aus einem Wörterbuch zu konstruieren. Die Schlüssel des DICT werden standardmäßig seine Spalten wie das übliche Verhalten sein. Die Wörterbuchschlüssel werden als Zeilen angezeigt, wenn die Orientierung „Index ist.”

Hier sehen wir zuerst die Standardeinstellungen und ändern dann die Ausrichtung in "Index".

Wir verwenden das Diktat "Daten". Um einen Datenrahmen aus dem Wörterbuch zu generieren, verwenden wir stattdessen die von_Dict () Methode. Die Schlüssel des Wörterbuchs werden standardmäßig als Spaltennamen verwendet, wenn die Methode von _dict () verwendet wird. Die Einträge aus dem Wörterbuch werden als Datenframewerte verwendet. Wir führen diese Methode also mit der Standardeinstellung aus und übergeben sie den Namen des Diktats „Daten“. Wir sehen die Ausgabe durch die Funktion print ().

Das Folgende ist das Ergebnis des vorherigen Python -Skripts:

Um die Ausrichtung des aus der bereitgestellten Wörterbuchliste generierten Datenrahmens zu ändern, ändern wir nun die Standardeinstellungen der Funktion from_dict ().

Wenn Sie das Argument orient = "index" angeben, wird ein Datenrahmen unter Verwendung der Werte aus den DICT -Werten konstruiert, wenn Sie es vorziehen, die DICT -Tasten als Zeilen zu verwenden. Wir haben somit den Parameter "Orient" hinzugefügt, um die Orientierung zu ändern und den "Index" -Wert zuzuweisen. Dies bedeutet, dass die Werteorientierung des Index von Spalten zu Zeilen geändert wird.

Dies ist die Ausgabe dieses Programms:

Abschluss

Dieser Leitfaden erläutert die Erzeugung eines Datenrahmens aus einer Wörterbuchliste. Wir haben alle verschiedenen Arten und Aspekte der Verwendung dieses Ansatzes ausgearbeitet. Mit den praktischen Beispielen haben wir Ihnen verstehen. Die angegebene Schritt -für -Schritt -Implementierung hilft Ihnen dabei, die beste Lernerfahrung in Python zu erzielen.