Pandas von JSON

Pandas von JSON

Die JSON- oder JS-Objektnotation ist ein Textdatenformat, das Textdaten als Schlüsselwert speichert. Im Internet werden Daten häufig über JSON -Dateien ausgetauscht. Zwischen lockigen Klammern () wird der JSON dargestellt. JSON verwendet Kommas, um die Trennung jedes Schlüssel-/Wertpaars zu bezeichnen. JSON -Daten ähneln einem Python -Wörterbuch im Aussehen. Die Wörterbücher sind jedoch Datenstrukturen, während JSON ein Datenformat ist. In Pandas ermöglicht die Funktion read_json das Lesen von JSON -Dateien an Pandas DataFrame. Sie können in den folgenden Beispielen sehen, wie JSON -Dateien in Pandas DataFrame umwandeln. Die JSON -Dateien können in den Datenrahmen von Pandas gelesen werden.

So lesen Sie JSON -Dateien in Pandas?

Wir verwenden die Funktion read_json (), um die Dateien mit dem zu extrahieren .JSON -Erweiterung, indem Sie den Pfad der gewünschten JSON -Datei in den Klammern der Funktion übergeben. Sobald dies erledigt ist. Wir können den Link zum Standort der Datei anstelle eines lokalen Pfades angeben, wenn wir eine JSON -Datei abrufen möchten, die auf einem Remote -Server gespeichert ist. Manchmal müssen Sie möglicherweise eine Datei mit einem verwandeln .JSON -Erweiterung in Pandas DataFrame. Die Pandas read_json () -Methode, die die folgende Syntax verwendet, macht es einfach, dies zu erreichen.

Syntax: read_json ('path', orient = 'index')

Wo,

Weg: Platziert den Pfad der JSON -Datei.

Orient: Die Ausrichtung der JSON -Datei. Der Standardwert ist "Index", aber Sie können "Split", "Datensätze", "Spalten" oder "Werte" auch definieren.

Lassen Sie uns sehen, wie Dateien mit JSON -Erweiterungen in den folgenden Beispielen in einem Datenrahmen gelesen werden können.

Beispiel 1: Verwenden Sie die Funktion read_json () zum Lesen einer JSON -Datei

Zunächst müssen wir eine JSON -Datei von der Open Source -Website herunterladen. Wir können einfach eine Datei mit einem herunterladen .JSON -Erweiterung von mehreren Websites. Anstatt eine JSON -Datei aus dem Internet zu erhalten, können Sie alternativ eine erstellen. Wir haben eine Datei 'Iris heruntergeladen.JSON 'von einer Open-Source-Website. Um diese Datei in Pandas zu lesen, werden wir die Funktion read_json () verwenden.

Wir haben die PD benutzt.Read_json () Methode zum Lesen der lokalen Datei (.JSON -Datei) in die Variable 'DF' '. Wir haben den JSON -Dateipfad als Zeichenfolge an die Funktion übergeben. Mit dieser Methode werden Daten in JSON -Dateien automatisch in DataFrame konvertiert. Das Pandas -Paket wurde ursprünglich als PD importiert. In der letzten Zeile exportieren wir die zehn Beispiellinien aus dem Datenrahmen. Die Methode read_json () hat die 150 Zeilen und 5 Datenspalten aus der IRIS -Datendatei als Eingabe genommen.

Durch Verwendung des DF.Sample () -Funktion haben wir in diesem Ausgabeblock nur eine Probe von 5 Datenzeilen angezeigt. Die Daten des DataFrame werden von der Funktion sample () zufällig abgerufen. Eine definierte Anzahl von Zeilen (zufällig) wird von der Proben () -Methode zurückgegeben. Wenn kein Wert angegeben ist, gibt die Funktion sample () 1 Zeile zurück. Wenn wir den Orient -Parameter der Funktion read_json () mit unterschiedlichen Werten wie "Split", "Spalten", "Datensätzen" oder "Werten" angeben, kann die Ausgabe geringfügig unterschiedlich sein.

Beispiel 2: Verwenden Sie die Funktion read_json () zum Lesen einer JSONFILE vom Remote -Standort

Eine Datei, die sich auf einem anderen CICS -System befindet (Kundeninformationssteuerungssystem). Durch die Verwendung der CICS -Funktion Versand werden Anfragen nach CICS -Dateisteuerung gegen Remote -Dateien an das Remote -System gesendet. Anwendungen können zum Zugriff auf Dateien gestellt werden, auch wenn sie an einem unbekannten Ort/Server platziert werden. Durch die Verwendung der Remote -URL anstelle des Dateipfads können wir JSON -Daten von einem Remote -Standort aus lesen. Die Methode read_json () kann von anderen Orten als nur lokalen Dateien gelesen werden. JSON -Dateien auf entfernten Servern können ebenfalls gelesen werden. Wir können einfach den Funktionsaufruf mit dem Pfad zur externen JSON -Datei bereitstellen.

Wir haben eine öffentlich zugängliche HTTP -API verwendet, die JSON -Formatdaten enthält. Die Methode read_json () wird auch verwendet, um die JSON -Daten aus der Remote -URL zu lesen. Diese Ausgabe enthält ein Beispiel von fünf JSON -Datenzeilen mit der Methode read_json (). Diese Daten stammen aus einer öffentlichen URL und haben 150 Zeilen und fünf Spalten.

Beispiel 3: Verwenden von PD.DataFrame () -Funktion zum Lesen einer JSON -Datei in Pandas DataFrame

In den vorherigen Beispielen haben wir die JSON -Datendatei heruntergeladen oder die Remote -URL zum Lesen der Daten verwendet. Jetzt werden wir JSON -Daten erstellen und sie dann mit dem PD in einen Datenrahmen umwandeln.DataFrame () -Funktion. Bevor wir die JSON -Daten- oder Pandas -Datenframe erstellen, müssen wir die Module von Pandas importieren, um seine Funktionen und Funktionen zu verwenden.

Unsere JSON -Daten 'j_data' werden mit zwei Spalten erstellt: "Name" und "Alter" mit Werten ('1': 'Brock', '2': 'Fin', '3': 'John', '4': 'Moris', '5': 'Jack', '6': 'Anna') und ('1': 38, '2': 26, '3': 41, '4': 35, '5': 28, '6': 27) jeweils. Jetzt werden wir unsere JSON -Daten innerhalb der PD übergeben.DataFrame () -Funktion zum Lesen in den DataFrame.

Wir haben einfach die 'j_data' innerhalb der Funktion dataframe () übergeben, um die JSON -Daten in Pandas DataFrame umzuwandeln.

Beispiel 4: Verwenden von PD.DataFrame () -Funktion zum Lesen eines verschachtelten JSON -Strukturen in Pandas DataFrame

In diesem Beispiel werden wir JSON -Daten mithilfe verschachtelter Wörterbücher erstellen. In Python können Sie verschachtelte Wörterbücher verwenden, um JSON -Daten zu erstellen. Für jedes Element im äußeren Wörterbuch befindet sich eine Spalte oder Variable in der JSON -Datei. Die Taste jedes Elements ist der Spaltenkopf und seine Daten sind ein weiteres Wörterbuch, das aus den Zeilen in dieser speziellen Spalte besteht. Wir werden ein Wörterbuch erstellen, mit dem wir eine JSON -Datei mit Details zu einigen zufälligen erstellen werden.

Wir haben unsere verschachtelten JSON -Daten erstellt. Die Schlüssel der Wörterbücher werden als "Name", "ID", "Kurs" und "Alter" angegeben. Jetzt werden wir die PD verwenden.DataFrame () -Funktion zum Umwandeln des verschachtelten Wörterbuchs in Pandas DataFrame.

Unser verschachteltes Wörterbuch von JSON -Daten wird erfolgreich in einen Datenrahmen konvertiert.

Beispiel 5: Verwenden Sie JSON_Normalize () -Funktion zum Lesen eines verschachtelten JSON -Strukturen in Pandas DataFrame

Für das Lesen verschachtelter JSON -Zeichenfolgen und die Rückgabe eines Datenfrequenz. Der JSON.Die Funktion loads () aus dem Python JSON -Paket muss zunächst zum Lesen der JSON -Zeichenfolge verwendet werden. Die Funktion JSON_NOMPERIGIST () empfängt dieses JSON -Objekt dann und gibt die erforderlichen Daten in Form eines Datenrahmens zurück.

Zusammen mit den Pandas haben wir auch die Module JSON und JSON_Normalize importiert, um die von ihnen bereitgestellten Funktionen und Funktionen zu verwenden. Wir haben den JSON benutzt.lades () die JSON -Saiten lesen. Ein Dateiobjekt wird an JSON übergeben.load (), das ein JSON -Objekt zurückgibt. Es wird verwendet, um Daten zu lesen, die aus einer Datei aus Jsoncodiert wurden, sie in ein Python-Wörterbuch umwandeln und dann die Originaldatei deserialisieren können. Die erforderlichen Daten wurden durch den Schlüssel 'REC' enthalten, der dann in der Funktion json_normale () übergeben wird, um die Daten in Pandas DataFrame zu verflachen.

Abschluss

In diesem Tutorial haben wir die JSON -Datendateien besprochen und wie wir sie mit der Funktion read_json () lesen können. Wir haben die Syntax der Methode read_json () gesehen, um zu verstehen, wie sie funktioniert. In diesem Artikel haben wir einige Beispiele implementiert, um Ihnen beizubringen, wie Sie eine JSON -Datei von einem lokalen und entfernten Ort unter Verwendung der Funktion read_json () und wie Sie die JSON -Datei und die verschachtelte JSON -Struktur mithilfe des PD in Pandas DataFrame in Pandas DataFrame lesen oder konvertieren.DataFrame () und json_normalize () Funktion.