Pandas konvertieren Serien in DataFrame

Pandas konvertieren Serien in DataFrame
Pandas ist ein Python-basierter Datenmanipulationstoolset. Unter anderem kann es auch zahlreiche Dateiformate analysieren und die gesamte Datentabelle in ein Numpy -Matrix -Array verwandeln. Infolgedessen ist Pandas ein zuverlässiger Mitarbeiter für maschinelles Lernen und Datenwissenschaftler.

Die PANDAS-Serie ist ein eindimensionales Array, einschließlich Etiketten an den Achsen. Das Objekt akzeptiert sowohl Integer- als auch labelbasierte Indexierung und hat eine Fülle von Techniken zur Ausführung von indexbezogenen Aktionen. Die Erzeugung neuer Spalten aus abgeleiteten oder gegenwärtigen Serien ist eine anspruchsvolle Herausforderung in der Feature Engineering. Mithilfe der nativen Funktionen von Pandas können die neu generierte Serie oder Spalte in einen Datenrahmen umgewandelt werden.

Pandas konvertieren Serien in DataFrame

Das Konvertieren einer Serie in einen Datenrahmen in Pandas ist ein recht einfacher Ansatz. Um eine Serie effizient in einen Datenrahmen zu verwandeln, verwenden Pandas die einrahmen() Funktion.

Diese Funktion verwendet die folgende Syntax:

Es hat einen Parameter "Name". Wenn die Serie einen Namen hat, sollte sie anstelle des übergebenen Namens verwendet werden. Die DataFrame -Darstellung der Serien wird durch diese Funktion zurückgegeben.

In diesem Tutorial erklären wir Ihnen die Methode, um die PANDAS -Serie mit Hilfe praktischer Beispiele in DataFrame umzuwandeln.

Beispiel 01: Verwenden von Pandas .to_frame () Methode, um eine Serie in DataFrame umzuwandeln

Wir verwenden das "Spyder" -Tool, das ein zuverlässiges und einfaches Werkzeug zum Schreiben und Zusammenstellen von Python -Codes ist. In der Umgebung „Spyder“ eröffnen wir eine neue Python -Datei und beginnen unser Skript zu schreiben. Während wir mit den Pandas -Merkmalen arbeiten, besteht die primäre und wichtigste Anforderung darin, „Pandas als PD“ zu importieren. Dies ermöglicht alle Pandas -Funktionen in unserer Python -Datei.

Wir erstellen dann eine Serie "new_ser" mit der „PD.Series () ”-Methode, die zum Bau einer Pandas -Serie verwendet wird. Wir initialisieren die Serie mit acht Ganzzahlwerten, die "8", "4", "3", "9", "11", "6", "15" und "21" sind. Diese Serie wird in der Variablen „New_ser“ gespeichert. Wir können jetzt auf die Serie zugreifen, indem wir diesen variablen Namen verwenden.

Jetzt müssen wir unsere neu erstellte Pandas -Serie sehen. Hier bieten Pandas eine Funktion „print ()“, die die in einer Variablen oder ein an sie übergebene Objekt gespeicherten Daten anzeigt. Da wir die Serie „New_ser“ drucken möchten, verwenden wir diese Variable als Parameter innerhalb der Klammern der Funktion „print ()“ als Parameter.

Drücken Sie die Schaltfläche "Datei ausführen" am Kopf des "Spyder" -Tools. Oder alternativ können Sie die Schlüssel "Shift+Enter" verwenden, um das Skript auszuführen. Jetzt ist der Ausgang am Terminal zu sehen. Wir erstellen zuerst eine Serie und weisen dann 8 Ganzzahlwerte zu, die im unten angegebenen Ausgangsbild beobachtet werden können.

Überprüfen Sie den Objekttyp der Variablen "new_ser". Wir verwenden die Methode "Type ()", um den Objekttyp zu finden. Wir müssen den Objekt oder den Variablennamen angeben, dessen Objekttyp wir in den Klammern dieser Funktion anzeigen müssen. Da wir die Variable "new_ser" als Parameter in die Funktion "type ()" aufgenommen haben. Anschließend fügen wir die Funktion "type ()" in die Funktion "print ()" ein, da wir die Variable "new_ser" als Parameter in die Funktion "type ()" eingeschlossen haben.

Drücken Sie erneut die Schaltfläche "Datei ausführen ausführen", um die Python -Datei auszuführen, um die Ausgabe auf dem Terminal zu erhalten. Es prüft, ob ein Parameter daran übergeben wird, wenn die Funktion „print ()“ aufgerufen wird. Wir haben es mit der Funktion "Typ (type (new_ser)) bereitgestellt, sodass der Objekttyp des Objekts" new_ser "angezeigt wird. Das Ausgabebild zeigt in der letzten Zeile “.Serienerweiterung, was bedeutet, dass das Objekt vom Typ Serientyp ist.

Wir werden nun die Serie „New_ser“ in den Pandas DataFrame umwandeln. Für diese Konvertierung bieten PANDAS uns eine sehr einfache und unkomplizierte Methode, die "to_frame ()" lautet. Wir haben ein DataFrame -Objekt oder eine Variable "new_df" erstellt und es die Ausgabe des Aufrufens der Methode "to_frame ()" zugewiesen. Wir müssen die Funktion „to_frame ()“ mit dem Namen des Serienobjekts verwenden, das wir in einen Datenrahmen konvertieren möchten.

Wir haben auch den Parameter dieser Funktion "Name" verwendet und ihm den Namen "Zahlen" zugewiesen, wie wir "new_ser" verwendet haben.to_frame (name = 'number') ”. Es wird als Spaltenname im DataFrame dargestellt. Anschließend verwenden wir die Methode „Print ()“ mit dem DataFrame -Objekt als Parameter, um den resultierenden Datenfreame anzuzeigen. Hier verwenden wir eine andere Funktion "print ()" mit der Funktion "type ()", um den Objekttyp für die Variable "new_df" zu bestimmen.

Sie können im Ausgabebild die von uns erstellte Serie und dann den Datenrahmen sehen, den wir aus der Serie erfolgreich generiert haben. Für die Überprüfung des Objekttyps definiert die Methode „Type ()“ die Typen für beide Objekte. Zuerst war es ".Serie ”und dann, wenn wir die Serie in DataFrame konvertieren, wandte sie sich zu“.DataFrame ”.

Beispiel 02: Verwenden von Pandas .to_frame () Methode, um mehrere Serien in DataFrame umzuwandeln

In der obigen Abbildung konvertieren wir eine Serie in eine Serie. Jetzt erklärt diese Demonstration, wie mehrere Serien in einen Datenrahmen konvertiert werden können.

Jetzt bauen wir die Pandas -Serie. In diesem Fall erstellen wir 3 Serien. Die erste Serie ist "Name" und speichert fünf Namen "Albert", "Boran", "Charlie", "Daren" und "Elsa". Die zweite Serie, die wir generieren, sind „Punkte“, die die gleiche Wertelänge enthält, die 5 und Werte „44“, „10“, „31“, „52“ und „18“ aufweist. Die letzte Serie "Assists" enthält Werte "10", "3", "7", "15" und "5".

Wir müssen dann die gesamte Serie eins nach dem anderen mit der Funktion „print ()“ verwenden. Wir verwenden zuerst das "Namensobjekt" in der Funktion "print ()", dann "Punkte". Schließlich wird „Assists“ an die "print ()" -Methode übergeben.

Wenn wir den oben genannten Code ausführen, indem wir die Schaltfläche „Datei ausführen“ des Tools „Spyder“ ausführen, erhalten wir nacheinander 3 Serien auf dem Terminal gedruckt.

Wir werden die Methode "to_frame ()" hier verwenden. Wir haben zunächst eine Variable "name_df" erstellt, um den aus der Serie "Name" generierten Datenrahmen zu speichern, und wir weisen die Eigenschaft "to_frame ()" -Methode "Name" den Wert "Name" als Titel der Spalte zu. Anschließend erstellen wir 2 weitere Variablen als "Punkte_DF" und "Assists_DF", um die Serien konvertierte Datenfrüchte aus der Serie "Punkte" und "Assists" zu speichern. Wir weisen den Titel "Assists" mit der Eigenschaft "Name" der Eigenschaft "to_frame ()" den Titel "punkte_df" zu "Punkte" und "Assist_Df".

Wir erstellen ein Objekt "endgültig", um den vollständigen Datenfreame zu speichern. Um alle 3 Datenrahmen zu binden, verwenden wir die „PD.concat () ”Funktion und übergeben die 3 Datenrahmen als Werte. Es wird alle Datenrahmen in einen vollständigen Datenrahmen binden und im „endgültigen“ Objekt speichern. Schließlich verwenden wir die Methode "Print (Final).

Wenn wir den oben genannten Code ausführen, zeigen wir eine Reihe konvertierter Datenframe mit drei Spalten mit dem Namen „Name“, „Punkte“ und „Assists“ an.

Abschluss

Dieser Artikel ist ein Leitfaden für Sie, um das Konzept der Serienkonvertierung in einen PANDAS -Datenframe zu lernen und zu verstehen. Das Umwandeln einer Serie in einen Datenfream ist eine einfache Praxis mit Pandas -Funktionen. Wir haben Ihnen zunächst die Techniken erklärt, um eine einzelne Serie in einen Datenrahmen umzuwandeln, und dann über die Konvertierung mehrerer Serien in mehrere Datenrahmen ausgearbeitet und dann alle einzelnen Spaltendatenrahmen zu einem einzelnen verketteten Datenrahmen mit dem Methode „concat ()“ kombiniert werden von Pandas. Wir haben auch eine Ausgabe für jeden Ansatz zur Verfügung gestellt, den wir verwendet haben. Wir gehen davon aus.