Pandas to_records

Pandas to_records
Pandas DataFrame ist ein heterogenes zweidimensionales Größenabfall-tabellarischer Datenformat mit benannten Achsen. Für mathematische Operationen müssen die Zeilen- und Spaltenbezeichnungen immer ausgerichtet sein. Die grundlegende Datenstruktur der Pandas ist vergleichbar mit einem DIKT, in dem sie als Container für Serienelemente fungiert.

DataFrame wird mit Pandas DataFrame in ein Numpy Record -Array konvertiert.zu Records () Funktionen. Der Index wird normalerweise als Anfangsfeld des Datensatzes angegeben. Wir werden die Methode pandas to_records () mit Beispielen in diesem Artikel diskutieren.

Was ist ein Datenrahmen?

Pandas ist ein beliebtes Python Data Science -Paket aus einem Grund: Es bietet leistungsstarke, ausdrucksstarke und flexible Datenstrukturen, die unter anderem die Manipulation und Analyse von Daten erleichtern. Der Datenrahmen ist eine dieser Strukturen.

Ein Datenrahmen ist eine zweidimensionale Datenstruktur, in der die Daten in Form von Zeilen und Spalten dargestellt werden. Ein Pandas -Datenfreame besteht aus drei Hauptkomponenten: Daten, Zeilen und Spalten.

Da sie eine flexible und einfache Art des Speicherns und Arbeitens mit Daten bieten, sind Datenrahmen eine der am häufigsten verwendeten Datenstrukturen in modernen Datenanalysen.

So erstellen Sie einen PANDAS -Datenfream, Listen, Serien, Dikten, Numpy NDarrays und ein weiterer Datenrahmen können zum Erstellen eines Pandas -Datenfreams verwendet werden.

Was ist die Syntax von Pandas?.Datenrahmen.to_records () Funktionen?

Die Methode to_Records () dient zum Konvertieren eines Datenrahmens in ein relevantes Numpy Record -Array. Die Funktion to_Records () in Pandas hat die folgende Syntax.

# DataFrame.to_records (index = true, column_dtypes = none, index_dtypes = none)

Alle Details zu den Parametern finden Sie im folgenden Abschnitt.

Index

Fügen Sie den Index in das resultierende Datensatzarray ein, das im Feld "Index" gespeichert oder über die Indexkennzeichnung zugegriffen werden kann, falls eine festgelegt wird.

Column_dtypes

Wenn der Datentyp eine Zeichenfolge oder ein Typ ist, wird er verwendet, um alle Spalten zu speichern.

INDEX_DTYPES

Wenn der Datentyp eine Zeichenfolge oder möglicherweise ein Typ ist, wird er verwendet, um alle Indexstufen zu halten. Wenn es sich um ein Wörterbuch handelt, werden sowohl Indexnamen -Namenszuordnung als auch Indizes verwendet, um Datentypen anzugeben. Nur wenn index = true diese zugebende Zuordnung verwendet.

Lassen Sie uns das Thema mit unterschiedlichen Beispielen diskutieren. Sie können diese Beispiele implementieren und das Gesamtkonzept besser verstehen.

Beispiel 1:

Der Datenrahmen.to_Records () Funktion von Python besteht darin, den angegebenen Datenrahmen in ein Numpy -Rekord -Array zu ändern. Betrachten Sie den angegebenen Code unten als Beispiel.

Wir haben einen Datenrahmen mit Werten für drei verschiedene Eigenschaften erstellt: "Gehalt, Mitarbeitername und Alter"; 39000, 44000, 25000 und 55000 sind die Werte für das Gehalt der Immobilie."Alex, Andrew, Zack und Kim gehören zu den Werten für den Namen des Attributs" Mitarbeiter.''

Ebenso umfasst das Altersattribut die Werte 39, 44, 25 und 55. Der Index wurde erstellt und festgelegt. Der Datenrahmen wird dann gedruckt.

Pandas importieren
d_frame = pandas.DataFrame ('Gehalt': [39000, 44000, 25000, 55000],
"Mitarbeitername": ["Alex", "Andrew", "Zack", "Kim"],
'Alter': [39, 44, 25, 55])
Index_ = Pandas.DATE_RANGE ('2020-08-05 07:30', Perioden = 4, freq = 'H')
d_frame.index = index_
print (d_frame)

Das Gehalt, der Mitarbeitername und die Alterswerte sowie das Datum und die Uhrzeit sind im folgenden Screenshot angezeigt.

Im folgenden Screenshot wird der angegebene Datenrahmen zu einer relevanten Numpy Record Array -Darstellung angezeigt.

Pandas importieren
d_frame = pandas.DataFrame ('Gehalt': [39000, 44000, 25000, 55000],
"Mitarbeitername": ["Alex", "Andrew", "Zack", "Kim"],
'Alter': [39, 44, 25, 55])
Index_ = Pandas.DATE_RANGE ('2020-08-05 07:30', Perioden = 4, freq = 'H')
d_frame.index = index_
print (d_frame)
OUTCOME = D_FRAME.to_records ()
Druck (Ergebnis)

Das nächste beigefügte Bild erklärt, dass der Datenrahmen.TO_RECORDS () -Funktion.

Beispiel 2:

Wir werden uns ansehen, wie Sie den Datenrahmen verwenden.to_records () Funktion im zweiten Beispiel. Der Code ähnelt dem oben genannten. Wir haben das PANDAS -Modul zuerst diesmal importiert und dann den DataFrame generiert.

Der Index wurde dann wie im Code gezeigt gebildet: index_ = ['Erste Zeile', 'zweite Zeile', 'dritte Zeile', 'vierte Zeile' und 'Fifth Zeile']. Schließlich haben wir den Index festgelegt und die DataFrame -Ergebnisse gedruckt. Schauen Sie sich die letzte Zeile des Codes an.

Pandas importieren
dta_frame = pandas.DataFrame ("1": [9, 3, 4, None, 6],
"2": [8, 1, 22, 35, keine],
"3": [19, 9, 17, 6, 9],
"4": [55, 2, keine, 1, 9])
Index_ = ['First_row', 'Second_row', 'Third_row', 'Fourth_Row', 'Fifth_Row']
dta_frame.index = index_
print (dta_frame)

Sie können das Ergebnis hier sehen, das den Index und den DataFrame enthält.

Mit dem Datenrahmen.In Records () -Funktionen haben wir den angegebenen Datenrahmen konvertiert. Sie können es in den folgenden Screenshot angezeigt.

Pandas importieren
dta_frame = pandas.DataFrame ("1": [9, 3, 4, None, 6],
"2": [8, 1, 22, 35, keine],
"3": [19, 9, 17, 6, 9],
"4": [55, 2, keine, 1, 9])
Index_ = ['First_row', 'Second_row', 'Third_row', 'Fourth_Row', 'Fifth_Row']
dta_frame.index = index_
print (dta_frame)
OUTCOME = DTA_FRAME.to_records ()
Druck (Ergebnis)

Nachdem minimale Änderungen am obigen Referenzcode vorgenommen wurden, ist dies das Ergebnis. Der Datenrahmen.to_Records () -Funktion verändert einen bestimmten Datenrahmen auf eine relevante Numpy Record Array -Darstellung.

Beispiel 3:

In unserem letzten Beispiel werden wir uns untersuchen. Die to_numpy -Methode kann verwendet werden, um diese Datenstruktur in ein Numpy -Array umzuwandeln.

Sie können in dem Code sehen, dass wir die Pandas- und Numpy -Module importiert haben, die für den Code von wesentlicher Bedeutung sind. Wir haben den Datenrahmen nach dem Importieren der Module erstellt. Es gibt 5 Zeilen und 3 Datenspalten im Datenrahmen.

Danach wird der Datenrahmen in ein Numpy -Array umgewandelt. Der transformierte Datenrahmen und sein Typ werden angezeigt.

Pandas importieren
Numpy importieren
data_frame = pandas.Datenrahmen (
Data = Numpy.willkürlich.Randint (
0, 10, (5,3)),
Spalten = ["A", "B", "C"])
cls_res = data_frame.to_numpy ()
print (cls_res)
print (type (cls_res))

Die Ausgabe befindet sich im nächsten Screenshot. Die Datenwerte in den 5 Zeilen und 3 Spalten des konstruierten DataFrame sind hier angezeigt. Die Klasse wird auch in der letzten Zeile der Ausgabe angezeigt. Wie oben dargestellt, verwandelt Pandas DataFrame to Numpy () Methode einen Datenrahmen in ein Numpy -Array.

Abschluss:

Die Funktion to_record () in Python wird in diesem Artikel beschrieben. Der Pandas DataFrame wird auch gut unter Beispielen unterrichtet. Die Schritte zum Konvertieren eines Datenrahmens mithilfe der Methode DataFrame to_records () werden ebenfalls erläutert.