Pandas zu Array

Pandas zu Array
Die häufigste und beliebteste Methode, um den Datenrahmen in ein Array umzuwandeln, besteht darin, die Funktion to_numpy () zu verwenden. In Numpy werden die Dimensionen als Achse bezeichnet. Das „Array.Array ”Klasse aus der Standard -Python -Bibliothek unterscheidet sich vom Numpy.Array. Wir haben auch das Attribut "Werte" und to_records () Methoden.

Methode 1: Verwenden von to_numpy ()

Wenn wir die Methode to_numpy () auf Pandas DataFrame, einem Objekt des Numpy -Datentyps, anwenden, wird NDarray als Ausgabe zurückgegeben. Typischerweise wird ein zweidimensionales NDarray zurückgegeben. Schauen wir uns die Syntax der Funktion an, bevor wir die Funktionen der Funktion in den folgenden Beispielen sehen.

Syntax:

DataFrame_Object.to_numpy (dType = none, copy = false, na_value = nodefault.kein Standard)

Parameter:

  1. DTYPE: Numpy.DTYPE, STR oder optional. Der Datentyp wird an Numpy übergeben.Asarray ().
  2. Kopieren: Bool, standardmäßig falsch falsch. Ob Sie überprüfen, ob die Ausgabe/zurückgegebene Daten/Wert in den anderen Arrays keine Ansicht ist, ist keine Ansicht. Der to_numpy () ist nicht garantiert, dass er kopiert wird, wenn Copy = False verwendet wird. Stattdessen macht Copy = True eine Kopie, auch wenn sie nicht streng notwendig ist.
  3. Na_Value: Jede Option. Der zu ersetzende Wert, wenn fehlende Werte vorliegen. Der Wert hängt standardmäßig von den DTypen der Spalten im DataFrame ab.

Beispiel 1:
Lassen Sie uns einen Datenrahmen mit 5 Zeilen und 3 Spalten haben und mit der Methode to_numpy () in ein Numpy -Array konvertieren.

Pandas importieren
Numpy importieren
# Betrachten Sie den PANDAS -Datenframe
tatsächlich = pandas.DataFrame ([[1, "Cooking", 200],
[2, "Musik", 3004],
[3, "Hand Webstuhl", 1000],
[4, "Hand Loom", 2000],
[5, "Dressing", 3000]],
Spalten = ['ID', 'Arbeit', 'Lohn'],
index = ['Person 1', 'Person 2', 'Person 3', 'Person 4', 'Person 5'])
# Zeigen Sie den konvertierten Datenrahmen an
print (tatsächlich, "\ n")
# In Numpy Array konvertieren
konvertiert = tatsächlich.to_numpy ()
# Zeigen Sie die Art des Numpy -Arrays an
print (type (konvertiert), "\ n")
drucken (konvertiert)

Ausgang:

Erläuterung:
Nach dem Konvertieren in das Numpy -Array verwenden wir die Funktion type (), um den Typ des konvertierten Arrays anzuzeigen. Sie können sehen, dass 5 Zeilen in einem Numpy -Array gespeichert werden.

Beispiel 2:
Konvertieren Sie nur zwei Spalten im DataFrame in das Numpy -Array mit der Methode to_numpy (). Hier müssen wir die Spaltennamen angeben, die in einer Liste in das Numpy -Array konvertiert werden sollen.

Pandas importieren
Numpy importieren
# Betrachten Sie den PANDAS -Datenframe
tatsächlich = pandas.DataFrame ([[1, "Cooking", 200],
[2, "Musik", 3004],
[3, "Hand Webstuhl", 1000],
[4, "Hand Loom", 2000],
[5, "Dressing", 3000]],
Spalten = ['ID', 'Arbeit', 'Lohn'],
index = ['Person 1', 'Person 2', 'Person 3', 'Person 4', 'Person 5'])
# Konvertieren Sie nur die Spalten "Arbeit" und "Löhne" in Numpy Array
print (tatsächlich [['Arbeit', 'Löhne']].to_numpy ())

Ausgang:

Erläuterung:
Wir können sehen, dass nur zwei Spalten ["Arbeit", "Löhne"] in das Numpy -Array konvertiert werden.

Methode 2: Verwenden des Werteattributs

Das "Werte" ist ein Attribut, das den Pandas -Datenfreame direkt in das Numpy -Array umwandelt.

Syntax:

DataFrame_Object.Werte

Beispiel 1: Konvertieren Sie den gesamten Datenrahmen in Numpy Array
Betrachten Sie den vorherigen DataFrame und konvertieren Sie es mit der Methode to_numpy () in ein Numpy -Array.

Pandas importieren
Numpy importieren
# Betrachten Sie den PANDAS -Datenframe
tatsächlich = pandas.DataFrame ([[1, "Cooking", 200],
[2, "Musik", 3004],
[3, "Hand Webstuhl", 1000],
[4, "Hand Loom", 2000],
[5, "Dressing", 3000]],
Spalten = ['ID', 'Arbeit', 'Lohn'],
index = ['Person 1', 'Person 2', 'Person 3', 'Person 4', 'Person 5'])
# Verwenden Sie das Werteattribut, um den obigen Datenrahmen in Numpy Array umzuwandeln.
drucken (tatsächlich.Werte)
drucken (type (tatsächlich.Werte))

Ausgang:

Erläuterung:
Sie können alle Spalten im Datenrahmen zum Numpy -Array sehen.

Beispiel 2: Konvertieren Sie einige Spalten in Numpy Array
Konvertieren Sie nur zwei Spalten im DataFrame in das Numpy -Array mit der Methode to_numpy (). Hier müssen wir die Spaltennamen angeben, die in einer Liste in das Numpy -Array konvertiert werden sollen.

Pandas importieren
Numpy importieren
# Betrachten Sie den PANDAS -Datenframe
tatsächlich = pandas.DataFrame ([[1, "Cooking", 200],
[2, "Musik", 3004],
[3, "Hand Webstuhl", 1000],
[4, "Hand Loom", 2000],
[5, "Dressing", 3000]],
Spalten = ['ID', 'Arbeit', 'Lohn'],
index = ['Person 1', 'Person 2', 'Person 3', 'Person 4', 'Person 5'])
print (tatsächlich [['Arbeit', 'Löhne']].Werte)

Ausgang:

Wir können sehen, dass nur zwei Spalten ["Arbeit", "Löhne"] in das Numpy -Array konvertiert werden.

Methode 3: Verwenden der to_records ()

Der "to_Records ()" "konvertiert den vorhandenen Datenrahmen direkt in ein Numpy -Array, das vom Rekordarray -Typ enthält. Der Vorteil dieser Methode besteht darin, dass für jede konvertierte Zeile der Index auch im Datensatzarray erhältlich ist.

Syntax:

DataFrame_Object.to_records ()

Beispiel 1: Konvertieren Sie den gesamten Datenrahmen in Numpy Array
Betrachten Sie den vorherigen DataFrame und konvertieren Sie es mit der Methode to_Records () in ein Numpy -Array.

Pandas importieren
Numpy importieren
# Betrachten Sie den PANDAS -Datenframe
tatsächlich = pandas.DataFrame ([[1, "Cooking", 200],
[2, "Musik", 3004],
[3, "Hand Webstuhl", 1000],
[4, "Hand Loom", 2000],
[5, "Dressing", 3000]],
Spalten = ['ID', 'Arbeit', 'Lohn'],
index = ['Person 1', 'Person 2', 'Person 3', 'Person 4', 'Person 5'])
# Verwenden Sie to_Records (), um den obigen Datenrahmen in Numpy Array umzuwandeln.
drucken (tatsächlich.to_records (), "\ n")
# Den Datentyp abrufen
drucken (type (tatsächlich.to_records ())))

Ausgang:

Erläuterung:
Sie können alle Spalten im DataFrame zum Numpy -Array sehen und das zurückgegebene Array ist ein Rekordarray. In jedem Datensatz können Sie auch den Index sehen.

Beispiel 2: Konvertieren Sie einige Spalten in Numpy Array
Verwenden Sie die Methode to_Records (), um die ersten 2 Spalten im DataFrame in ein Numpy -Array umzuwandeln.

Pandas importieren
Numpy importieren
# Betrachten Sie den PANDAS -Datenframe
tatsächlich = pandas.DataFrame ([[1, "Cooking", 200],
[2, "Musik", 3004],
[3, "Hand Webstuhl", 1000],
[4, "Hand Loom", 2000],
[5, "Dressing", 3000]],
Spalten = ['ID', 'Arbeit', 'Lohn'],
index = ['Person 1', 'Person 2', 'Person 3', 'Person 4', 'Person 5'])
# Verwenden.
print (tatsächlich [['ID', 'Arbeit']]].to_records (), "\ n")

Ausgang:

Die ersten beiden Spalten werden in das Numpy -Array umgewandelt.

Abschluss

Wir haben besprochen, was Arrays sind und wie die Datenrahmen in Pandas in Numpy -Spalten konvertiert werden können. Wir haben drei Methoden verwendet, um die DataFrame -Spalten in ein Array zu ändern. In den Beispielen dieses Artikels haben wir versucht, Ihnen beibringen. Wir haben auch die Werteattribut und die Methode to_Records () verwendet, um die DatenfraMes -Spalten in ein Numpy -Array umzuwandeln.