Pandas DataFrame Indexierung

Pandas DataFrame Indexierung
In Pandas beinhaltet die Indexierung die Auswahl bestimmter Spalten und Datenzeilen aus einem Datenrahmen. Die Auswahl aller Zeilen und sogar einige Spalten, Teil der Zeilen und alle Spalten oder einige der Zeilen und Spalten beinhaltet, was die Indexierung beinhaltet. Die Subset -Auswahl ist ein anderer Name für die Indizierung. Wenn wir ein Pandas DataFrame -Objekt in Python mit der PD erstellen.DataFrame () -Funktion aus dem PANDAS -Modul, eine Adresse in den Zeile oder in den Spaltenindizes wird automatisch erstellt, um jedes Datenelement/Punkt im DataFrame zu symbolisieren. Zeilenindizes sind jedoch der Index des DataFrame, während Spaltenindizes einfach als Spalten bezeichnet werden. Ein Index eines Pandas DataFrame -Objekts identifiziert im Wesentlichen bestimmte Zeilen. Schauen wir uns an, wie Sie das Indexdatenframe -Objekt des Pandas ändern können.

Beispiel 1

Die Indexoption in Python kann verwendet werden, um den Index eines Datenrahmens so festzulegen, dass er erstellt wird. Wir werden eine Liste erstellen und an die PD weitergeben.Indexparameter der DataFrame () -Methode. Lassen Sie uns dies mit Python -Code in die Praxis umsetzen. Wir haben das Pandas -Modul hier importiert. Anschließend haben wir ein Wörterbuch und eine Pythonliste erstellt. Das Wörterbuch wurde verwendet, um die Entwicklung des Datenframe zu beginnen. Wie Sie sehen können, haben wir die DataFrame -Funktion mit dem Indexparameter verwendet, um die Spalte „RR“ zum Index zu machen.

Pandas als PD importieren
dd = 'name': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marks': [33, 66, 88, 67, 78],
'City': ['New York', 'Los Angeles', 'Chicago', 'San Diego', 'Dallas']
RR = [1, 2, 3, 4, 5]
ff = pd.DataFrame (DD, Index = RR)
Druck (FF)

Siehe die Ausgabe im folgenden Bild.

Beispiel 2

In Python können wir verschiedene Methoden verwenden, um den Index jeder vorhandenen Spalte oder Spalten eines Pandas -Datenfreame -Objekts zu erstellen. In diesem Szenario werden wir das Set Index () -Methode des Python Pandas -Moduls verwenden. Das innenlaufende Argument ist standardmäßig auf false festgelegt. Wir werden jedoch in diesem Fall den Wert von Inplace auf True setzen. Die vorhandene Spalte übergeben an die PD.setzen. Mal sehen, wie das funktioniert.

Pandas als PD importieren
dd = 'name': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Rollnum': ['1', '2', '3', '4', '5'],
'City': ['New York', 'Los Angeles', 'Chicago', 'San Diego', 'Dallas']
ff = pd.DataFrame (DD)
print ("\ ninitial DataFrame:")
Druck (FF)
ff = ff.set_index ('rollnum')
print ("\ nFinal DataFrame:")
Druck (FF)

Die Ausgabe ist im folgenden Screenshot angegeben.

Beispiel 3

In diesem Fall werden wir das Drop -Argument der Set Index () -Funktion des Python Pandas -Moduls verwenden. Wir werden das Drop -Argument in diesem Fall jedoch auf False setzen. Damit der DataFrame nicht die Spalte verliert, die als neuer Index zugewiesen wurde. Setzen wir dies in die Praxis um den Code unten.

Pandas als PD importieren
dd = 'rollnum': ['1', '2', '3', '4', '5'],
'Name': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marks': [33, 66, 88, 67, 78]
ff = pd.DataFrame (DD)
print ("\ ninitial DataFrame:")
Druck (FF)
ff = ff.set_index ('name', drop = false)
print ("\ nFinal DataFrame:")
Druck (FF)

Hier ist das Ergebnis.

Beispiel 4

Durch das Erstellen einer Liste von Spaltennamen der Datenfreame und über die Übergabe an die Funktion "set index ()) können wir mehrere Spalten des Pandas DataFrame -Objekts genau wie der Index festlegen. Infolgedessen wird der Index in diesem Szenario als Multi-Index bezeichnet.

Pandas als PD importieren
dd = 'rollnum': [1, 2, 3, 4, 5],
'Name': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marks': [33, 66, 88, 67, 78],
'City': ['New York', 'Los Angeles', 'Chicago', 'San Diego', 'Dallas']
ff = pd.DataFrame (DD)
print ("\ ninitial DataFrame:")
Druck (FF)
ff = ff.set_index (['rollnum', 'name'])
print ("\ nFinal DataFrame:")
Druck (FF)

Hier sehen Sie die Ausgabe des oben angegebenen Code.

Beispiel 5

Verschiedene Techniken können verwendet werden, um die Position des Pandas DataFrame -Objekts auf jedes Python -Objekt wie eine Liste, einen Bereich oder sogar eine Serie festzulegen. Verwenden der PD.Index (), set index () und range () funktionen können wir den Index des DataFrame -Objekts (PANDAS) in diesem Ansatz festlegen. Zunächst werden wir die Funktion von Range () verwenden, um eine Python -Sequenz von Ganzzahlen zu erstellen, die wir dann an die PD senden werden.Index () Funktion. Diese Methode erzeugt das Indexobjekt des Datenrahmens. Das zurückgegebene DataFrame Index -Objekt wird dann als neuer Index des DataFrame unter Verwendung der Funktion "set Index () festgelegt. Lassen Sie uns diesen Code implementieren.

Pandas als PD importieren
dd = 'rollnum': [1, 2, 3],
'Name': ['Alex', 'Ramen', 'Zayn'],
'Marks': [33, 66, 88],
'City': ['New York', 'Los Angeles', 'Chicago']
ff = pd.DataFrame (DD)
print ("\ ninitial DataFrame:")
Druck (FF)
my_list = ['i', 'ii', 'iii']
idx = pd.Index (my_list)
ff = ff.set_index (idx)
print ("\ nFinal DataFrame:")
Druck (FF)

Siehe die Ausgabe unten.

Beispiel 6

Der Index des Pandas DataFrame -Objekts kann mit dem Set Index () und PD festgelegt werden.Index () Methoden. Wir werden zunächst eine Python -Liste erstellen, die wir dann an die PD senden werden.Index () Funktion. Diese Funktion ergibt ein DataFrame Index -Objekt. Das zurückgegebene DataFrame Index -Objekt wird dann als neuer Index des DataFrame unter Verwendung der Funktion "set Index () festgelegt.

Pandas als PD importieren
dd = 'rollnum': [1, 2, 3, 4, 5],
'Name': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marks': [33, 66, 88, 67, 78],
'City': ['New York', 'Los Angeles', 'Chicago', 'San Diego', 'Dallas']
ff = pd.DataFrame (DD)
print ("\ ninitial DataFrame:")
Druck (FF)
INDX = PD.Index (Bereich (1, 6, 1))
ff = ff.set_index (INDX)
print ("\ nFinal DataFrame:")
Druck (FF)

Das Ergebnis ist im angehängten Screenshot angegeben.

Beispiel 7

Verwenden der PD.Series () und set index () Funktionen können wir den Index des DataFrame -Objekts von Pandas in der vorhergehenden Methode festlegen. Erstellen Sie eine Liste und geben Sie sie an die PD weiter.Die Funktion der Serie der Serie () () gibt eine Pandas -Serie zurück, die als DataFrame Index -Objekt verwendet werden kann. Die resultierende PANDAS -Reihe wird an die Set Index () -Methode übergeben, die sie als neuer Index des DataFrame festlegt. Lassen Sie uns den folgenden Code sehen und verstehen, wie dies funktioniert.

Pandas als PD importieren
dd = 'rollnum': [1, 2, 3, 4, 5],
'Name': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marks': [33, 66, 88, 67, 78],
'City': ['New York', 'Los Angeles', 'Chicago', 'San Diego', 'Dallas']
ff = pd.DataFrame (DD)
print ("\ ninitial DataFrame:")
Druck (FF)
ser_indx = pd.Serie ([5, 4, 3, 2, 1])
ff = ff.set_index (ser_indx)
print ("\ nFinal DataFrame:")
Druck (FF)

Hier sehen Sie die Ausgabe.

Abschluss

Indexierung ist der Prozess der Auswahl von Werten aus bestimmten Zeilen und Spalten in einem Datenrahmen. Wir können alle Zeilen und einige Spalten oder Zeilen und alle Spalten mithilfe der Indexierung auswählen. In dieser Sitzung wurden Themen wie der Index besprochen und wie Sie den Index bei der Generierung eines Datenrahmens festlegen können, wie Sie vorhandene Datenfreamespalten als Index oder sogar Multi-Index festlegen können und wie Sie Python-Objekte wie Bereich, List, List, festlegen können, oder sogar Serien als Index.