"In" Pandas "können wir viele Informationen in tabellarischer Form speichern, was auch als DataFrame bezeichnet wird. Die "Pandas" erleichtert uns die Methode "DataFrame ()" zum Erstellen des DataFrame. Der DataFrame enthält Indizes, und wir können auch die Indizes des Datenrahmens ändern, indem wir die „Pandas“ -Funktionen verwenden. Die Methode, die wir zur Neueindexierung des Datenrahmens verwenden. Diese Methode hilft beim Ändern der Indexwerte der Zeilen sowie der Indexwerte der Spalten. Durch die Verwendung dieser Methode können wir den Standardindex des Datenrahmens ändern, und wir können auch den Index ändern, den wir beim Erstellen des Datenrahmens festlegen. Wir werden die „Reindedex ()“ -Methode in unseren „Pandas“ -Methoden in diesem Tutorial verwenden und dieses Konzept hier ausführlich erklären.”
Beispiel # 01
Das "Spyder" -Tool hilft uns bei der Entwicklung des "Pandas" -Codes hier in diesem Tutorial und wir starten unseren Code mit dem Schlüsselwort "Import", das beim Importieren der Funktion „Pandas“ hilft. Wir platzieren "Pandas als PD", nachdem wir den "Import" eingegeben haben. Danach erstellen wir den Datenrahmen, indem wir „PD eingeben“.DataFrame () ”. Wir schreiben diese "PD" hier, weil der "DataFrame ()" die Methode von "Pandas" ist. Das "value_df" ist der Name der Variablen, in der der Datenrahmen gespeichert wird. Wir fügen "RandomName" hinzu, das ist der Spaltenname, und der „RandomName“ enthält „Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander und Samuel“.
Dann haben wir "Value_1", in das wir "16, 29, 24, 35, 44, 50, 69, 74 und 88" eingefügt haben. Dann kommt "Value_2", und wir haben "25, 38, 42, 56, 54, 65, 78, 89 und 99" hinzugefügt. Jetzt kommt der „Value_3“ als nächstes, und wir platzieren „36, 48, 52, 69, 74, 75, 87, 91 und 69“ darin. Die Spalte "Value_4" ist danach vorhanden, in der wir "52, 64, 72, 88, 82, 95, 97, 21 und 39" eingefügt haben. Die letzte Spalte ist hier die Spalte "Value_5", und in dieser Spalte sind die Werte, die wir hinzugefügt haben, "66, 78, 82, 99, 34, 45, 57, 61 und 89". Danach verwenden wir die Funktion "print ()", in der "values_df" hinzugefügt wird. Es wird auf dem Terminal drucken.
Nachdem wir "Shift+Enter" gedrückt haben, können wir leicht das Ergebnis unserer Codes in der "Spyder" -App erzielen. Hier gibt dieser Code den Datenrahmen mit dem Standardindex zurück. Jetzt werden wir die Methode "reindex ()" zur ReinIdexierung dieses Datenrahmens in "Pandas" anwenden.
Die Funktion „reindex ()“ wird hier für die Reindedexierung des Indexwerts der Zeile verwendet. Im obigen DataFrame können Sie feststellen, dass die Standardindexwerte der Zeile angezeigt werden, und jetzt wenden wir die Methode „reindex ()“ zur ReinIdexierung dieser Zeilenindizes an. Wir platzieren den Namen des DataFrame und dann die Methode "reindex ()", in der wir die Indexwerte platzieren, die wir dem obigen Datenrahmen hinzufügen möchten. Wir haben in der Funktion "rEdex ()" "" ind_a, ind_b, ind_c, ind_d, ind_e, ind_f, ind_g, ind_h und ind_i "gesetzt. Daher werden die Indizes dieser Zeilen auf dem Datenrahmen aktualisiert, wenn wir diesen Code ausführen.
Die Werte des Zeilenindex werden in diesem Ergebnis angezeigt, und Sie können feststellen. Dies liegt daran, dass die neuen Indexwerte nicht mit den vorherigen Indexwerten des Datenrahmens übereinstimmen. Wenn der neue Index und der alte Index nicht übereinstimmen, wird dort „Nan“ angezeigt. Diese "NAN" -Werte erscheinen standardmäßig, wenn wir den Index ändern, und sie stimmen nicht mit dem vorherigen Index überein.
Beispiel # 02
Wir ändern nun die Spaltenindexwerte des „value_df“, den wir zuvor in Beispiel 1 erstellt haben. Nach dem Drucken der "value_df" setzen wir die Variable "Spalten" ein und fügten einige Werte hinzu. Wir fügen "A_1, B_1, C_1, D_1 und E_1" hinzu. Jetzt möchten wir diese Werte als Index der Spalten anpassen. Dafür verwenden wir die Methode „rendex ()“ und platzieren den Namen der Variablenspalte, in der die neuen Spaltenindexwerte gespeichert und gespeichert sind und werden Stellen Sie auch die "Achse" auf "Spalten" fest, sodass der Spalten -Achsenindex aktualisiert wird. Wir setzen die "rendex ()" -Methode in die "print ()" ein, sodass sie auch am Terminal aufgebaut wird.
Da wir die Methode "rendex ()" verwendet haben, werden die im ersten Datenrahmen vorhandenen Spaltenindexwerte aktualisiert, und im aktualisierten Datenrahmen werden neue Werte hinzugefügt. Sie können auch beachten, dass alle Werte des Datenrahmens in „NAN“ konvertiert werden, da beide Indexwerte von Spalten unterschiedlich sind.
Beispiel # 03
Das "Programming_Data" in diesem Code enthält "P_Languages", in dem wir "JavaScript, CSS, Web Engineering, OOP, C#, AI, Java und JavaScript" hinzugefügt haben. Dann haben wir "Stunden", in denen wir "4_HRS, 2_HRS, 3_HRS, 7_HRS, 6_HRS, 5_HRS, 8_HRS und 6_HRS" platzieren "platzieren. Danach wird der „P_CODE“ eingegeben, und wir fügen „11523, 12423, 12321, 11456, 11454, 12267, 13106 und 14123 ein.“. Wir fügen die Variable "p_index" hinzu und setzen "pro_a, pro_b, pro_c, pro_d, pro_e, pro_f, pro_g und pro_h" ein.
Diese Werte werden als Indexwerte der Zeilen verwendet. Wir ändern den Datenrahmen "programing_df". Wir fügen diesem Datenrahmen auch den "p_index" mit der Methode "Index" hinzu. Wir setzen "programming_df" und dann die "index" -Methode ein und weisen dem "p_index" diesem zu, diesem zuordnen. Jetzt werden die obigen Indexwerte als Zeilenindexwerte zum DataFrame hinzugefügt. Wir drucken auch die "programmierung_df".
Danach fügen wir einige neue Indexwerte in die Variable "new_index" hinzu, und diese sind "p_1, p_2, p_3, p_4, p_5, p_6, p_7 und p_8". Da wir die Indexwerte von Zeilen aktualisieren möchten, verwenden wir die Methode "reindex ()" und "new_index" als Parameter dieser Funktion und speichern den aktualisierten Datenrahmen im "newProgramming_df" und platzieren die "newprogramming_df" in "in" in "in" in "in" in "in" print () ”zum Anzeigen.
Die Indexwerte werden aktualisiert, und wir können auch sagen, dass wir den Datenrahmen, den wir erstellt haben. Alle Werte des Datenrahmens werden ebenfalls in „NAN“ konvertiert, da beide Indexwerte unterschiedlich sind.
Beispiel # 04
Derzeit ändern wir die Indexwerte von "programing_df" von Spalten, die wir zuvor in Beispiel 3 entwickelt haben. Wir platzieren die Variable „Spalten“ und fügen neue Werte hinein ein. Die Variable "P_CODE, P_LUGUAGES, STORLEN UND NEU" wird zur "Spalte" -Variable hinzugefügt. Anschließend verwenden wir erneut die Methode "reindex ()", in der wir die Variable "Spalte" festgelegt haben, die die vorherigen Spaltenindexwerte aktualisiert und diese neuen Spaltenindexwerte zum DataFrame hinzufügen.
Hier können Sie beachten, dass die neuen Werte, die wir in „Spalte“ hinzugefügt haben in der Variablen „Spalte“ erwähnt. Außerdem fügen wir einen weiteren Indexwert hinzu, der im obigen DataFrame nicht vorhanden ist, was hier „neu“ ist, sodass die NAN -Werte in dieser Spalte angezeigt werden.
Die Sequenz der Spalten wird hier geändert, und alle Werte werden angezeigt, da sie in den Spalten des Originaldatenrahmens vorhanden sind, und in der Spalte "Neue" im aktualisierten Datenrahmen enthält alle "NAN" -Werte, da diese Spalte nicht im Originaldatenrahmen vorhanden ist.
Abschluss
Wir haben dieses Tutorial vorgestellt, das uns beim Verständnis des Begriffs „Pandas Reindex“ im Detail hilft. Wir haben diskutiert, wie wir die Spalte eines Datenrahmens sowie die Indexwerte der Zeile neu ernennieren können. Wir haben erklärt, dass die Funktion „reindex ()“ von „Pandas“ dafür verwendet wird. Wir haben verschiedene Beispiele durchgeführt, in denen wir die Indexwerte der Zeilen des Datenrahmens und auch die Indexwerte des Spaltenindex des Datenrahmens geändert haben. Wir haben die Ergebnisse aller Codes erzielt, die wir hier in diesem Tutorial gemacht haben, und erklärten sie auch ausführlich.