Pandas zu String

Pandas zu String
„Die DataFrame- und Serienansätze, die uns Pandas anbieten, können für jede Spalte in Ihrem Datenrahmen verwendet werden und sind für die Arbeit mit Strings entwickelt. Mit der Methode „applyMap (STR)“ können wir den Datenrahmen in Zeichenfolgen umwandeln, wie Sie in der folgenden Stichprobe sehen können. Diese Methode wandelt einfach einen Datentyp in einen String -Typ um. In Pandas haben wir hauptsächlich „Objekt“ als Datentyp für die String verwendet. Wir können die Gesamtzahl der in den Spaltenwerten enthaltenen Zeichen bestimmen, indem wir die Technik „Länge ()“ in der String -Verarbeitung verwenden.”

Die Syntax zum Konvertieren von Datenframe in String

Die Syntax zum Erhalten der Länge der Stringwerte in einer Spalte vorhanden

Beispiel 1: Konvertieren Sie den DataFrame in Zeichenfolgen mithilfe von ApplyMap (STR) in Zeichenfolgen

In Python gibt es viele konstruierte Methoden zum Arbeiten mit Strings. Jede dieser Methoden gibt einen neuen Wert zurück, ohne die ursprüngliche Zeichenfolge zu ändern. Für Zeichenfolgewerte wird der Datentyp „Objekt“ verwendet. In Python Pandas wird der Text -Datentyp als "Zeichenfolge" oder als "Objekt" bezeichnet. Eine Zeichenfolge kann eine Wortphrase enthalten oder auch eine Nummer sein. In diesem Fall verwenden wir "ApplyMap (STR)", um einen ganzen Datenrahmen in einen String -Typ zu verwandeln. Mit dem „Apply (STR)“ werden die Ganzzahlen in Zeichenfolgen umwandelt, und das ApplyAmap (STR) wird verwendet, um den vollständigen Datenrahmen in Zeichenfolgen umzuwandeln.

Lassen Sie uns jetzt über die Ausführung unseres Codes sprechen. Um unseren Code auszuführen, haben wir das "Spyder" -Tool verwendet. Die Pandas -Bibliothek muss zuerst als "PD" importiert werden. Wir würden dann unseren Datenrahmen erstellen. Der DataFrame wird als "Daten" bezeichnet. Wir haben drei Spalten in diesem Datenrahmen "Kurs", "Gebühr" und "Kreditstunde". Diese Spalten haben jetzt bestimmte Werte zugewiesen. Wir haben eine Liste von Kursen "Python", "OOP", "Virtual_ Studio" und "Java" in der Spalte "Kurs". Die Werte für die Spalte "Gebühr" haben "35000", "30000", "20000" und "15000" und in der letzten Spalte "Credit_Hour" haben wir "3", "4", "3" und " 3". Daher die „PD.DataFrame ”wird verwendet, um den Datenrahmen zu erstellen. In dieser Abbildung zeigen wir auch die „Datentypen“ unseres Programms mit der Funktion „print ()“ mit „DF. Datentypen". Im Wesentlichen „df“.DataTypes “wird verwendet, um einen Datentyp für einen Datenrahmen zu erstellen.

Wir wechseln jetzt zum Hauptzweck unseres Programms. Um den DataFrame in eine Zeichenfolge umzuwandeln, verwenden wir „DF.ApplyMap (STR) ”. Mit der Methode „appeapeMap ()“ kann eine Funktion zweimal auf jedes DataFrame -Element angewendet werden. In Pandas wird der „Str“ hauptsächlich verwendet, um die Werte von Datenrahmen oder Serien abzurufen. Was in diesem Programm vorkommt, ist, dass diese Funktion die Datentypen von "Integer" in "String" -Datentypen konvertiert. Wenn wir die Funktion „print ()“ aufrufen, zeigen wir jetzt unseren Datenrahmen und seine Datentypen nach der Verwendung des „ApplyMap (STR)“ an.

Zwei Datenrahmen mit den Datentypen werden im Ausgabebild unseres Programms angezeigt. Wir können im zweiten DataFrame sehen, dass er den DataFrame in eine Zeichenfolge konvertiert hat, indem der Datentyp geändert wird. Die Ganzzahl -Datentypen werden jetzt als "Objekt" -Datentypen angezeigt. Für String verwenden wir "Objekt" als Datentyp. Der String -Datentyp dieses Objekts ist ermöglicht, entweder ein einzelner Wert, eine Anzahl oder ein Satz zu sein. Im ersten Datenrahmen waren die Datentypen für die Spalten "Fee" und "Credit_Hour" Ganzzahlen. Nachdem die Datentypen für diese Spalten als „Objekte“ angezeigt werden, werden die Datentypen jedoch als „Objekte“ angezeigt. Zuletzt zeigt es „DTYPE: Object“ an, was darauf hinweist, dass es in eine Zeichenfolge konvertiert wurde.

Beispiel 2: Konvertieren der Spaltenwerte in Zeichenfolge Typ, indem die Funktion „Asttype ()“ verwendet wird

In diesem Beispiel wird ein Datentyp einer einzelnen Spalte in einen "String" -Typ konvertiert. Im vorherigen Beispiel wurde der gesamte Datenrahmen in Zeichenfolgen konvertiert, während in diesem Fall nur eine einzige Spalte in Zeichenfolgen konvertiert wird. Wir haben die Spalte mit der Funktion "Asttype ()" in einen Zeichenfolge -Typ konvertiert. Die Funktion „Astype ()“ in Pandas wird hauptsächlich verwendet, wenn wir einen Datentyp in einen anderen Datentyp verwandeln möchten. In Python gibt es jedoch andere alternative Methoden, um einen oder mehrere Datentypen gleichzeitig zu ändern.

Beginnen Sie nun die Codierung. Die Pandas -Bibliothek muss zuerst als PD importiert werden.Der folgende Schritt besteht. Dieser DataFrame hat vier Spalten "Kurs", "Gebühren", "Dauer" und "Rabatt". Für jede dieser Spalten haben wir bestimmte Werte aufgeführt. Die Werte in der ersten Spalte sind wie folgt "Java", "Graphic_Desiging", "android_studio" und "OOP". In der zweiten Spalte "Gebühren" haben wir "20000", "21000", "20000" und "24000". Wir haben die Werte "1_Month", "2_Month" und "3_Month" in der dritten Spalte "Dauer" und im letzten Eintrag haben wir die Rabatte "20%" und "30%" für die Kurse. Der Datenrahmen wird dann mit „PD“ generiert.DataFrame ”. Der DataFrame wird nun mit der Funktion „print ()“ auf dem Bildschirm angezeigt, und seine Datentypen werden auch mit dem „DF.DTYPES ”Befehl.

Wir werden nun die Funktion „AStypes ()“ verwenden, um die bestimmte Spalte in eine Zeichenfolge umzuwandeln. Mit "Asttype ()" und dem Spaltennamen "Ladungen" und Datentyp "String" in der Parameterspalten werden wir in diesem Fall die Spalte "Ladungen" in eine Zeichenfolge konvertieren. Jetzt wenden wir die Funktion „print ()“ an, um die Ergebnisse auf dem Bildschirm anzuzeigen.

Wie Vorderseite der „Ladung“ als Datentyp. Der Datentyp für eine Zeichenfolge in Python ist ein „Objekt“, und da die verbleibenden drei Spalten Strings sind, zeigt dies an, dass jetzt der gesamte Datenrahmen in Zeichenfolgen umgewandelt wird.

Beispiel 3: Bestimmung der Länge der Zeichenfolge für eine bestimmte Spalte in einem Datenrahmen

In diesem Beispiel bestimmen wir die Länge jedes Zeichenfolgewerts für eine bestimmte Spalte im Datenrahmen. Mit der Funktion „Länge ()“ können wir die Länge der Stringwerte bestimmen. Diese Methode wird verwendet, um die Gesamtzeichen in einer Eingangszeichenfolge zu bestimmen.

Nachdem wir die Pandas -Bibliothek importiert haben, um das dritte Beispiel unseres Artikels zu beginnen.DataFrame ”. "Student_Name", "Roll_number" und "Total_marks" sind als Spalten verfügbar. Diese Spalten sind mit einigen Werten aufgeführt. "Albert", "Jhon", "Ava", "Oliver" und "Amelia" sind in der ersten Spalte aufgeführt, während ihre Rollnummern in der zweiten Spalte als "1", "2", "3", "," aufgeführt sind ",", "," 4 "und" 5 ". Und in der letzten Kolumne bieten wir ihre letzten Marken „498“, „470“, „444“, „390“ und „489“. Nachdem die Anweisung „DataFrame“ gedruckt wurde, werden wir die Funktion „Print ()“ verwenden, um den darunter.

Anschließend zeigen wir eine Anweisungszeile mit der Aufschrift „Berechnung der Länge der Zeichenfolge in einer Spalte“ und berechnen dies mit der Funktion „Länge ()“. Wir können aus unserem Datenrahmen beobachten, dass die Spalte „Student_Name“ Stringwerte enthält, damit wir die Länge seiner Werte bestimmen können. Wir verwenden diese Spalte. Daher verwenden wir "DF [Schülername]" mit "Bewerben (len)" ". Dadurch werden die Gesamtnummern der einzelnen Werte in dieser Spalte hinzugefügt, die dann als neue Spalte im DataFrame mit dem Namen "student_name_length" angezeigt werden. Wenden wir uns derzeit seinen Ergebnissen zu.

Hier werden zwei Datenrahmen angezeigt, wie Sie sehen können. Der zweite DataFrame hat eine zusätzliche Spalte, "student_name_length", und wie wir sehen können, berechnet er die gesamte Anzahl von Wörtern und zeigt sie dort an. Zum Beispiel hat der Name „Albert“ insgesamt 6 Zeichen. Dies zeigt an, dass diese Funktion in unserem Programm erfolgreich funktioniert.

Abschluss

Pandas bieten verschiedene Methoden, um einen Datenrahmen in eine Zeichenfolge zu verwandeln. Der gesamte Datenrahmen kann mit "ApplyMap (STR)" in eine Zeichenfolge konvertiert werden, mit der die Integer der Datentyp in die Zeichenfolge umgewandelt wird. Die Berechnung der Zeichen der Zeichenfolgenwerte in einer Spalte mit der Methode „Länge ()“ ist ebenfalls sehr hilfreich. Wenn wir mehrere Einzelwerte berechnen möchten, vereinfacht diese Pandas -Technik uns. Es wird für uns einfacher sein, zu arbeiten, wenn wir kleine, unkomplizierte Strategien anwenden. Wir gehen davon aus, dass unsere Arbeit, wenn wir diese Strategien effektiv anwenden, viel zu einfach sein wird.