Pandas Value Count

Pandas Value Count

Verwenden Sie die Funktion "values_count ()" in Python Panda, um die Anzahl der eindeutigen Werte und Zeichenfolgen zu zählen. Es gibt die Objekte zurück, die in der Liste am häufigsten erscheinen. Mit seinem Parameter kann "Index" mit "Value_Count" die Werte zählen und den Index entweder in der Aufstieg oder in der Reihenfolge bestellen.

Die Syntax von count_values ​​() Methode

Beispiel 1: Zählen Sie die Zeichenfolge anhand der Funktion count_value ()

In diesem Beispiel werden wir die Zeichenfolge der angegebenen Daten im Programm mit der Funktion "count_value ()" verwendet. Eine Sequenz, die die Anzahl verschiedener Werte enthält. Diese Methode gibt daher die Anzahl der eindeutigen Einträge in jeder Spalte eines Datenrahmens für eine bestimmte Spalte zurück. Beim Versuch, die Häufigkeit gültiger Werte zu bestimmen, die in Spalten zu einer bestimmten Spalte in Pandas vorhanden sind, wird „count ()“ verwendet. Während der Wert "count_value ()" verwendet wird, um die Zählungen einer Serie zu bestimmen.

Um den Code in Aktion zu setzen, verwenden wir das Tool "Spyder". Wir müssen zuerst die Bibliothek des Pandas als „PD“ importieren, bevor wir den Code ausführen können. In diesem Beispiel „PD.Index ”wird verwendet, um eine Indexliste zu erstellen. Diese Liste wird als "Person" bezeichnet. Die Werte, die wir für diese Liste gemacht haben, sind "Watson", "Emma", "Enna", "Watson", "Jhon", "Smith", "Jack", "Emma", "Isabella" und "Daniel". Wir initialisieren die Variable „ID“, um den Index beizubehalten. Daher „PD.Index ”wird aufgerufen, um diesen Datenrahmen zu erstellen.

Um die Zeichenfolgen in diesem Code zu zählen, werden wir nun die „ID“ verwenden.value_counts () ”Funktion. Es gibt uns mehrere Zählungen für jede in der Indexliste verwendete Zeichenfolge. Da bestimmte Zeichenfolgen in der Indexliste wiederholt werden, können wir problemlos die Anzahl der Wiederholungen zählen, indem sie "Value_Count ()" verwenden ". Wir werden nun die Funktion „print ()“ verwenden, um „ID ID) anzuzeigen.count_value “auf dem Bildschirm.

Zwei Spalten, die Indexliste und die Anzahl der Zählungen werden verwendet, um die Ergebnisse anzuzeigen. Die Indexliste wird mit ihrem "Namen: Person" angezeigt und der Datentyp für diesen Index lautet "int64". Es zeigte die Nummer der Zeichenfolge vor den Saiten, wie man zu sehen ist. Watson erscheint mit einem „2“ davor, weil das Wort zweimal in der Zeichenfolge verwendet wird. Ähnlich wie "Emma" in der Liste zweimal erscheint, wird „2“ vor diesem angezeigt. "Enna" erscheint nur einmal in der Liste, sodass "1" vor "Enna" angezeigt wird. Der Rest folgt dem gleichen Verfahren.

Beispiel 2: Verwendung der Value Count () -Methode, um die Anzahl der Ganzzahlen zu zählen

In dieser Illustration zählen wir die Anzahl der Werte des Index. Im Vergleich zu dem vorhergehenden Beispiel, in dem zeigt, wie die Anzahl der Zeichenfolgen ermittelt wird, bestimmen wir die Gesamtzahl der Werte in diesem Fall.

Wir müssen zuerst die Pandas -Bibliothek importieren. Zunächst müssen wir die Indexliste mit „PD verwenden“ generieren.Index". Wir haben einige Werte in Form von Zahlen in dieser Liste. Wir fügen die Ganzzahlwerte an die Indexwerte hinzu. Die Werte sind "61", "28", "28", "98", "52", "43", "52", "98", "1", "4", "9" und "61". Anschließend wird die Variable "ID" zugewiesen, um den erstellten Index zu speichern. Die Methode „print ()“ wird dann verwendet, um diese Indexliste anzuzeigen.

Danach verwenden wir jetzt die "value_counts ()", um die Anzahl der in der Indexliste vorhandenen Ganzzahlwerte zu zählen. Es gibt die Anzahl der in der Indexliste enthaltenen Wert. Es wird in der Ausgabe „1“ angezeigt, wenn eine Zahl nur einmal verwendet wird und die Anzahl der wiederholten Zahlen vor dieser Zahl angezeigt wird, wenn die Zahl mehr als einmal verwendet wird. Jetzt werden wir die „ID“ anzeigen.value_count ”mit der Funktion„ print () “verwendet.

Wie zu sehen ist, wird auf dem Bildschirm eine einzelne Indexliste angezeigt. Diese Liste zeigt die Nummer "61", "28", "28", "98", "52", "43", "52", "96", "1", "4", "9" und " 61 ”mit seinem Datentyp„ Int64 “. Die Indexliste ist die erste Spalte in der folgenden Zeile, während die zweite Spalte die Anzahl der Ganzzahlwerte anzeigt. Dieser Frame definiert die Zahlen "61", "28", "98" und "52" verwendet zweimal in der Indexliste. Während die Zahlen "43", "1", "4" und "9" eine einzige Zeit in der Indexliste verwenden. Die Funktion „count_value ()“ zeigt zuerst wiederholte Werte an, bevor sie zu einzelnen Werten übergehen.

Beispiel 3: Verwenden Sie Value_Count, um die Anzahl der Ganzzahlwerte zu zählen und sie in aufsteigender Reihenfolge zu sortieren

In diesem Beispiel zählen wir die Anzahl der Ganzzahlwerte, die in einer Datenrahmenspalte vorhanden sind, und sortieren sie mit den Integer -Werten -Indizes. Durch die Übergabe einer Funktion, die nach dem erforderlichen internen Listenindex als Schlüsselwort sortiert, wird die Funktion „sort ()“ verwendet, um diese Sortiervariante durchzuführen.

Wenn wir uns das dritte Beispiel in diesem Artikel ansehen, müssen wir als erstes die Pandas -Bibliothek als „PD“ importieren, um zu importieren. Der folgende Schritt besteht darin, einen Datenrahmen zu generieren. Der DataFrame wird als "Daten" bezeichnet. Dieser Datenrahmen enthält eine Spalte mit dem Namen "Zahlen". Wir haben der Spalte "Zahlen" ein paar Ganzzahlwerte hinzugefügt. Die Werte sind "1", "2", "4", "8", "8", "1" und "0". Mit „PD.DataFrame ”Wir generieren jetzt den Datenrahmen. Anschließend verwenden wir jetzt die Funktion „print ()“, um die Datenfream -Daten auf dem Bildschirm anzuzeigen.

Jetzt sind wir „Daten.Zahlen.value_count () ”, um die in der Spalte„ Nummer “dieses Datenrahmens vorhandenen Zahlen zu zählen. Es wird jede Nummer überprüft, um festzustellen, wie viele sie wiederholt wurden, und wenn dies der Fall ist, wird diese Informationen als neue Spalte im Ausgabebild angezeigt. Dann drucken wir die Anweisung "count_values" und zeigen die „Daten an.Nummer.Wert count () ”unter Verwendung der Methode„ print () “. Wir rufen jetzt die Funktion „Value_Count ()“ und ihren Parameter „sort_index“ an. Sortierung ist die Methode, um Daten in eine bestimmte Reihenfolge zu setzen, um die Daten zu erleichtern. Der Index der Zählwerte wird dann entweder nacheinander oder aufsteigend sortiert. Dieses Ergebnis wird in der initialisierten Variablen "ID" gespeichert. Mit der Funktion „print ()“ zeigen wir schließlich das Endergebnis auf dem Bildschirm an.

Drei Frames werden im Ergebnisergebnis angezeigt. Der erste zeigt den Datenrahmen, den wir erstellt haben, mit einer einzelnen Spalte „Nummern“ erstellt. Mit seinem Index zeigt diese Spalte ihre Werte an. Die Anzahl des Datenrahmens wird in der zweiten Zeile unterhalb der Anweisung count_values ​​angezeigt. Die Nummern, die nicht wiederholt werden, werden in der Spalte nach den wiederholten Zahlen angezeigt. Es ist einfach zu sehen. "INT64" wird als Datentyp angezeigt. Die letzte Phase sortiert den Index der Zählwerte, die jetzt in aufsteigender Reihenfolge platziert sind. Jetzt ist der Index "0", "1", "2", "4" und "8".

Abschluss

Die Funktion „Value_Count ()“ wird verwendet, um alle Ganzzahlwerte oder Zeichenfolgen zu zählen, die in den Spalten des DataFrame oder in der Indexliste enthalten sind. In den ersten beiden Beispielen „PD.Index ”wurde verwendet, um eine Indexliste zu generieren. Um die Anzahl zu bestimmen, verwenden wir Ganzzahlwerte in der zweiten Liste und in den Zeichenfolgenwerten in der ersten Indexliste. Im dritten Beispiel erstellen wir einen Datenrahmen und wenden "Value_Count ()" mit seinem Parameter "Index_Sort" an. Die im Artikel verwendeten Strategien sind relativ einfach und benutzerfreundlich.