Pandas Groupby Count District

Pandas Groupby Count District

In diesem Artikel werden Sie vermittelt, wie Sie die unterschiedlichen Werte für jede Gruppe nach der Gruppierung der Daten mithilfe der Gruppe GroupBy () zählen können. Mit Hilfe der Pandas.GroupBy () -Methode können wir die Daten leicht in mehrere Gruppen unterteilen, damit die Aggregationsfunktionen auf jede Gruppe angewendet werden können. In Pandas ist diese Technik ein wesentlicher Bestandteil der Datenanalyse. Es gibt verschiedene Möglichkeiten, zu bestimmen, wie viele eindeutige Werte in einer Datenspalte für eine Datengruppe vorhanden sind. Verwenden von DataFrame.GroupBy (), Nunique (), DataFrame.Agg () und Serie.Value_Counts () Methoden usw., Wir können die Anzahl der unterschiedlichen Werte für die Gruppen erhalten.

So zählen Sie die eindeutigen Werte nach der Gruppierung der Daten in Pandas

Erstens werden wir die Daten in der Spalte oder in der Reihe von Kategoriengruppen unterteilen. Anschließend werden wir eine Funktion verwenden, um die Anzahl der eindeutigen Daten/Werte für die Gruppe der Kategorien zu berechnen. In den folgenden Beispielen werden wir verschiedene Funktionen verwenden, um die unterschiedlichen Daten für die Gruppen von Kategorien zu zählen.

Beispiel Nr. 01: Zählen Sie die unterschiedlichen Werte aus einer DataFrame -Spalte mit der Methode VALUTE_COUNT ()

Die Funktionswerte_Count () gibt ein Objekt mit Zahlen verschiedener Werte zurück. Das resultierende Objekt wird in absteigender Reihenfolge angeordnet, wobei das erste Element am häufigsten erscheint. Standardmäßig schließt es NA -Werte aus. Lassen Sie uns zunächst einen Datenrahmen erstellen. Der Datenrahmen wird nach dem Importieren des Pandas -Moduls erstellt.

Wir haben unseren Datenrahmen erstellt, indem wir ein Wörterbuch innerhalb der PD verwendet haben.DataFrame () -Funktion. Unser Datenrahmen besteht aus zwei Spalten, "Student" und "Alter". Der Spaltenstudent enthält die Datenwerte ('Dave', 'Sybil', 'Dave', 'Jenny', 'Dave', 'Dave', 'Sybil', 'Jenny', 'Jenny', 'Sybil') und die Die Spalte 'Alter' enthält die Werte (14, 15, 16, 16, 15, 14, 15, 14, 14, keine). Gruppen wir nun die Daten und bestimmen die Gesamtwerte für die Gruppen die Gesamtwerte für die Gruppen.

Die Funktion hat die gesamten unterschiedlichen Werte für die in der Spalte "Student" erstellten Gruppen zurückgegeben. Zum Beispiel für Gruppe 'Dave' tritt der Alterswert '14' in der Spalte 'Alter' zweimal auf, und die Werte '15' und '16' passieren gerade ein einziges Mal und so weiter. Wie bereits erwähnt, hat die Funktion auch den fehlenden Wert ignoriert.

Beispiel Nr. 02: Zählen Sie die unterschiedlichen Werte mehrerer Spalten mithilfe der Methode VALUTE_COUNT ()

Im vorherigen Beispiel haben wir die unterschiedlichen Werte einer einzelnen Spalte für jede gruppierte Daten/jeden gruppierten Wert gezählt. Jetzt bestimmen wir die Anzahl der unterschiedlichen Werte mehrerer Spalten nach Gruppen einer Spalte des Datenrahmens. Wir brauchen einen weiteren Datenrahmen mit mindestens drei Spalten.

Wir haben unseren Datenrahmen mit drei Spalten erstellt, ich.e., "Name", "Marks" und "Note". Die Spaltenmarken speichern die Daten ('Tyson', 'Nancy', 'Nancy', 'Tyson', 'Jimmy', 'Jimmy', 'Jimmy', 'Nancy', 'Tyson'). Während die Säulen, "Marks" und "Klassen" die Werte (15, 15, 17, 17, 18, 18, 14, 14, 14) und ("B", "B", "A", "," enthalten A ',' a ',' a ',' b ',' b ',' b ') jeweils. Zählen wir nun die eindeutigen Werte der Spaltenmarkierungen und "Noten", nachdem die Daten des Spaltennamens gruppiert wurden.

Die Funktion Value_Counts () wird auf eine Liste angewendet, die die Spaltenbezeichnungen enthält. Die Funktion hat die charakteristischen Wertzahlen für jede Gruppendaten in der Spalte 'Name' zurückgegeben.

Beispiel Nr. 3: Zählen Sie die unterschiedlichen Werte mit GroupBy.nunique () Funktion

Die Anzahl der unterschiedlichen Werte für jede Spalte wird von der Nunique () -Methode zurückgegeben. Die Funktion nunique () sucht spalte Molumnungssuche und ruft die Anzahl der unterschiedlichen Datenwerte für jede DataFrame-Zeile ab, wenn die Spaltenachse angegeben ist (Axis = 'Spalten'). Bei Verwendung der Methode nunique () zur Bestimmung der Anzahl verschiedener Werte erstellen wir zunächst einen Datenrahmen mit mindestens einer Spalte, die sich wiederholende Daten enthält.

Wir haben zwei Spalten erstellt, ich.e., "Mitarbeiter" und "Gehalt" in unserem Datenrahmen. Der Spaltenangestellte speichert Daten als String ('Manager', 'Accountant', 'Manager', 'Manager', 'Clerk', 'Accountant', "Clerk '," Clerk', "Accountant", "Clerk", "Clerk") und des Clerk "," Manager "," Manager "," Clerk "," Accountant ") und Die Spalte 'Gehalt' enthält die Werte (15000, 14000, 15000, 14000, 12000, 13000, 12000, 14000, 15000, 13000). Lassen Sie uns die unterschiedlichen Werte im Spaltengehalt für Gruppen in der Spalte 'Mitarbeiter' finden.

Es gibt drei eindeutige Werte im Spaltengehalt "Gehalt" für die Gruppen "Buchhalter" und "Angestellter" in der Spalte "Angestellter". Die Anzahl der unterschiedlichen Werte für Gruppenmanager beträgt 2.

Beispiel 4: Zählen Sie unterschiedliche Werte mehrerer Spalten mithilfe der Funktion nunique ()

Jetzt berechnen wir die Anzahl der eindeutigen Werte für mehrere Datenrahmenspalten. Fügen wir eine weitere Spalte im DataFrame hinzu, die wir in Beispiel 3 erstellt haben.

Wir haben einen neuen Spaltenpost in unserem Datenrahmen mit den Datenwerten ("Junior", "Junior", "Senior", "Junior", "Senior", "Senior", "Senior", "Junior", "Junior" hinzugefügt. Junior ',' Junior '). Jetzt zählen wir die eindeutigen Werte von Spalten 'Post' und 'Gehalt' für jede Gruppendaten in der Spalte "Mitarbeiter". Wir werden die AGG () -Funktion verwenden, um die Anzahl eindeutiger Werte für mehrere Spalten zu finden.

Wir haben die Daten in der Spalte "Mitarbeiter" gruppiert und die Agg () -Funktion angewendet. In der Funktion agg () haben wir ein Wörterbuch mit Spaltennamen als Schlüssel und den Nagenturen als Werte von Schlüssel übergeben. Die Funktion hat die Anzahl der eindeutigen Werte in Spalten 'Post' und "Gehalt" für jede Gruppendaten zurückgegeben, i.E, "Buchhalter", "Angestellter" und "Manager".

Wir können auch die Anzahl der unterschiedlichen Werte unter Verwendung der Funktion nunique () ohne die Agg () -Methode bestimmen. Zuerst erstellen wir zuerst eine Liste mit Spaltenbeetikern von, von denen wir die unterschiedlichen Werte zählen möchten. Anschließend werden wir die Funktionen von GroupBy () und Nunique in den spezifischen Spalten des Datenrahmens in der Liste anstelle des gesamten Datenfrequellen 'DF' verwenden.

Ohne die Agg () -Funktion haben wir dieselben Ergebnisse wie zuvor erhalten, als wir die Agg () -Funktion angewendet haben.

Wir können auch mehrere Spalten gruppieren und die Anzahl der unterschiedlichen Werte für die Gruppe und die Untergruppe finden. Gruppieren wir die Daten der Spalten "Mitarbeiter" und "Post" und finden Sie dann die unterschiedlichen Werte in der Spalte "Gehalt" für jede Gruppe und Untergruppe.

Beispiel Nr. 5: Bestimmen

Wenn Sie mit einer bestimmten Spalte eines Datenrahmens arbeiten, wird die Funktion für eindeutige () verwendet und gibt alle eindeutigen Daten/Werte der Spalte zurück. Zunächst erstellen wir einen Datenrahmen, aus dem wir die eindeutigen Werte in der angegebenen Spalte für die Gruppendaten einer einzelnen Spalte finden, die unter Verwendung der Gruppe GroupBy () gruppiert ist.

Es gibt zwei Spalten in unserem Datenrahmen, ich.e., "Geschlecht" und "Alter". Die Datenwerte in der Spalte "Geschlecht" sind ("männlich", "männlich", "männlich", "weiblich", "männlich", "weiblich", "weiblich", "männlich", "weiblich", "weiblich") und die Spalte 'Alter' speichert die Werte (19, 19, 20, 18, 20, 18, 19, 20, 17, 20). Jetzt werden wir die Daten in der Spalte "Geschlecht" mithilfe der Funktion GroupBy () gruppieren und die unterschiedlichen Werte im Spaltenalter für jede Gruppe finden.

Die Funktion hat einen Datenrahmen mit den unterschiedlichen Werten einer Spalte anstelle von Zahlen verschiedener Werte zurückgegeben. Es ist jedoch ersichtlich, dass es vier eindeutige Werte (18, 19, 17, 20) für die Gruppe weiblich und 2 eindeutige Werte für die Gruppe männlich in der Spalte „Alter“ gibt.

Abschluss

In diesem Pandas -Tutorial haben wir darüber diskutiert, wie die unterschiedlichen Werte oder eindeutigen Daten in einer Spalte oder Spalten des Datenrahmens in Pandas bestimmen oder zählt werden. Jetzt können Sie möglicherweise die eindeutigen Werte in Pandas zählen. Wir haben in diesem Artikel mehrere Beispiele implementiert, um Ihnen beizubringen, wie Sie die unterschiedlichen Werte aus einer DatenfraMes -Spalte unter Verwendung der Funktion von VALUTE_COUNT (), NUNIQUE () und Unique () nach der Gruppierung der Daten mit der Funktion "GroupBy () () () unter Verwendung der Funktion GroupBy () zählen können.