Pandas Agg Count

Pandas Agg Count
In „Pandas“ können wir die Datenrahmen erstellen, die die rows_and_columns enthalten. Große Mengen an tabellarischen Daten werden im Allgemeinen unter Verwendung des PANDAS -Programms untersucht und organisiert. "Pandas" liefert uns verschiedene Methoden und eine davon ist die "Anzahl". Wir können sehen.

Die Zählmethode wird verwendet, um unvollständige Spalten zu lokalisieren. Von dort aus können Sie wählen, ob Sie die Spalten in Ihren Prozessen überspringen oder bei Bedarf Standardwerte geben können. In diesem Leitfaden untersuchen wir Pandas Count und Value_Counts, die zwei Möglichkeiten zur Bewertung Ihres Datenrahmens sind.

Beispiel # 01

Wir beginnen mit der "Spyder" -App. Dies wird uns helfen, die "Pandas" -Codes durchzuführen. In seinem Texteditor starten wir unseren ersten Code, indem wir die „Pandas als PD“ importieren. Diese „PD“ wird verwendet, um auf die gewünschten „Pandas“ -Methoden zuzugreifen. Jetzt müssen wir nicht den vollständigen Namen „Pandas“ schreiben, um auf seine Funktion zuzugreifen. Stattdessen schreiben wir einfach "PD".

Wir erstellen dann eine Variable und initialisieren sie auch, indem wir einige Daten hinzufügen. Wir fügen die Daten in der Spalte hinzu, indem wir den ersten Spaltennamen als "Namen" einstellen, und die Namen, die wir hier hinzufügen, sind "Ray", "James", "Mole", "Smith", "Jay", "Milli", "William" und "Rick". Die nächste Spalte heißt „Fächer“, die Fachnamen wie „Mathematik“, „Wirtschaft“, „Naturwissenschaften“, „Mathematik“, „Statistik“, „Statistik“, „Statistik“ und „Computer“ enthält.

Unterhalb der Variablen erstellen wir „Nummer“ und verwenden die „PD.DataFrame () ”Methode. Wir verwenden die „PD“, um die Pandas -Methode "DataFrame" zu erhalten. Wir ändern die „Kurse“ -Daten in den "DataFrame" und aktualisieren seinen Namen als "Nummer". Dann hilft die Methode "print ()" bei der Anzeige des Datenrahmens. Darunter verwenden wir zunächst die Methode „GroupBy ()“. Es ermöglicht uns, Ihre Daten in viele Kategorien zu unterteilen, damit Sie Berechnungen für eine gründlichere Analyse durchführen können. Wir „gruppy“ diesen Datenrahmen, indem wir "Probanden" einstellen und dann die "count ()" -Methode verwenden.

Die Funktion count () gibt eine Serienentität mit dem Ergebnis für jede Zeile nach dem Zählen der Anzahl nicht leerer Werte für jede Zeile. Wir setzen beide Methoden in die Funktion „print ()“ ein, damit sie auf dem Terminal angezeigt werden.

Es zeigt zuerst den ursprünglichen DataFrame und dann die Probanden „GroupBy“ und zählt die Anzahl des Subjekts. Es fügt auch die gleichen Themen hinzu und schreibt es hier. In diesem DataFrame enthalten zwei Spalten das Thema "Maths", sodass es das Thema "Maths" "2" und das "Statistik" -Bet. "3" angezeigt wird.

Beispiel # 02

Jetzt importieren wir "pandas" und generieren dann Daten und speichern diese Daten in der Variablen "Data123". Wir haben hier Spalten "Mitarbeiter" und "Adress". In "Mitarbeiter" setzen wir Namen von Mitarbeitern ein, die "Ray", "James", "Mole", "Smith", "Jay", "Milli", "William" und "Rick" sind. In der "Adresse" geben wir die Adressen der Mitarbeiter "London", "America", "Sodan", "London", "Sodan", "Sodan", "America" ​​und "America" ​​an, die "London", "Amerika", "Sodan", "London" sind.

Dann deklarieren und initialisieren wir "SAMMT", was ein variabler Name ist, und initialisieren ihn mit „PD“.DataFrame ”. Wir übergeben auch den Parameter „Data123“ an diese „PD.DataFrame ”. Wir verwenden die unten stehende Methode "Value_Count ()". Die Wertzählungstechnik ist besser. Diese Technik ergibt die Gesamtzahl der unterschiedlichen Werte für eine bestimmte Spalte. Wir geben hier die Spalte "Adresse".

Wir haben den Namen des Datenrahmens, der "gleich" ist, und fügen den Namen der Spalte hinzu, die "Adresse" lautet. Schreiben Sie dann die Funktion oder Methode "value_count ()". Wir fügen diese vollständige Anweisung in die Methode „Print ()“ hinzu, damit sie auch auf dem Konsolenbildschirm rendert.

Nachdem der Datenrahmen in diesem Ergebnis gerendert wurde, zählt er dieselben Adressen der Mitarbeiter und zeigt sie unten an und entfernt den Namen der Mitarbeiter oder entfernt die Spalte „Mitarbeiter“. Es zeigt nur die Adresse und ihre Nummern, die in diesem Datenrahmen vorhanden sind.

Beispiel # 03

Die Daten hier werden in fünf Spalten eingefügt. Wir erstellen einen Datenrahmen mit dem Namen "Studenten" und die Spalten, die wir haben, sind "Roll_no", "S_Name", "S_Instructor", "S_Course" und "Credit_HRs". In der Spalte "Roll_no" haben wir "A1, A2, A3, A4 und A5". Jetzt, in der nächsten Spalte "S_Name", fügen wir die Namen der Schüler "Smith, Noah, Joseph, Mishi und William" hinzu. Dann setzen wir die Ausbildernamen: "Peter, Taylor, James, Robert und Olivia". Die Kurse, die wir hier einfügen, sind „Englisch, Britisch, Englisch, Arabisch und Englisch“.

Für die Spalte "Credit_HRs" fügen wir "4, 5, 4, 3 und 4" hinzu. Wir ändern all diese Daten im Datenrahmen und benennen diesen Datenrahmen oder speichern diesen Datenrahmen in der Variablen „Studenten“. Dann verwenden wir "Print ()", was diesen Datenrahmen rendert. Darunter platzieren wir die Methoden „GroupBy ()“ und „Count ()“. Und geben Sie "S_Couse" hinein, damit es die Kurse zählt und sie anzeigt.

Wir haben einen „arabischen“ Kurs, einen „britischen“ Kurs und 3 „englische“ Kurse hier in diesem Datenrahmen. Wir erhalten diese Zählung, indem wir die Methode „count ()“ anwenden.

Beispiel # 04

In diesem Beispiel enthält der erstellte Datenrahmen die "upload_date", in der wir einige Daten hinzufügen, die zu fünf Daten hinzugefügt werden. Fügen Sie dann eine andere Spalte "Viewer_ids" ein, in der wir die IDs der Zuschauer als "v1, v2, v3, v4 und v5" hinzufügen. Wir geben diesem Datenrahmen den Namen "Video". Verwenden Sie zuerst "GroupBy", in dem die Daten basierend auf "Upload_Date" basieren und dann die "count ()" verwendet, die diese Daten basierend auf "Upload_Time" zählt. Schließlich zeigen Sie das Ergebnis an.

Dies ist das Ergebnis dieses Codes und zählt die Daten basierend auf der „Hochzeitenzeit“ der Videos. Die Videos, die auf „2022-07-21“ hochgeladen werden.

Beispiel # 05

Die „Studie“ ist die Variable, die Daten enthalten, die sich in Spalten- und Zeilenformen befinden. Die Spaltennamen sind "Kurse, c_fee und c_duration". In der Spalte „Kurse“ enthält „Pandas, Ubuntu, Linux, Python, Pandas, Linux, Spark, Python, Ubuntu, Python und Python“ darin. Die Spalte "C_fee" enthält "22000, 25000, 23000, 24000, 26000, 25000, 25000, 22000, 25000, 24000 und 24000". Die Spalte „C_duration“ enthält Daten, die „30 Tage, 50 Tage, 35 Tage, 40 Tage, 60 Tage, 35 Tage, 30 Tage, 50 Tage, 50 Tage, 40 Tage und 40 Tage“ sind.

Ändern Sie sie in DataFrame und drucken Sie auch den DataFrame aus. "GroupBy ()" Die "Kurse und C_Duration" und zählen Sie sie, indem Sie "count ()" anwenden ". Diese Methoden "GroupBy" und "Count" gruppieren die Daten basierend auf den Spalten für Kurse und Dauer. Berechnen Sie dann die Anzahl.

Hier gruppiert es die Daten zu Kursen und ihre Dauer und zählt diese Kurse dann mit der Methode „count ()“.

Abschluss

Dieser Leitfaden befasst sich mit dem Konzept der Funktion „Agg Count“ in „Pandas.„Wir haben beschrieben, wie die Funktion„ Agg Count “in Pandas verwendet wird, um zu zählen. Die Methode „Agg Count“ wurde auf die fünf Fälle angewendet, die wir festgelegt haben.