Pandas -Frequenzzahl

Pandas -Frequenzzahl
Sie lernen, wie Sie das Vorkommen von Daten oder Wert in einer Spalte in diesem Pandas -Tutorial zählen können. In der Data Science gibt es Fälle, in denen wir bestimmen müssen, wie häufig ein bestimmter Wert in einer bestimmten Spalte eines Datenrahmens auftritt. Dies kann beispielsweise auftreten, wenn Sie nur einen kleinen Bereich potenzieller Werte vergleichen möchten. Wenn Sie die Menge an doppelten oder wiederholten Werten in einer Spalte zählen möchten, ist dies ein weiteres Beispiel. Darüber hinaus müssen wir möglicherweise die Beobachtungen zählen, die einen Faktor ausmachen oder den Anteil von Männern und Frauen in der Datenerfassung kennen müssen.

So verwenden Sie die durchschnittliche Pandas -Funktion

Wir müssen die Häufigkeitszahlen von Daten/Werten oder Elementen in einer oder mehreren Spalten eines Pandas -Datenfrequenzs bestimmen. Es gibt verschiedene Möglichkeiten, dies zu erreichen. Wir werden einige Methoden diskutieren, um das Vorkommen oder die Häufigkeit von Elementen oder Werten in der Spalte eines Datenrahmens zu zählen.

Beispiel 1: Zählen der Frequenz der Spalte mit der Funktion Value_Counts ()

Die Value_Counts () -Methode in Pandas gibt eine Reihe mit der Häufigkeit einzigartiger Werte zurück. Die resultierende Reihe ist standardmäßig in abnehmender Reihenfolge und ohne NA -Werte frei. Die „Pandas.Das Objekt der Serie ist für die Verwendung mit dieser Funktion geeignet (value_counts ()). Die Frequenzzahlen der Werte in einer einzelnen Spalte können mit dieser Methode erhalten werden. Wir müssen zuerst einen Datenrahmen erstellen, um dieses Beispiel zu demonstrieren. Die „Pandas.DataFrame () ”-Funktion wird verwendet, um den Datenrahmen zu generieren. Somit müssen wir das Pandas -Paket zuerst importieren.


Innerhalb der PD.DataFrame () -Funktion haben wir ein Python -Wörterbuch verwendet, um unseren Datenrahmen zu generieren. Wir haben die Spalten in unserem Datenrahmen mit den Beschriftungen „X“ und „Y“ zugewiesen. Wir zeigen unseren Datenfrequer "DF" mithilfe der Print () -Methode an.


In der neu erstellten "DF" -Datenfreame gibt es zwei Spalten - "x" Spalte "X" die Ganzzahlwerte (1, 1, 4, 3, 5, 1, 4, 3, 5, 4) und "Y" speichern die Spalte der Spalte der Spalte der Spalte String -Werte ("Q", "R", "T", "Q", "Q", "T", "R", "Q", "T", "R"). Sie können beobachten, dass die Daten beider Spalten eine Wiederholung enthält. Wir können die Funktion Value_Counts () verwenden, um die Häufigkeit von Daten in einer bestimmten Spalte zu berechnen. Zählen wir die Datenhäufigkeit in der Spalte „Y“.


Die Funktion gab eine Serie zurück, die die Zahlen unterschiedlicher Werte aufweist. Der Wert "q" tritt 4 Mal auf und die Werte „R“ und „T“ treten dreimal in der Spalte „Y“ auf. Zählen wir auch die eindeutigen Werte in Spalte x.


Es ist ersichtlich, dass die Werte „1“ und „4“ dreimal in der Spalte „x“ auftreten, während die Werte „3“ und „5“ 2 -mal auftreten.

Beispiel 2: Zählen Sie die Frequenz der Spalte mit dem GroupBy.Counts () Funktion

In diesem Beispiel gruppieren wir die Zeilen mit dem Pandas DataFrame mit der Spalte mit der Spalte.GroupBy () Funktion und verwenden Sie die Methode count (), um die Anzahl der unterschiedlichen Werte für jede Gruppe zu bestimmen, wodurch die None- und NAN -Werte ignoriert werden. Erstellen wir zunächst einen DataFrame, bei dem wir den GroupBy anwenden.Counts () Funktion.


Wir haben ein Pandas -Wörterbuch verwendet, um unseren Datenrahmen nach dem Importieren des Pandas -Moduls zu erstellen. Die Namen unserer Spalten werden als "Col1" und "Col2" angegeben.


In der Spalte „Col1“ haben wir die Ganzzahldaten (8, 6, 5, 8, 8, 7, 7, 9, 5, 7). In der Spalte "Col2" haben wir die Streichendaten ("Junge", "Junge", "Mädchen", "Junge", "Junge", "Mädchen", "Mädchen", "Mädchen", "Junge", " Junge"). Jetzt wenden wir den Groupby an.counts () Funktion zur Berechnung der Wertefrequenz in jeder Spalte.


Um Berechnungen durchzuführen, haben wir die Daten mithilfe der Gruppe GroupBy () in verschiedene Gruppen unterteilt. Anschließend wird die Funktion count () angewendet, um die Frequenzen verschiedener Werte in der angegebenen Spalte des Datenrahmens zu zählen. Der Wert „5“ tritt 2 Mal auf. Die Werte „6“ und „9“ treten einmal auf. Während die Werte „7“ und „8“ zweimal in der Spalte „Col1“ auftreten. Lassen Sie uns nun den Groupby anwenden.count () Funktion in der Spalte „Col2“.


Die Funktion bestimmte die Häufigkeit der Werte „Junge“ und „Mädchen“ als 6 bzw. 4 -mal.

Beispiel 3: Zählen Sie die Frequenz der Spalte mit dem GroupBy.Size () Funktion

Die Häufigkeit von Elementen in den einzelnen Spalten kann mit dieser Methode gezählt werden. Um ein DataFrame -Objekt mit einer Frequenzzahl zu erhalten, können wir die Methode count () auf ein DataFrame -Objekt anwenden, das von einer einzelnen Spalte gruppiert wird. Erstens wird ein Datenrahmen, der mindestens eine sich wiederholende Spalte enthält, so erstellt, dass wir die Funktion count () verwenden können. Wir importieren zuerst das PANDAS -Modul, bevor wir einen Datenrahmen erstellen. Dann verwenden Sie die PD.DataFrame () -Funktion erstellen wir unseren Datenrahmen.


Im vorherigen DataFrame haben wir zwei Spalten - die Spalte "Name" mit Werten ("Alex", "Jack", "Alex", "Ali", "Jack", "Jack", "Alex", "Alex", "Ali", "Jack", "Jack", "Alex", "Alex". "Ali", "Alex", "Ali", "Ali", "Jack", "Alex") und die Spalte "Note", die die Noten von Individuen ("A", "A", "B", ",", ",", ",", " B "," B "," B "," A "," C "," A "," C "," C "," C "," A "," B "). Um nun die Frequenzzahlen dieser Spalten zu finden, verwenden wir den Groupby.size () Funktion. Ein INT, das die Anzahl der Elemente in diesem Objekt darstellt, kann mit dem Größenattribut erhalten werden. Wenn die Serie die Anzahl der Zeilen angibt und der DataFrame die Gesamtzeilen multipliziert mit der Anzahl der Spalten zurückgibt.


Es zeigt, dass es zwei Ereignisse gibt, bei denen „Alex“ einen Notenwert von „A“ hat. Es gibt auch zwei Ereignisse, bei denen „Alex“ einen Notenwert von „B“ und „C“ hat. "Ali" trat 1 Zeit mit den Klassen „A“ und „B“ auf, während 2 -mal mit dem Gradwert von „C“. "Jack" ereignete sich zweimal mit den Noten "A" und "B".

Beispiel 4: Zählen Sie die Frequenz der Spalte durch Erstellen einer Frequenztabelle für eine bestimmte Zeile

Wir können die CrosStab () -Methode anwenden, um die Frequenzen in einem PANDAS -Datenframe zu bestimmen.

Nehmen wir nun an, wir müssen einen Datenrahmen mit Details zum Geschlecht, Alter und Buchstaben von zehn verschiedenen Schülern erstellen.


Wir haben den erforderlichen Datenrahmen mit drei Spalten erstellt - die Spalte "A", "B", "A", "B", "C", "B", "B", "C", "A", "," A ”), die Altersspalte (17, 19, 18, 17, 19, 17, 18, 18, 17, 19) und die Gender -Kolumne („ F “,„ M “,„ F “,„ M “,, "F", "f", "m", "m", "f", "f"). Jetzt verwenden wir die Funktion crosStabab (), um eine Frequenztabelle zu erstellen. Eine durch die CrosStab () -Methode erstellte Kreuzungstabelle kann verwendet werden, um die Frequenz anzuzeigen, mit der die verschiedenen Datengruppen erscheinen.


In der PD.CrosStab () -Funktion, wir haben die Spalte "Grad" im Indexparameter angegeben, um die Datenfrequenz in der Spalte zu berechnen, und den Parameter der Spalten als "Frequenz" angegeben.

Abschluss

In diesem Pandas -Tutorial haben wir darüber diskutiert, wie Daten oder Wert in einer Spalte von Pandas DataFrame gezählt werden können. Wir haben versucht zu lehren, wie man die Funktionen „Value_Counts ()“ und „GroupBy ()“ zusammen mit den Attributen „Size ()“ und „count ()“ verwendet, um die Datenfrequenz in der angegebenen Spalte zu zählen. Wir haben auch gesehen.