Pandas erhalten den häufigsten Wert

Pandas erhalten den häufigsten Wert
Das Ziel dieses Artikels ist es, den häufigsten Wert in einer Reihe von Zahlen zu zeigen. Um die Anzahl der Erscheinungen eines Elements oder einer Nummer zu summieren, wird die Funktion von Python Value_Counts () verwendet. Die Methode modus () kann dann verwendet werden, um das am häufigsten vorkommende Element zu erhalten. Wenn Sie verschiedene Möglichkeiten wünschen, die häufigsten Werte in Python zu erhalten, enthält dieser Artikel alle Richtlinien.

Was ist die Value_Counts () -Methode in Python?

Die eindeutigen Werte eines Pandas -Objekts werden mit der Value Counts () -Methode gezählt. In Python verwenden wir diese Technik im Allgemeinen sowohl für das Verbrechen von Daten als auch für die Datenerforschung.

Die Value_Counts () -Methode kann mit einer Vielzahl von Pandas -Objekten funktionieren. PANDAS -Serien, Pandas -Datenframes und DataFrame -Spalten sind Beispiele dafür (die PANDAS -Serienobjekte sind).

Abhängig von der Art von Objekt, mit der Sie arbeiten, unterscheidet sich die Art und Weise, wie Sie die Methode Value_Counts () implementieren.

Andere optionale Argumente können verwendet werden, um die Funktionalität der Value_Counts () -Methode zu ändern.

Syntax der PANDAS -Serie -Modus () -Funktion

In einer PANDAS -Serie ist der häufigste Wert einfach der Modus der Serie. Die PANDAS -Serie -Modus () -Methode wird verwendet, um Informationen über den Modus zu erhalten. Die Syntax ist wie folgt. Die Modi der Serie werden in sortierter Reihenfolge zurückgegeben.

# df ['Spalte'].Modus()

Syntax von pandas value_counts () Funktion

Verwenden Sie die Funktionen pandas value_counts () und idxmax () gleichzeitig, um den höchsten Zählwert zu erhalten. Die Syntax ist wie folgt:

# df ['Spalte'].Value_Counts ().idxmax ()

Schauen wir uns nun einige praktische Beispiele an, um zu sehen, wie Sie die häufigsten Werte erreichen können, indem Sie welche Schritte befolgen.

Beispiel 1:

Wir müssen zuerst den Datenrahmen festlegen, bevor wir mit dem modus () zu den Schritten zur Bestimmung des häufigsten Werts fortfahren,. Dies ist ein Datenrahmen mit einem Kategoriefeld, das wir für den Rest des Tutorials verwenden werden. Der DataFrame 'D_Frame' enthält die Namen ('Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill') und die Teaminformationen ('a', 'B', ',' Gathie ',' Phill '). C ',' d ',' e ',' a ',' b ',' a ',' b ',' a '). Die "Team" des DataFrame "Team" ist ein Kategoriefeld mit Werten, die das Team jedem Schüler zugewiesen haben.

Das Pandas -Modul wird am Anfang des Code im folgenden Referenzcode importiert. Der Datenrahmen wird dann generiert und auf dem Bildschirm angezeigt.

Pandas importieren
d_frame = pandas.DataFrame (
'Name': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill'],
'Team': ['A', 'B', 'C', 'D', 'E', 'A', 'B']
)
print (d_frame)

Im Bild unten werden die Namen der Schüler zusammen mit dem Namen des Teams angezeigt, dem sie zugewiesen wurden.

Wir zeigen Ihnen, wie Sie die Funktion modus () verwenden, um den häufigsten Wert zu bestimmen. Der Modus, der eine beschreibende Statistik ist, ist im Grunde genommen der häufigste Wert im Datensatz. Es gibt Ihnen Informationen über das Team, das die meisten Schüler hat.

Wir haben das PANDAS -Modul zuerst importiert und den Datenrahmen generiert, wie Sie im Code sehen können. Die Namen der Schüler und des Teams sind im DataFrame enthalten.

Pandas importieren
d_frame = pandas.DataFrame (
'Name': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill'],
'Team': ['A', 'B', 'C', 'D', 'E', 'A', 'B']
)
print (d_frame ['Team'].Modus())

Es gibt eine Pandas -Serie plus den Modus der Spalte. Da „A“ und „B“ die häufigsten Werte im Bereich „Team“ sind, erhalten wir "A" und "B" als Modus.

Bitte beachten Sie, dass Sie den Modus jeder Spalte in einem Pandas -Datenfreame mit der Methode modus () erwerben können.

Beispiel 2:

Wir zeigen Ihnen, wie Sie Value_Counts () verwenden, um in diesem Beispiel den häufigsten Wert zu erhalten. Die Funktion value_counts () kann verwendet werden, um Zählungen zu erhalten, und dann kann die Funktion idxmax () verwendet werden, um den Wert mit den meisten Zählungen zu erhalten.

Der Rest des Codes mit Ausnahme der letzten Zeile ist identisch mit dem oben genannten. Es zeigt, wie die Funktion (value_counts) verwendet wird, um den Wert mit der höchsten Anzahl herauszufinden.

Pandas importieren
d_frame = pandas.DataFrame (
'Name': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill'],
'Team': ['a', 'b', 'c', 'd', 'e', ​​'a', 'a']
)
print (d_frame ['Team'].Value_Counts ().idxmax ())

Siehe den resultierenden Bildschirm unten. Wir erhalten den Wert in der Spalte „Team“ mit der maximalen Wertzahlanzeige.

Beispiel 3:

In diesem Beispiel wird gezeigt, was passieren wird, wenn der Datenrahmen die am häufigsten vorkommenden Werte enthält. Ändern wir den Datenrahmen, damit die Spalte „Team“ wiederholte Modi enthält. Wir ändern "Robs" Team -Wert von "D" zu "B" hier.

Pandas importieren
d_frame = pandas.DataFrame (
'Name': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill'],
'Team': ['A', 'B', 'C', 'D', 'E', 'A', 'F']
)
d_frame.bei [3, 'Team'] = 'B'
print (d_frame)

Wir haben jetzt wiederkehrende Modi, wie Sie sehen können. "A" erscheint zweimal in der Spalte "Team" in unserem Szenario.

Der Teamname für den Studenten 'Rob' wurde im dazugehörigen Bild von „D“ zu „A“ geändert.

Beispiel 4:

Lassen Sie uns sehen, was die Werte () und idxmax () -Methoden zurückgeben. Wir haben die Datenframewerte in diesem Beispielcode aktualisiert. Beachten Sie, dass das Team "A" und "B" zweimal erscheinen. Danach haben wir den Wert verwendet.zählt () und idxmax (), um den häufigsten Wert im Datenrahmen zu bestimmen. Hier ist der Referenzcode.

Pandas importieren
d_frame = pandas.DataFrame (
'Name': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill'],
'Team': ['A', 'B', 'C', 'D', 'E', 'A', 'B']
)
print (d_frame ['Team'].Value_Counts ().idxmax ())

Bitte beachten Sie, dass diese Methode auch dann einen einzelnen Wert zurückgibt, wenn viele Modi vorhanden sind. Dies geschah, weil die Funktion idxmax () nur ein Ergebnis liefert - „Wenn mehrere Werte mit dem Maximum übereinstimmen, wird der Ein -Reihen -Titel mit diesem Wert zurückgegeben.Um den häufigsten Wert in einer PANDAS -Serie abzurufen, müssen Sie die Funktion 'modus ()' der PANDAS -Serie anwenden.

Abschluss:

In diesem Artikel haben wir uns untersucht, wie Sie den häufigsten Wert in einer Pandas -Spalte oder -serie unter Verwendung bestimmter Beispiele finden. Wir haben eine Vielzahl von Funktionen besprochen, die verwendet werden können, um dieses Ziel zu erreichen. Modus (), Wertzählungen () und idxmax () sind einige dieser Methoden. Wenn Sie in diesem Konzept neu sind und eine Schritt-für-Schritt-Anleitung zum Einstieg benötigen, gehen Sie nicht weiter als diesen Artikel.