Python Count Dopplicate in der Liste

Python Count Dopplicate in der Liste
Durch Duplikate in Ihren Daten kann schwerwiegende Probleme verursacht werden, insbesondere wenn Sie mit großen Datenmengen für Datenanalysen oder Datenverarbeitung arbeiten. Daher ist es die Pflicht des Programmierers, Duplikate zu erkennen und aus den Daten zu löschen. Dieser Beitrag konzentriert sich auf die ersteren und erklärt die verschiedenen Methoden, mit denen der Benutzer Duplikate in einer Python -Liste leicht erkennen und zählen kann.

Der Inhalt dieser Anleitung ist unten angegeben:

  • Methode 1: Verwenden Sie die Liste, um die Konvertierung festzulegen
  • Methode 2: Verwenden der Listenverständnis und der Methode count ()
  • Methode 3: Verwenden des Listenverständnisses mit IF-NOT-In-Bedingung

Beginnen wir sofort mit der ersten Methode!

Methode 1: Verwenden Sie die Liste, um die Konvertierung festzulegen

Eine Liste in Python kann Duplikate enthalten, was bedeutet, dass es keine Einzigartigkeit wie die in Python -Sets gibt. Eine einfache Möglichkeit zu erkennen, ob in einer Python -Liste Duplikate vorhanden sind, besteht darin, sie in einen Satz umzuwandeln und die Größe von beiden zu vergleichen.

Um dies zu demonstrieren, erstellen Sie zunächst eine Liste in Python mit dem folgenden Code:

ListVar = [123,46,11,78,334,46,98,11,90]

Verwenden Sie anschließend die Methode set (), um diese Liste in einen Satz umzuwandeln und in einer separaten Variablen zu speichern:

setvar = set (listVar)

Drucken Sie die Anzahl der Elemente beider mit der Len () -Methode:

print ("Elemente in List:", Len (ListVar))
print ("Elemente in set:", len (setvar))

Wenn dieser Code ausgeführt wird, werden die folgenden Ergebnisse auf dem Terminal erstellt:

Gemäß der Ausgabe ist die Anzahl der Elemente in der Liste 9 Und 7 für das Set. Dies bedeutet, dass in der Liste insgesamt zwei Duplikate enthalten sind. Anstatt Duplikate manuell zu berechnen, können Sie auch die folgende Zeile verwenden:

print ("Anzahl der Duplikate in der Liste", Len (ListVar) -len (setvar))

Der vollständige Code -Snippet mit dieser neuen Druckanweisung lautet:

ListVar = [123,46,11,78,334,46,98,11,90]
setvar = set (listVar)
print ("Anzahl der Duplikate in der Liste", Len (ListVar) -len (setvar))

Wenn dieser Code ausgeführt wird, wird das folgende Ergebnis auf dem Terminal erzeugt:

Wie Sie aus dem Ausgabebild sehen können, befinden sich insgesamt zwei Duplikate in der Liste.

Methode 2: Verwenden der Listenverständnis und der Methode count ()

Eine andere Methode zum Ausdrucken der Duplikate einer Liste besteht darin. Wenn das Ergebnis der count () -Methode größer als eins ist, können Sie dieses Element einer Liste von Duplikaten hinzufügen.

Um die Arbeit dieser Methode zu demonstrieren, nehmen Sie den folgenden Code an:

ListVar = [123,46,11,78,334,46,98,11,90]
DuplicateVar = []
für x in ListVar:
Wenn ListVar.zählen (x)> 1:
Duplicatevar.anhängen (x)
print ("Die in der Liste gefundenen Duplikate sind:", Duplicatevar)

Wenn dieser Code ausgeführt wird, wird das folgende Ergebnis in Ihrem Terminal erzeugt:

Wie Sie aus der Ausgabe sehen können, waren die Werte „46“ und „11“ jeweils zweimal vorhanden.

Methode 3: Verwenden des Listenverständnisses mit IF-NOT-In-Bedingung

Eine andere Methode zum Auffinden von Duplikaten in einer Liste besteht.

Nehmen Sie den folgenden Code -Snippet für diese Methode:

ListVar = [123,46,11,78,334,46,98,11,90]
Einheitstättevar = []
Duplicatelistvar = []
für x in ListVar:
Wenn x nicht in einiglistischer Sprache:
Einheitsteiler.anhängen (x)
anders:
Duplicatelistvar.anhängen (x)
print ("Die Liste der einzigartigen Elemente lautet:", Uniquelistvar)
Print ("Die in der Liste gefundenen Duplikate sind:", Duplicatelistvar)

In diesem Code -Snippet:

  • Es werden zwei neue Listen erstellt, eine zum Speichern jedes einzigartigen Wert
  • Jedes Element wird gegen die in der eindeutigen Werteliste gespeicherten Werte überprüft. Wenn es dort noch nicht vorhanden ist, wird es an sie angehängt.
  • Wenn es dort bereits vorhanden ist, wird es an die Liste der doppelten Werte angehängt.
  • Drucken Sie am Ende beide Listen auf dem Terminal mit der Print () -Methode aus

Wenn dieser Code ausgeführt wird, wird das folgende Ergebnis in Ihrem Terminal erzeugt:

Aus der Ausgabe ist ersichtlich, dass die Werte „46“ und „11“ Duplikate waren und daher nur einer ihrer Instanzen in der Liste der eindeutigen Werte übrig bleibt.

Abschluss

Um Duplikate in einer Liste zu finden, kann der Benutzer verschiedene Ansätze verwenden, die die Konvertierung der Liste in eine Zeichenfolge, die Listenverständnis mit der Methode count () oder die IF-NOT-In-Bedingung mit dem Listenverständnis verwenden. Die schnellste Methode, um die Duplikate aus der Liste zu entfernen, ist jedoch die Umwandlung der Liste in einen Satz.