MongoDB Finden Sie Duplikate

MongoDB Finden Sie Duplikate
„Haben Sie jemals von dem Konzept des Datenverdoppelung gehört, während Sie in Datenbanken arbeiten? Wenn eine Aufzeichnung, eine Person, eine Person oder ein Ort die genaue Kopie hat, soll diese Kopie das Duplikat des Originals sein. Während wir in herkömmlichen Datenbanken arbeiten, verwenden wir die Klausel, um die Duplikate innerhalb der Tabellensätze herauszufinden.e., SQL, PostgreSQL. Auf der anderen Seite können Sie mit MongoDB nicht mit der Where -Klausel die in die Sammlungen einer bestimmten Datenbank eingefügten Duplikate herausfinden.

Es gab die Gesamtfunktion, um die doppelten Werte aus der Sammlung herauszufinden. In diesem heutigen Artikel werden wir die Einführung doppelter Datensätze in den Mongo -DB -Sammlungen diskutieren und sie mit dem aggregierten Befehl von Sammlungen auf der MongoDB -Shell anzeigen. Beginnen wir mit unserem heutigen Artikel mithilfe von APT -Update- und Upgrade -Anweisungen in der Terminalschale des Ubuntu 20.04 System. Dafür müssen Sie sich zuerst anmelden und die Shell mithilfe von „Strg+Alt+t“ öffnen.„Danach können Sie den Anweisungen für den 2-Punkte-R-Felow in Ihrer Shell ausprobieren und das Kennwort für den Benutzer hinzufügen, um den Aktualisierungsprozess fortzusetzen.”

Möglicherweise erfordern Ihre Bestätigung, diesen Prozess fortzusetzen. Tippen Sie auf "Y", wenn Sie gefragt werden: „Möchten Sie fortfahren?”. Drücken Sie danach die Eingabetaste.

Es kann mehr oder weniger Zeit dauern, um die Situation Ihres Systems zu verarbeiten.

Nach dem vollständigen Update erhalten Sie die letzten Verarbeitungszeilen mit dem DIMBELOW.

Nach dem erfolgreichen System Update und Upgrade müssen wir die MongoDB -Shell öffnen, um einige Sammlungen und Datensätze in die Datenbank einzufügen. Wir haben also die Abfrage „Mongo“ verwendet, wie im Bild angezeigt wird. Die Hülle wurde erfolgreich vorbereitet.

Während wir die Anweisung „DB“ bei der MongoDB -Shell verwenden, haben wir festgestellt, dass die "Test" -Datenbank für unsere Verwendung verfügbar ist.

Daher haben wir die "Test" -Datenbank für weitere Abfragen und die Erstellung einer Sammlung darin verwendet. Probieren Sie dazu den Anweisungen „Verwenden“, gefolgt vom Namen einer Datenbank, ich.e., "prüfen.”

Um Datensätze hinzuzufügen, benötigen wir eine Sammlung in der Testdatenbank. Daher müssen wir eine neue Sammlung erstellen. Dafür müssen wir die Anweisung „DB“ zusammen mit der Funktion „CreateCollection ()“ von MongoDB ausprobieren, gefolgt von dem Namen einer neuen Sammlung in seiner Klammung, ich.e., Daten. Die Abfrage war erfolgreich und die Sammlung wurde erfolgreich gemäß dem Status "OK: 1" erstellt. Darüber hinaus neigen wir dazu, die Find () -Funktion des Sammlungsnamens zu verwenden, um die Datensätze einer bestimmten Sammlung anzuzeigen. Daher haben wir die „DB“ -Anweisung ausprobiert, gefolgt vom Sammlungsnamen, ich.e., Daten und die Funktion finden () dazu. Die Sammlung „Daten“ ist momentan leer. Daher müssen wir der Sammlung einige Datensätze hinzufügen.

Um die Datensätze in die Datenerfassung von MongoDB einzufügen, müssen wir die Funktion Insert () in der DB -Anweisung zusammen mit den Daten in Form von Dokumenten ausprobieren.e., Listenformat. Wir haben insgesamt 4 Spalten für die Dokumentdaten von Sammlungen verwendet, i.e., _id, Titel, Alter und Preis. Wir haben insgesamt 5 Datensätze für all diese 4 Spalten der Datenerfassung hinzugefügt.

Der Datensatz wurde erfolgreich nach der obigen Ausgabe hinzugefügt. Danach werden wir die Funktion "Find () mit der" Daten "-Kollektion verwenden, um alle Datensätze dieser Sammlung zu finden und anzuzeigen. Wir geben keine Argumente an die Klammern einer Find () -Funktion, um die Sammelsätze nicht einzuschränken. Alle 5 Datensätze für die Datenerfassung wurden in der Mongo DB Shell präsentiert.

Da wir uns mit dem Thema befasst haben, die Duplikate in den Sammlungen von MongoDB zu finden, müssen wir auch einige doppelte Aufzeichnungen in den Sammlungen haben. Daher haben wir drei weitere Datensätze in der Datenerfassung eingefügt, die als Duplikate einiger der bereits eingefügten Datensätze verwendet werden sollen. Wir müssen die Spalte "_id" nur aktualisieren, da die ID einer Spalte in MongoDB eindeutig sein muss, wie wir es früher in herkömmlichen Datenbanken getan haben. Die gleiche Einfügungsfunktion wurde bisher mit dem Namen „Daten“ verwendet. Alle drei Datensätze wurden hinzugefügt.

Wenn Sie nun den Anweisungen „DB“ mit dem Sammlungsnamen „Daten“ ausführen, gefolgt von der Find () -Funktion auf der MongoDB -Shell, werden insgesamt 8 Datensätze auf Ihrem Bildschirm angezeigt. Wir können die doppelten Werte für andere Spalten als „_id“ in diesen Sammeldaten sehen.

Es ist an der Zeit, die Aggregate () -Methode für die Datenerfassung auszuprobieren, um die spezifischen Spaltenwerte aufzulisten, die darin dupliziert sind. Sie müssen die Syntax für die Syntax des 2-Abgeordneten eines aggregierten Befehls in MongoDB verwenden. Die Option „$ gruppe“ wird verwendet, um alle doppelten Werte einer bestimmten Spalte in einer Spalte hinzuzufügen, während die Option $ Match verwendet wird, um herauszufinden, dass die Gruppen mehr als 1 Dokument haben. Andererseits wird die Option „$ project“ verwendet, um das Format der Anzeige der doppelten Datensätze anzugeben. Das erste Feld der Option "$ gruppe" gibt den Spaltennamen an, in dem wir nach Duplikaten suchen werden. Insgesamt 3 Datensätze wurden für die Spalte „Titel“ einer Datenerfassung dupliziert gefunden. Danach wurde die gleiche Abfrage für die Spalte „Alter“ vor Gericht gestellt und erhielt die 3 Ergebnisse wieder.

Abschluss

Die Erklärung von doppelten Aufzeichnungen wurde im Einführungsabsatz gegeben, und wir haben den Unterschied zwischen den Duplikaten aus herkömmlichen Datenbanken und MongoDB erörtert. Zu diesem Zweck haben wir versucht, eine Illustration über die Erstellung einer neuen Sammlung innerhalb von MongoDB zu geben und Aufzeichnungen darin einzufügen. Darüber hinaus haben wir die Verwendung der Aggregatfunktion erörtert, um die spezifische Spalte mit dem doppelten Wert innerhalb der Sammlungen herauszufinden. In diesem Artikel wurde der klare Unterschied bei der Ermittlung der Duplikate für MongoDB als Vergleich mit jeder anderen Datenbank gezeigt.