Während der Verwendung von ETL -Jobs können Benutzer auch die Datenpipelines erstellen und überwachen, über die die extrahierten Daten übertragen werden. AWS Glue integriert sich in Dienste wie Amazon S3, Amazon DynamoDB, Amazon Redshift und Amazon RDs, um Daten zu extrahieren und zu verschieben.
In diesem Artikel werden die folgenden Aspekte des AWS -Klebers beschrieben:
Was sind die Komponenten des AWS -Klebers??
Im Folgenden finden Sie einige Komponenten des AWS -Klebstoffs, die in Koordination verschiedene Aufgaben ausführen:
AWS -Klebekonsole: AWS -Glue -Konsole definiert den ETL -Workflow und ruft API -Operationen in anderen AWS -Kleberkomponenten auf, um verschiedene Aufgaben wie das Ausführen und Scheduling -Crawler, das Erstellen von Tabellen, das Konfigurieren der Verbindungen usw. durchzuführen.
Katalog: AWS -Kleberdatenkatalog ist der Metadatenspeicher der AWS -Cloud. In jedem AWS -Konto hat jede AWS -Region einen bereits erstellten Klebedatenkatalog erstellt. In den Datenkatalogen werden Tabellen mit Daten aus verschiedenen Diensten wie AWS -RDs in organisierter Form gespeichert.
Crawler und Klassifizierer: Crawler können die Daten aus allen Arten von Repositories auf AWS scannen. Durch Crawlers können Benutzer Datenbanken erstellen, um die Datentabellen der extrahierten Daten im AWS -Kleber zu organisieren, damit die Daten sauber und organisiert aussehen.
ETL -Operationen: Der Benutzer kann die Daten aus einem Dienst „extrahieren“ und die Daten „transformieren“ (z. B. Rohdaten extrahieren und in ein sauberes Formular verwandeln, indem sie sie in verschiedene Datensätze kategorisieren) und dann die Daten „laden“ oder diese Daten erstellen für die Dienste zugänglich, die die Daten anstellen und analysieren.
ETL -Jobs: AWS LLUE ETL Jobs Verwalten Sie den ETL -Workflow durch einige Konfigurationen. Benutzer können ETL -Jobs für den Datenfluss planen und den Job bei bestimmten Ereignissen auslösen, z. B. wenn neue Daten verschoben werden, eine Datentabelle gelöscht werden usw.
Was ist die Bedeutung von AWS -Kleber??
AWS -Kleber ist aus verschiedenen Gründen beliebt, einschließlich Folgendes:
Wie man AWS -Kleber verwendet?
Die Verwendung von AWS -Kleber ist sehr einfach. Öffnen Sie den Dienst „AWS Glue“, nachdem Sie sich bei der AWS -Konsole angemeldet haben. Auf dem linken Menü der AWS-Kleberkonsole gibt es eine Liste von Optionen, die die Funktionalität des AWS-Kleberdienstes verständlicher machen. Der Benutzer kann im AWS -Kleber einen ETL -Job (Extrakt, Transformation und Last) ausführen:
Beispielsweise wählen wir die Option „Datenbanken“ aus, um eine Datenbank im AWS -Kleber zu erstellen oder auf eine Datenbank zuzugreifen, die in einem anderen AWS -Dienst erstellt wurde:
In ähnlicher Weise können Benutzer Crawler in AWS erstellen:
Wenn wir die Details eines der erstellten Crawler öffnen, wird die Datenquelle angezeigt. Hier ist klar, dass auf die Daten aus einem im AWS S3 -Dienst erstellten Eimer zugegriffen wird:
Oben erläutert drehte sich alles um AWS -Kleber, seine Komponenten, Wichtigkeit und Verwendung.
Abschluss
AWS Glue ist der serverlose Datenintegrationsdienst von AWS, der die Daten zwischen AWS -Diensten, Anwendungen und Softwarekomponenten verschiebt. Die Daten werden zuerst extrahiert und dann nach der Änderung an einen anderen Dienst mithilfe von AWS -Cloud -Ressourcen effizient übertragen. Dieser zuverlässige und skalierbare AWS-Service ist ebenfalls einfach zu bedienen und wird gegenüber anderen Plattformen mit den gleichen Funktionen aufgrund seiner umfangreichen und verwendbaren Merkmale und der Kostenwirksamkeit bevorzugt.