Was ist AWS -Kleber

Was ist AWS -Kleber
AWS Glue ist ein AWS -Datenintegrations -Computerdienst, mit dem die Datensätze zwischen Diensten verschoben werden können, um sie auf die Analyse vorzubereiten. Die in den Amazon -Speicherdiensten wie S3 gespeicherten Datensätze werden an die Dienste übertragen, die Datensätze wie AWS Athena analysieren. Die primäre Funktion des AWS -Klebers besteht darin, ETL -Jobs (Extrakt, Transformation und Last) zu erstellen. ETL -Jobs extrahieren die Daten aus den Datenbanken eines bestimmten Dienstes und ändern und verschieben Sie die Daten an einen anderen Ort, an dem sie analysiert werden müssen.

Während der Verwendung von ETL -Jobs können Benutzer auch die Datenpipelines erstellen und überwachen, über die die extrahierten Daten übertragen werden. AWS Glue integriert sich in Dienste wie Amazon S3, Amazon DynamoDB, Amazon Redshift und Amazon RDs, um Daten zu extrahieren und zu verschieben.

In diesem Artikel werden die folgenden Aspekte des AWS -Klebers beschrieben:

  • Was sind die Komponenten des AWS -Klebers??
  • Was ist die Bedeutung von AWS -Kleber??
  • Wie man AWS -Kleber verwendet?

Was sind die Komponenten des AWS -Klebers??

Im Folgenden finden Sie einige Komponenten des AWS -Klebstoffs, die in Koordination verschiedene Aufgaben ausführen:

AWS -Klebekonsole: AWS -Glue -Konsole definiert den ETL -Workflow und ruft API -Operationen in anderen AWS -Kleberkomponenten auf, um verschiedene Aufgaben wie das Ausführen und Scheduling -Crawler, das Erstellen von Tabellen, das Konfigurieren der Verbindungen usw. durchzuführen.

Katalog: AWS -Kleberdatenkatalog ist der Metadatenspeicher der AWS -Cloud. In jedem AWS -Konto hat jede AWS -Region einen bereits erstellten Klebedatenkatalog erstellt. In den Datenkatalogen werden Tabellen mit Daten aus verschiedenen Diensten wie AWS -RDs in organisierter Form gespeichert.

Crawler und Klassifizierer: Crawler können die Daten aus allen Arten von Repositories auf AWS scannen. Durch Crawlers können Benutzer Datenbanken erstellen, um die Datentabellen der extrahierten Daten im AWS -Kleber zu organisieren, damit die Daten sauber und organisiert aussehen.

ETL -Operationen: Der Benutzer kann die Daten aus einem Dienst „extrahieren“ und die Daten „transformieren“ (z. B. Rohdaten extrahieren und in ein sauberes Formular verwandeln, indem sie sie in verschiedene Datensätze kategorisieren) und dann die Daten „laden“ oder diese Daten erstellen für die Dienste zugänglich, die die Daten anstellen und analysieren.

ETL -Jobs: AWS LLUE ETL Jobs Verwalten Sie den ETL -Workflow durch einige Konfigurationen. Benutzer können ETL -Jobs für den Datenfluss planen und den Job bei bestimmten Ereignissen auslösen, z. B. wenn neue Daten verschoben werden, eine Datentabelle gelöscht werden usw.

Was ist die Bedeutung von AWS -Kleber??

AWS -Kleber ist aus verschiedenen Gründen beliebt, einschließlich Folgendes:

  • AWS-Kleber ist einfach zu bedienen und kostengünstig im Vergleich zu anderen Plattformen, die die gleiche Funktionalität liefern.
  • Benutzer können mit AWS -Kleber eine Verbindung zu über siebzig verschiedenen Datenquellen herstellen.
  • Es bietet einen zentralisierten Datenkatalog, um den ETL -Prozess zum Extrahieren, Verwalten und Umzug auf die Datenseen zu verwalten.
  • AWS -Kleber ist ein serverloser Service, daher müssen die Server nicht eingerichtet, verwaltet und verwaltet werden.

Wie man AWS -Kleber verwendet?

Die Verwendung von AWS -Kleber ist sehr einfach. Öffnen Sie den Dienst „AWS Glue“, nachdem Sie sich bei der AWS -Konsole angemeldet haben. Auf dem linken Menü der AWS-Kleberkonsole gibt es eine Liste von Optionen, die die Funktionalität des AWS-Kleberdienstes verständlicher machen. Der Benutzer kann im AWS -Kleber einen ETL -Job (Extrakt, Transformation und Last) ausführen:

Beispielsweise wählen wir die Option „Datenbanken“ aus, um eine Datenbank im AWS -Kleber zu erstellen oder auf eine Datenbank zuzugreifen, die in einem anderen AWS -Dienst erstellt wurde:

In ähnlicher Weise können Benutzer Crawler in AWS erstellen:

Wenn wir die Details eines der erstellten Crawler öffnen, wird die Datenquelle angezeigt. Hier ist klar, dass auf die Daten aus einem im AWS S3 -Dienst erstellten Eimer zugegriffen wird:

Oben erläutert drehte sich alles um AWS -Kleber, seine Komponenten, Wichtigkeit und Verwendung.

Abschluss

AWS Glue ist der serverlose Datenintegrationsdienst von AWS, der die Daten zwischen AWS -Diensten, Anwendungen und Softwarekomponenten verschiebt. Die Daten werden zuerst extrahiert und dann nach der Änderung an einen anderen Dienst mithilfe von AWS -Cloud -Ressourcen effizient übertragen. Dieser zuverlässige und skalierbare AWS-Service ist ebenfalls einfach zu bedienen und wird gegenüber anderen Plattformen mit den gleichen Funktionen aufgrund seiner umfangreichen und verwendbaren Merkmale und der Kostenwirksamkeit bevorzugt.