Wie man AWS -Kleber verwendet

Wie man AWS -Kleber verwendet
AWS Glue ist ein vollständig verwalteter Datenintegrationsdienst, der Daten liefert und integriert und die Benutzer Crawler ausführen und ETL -Jobs erstellen und überwachen (extrahieren, transformieren und laden). AWS -Kleber arbeitet in einer serverlosen Umgebung und ermöglicht es den Benutzern, Aktivitäten in einer skalierbaren Infrastruktur auszuführen. AWS Glue zieht Daten von anderen Amazon -Diensten wie S3 oder AWS Kinesis und integriert die Zugriffsdaten.

Wenn die Benutzer ETL -Jobs und Crawler in AWS -Kleber erstellen, müssen sie den Zielort für die Daten bzw. die Datenquelle angeben und deklarieren. Dies bedeutet, dass der AWS -Kleber nicht allein verwendet werden kann, aber der Benutzer muss Daten in Speicherdiensten wie S3 -Buckets speichern und diese Daten dann für den AWS -Kleberdienst zugänglich machen. Benutzer können auch Datenbanken, Tabellen, Schemas, Verbindungen usw. erstellen., im AWS -Kleber.

In diesem Artikel wird der Prozess der Verwendung von AWS -Kleber in einfachen Schritten erläutert.

Wie man AWS -Kleber verwendet?

Um die Verwendung von AWS -Kleber zu verstehen, melden Sie sich zuerst bei der AWS -Konsole an und suchen Sie dann nach AWS -Kleber in den AWS -Diensten.

Auf der ersten Schnittstelle von AWS -Kleber befindet sich auf der linken Seite ein Menü, das die Liste aller möglichen Aufgaben enthält, die mit dem AWS -Kleber wie Crawler, Datenbanken, Tabellen, Schemas usw. ausgeführt werden können.

Wenn wir auf die Schaltfläche „Erste Schritte erstellen“ klicken, zeigt die nächste Schnittstelle drei verschiedene Aufgaben an, ich.e., Sehen Sie sich Jobs an, sehen Sie sich die Überwachung an und sehen Sie Steckverbinder an.

Um Jobs in AWS -Kleber zu erstellen, muss der Benutzer zunächst den Auftrag entsprechend den Details konfigurieren, wie den Ort von S3 -Eimer, Objekten, Ordnern und AWS -Clustern. Also, um AWS -Kleber zu verwenden. Es ist erforderlich, einige Dateien im S3 -Speicherdienst von AWS zu speichern.

Erstellen Sie einen S3 -Eimer

Besuchen Sie zunächst den „Amazon S3“ -Dienst von AWS und erstellen Sie dort einen neuen S3 -Eimer.

Ordner im Eimer erstellen

Erstellen Sie nach dem Erstellen eines neuen S3 -Bucket in Amazon S3 einen Ordner darin, indem Sie die Details des Eimers öffnen und dann auf "Ordner erstellen" klicken.

Geben Sie dem Ordner einfach einen Namen an:

Auf diese Weise wird der Ordner erstellt.

Erstellen Sie nun einen weiteren Ordner im Eimer.

Objekte hochladen

Gehen Sie nun zu "Objekten" und klicken Sie auf die Schaltfläche "Upload". Durchsuchen Sie die Dateien aus dem System, die auf den neu erstellten Amazon S3 -Bucket hochgeladen werden sollen.

Die Erfolgsnachricht oben in der Schnittstelle überprüft, ob die aus dem System ausgewählten Objekte erfolgreich in den AWS S3 -Bucket hochgeladen werden.

Offener AWS -Kleber

Nach dem Hochladen von Objekten und dem Hinzufügen von Ordnern im S3 -Eimer kann der Benutzer Aufgaben im AWS -Kleber ausführen. Suchen Sie nach und öffnen Sie den AWS -Kleberdienst aus den Diensten von AWS.

Crawler erstellen

Auf der linken Seite befindet sich ein Menü mit den Namen aller auf AWS -Kleber ausgeführten Aufgaben. Wählen Sie im angegebenen Menü die Option "Crawler" aus und erstellen Sie einen Crawler.

Geben Sie einen Namen für den Crawler ein.

Wählen Sie den neu erstellten Bucket als S3 -Pfad des Crawlers, damit dieser Crawler auf diesen Eimer zugreifen kann:

Deklarieren Sie die Zieldatenbank, indem Sie eine der im AWS -Kleber erstellten Datenbanken auswählen, oder erstellen Sie eine neue Datenbank und wählen Sie dann das aus:

Nachdem Sie alles konfiguriert haben, was zum Erstellen eines Crawlers erforderlich ist, klicken Sie auf die Schaltfläche „Crawler erstellen“:

Nachdem der Crawler erstellt wurde, klicken Sie auf die Schaltfläche „Crawler ausführen ausführen“, um den Crawler aktiv zu machen:

Erstellen Sie einen ETL -Job

Wählen Sie im Menü links die Option "Jobs" aus:

Hier ging es darum, den AWS -Kleber zu verwenden.

Abschluss

AWS -Kleber ist ein serverloser AWS -Dienst, der Daten von anderen AWS -Diensten wie S3 -Buckets zieht. Es kann Cluster, Datenbanken, Jobs usw. geben., Erstellt in AWS -Kleber. Eine der Hauptaufgaben des AWS -Klebers ist die Schaffung von ETL -Jobs. Nachdem einige Dateien in AWS -Speicherdiensten gespeichert sind, können ETL -Jobs erstellt werden, indem die Details des Jobs so konfiguriert werden, dass sie auf die Dateien zugreifen können.