So erhalten Sie die aktuelle URL mit Selen

Ansgar Radtke

Selenium ist ein Tool für Browser -Tests, Webautomation und Web -Scraping. Während Sie an Ihren Seleniumprojekten arbeiten. Diese Informationen können nützlich sein, um die URL zu verfolgen, aus der Sie einige Daten extrahiert haben, damit Sie die Daten möglicherweise automatisch über ein Skript aktualisieren können.

In diesem Artikel werde ich Ihnen zeigen, wie Sie die aktuelle URL des Browsers mit Selen erhalten können. Also lasst uns anfangen.

Voraussetzungen:

Um die Befehle und Beispiele dieses Artikels auszuprobieren, müssen Sie haben,

1) Eine Linux -Verteilung (vorzugsweise Ubuntu), die auf Ihrem Computer installiert ist.
2) Python 3 auf Ihrem Computer installiert.
3) PIP 3 auf Ihrem Computer installiert.
4) Python virtualenv Paket auf Ihrem Computer installiert.
5) Mozilla Firefox oder Google Chrome -Webbrowser auf Ihrem Computer installiert.
6) Muss wissen, wie man den Firefox Gecko -Treiber oder den Chrome -Web -Treiber installiert.

Für die Erfüllung der Anforderungen 4, 5 und 6 lesen Sie bitte meinen Artikel Einführung in Selen mit Python 3 bei LinuxHint.com.

Sie können viele Artikel zu den anderen Themen unter LinuxHint finden.com. Schauen Sie sich sie an, wenn Sie Hilfe benötigen.

Einrichten eines Projektverzeichnisses:

Um alles organisiert zu halten, erstellen Sie ein neues Projektverzeichnis selenium-url/ folgendermaßen:

$ mkdir -pv Selenium -URL/Treiber

Navigieren zum selenium-url/ Projektverzeichnis wie folgt:

$ cd selen-url/

Erstellen Sie eine virtuelle Python -Umgebung im Projektverzeichnis wie folgt:

$ virtualenv .Venv

Aktivieren Sie die virtuelle Umgebung wie folgt:

$ Quelle .Venv/bin/aktivieren

Installieren Sie die Selenium Python Library in Ihrer virtuellen Umgebung mit PIP3 wie folgt:

$ pip3 Selen installieren

Laden und installieren Sie alle erforderlichen Web -Treiber in der Treiber/ Projektverzeichnis. Ich habe den Prozess des Herunterladens und Installierens von Webtreibern in meinem Artikel erläutert Einführung in Selen mit Python 3. Wenn Sie Hilfe benötigen, suchen Sie nach LinuxHint.com Für diesen Artikel.

Ich werde den Google Chrome -Webbrowser für die Demonstration in diesem Artikel verwenden. Also werde ich die verwenden Chromedriver Binär mit Selen. Sie sollten die verwenden Geckodriver Binär, wenn Sie den Firefox -Webbrowser verwenden möchten.

Aktuelle URL mit Selen erhalten:

Erstellen Sie ein Python -Skript Ex01.py In Ihrem Projektverzeichnis und in die folgenden Codes -Zeilen eingeben.

Sobald Sie fertig sind, speichern Sie die Ex01.py Python -Skript.

Hier importieren Sie Zeile 1 und Zeile 2 alle erforderlichen Komponenten aus der Python Seleniumbibliothek.

Zeile 4 erstellt ein Chrome -Optionsobjekt, und Zeile 5 ermöglicht den Kopflosenmodus für den Chrome -Webbrowser.

Zeile 7 erzeugt ein Chrom Browser Objekt mit dem Chromedriver binär von der Treiber/ Projektverzeichnis.

Zeile 9 teilt dem Browser an, das DuckDuckgo zu laden.com Website.

Zeile 10 druckt die aktuelle URL des Browsers. Hier, Browser.Current_url Eigenschaft wird verwendet, um auf die aktuelle URL des Browsers zuzugreifen.

Zeile 12 schließt den Browser.

Führen Sie das Python -Skript aus Ex01.py folgendermaßen:

$ python3 ex01.py

Wie Sie sehen können, die aktuelle URL (https: // Duckduckgo.com) wird auf der Konsole gedruckt.

Im früheren Beispiel habe ich die Website Duckduckgo besucht.com und druckte die aktuelle URL auf der Konsole. Dies gibt die URL der Seite zurück, die wir besuchen. Nicht sehr schick, da wir die Seiten -URL bereits kennen. Suchen wir nun auf Duckduckgo nach etwas und versuchen, die URL der Suchergebnisseite auf der Konsole zu drucken.

Erstellen Sie ein Python -Skript Ex02.py In Ihrem Projektverzeichnis und in die folgenden Codes -Zeilen eingeben.

vom Selenium importieren Webdriver
Aus Selen.Webdriver.gemeinsam.Schlüssel importieren Schlüsseln
Optionen = Webdriver.ChromeOptions ()
Optionen.Kopflos = wahr
browser = webdriver.Chrome (ausführbarer_path = "./Treiber/Chromedriver ", Optionen = Optionen)
Browser.Get ("https: // Duckduckgo.com/")
Druck (Browser.current_url)
SearchInput = Browser.find_element_by_id ('search_form_input_homepage')
SearchInput.send_keys ('selenium hq' + keys.EINGEBEN)
Druck (Browser.current_url)
Browser.schließen()

Sobald Sie fertig sind, speichern Sie die Ex02.py Python -Skript.

Hier sind die Zeilen 1-10 die gleichen wie in Ex01.py. Also erkläre ich sie nicht wieder.

Zeile 12 findet das Suchtextfeld und speichert es in der SearchInput Variable.

Zeile 13 sendet die Suchanfrage Selenium HQ im SearchInput Textfeld und drückt die Schlüssel verwenden Schlüssel.EINGEBEN.

Sobald die Suchseite geladen wird, Browser.Current_url wird verwendet, um auf die aktualisierte aktuelle URL zuzugreifen.

Zeile 15 druckt die aktualisierte aktuelle URL auf der Konsole.

Zeile 17 schließt den Browser.

Leiten Sie die Ex02.py Python -Skript wie folgt:

$ python3 ex02.py

Wie Sie sehen können, das Python -Skript Ex02.py Drucke 2 URLs.

Der erste ist die Homepage -URL der DuckDuckgo Suchmaschine.

Die zweite ist die aktualisierte aktuelle URL nach der Durchführung einer Suche in der DuckDuckgo -Suchmaschine mit der Abfrage Selenium HQ.

Abschluss:

In diesem Artikel habe ich Ihnen gezeigt, wie Sie die aktuelle URL des Webbrowsers mithilfe der Selenium Python Library erhalten. Jetzt sollten Sie in der Lage sein, Ihre Seleniumprojekte interessanter zu gestalten.

Python

Seeborn Tsllot

In Python die „Seeborn.Lineplot () ”Methode wird verwendet, um mehrere Zeilen in einem einzelnen Dia...

Lars Daub

Python

Matplotlib 2D -Histogramm

In Python das „PLT.Hist2d () ”-Funktion des„ Pyplot “-Moduls in der Bibliothek„ Matplotlib “wird ver...

Christopher Lammert

Docker

Was ist der Unterschied zwischen Docker und Podman?

Docker verwendet eine Client-Server-Architektur, während Podman ein Dämon weniger Container-Engine i...

Christopher Lammert