Python enthält ein Modul mit dem Namen Urlib Für die Behandlung von URL-bezogenen Aufgaben des gleichmäßigen Ressourcenlocators (URL). Dieses Modul ist standardmäßig in Python 3 installiert und holt URLs verschiedener Protokolle über die urlopen () Funktion. Urllib kann für viele Zwecke verwendet werden, z. B. für das Lesen von Website -Inhalten, das Erstellen von HTTP- und HTTPS -Anfragen, das Senden von Anforderungsüberschriften und das Abrufen von Antwortheadern. Der Urlib Das Modul enthält viele andere Module für die Arbeit mit URLs, wie z Urlib.Anfrage, Urlib.analysieren, Und Urlib.Fehler, unter anderen. In diesem Tutorial wird Ihnen angezeigt, wie Sie das Urllib -Modul in Python verwenden.
Beispiel 1: Öffnen und Lesen von URLs mit Urllib.Anfrage
Der Urlib.Anfrage Das Modul enthält die Klassen und Methoden, die zum Öffnen und Lesen einer URL erforderlich sind. Das folgende Skript zeigt, wie man verwendet Urlib.Anfrage Modul zum Öffnen einer URL und zum Lesen des Inhalts der URL. Hier das urlopen () Methode wird verwendet, um die URL zu öffnen, “https: // www.LinuxHint.com/.Wenn die URL gültig ist, wird der Inhalt der URL in der benannten Objektvariablen gespeichert Antwort. Der lesen() Methode der Antwort Objekt wird dann verwendet, um den Inhalt der URL zu lesen.
#!/usr/bin/env python3Ausgang
Die folgende Ausgabe wird nach dem Ausführen des Skripts angezeigt.
Beispiel 2: Parsen und unverzichtete URLs mit Urllib.analysieren
Der Urlib.analysieren Das Modul wird hauptsächlich verwendet, um die verschiedenen Komponenten einer URL zusammenzuteilen oder zusammenzuschließen. Das folgende Skript zeigt verschiedene Verwendungen der Urlib.analysieren Modul. Die vier Funktionen von Urlib.analysieren In dem folgenden Skript wird verwendet Urlparse, Urlunparse, URLSPLIT, Und urlunsplit. Der Urlparse Modul funktioniert wie URLSPLIT, und das Urlunparse Modul funktioniert wie urlunsplit. Es gibt nur einen Unterschied zwischen diesen Funktionen; das ist, Urlparse Und Urlunparse enthalten einen zusätzlichen Parameter mit dem Namen 'Parameter'Zum Aufteilen und der Verbindungsfunktion. Hier die URL 'https: // linuxhint.com/play_sound_python/'wird zum Aufteilen und Verbinden der URL verwendet.
#!/usr/bin/env python3Ausgang
Die folgenden vier Ausgänge werden nach dem Ausführen des Skripts angezeigt.
Beispiel 3: Reading Response Header von HTML mit Urllib.Anfrage
Das folgende Skript zeigt, wie die verschiedenen Teile des Antwortheaders der URL über die abgerufen werden können die Info() Methode. Der Urlib.Anfrage Modul zum Öffnen der URL 'https: // linuxHint.com/python_pause_user_input/,'Und die Header -Informationen dieser URL werden über die gedruckt die Info() Methode. Der nächste Teil dieses Skripts zeigt Ihnen, wie Sie jeden Teil des Headers getrennt lesen können. Hier das Server, Datum, Und Inhaltstyp Die Werte werden getrennt gedruckt.
#!/usr/bin/env python3Ausgang
Die folgende Ausgabe wird nach dem Ausführen des Skripts angezeigt.
Beispiel 4: Lesen der URL -Antworten nach Zeile
Eine lokale URL -Adresse wird im folgenden Skript verwendet. Hier eine Test -HTML -Datei mit dem Namen prüfen.html wird am Standort erstellt, var/www/html. Der Inhalt dieser Datei wird über die Zeile von Zeile gelesen für Schleife. Der Streifen() Die Methode wird dann verwendet, um den Raum von beiden Seiten jeder Zeile zu entfernen. Sie können jede HTML -Datei vom lokalen Server verwenden, um das Skript zu testen. Der Inhalt der prüfen.html Die in diesem Beispiel verwendete Datei ist unten angegeben.
prüfen.HTML:
Ausgang
Die folgende Ausgabe wird nach dem Ausführen des Skripts angezeigt.
Beispiel 5: Ausnahmebehandlung mit Urllib.Fehler.Urlerror
Das folgende Skript zeigt, wie die Verwendung der Verwendung Urlerror in Python über die Urlib.Fehler Modul. Jede URL -Adresse kann als Eingabe vom Benutzer angenommen werden. Wenn die Adresse nicht vorhanden ist, dann ein Urlerror Die Ausnahme wird erhöht und der Grund für den Fehler wird gedruckt. Wenn der Wert der URL in einem ungültigen Format ist, dann a ValueError wird erhöht und der benutzerdefinierte Fehler wird gedruckt.
#!/usr/bin/env python3Ausgang
Das Skript wird im folgenden Screenshot dreimal ausgeführt. In der ersten Iteration wird die URL -Adresse in einem ungültigen Format angegeben, wobei ein ValueError generiert wird. Die in der zweite Iteration angegebene URL. Eine gültige URL -Adresse ist in der dritten Iteration angegeben, sodass der Inhalt der URL gedruckt wird.
Beispiel 6: Ausnahmebehandlung mit Urllib.Fehler.HTTP Fehler
Das folgende Skript zeigt, wie die Verwendung der Verwendung HTTP Fehler in Python über die Urlib.Fehler Modul. Ein Htmlerror generiert, wenn die angegebene URL -Adresse nicht existiert.
#!/usr/bin/env python3Ausgang
Hier wird das Skript zweimal ausgeführt. Die erste URL. Die zweite URL HTTP Fehler.
Abschluss
In diesem Tutorial wurde viele wichtige Verwendungszwecke der Diskussionen erörtert Urlib Modul mit verschiedenen Beispielen, mit denen die Leser die Funktionen dieses Moduls in Python kennenlernen können.