Vad är urllib?
urllib är en Python-modul som kan användas för att öppna webbadresser. Den definierar funktioner och klasser för att hjälpa till vid URL-åtgärder.
Med Python kan du också komma åt och hämta data från internet som XML, HTML, JSON, etc. Du kan också använda Python för att arbeta med dessa data direkt. I denna handledning ska vi se hur vi kan hämta data från webben. Här använde vi till exempel en guru99-video-URL, och vi kommer att komma åt denna video-URL med Python samt skriva ut HTML-fil med den här URL: n.
I denna handledning lär vi oss
- Hur man öppnar URL med Urllib
- Hur man läser HTML-fil för din URL i Python
Hur man öppnar URL med Urllib
Innan vi kör koden för att ansluta till internetdata måste vi importera uttalande för URL-biblioteksmodulen eller "urllib".
- Importera urllib
- Definiera din huvudfunktion
- Förklara variabeln webUrl
- Ring sedan urlopen-funktionen i URL-biblioteket
- Webbadressen vi öppnar är guru99-handledning på youtube
- Därefter skriver vi ut resultatkoden
- Resultatkoden hämtas genom att anropa getcode-funktionen på den webbUrl-variabel som vi har skapat
- Vi kommer att konvertera det till en sträng så att den kan sammanfogas med vår sträng "resultatkod"
- Detta kommer att vara en vanlig HTTP-kod "200", vilket indikerar att http-begäran har behandlats framgångsrikt
Hur man får HTML-filformulär URL i Python
Du kan också läsa HTML-filen med hjälp av "läsfunktionen" i Python, och när du kör koden visas HTML-filen i konsolen.
- Ring läsfunktionen på webURL-variabeln
- Läsvariabeln gör det möjligt att läsa innehållet i datafiler
- Läs hela innehållet i URL: en i en variabel som heter data
- Kör koden - den kommer att skriva ut data i HTML-format
Här är den fullständiga koden
Python 2 Exempel
## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()
Python 3 Exempel
## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)