Python Internet Access med Urllib.Request och urlopen ()

Innehållsförteckning:

Anonim

Vad är urllib?

urllib är en Python-modul som kan användas för att öppna webbadresser. Den definierar funktioner och klasser för att hjälpa till vid URL-åtgärder.

Med Python kan du också komma åt och hämta data från internet som XML, HTML, JSON, etc. Du kan också använda Python för att arbeta med dessa data direkt. I denna handledning ska vi se hur vi kan hämta data från webben. Här använde vi till exempel en guru99-video-URL, och vi kommer att komma åt denna video-URL med Python samt skriva ut HTML-fil med den här URL: n.

I denna handledning lär vi oss

  • Hur man öppnar URL med Urllib
  • Hur man läser HTML-fil för din URL i Python

Hur man öppnar URL med Urllib

Innan vi kör koden för att ansluta till internetdata måste vi importera uttalande för URL-biblioteksmodulen eller "urllib".

  • Importera urllib
  • Definiera din huvudfunktion
  • Förklara variabeln webUrl
  • Ring sedan urlopen-funktionen i URL-biblioteket
  • Webbadressen vi öppnar är guru99-handledning på youtube
  • Därefter skriver vi ut resultatkoden
  • Resultatkoden hämtas genom att anropa getcode-funktionen på den webbUrl-variabel som vi har skapat
  • Vi kommer att konvertera det till en sträng så att den kan sammanfogas med vår sträng "resultatkod"
  • Detta kommer att vara en vanlig HTTP-kod "200", vilket indikerar att http-begäran har behandlats framgångsrikt

Hur man får HTML-filformulär URL i Python

Du kan också läsa HTML-filen med hjälp av "läsfunktionen" i Python, och när du kör koden visas HTML-filen i konsolen.

  • Ring läsfunktionen på webURL-variabeln
  • Läsvariabeln gör det möjligt att läsa innehållet i datafiler
  • Läs hela innehållet i URL: en i en variabel som heter data
  • Kör koden - den kommer att skriva ut data i HTML-format

Här är den fullständiga koden

Python 2 Exempel

## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()

Python 3 Exempel

## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)