Hur laddar jag ner & Installera NLTK på Windows / Mac

Innehållsförteckning:

Anonim

I den här handledningen lär du dig -

  • Installerar NLTK i Windows
  • Installerar Python i Windows
  • Installerar NLTK i Mac / Linux
  • Installerar NLTK via Anaconda
  • NLTK-datauppsättning
  • Hur man laddar ner alla paket med NLTK
  • Köra NLP-skriptet
  • Hur man kör NLTK-skript

Installerar NLTK i Windows

I den här delen lär vi oss hur man gör installation av NLTK via terminal (Kommandotolken i Windows).

Instruktionen nedan baseras på antagandet att du inte har python installerat. Så första steget är att installera python.

Installera Python i Windows:

Steg 1) Gå till länkar https://www.python.org/downloads/ , och väljer den senaste versionen för Windows.

Obs! Om du inte vill ladda ner den senaste versionen kan du besöka nedladdningsfliken och se alla versioner.

Steg 2) Klicka på den nedladdade filen

Steg 3) Välj Anpassa installation

Steg 4) Klicka på NÄSTA

Steg 5) I nästa skärm

  1. Välj de avancerade alternativen
  2. Ge en anpassad installationsplats. I mitt fall väljs en mapp på C-enheten för enkel användning
  3. Klicka på Installera

Steg 6) Klicka på knappen Stäng när installationen är klar.

Steg 7) Kopiera sökvägen till mappen Skript.

Steg 8) I Windows-kommandotolken

  • Navigera till platsen för pipmappen
  • Ange kommando för att installera NLTK
    pip3 install nltk
  • Installationen ska göras framgångsrikt

OBS : För Python2 använd commandpip2 install nltk

Steg 9) I Windows Start-meny, sök och öppna PythonShell

Steg 10) Du kan verifiera om installationen är korrekt genom att tillhandahålla kommandot nedan

import nltk

Om du inte ser något fel är installationen klar.

Installerar NLTK i Mac / Linux

För att installera NLTK i Mac / Unix krävs python-pakethanteringspip för att installera nltk. Om pip inte är installerad, följ instruktionerna nedan för att slutföra processen

Steg 1) Uppdatera paketindex genom att skriva kommandot nedan

sudo apt update

Steg 2) Installera pip för Python 3:

sudo apt install python3-pip

Du kan också installera pip med easy_install.

sudo apt-get install python-setuptools python-dev build-essential 

Nu är easy_install installerat. Kör kommandot nedan för att installera pip

sudo easy_install pip

Steg3) Använd följande kommando för att installera NLTK

sudo pip install -U nltksudo pip3 install -U nltk

Installerar NLTK via Anaconda

Steg 1) Installera anaconda (som också kan användas för att installera olika paket) genom att besöka https://www.anaconda.com/products/individual och välj vilken version av python du behöver installera för anaconda.

Obs: Se denna handledning för detaljerade steg för att installera anaconda

Steg 2) I Anaconda-prompten,

  1. Ange kommando
    conda install -c anaconda nltk
  2. Granska paketuppgraderingen, nedgradera, installera information och ange ja
  3. NLTK laddas ner och installeras

NLTK-datauppsättning

NLTK-modulen har många tillgängliga datauppsättningar som du behöver ladda ner för att använda. Mer tekniskt kallas det corpus . Några av exemplen är stoppord , gutenberg , framenet_v15 , stora_grammatik och så vidare.

Hur man laddar ner alla paket med NLTK

Steg 1) Kör Python-tolk i Windows eller Linux

Steg 2)

  1. Ange kommandona
import nltknltk.download ()
  1. Nedladdat NLTK-fönster öppnas. Klicka på nedladdningsknappen för att ladda ner datasetet. Denna process tar tid, baserat på din internetanslutning

OBS! Du kan ändra nedladdningsplatsen genom att klicka på Arkiv> Ändra nedladdningskatalog

Steg 3) Använd följande kod för att testa installerade data

>>> from nltk.corpus import brown>>>brown.words()

['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]

Köra NLP-skriptet

Vi ska diskutera hur NLP-skript kommer att köras på vår lokala dator. Det finns många bibliotek för naturlig språkbehandling på marknaden. Så att välja ett bibliotek beror på att passa dina behov. Här är listan över NLP-bibliotek.

Hur man kör NLTK-skript

Steg 1) Kopiera koden i din favoritkodredigerare och spara filen som " NLTKsample.py "

from nltk.tokenize import RegexpTokenizertokenizer = RegexpTokenizer(r'\w+')filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')print(filterdText)

Kodförklaring:

  1. I det här programmet var målet att ta bort alla typer av skiljetecken från given text. Vi importerade "RegexpTokenizer" som är en modul för NLTK. Det tar bort alla uttryck, symboler, tecken, siffror eller andra saker vad du vill.
  2. Du har precis skickat det vanliga uttrycket till "RegexpTokenizer" -modulen.
  3. Vidare tokeniserade vi ordet med hjälp av "tokenize" -modulen. Utgången lagras i variabeln "filterdText".
  4. Och skrev ut dem med "print ()."

Steg 2) I kommandotolken

  • Navigera till den plats där du har sparat filen
  • Kör kommandot Python NLTKsample.py

Detta visar output som:

['Hello', 'Guru99', 'You', 'have', 'build', 'a', 'very', 'good', 'site', 'and', 'I', 'love', ' besöker ',' din ',' webbplats ']