I den här handledningen lär du dig -
- Installerar NLTK i Windows
- Installerar Python i Windows
- Installerar NLTK i Mac / Linux
- Installerar NLTK via Anaconda
- NLTK-datauppsättning
- Hur man laddar ner alla paket med NLTK
- Köra NLP-skriptet
- Hur man kör NLTK-skript
Installerar NLTK i Windows
I den här delen lär vi oss hur man gör installation av NLTK via terminal (Kommandotolken i Windows).
Instruktionen nedan baseras på antagandet att du inte har python installerat. Så första steget är att installera python.
Installera Python i Windows:
Steg 1) Gå till länkar https://www.python.org/downloads/ , och väljer den senaste versionen för Windows.
Obs! Om du inte vill ladda ner den senaste versionen kan du besöka nedladdningsfliken och se alla versioner.
Steg 2) Klicka på den nedladdade filen
Steg 3) Välj Anpassa installation
Steg 4) Klicka på NÄSTA
Steg 5) I nästa skärm
- Välj de avancerade alternativen
- Ge en anpassad installationsplats. I mitt fall väljs en mapp på C-enheten för enkel användning
- Klicka på Installera
Steg 6) Klicka på knappen Stäng när installationen är klar.
Steg 7) Kopiera sökvägen till mappen Skript.
Steg 8) I Windows-kommandotolken
- Navigera till platsen för pipmappen
- Ange kommando för att installera NLTK
pip3 install nltk
- Installationen ska göras framgångsrikt
OBS : För Python2 använd commandpip2 install nltk
Steg 9) I Windows Start-meny, sök och öppna PythonShell
Steg 10) Du kan verifiera om installationen är korrekt genom att tillhandahålla kommandot nedan
import nltk
Om du inte ser något fel är installationen klar.
Installerar NLTK i Mac / Linux
För att installera NLTK i Mac / Unix krävs python-pakethanteringspip för att installera nltk. Om pip inte är installerad, följ instruktionerna nedan för att slutföra processen
Steg 1) Uppdatera paketindex genom att skriva kommandot nedan
sudo apt update
Steg 2) Installera pip för Python 3:
sudo apt install python3-pip
Du kan också installera pip med easy_install.
sudo apt-get install python-setuptools python-dev build-essential
Nu är easy_install installerat. Kör kommandot nedan för att installera pip
sudo easy_install pip
Steg3) Använd följande kommando för att installera NLTK
sudo pip install -U nltksudo pip3 install -U nltk
Installerar NLTK via Anaconda
Steg 1) Installera anaconda (som också kan användas för att installera olika paket) genom att besöka https://www.anaconda.com/products/individual och välj vilken version av python du behöver installera för anaconda.
Obs: Se denna handledning för detaljerade steg för att installera anaconda
Steg 2) I Anaconda-prompten,
- Ange kommando
conda install -c anaconda nltk
- Granska paketuppgraderingen, nedgradera, installera information och ange ja
- NLTK laddas ner och installeras
NLTK-datauppsättning
NLTK-modulen har många tillgängliga datauppsättningar som du behöver ladda ner för att använda. Mer tekniskt kallas det corpus . Några av exemplen är stoppord , gutenberg , framenet_v15 , stora_grammatik och så vidare.
Hur man laddar ner alla paket med NLTK
Steg 1) Kör Python-tolk i Windows eller Linux
Steg 2)
- Ange kommandona
import nltknltk.download ()
- Nedladdat NLTK-fönster öppnas. Klicka på nedladdningsknappen för att ladda ner datasetet. Denna process tar tid, baserat på din internetanslutning
OBS! Du kan ändra nedladdningsplatsen genom att klicka på Arkiv> Ändra nedladdningskatalog
Steg 3) Använd följande kod för att testa installerade data
>>> from nltk.corpus import brown>>>brown.words()
['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]
Köra NLP-skriptet
Vi ska diskutera hur NLP-skript kommer att köras på vår lokala dator. Det finns många bibliotek för naturlig språkbehandling på marknaden. Så att välja ett bibliotek beror på att passa dina behov. Här är listan över NLP-bibliotek.
Hur man kör NLTK-skript
Steg 1) Kopiera koden i din favoritkodredigerare och spara filen som " NLTKsample.py "
from nltk.tokenize import RegexpTokenizertokenizer = RegexpTokenizer(r'\w+')filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')print(filterdText)
Kodförklaring:
- I det här programmet var målet att ta bort alla typer av skiljetecken från given text. Vi importerade "RegexpTokenizer" som är en modul för NLTK. Det tar bort alla uttryck, symboler, tecken, siffror eller andra saker vad du vill.
- Du har precis skickat det vanliga uttrycket till "RegexpTokenizer" -modulen.
- Vidare tokeniserade vi ordet med hjälp av "tokenize" -modulen. Utgången lagras i variabeln "filterdText".
- Och skrev ut dem med "print ()."
Steg 2) I kommandotolken
- Navigera till den plats där du har sparat filen
- Kör kommandot Python NLTKsample.py
Detta visar output som:
['Hello', 'Guru99', 'You', 'have', 'build', 'a', 'very', 'good', 'site', 'and', 'I', 'love', ' besöker ',' din ',' webbplats ']