Hur laddar jag ner & Installera NLTK på Windows / Mac

I den här handledningen lär du dig -

Installerar NLTK i Windows
Installerar Python i Windows
Installerar NLTK i Mac / Linux
Installerar NLTK via Anaconda
NLTK-datauppsättning
Hur man laddar ner alla paket med NLTK
Köra NLP-skriptet
Hur man kör NLTK-skript

Installerar NLTK i Windows

I den här delen lär vi oss hur man gör installation av NLTK via terminal (Kommandotolken i Windows).

Instruktionen nedan baseras på antagandet att du inte har python installerat. Så första steget är att installera python.

Installera Python i Windows:

Steg 1) Gå till länkar https://www.python.org/downloads/ , och väljer den senaste versionen för Windows.

Obs! Om du inte vill ladda ner den senaste versionen kan du besöka nedladdningsfliken och se alla versioner.

Steg 2) Klicka på den nedladdade filen

Steg 3) Välj Anpassa installation

Steg 4) Klicka på NÄSTA

Steg 5) I nästa skärm

Välj de avancerade alternativen
Ge en anpassad installationsplats. I mitt fall väljs en mapp på C-enheten för enkel användning
Klicka på Installera

Steg 6) Klicka på knappen Stäng när installationen är klar.

Steg 7) Kopiera sökvägen till mappen Skript.

Steg 8) I Windows-kommandotolken

Navigera till platsen för pipmappen
Ange kommando för att installera NLTK
```
pip3 install nltk
```
Installationen ska göras framgångsrikt

OBS : För Python2 använd commandpip2 install nltk

Steg 9) I Windows Start-meny, sök och öppna PythonShell

Steg 10) Du kan verifiera om installationen är korrekt genom att tillhandahålla kommandot nedan

import nltk

Om du inte ser något fel är installationen klar.

Installerar NLTK i Mac / Linux

För att installera NLTK i Mac / Unix krävs python-pakethanteringspip för att installera nltk. Om pip inte är installerad, följ instruktionerna nedan för att slutföra processen

Steg 1) Uppdatera paketindex genom att skriva kommandot nedan

sudo apt update

Steg 2) Installera pip för Python 3:

sudo apt install python3-pip

Du kan också installera pip med easy_install.

sudo apt-get install python-setuptools python-dev build-essential

Nu är easy_install installerat. Kör kommandot nedan för att installera pip

sudo easy_install pip

Steg3) Använd följande kommando för att installera NLTK

sudo pip install -U nltksudo pip3 install -U nltk

Installerar NLTK via Anaconda

Steg 1) Installera anaconda (som också kan användas för att installera olika paket) genom att besöka https://www.anaconda.com/products/individual och välj vilken version av python du behöver installera för anaconda.

Obs: Se denna handledning för detaljerade steg för att installera anaconda

Steg 2) I Anaconda-prompten,

Ange kommando
```
conda install -c anaconda nltk
```
Granska paketuppgraderingen, nedgradera, installera information och ange ja
NLTK laddas ner och installeras

NLTK-datauppsättning

NLTK-modulen har många tillgängliga datauppsättningar som du behöver ladda ner för att använda. Mer tekniskt kallas det corpus . Några av exemplen är stoppord , gutenberg , framenet_v15 , stora_grammatik och så vidare.

Hur man laddar ner alla paket med NLTK

Steg 1) Kör Python-tolk i Windows eller Linux

Steg 2)

Ange kommandona

import nltknltk.download ()

Nedladdat NLTK-fönster öppnas. Klicka på nedladdningsknappen för att ladda ner datasetet. Denna process tar tid, baserat på din internetanslutning

OBS! Du kan ändra nedladdningsplatsen genom att klicka på Arkiv> Ändra nedladdningskatalog

Steg 3) Använd följande kod för att testa installerade data

>>> from nltk.corpus import brown>>>brown.words()

['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]

Köra NLP-skriptet

Vi ska diskutera hur NLP-skript kommer att köras på vår lokala dator. Det finns många bibliotek för naturlig språkbehandling på marknaden. Så att välja ett bibliotek beror på att passa dina behov. Här är listan över NLP-bibliotek.

Hur man kör NLTK-skript

Steg 1) Kopiera koden i din favoritkodredigerare och spara filen som " NLTKsample.py "

from nltk.tokenize import RegexpTokenizertokenizer = RegexpTokenizer(r'\w+')filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')print(filterdText)

Kodförklaring:

I det här programmet var målet att ta bort alla typer av skiljetecken från given text. Vi importerade "RegexpTokenizer" som är en modul för NLTK. Det tar bort alla uttryck, symboler, tecken, siffror eller andra saker vad du vill.
Du har precis skickat det vanliga uttrycket till "RegexpTokenizer" -modulen.
Vidare tokeniserade vi ordet med hjälp av "tokenize" -modulen. Utgången lagras i variabeln "filterdText".
Och skrev ut dem med "print ()."

Steg 2) I kommandotolken