Natural Language Toolkit - Primeiros passos

Para instalar o NLTK, devemos ter o Python instalado em nossos computadores. Você pode acessar o link www.python.org/downloads e selecionar a versão mais recente para o seu sistema operacional, ou seja, Windows, Mac e Linux / Unix. Para o tutorial básico sobre Python, você pode consultar o link .

Agora, depois de instalar o Python em seu sistema de computador, vamos entender como podemos instalar o NLTK.

Instalando NLTK

Podemos instalar o NLTK em vários sistemas operacionais da seguinte maneira -

No Windows

Para instalar o NLTK no sistema operacional Windows, siga as etapas abaixo -

  • Primeiro, abra o prompt de comando do Windows e navegue até o local do pip pasta.

  • Em seguida, digite o seguinte comando para instalar o NLTK -

pip3 install nltk

Agora, abra o PythonShell no menu Iniciar do Windows e digite o seguinte comando para verificar a instalação do NLTK -

Import nltk

Se não obtiver nenhum erro, você instalou com sucesso o NLTK em seu sistema operacional Windows com Python3.

No Mac / Linux

Para instalar o NLTK no Mac / Linux OS, escreva o seguinte comando -

sudo pip install -U nltk

Se você não tem o pip instalado no seu computador, siga as instruções fornecidas abaixo para instalar primeiro pip -

Primeiro, atualize o índice do pacote seguindo o seguinte comando -

sudo apt update

Agora, digite o seguinte comando para instalar pip para python 3 -

sudo apt install python3-pip

Através da Anaconda

Para instalar o NLTK através do Anaconda, siga os passos abaixo -

Primeiro, para instalar o Anaconda, vá para o link www.anaconda.com/distribution/#download-section e selecione a versão do Python que você precisa instalar.

Depois de ter o Anaconda em seu sistema de computador, vá para o prompt de comando e escreva o seguinte comando -

conda install -c anaconda nltk

Você precisa revisar a saída e inserir 'sim'. O NLTK será baixado e instalado em seu pacote Anaconda.

Baixando o conjunto de dados e pacotes da NLTK

Agora temos o NLTK instalado em nossos computadores, mas para usá-lo precisamos baixar os conjuntos de dados (corpus) disponíveis nele. Alguns dos conjuntos de dados importantes disponíveis sãostpwords, guntenberg, framenet_v15 e assim por diante.

Com a ajuda dos comandos a seguir, podemos baixar todos os conjuntos de dados NLTK -

import nltk
nltk.download()

Você obterá a seguinte janela de download do NLTK.

Agora, clique no botão de download para baixar os conjuntos de dados.

Como executar o script NLTK?

A seguir está o exemplo em que estamos implementando o algoritmo Porter Stemmer usando PorterStemmerclasse nltk. com este exemplo, você seria capaz de entender como executar o script NLTK.

Primeiro, precisamos importar o kit de ferramentas de linguagem natural (nltk).

import nltk

Agora, importe o PorterStemmer classe para implementar o algoritmo Porter Stemmer.

from nltk.stem import PorterStemmer

Em seguida, crie uma instância da classe Porter Stemmer da seguinte maneira -

word_stemmer = PorterStemmer()

Agora, insira a palavra que você deseja radicalizar. -

word_stemmer.stem('writing')

Resultado

'write'
word_stemmer.stem('eating')

Resultado

'eat'