Python - ambiente de processamento de texto

Para criar e executar com sucesso o código de exemplo neste tutorial, precisaremos de um ambiente configurado que terá tanto o python de uso geral quanto os pacotes especiais necessários para ciência de dados. Primeiro veremos como instalar o python de uso geral, que pode ser python 2 ou python 3. Mas preferiremos o python 2 para este tutorial principalmente por causa de sua maturidade e suporte mais amplo de pacotes externos.

Obtendo Python

O código-fonte mais atualizado e atual, binários, documentação, notícias, etc., está disponível no site oficial do Python https://www.python.org/

Você pode baixar a documentação do Python em https://www.python.org/doc/. A documentação está disponível nos formatos HTML, PDF e PostScript.

Instalando Python

A distribuição Python está disponível para uma ampla variedade de plataformas. Você precisa baixar apenas o código binário aplicável à sua plataforma e instalar o Python.

Se o código binário para sua plataforma não estiver disponível, você precisa de um compilador C para compilar o código-fonte manualmente. Compilar o código-fonte oferece mais flexibilidade em termos de escolha de recursos que você precisa em sua instalação.

Aqui está uma rápida visão geral da instalação do Python em várias plataformas -

Instalação Unix e Linux

Aqui estão as etapas simples para instalar o Python em uma máquina Unix / Linux.

  • Abra um navegador da Web e vá para https://www.python.org/downloads/.

  • Siga o link para baixar o código-fonte compactado disponível para Unix / Linux.

  • Baixe e extraia arquivos.

  • Editando o arquivo Módulos / Configuração se desejar personalizar algumas opções.

  • execute o script ./configure

  • make

  • faça instalar

Isso instala o Python no local padrão / usr / local / bin e suas bibliotecas em / usr / local / lib / pythonXX onde XX é a versão do Python.

Instalação Windows

Aqui estão as etapas para instalar o Python na máquina Windows.

  • Abra um navegador da Web e vá para https://www.python.org/downloads/.

  • Siga o link para o arquivo python-XYZ.msi do instalador do Windows, em que XYZ é a versão que você precisa instalar.

  • Para usar este instalador python-XYZ.msi , o sistema Windows deve oferecer suporte ao Microsoft Installer 2.0. Salve o arquivo do instalador em sua máquina local e execute-o para descobrir se sua máquina oferece suporte a MSI.

  • Execute o arquivo baixado. Isso abre o assistente de instalação do Python, que é realmente fácil de usar. Basta aceitar as configurações padrão e esperar até que a instalação seja concluída e você esteja pronto.

Instalação Macintosh

Macs recentes vêm com o Python instalado, mas pode estar desatualizado há vários anos. Vejohttp://www.python.org/download/mac/para obter instruções sobre como obter a versão atual junto com ferramentas extras para apoiar o desenvolvimento no Mac. Para Mac OS anteriores ao Mac OS X 10.3 (lançado em 2003), o MacPython está disponível.

Jack Jansen o mantém e você pode ter acesso total a toda a documentação em seu site - http://www.cwi.nl/~jack/macpython.html. Você pode encontrar detalhes de instalação completos para a instalação do Mac OS.

Configurando PATH

Os programas e outros arquivos executáveis ​​podem estar em vários diretórios, portanto, os sistemas operacionais fornecem um caminho de pesquisa que lista os diretórios em que o sistema operacional pesquisa executáveis.

O caminho é armazenado em uma variável de ambiente, que é uma string nomeada mantida pelo sistema operacional. Esta variável contém informações disponíveis para o shell de comando e outros programas.

o path variável é nomeada como PATH no Unix ou Path no Windows (Unix diferencia maiúsculas de minúsculas; Windows não).

No Mac OS, o instalador lida com os detalhes do caminho. Para invocar o interpretador Python de qualquer diretório específico, você deve adicionar o diretório Python ao seu caminho.

Definir caminho em Unix / Linux

Para adicionar o diretório Python ao caminho para uma sessão particular no Unix -

  • In the csh shell - digite setenv PATH "$ PATH: / usr / local / bin / python" e pressione Enter.

  • In the bash shell (Linux) - digite export ATH = "$ PATH: / usr / local / bin / python" e pressione Enter.

  • In the sh or ksh shell - digite PATH = "$ PATH: / usr / local / bin / python" e pressione Enter.

  • Note - / usr / local / bin / python é o caminho do diretório Python

Configurando caminho no Windows

Para adicionar o diretório Python ao caminho para uma sessão específica no Windows -

At the command prompt - digite path% path%; C: \ Python e pressione Enter.

Note - C: \ Python é o caminho do diretório Python

Variáveis ​​de ambiente Python

Aqui estão variáveis ​​de ambiente importantes, que podem ser reconhecidas pelo Python -

Sr. Não. Variável e Descrição
1

PYTHONPATH

Ele tem uma função semelhante a PATH. Esta variável informa ao interpretador Python onde localizar os arquivos de módulo importados para um programa. Deve incluir o diretório da biblioteca de origem do Python e os diretórios que contêm o código-fonte do Python. PYTHONPATH às vezes é predefinido pelo instalador Python.

2

PYTHONSTARTUP

Ele contém o caminho de um arquivo de inicialização contendo o código-fonte Python. Ele é executado toda vez que você inicia o interpretador. É denominado .pythonrc.py no Unix e contém comandos que carregam utilitários ou modificam PYTHONPATH.

3

PYTHONCASEOK

É usado no Windows para instruir o Python a encontrar a primeira correspondência sem distinção entre maiúsculas e minúsculas em uma instrução de importação. Defina esta variável com qualquer valor para ativá-la.

4

PYTHONHOME

É um caminho alternativo de pesquisa de módulo. Geralmente é incorporado aos diretórios PYTHONSTARTUP ou PYTHONPATH para facilitar a troca de bibliotecas de módulos.

Executando Python

Existem três maneiras diferentes de iniciar o Python -

Intérprete Interativo

Você pode iniciar o Python a partir do Unix, DOS ou qualquer outro sistema que forneça um interpretador de linha de comando ou janela de shell.

Entrar python a linha de comando.

Comece a codificar imediatamente no interpretador interativo.

$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

Aqui está a lista de todas as opções de linha de comando disponíveis -

Sr. Não. Opção e descrição
1

-d

Ele fornece saída de depuração.

2

-O

Ele gera bytecode otimizado (resultando em arquivos .pyo).

3

-S

Não execute o site de importação para procurar caminhos Python na inicialização.

4

-v

saída detalhada (rastreamento detalhado nas instruções de importação).

5

-X

desabilite exceções integradas baseadas em classe (apenas use strings); obsoleto a partir da versão 1.6.

6

-c cmd

execute o script Python enviado como string cmd

7

file

execute o script Python a partir do arquivo fornecido

Script da linha de comando

Um script Python pode ser executado na linha de comando invocando o interpretador em seu aplicativo, como a seguir -

$python script.py # Unix/Linux
or
python% script.py # Unix/Linux
or 
C: >python script.py # Windows/DOS

Note - Certifique-se de que o modo de permissão de arquivo permite a execução.

Ambiente de desenvolvimento integrado

Você também pode executar o Python a partir de um ambiente de interface gráfica do usuário (GUI), se tiver um aplicativo GUI em seu sistema que suporte Python.

  • Unix - IDLE é o primeiro IDE Unix para Python.

  • Windows - PythonWin é a primeira interface Windows para Python e é um IDE com uma GUI.

  • Macintosh - A versão para Macintosh do Python junto com o IDLE IDE está disponível no site principal, para download como arquivos MacBinary ou BinHex.

Instalando o Pacote NLTK

O NLTK é muito simples de se integrar ao ambiente python. Use o comando abaixo para adicionar NLTK ao ambiente.

sudo pip install -U nltk

A adição de outras bibliotecas será discutida em cada capítulo conforme e quando precisarmos para seu uso no programa python.