Weka - Carregando dados

Neste capítulo, começamos com a primeira guia que você usa para pré-processar os dados. Isso é comum a todos os algoritmos que você aplicaria aos seus dados para construir o modelo e é uma etapa comum para todas as operações subsequentes no WEKA.

Para que um algoritmo de aprendizado de máquina forneça uma precisão aceitável, é importante que você primeiro limpe seus dados. Isso ocorre porque os dados brutos coletados do campo podem conter valores nulos, colunas irrelevantes e assim por diante.

Neste capítulo, você aprenderá como pré-processar os dados brutos e criar um conjunto de dados limpo e significativo para uso posterior.

Primeiro, você aprenderá a carregar o arquivo de dados no WEKA explorer. Os dados podem ser carregados das seguintes fontes -

  • Sistema de arquivos local
  • Web
  • Database

Neste capítulo, veremos todas as três opções de carregamento de dados em detalhes.

Carregando dados do sistema de arquivos local

Logo abaixo das guias do Machine Learning que você estudou na lição anterior, você encontrará os três botões a seguir -

  • Abrir arquivo ...
  • Abrir URL ...
  • Abrir banco de dados ...

Clique no Open file... botão. Uma janela do navegador de diretório é aberta, conforme mostrado na tela a seguir -

Agora, navegue até a pasta onde seus arquivos de dados estão armazenados. A instalação do WEKA vem com muitos bancos de dados de amostra para você experimentar. Estes estão disponíveis nodata pasta de instalação do WEKA.

Para fins de aprendizagem, selecione qualquer arquivo de dados desta pasta. O conteúdo do arquivo seria carregado no ambiente WEKA. Muito em breve aprenderemos como inspecionar e processar esses dados carregados. Antes disso, vamos ver como carregar o arquivo de dados da web.

Carregando dados da web

Depois de clicar no Open URL ... botão, você pode ver uma janela como a seguir -

Abriremos o arquivo de um URL público. Digite o seguinte URL na caixa pop-up -

https://storm.cis.fordham.edu/~gweiss/data-mining/weka-data/weather.nominal.arff

Você pode especificar qualquer outro URL onde seus dados estão armazenados. oExplorer carregará os dados do site remoto em seu ambiente.

Carregando dados do banco de dados

Depois de clicar no Open DB ..., você pode ver uma janela como a seguir -

Configure a string de conexão para seu banco de dados, configure a consulta para seleção de dados, processe a consulta e carregue os registros selecionados no WEKA.