Regressão Logística em Python - Teste
Precisamos testar o classificador criado acima antes de colocá-lo em uso em produção. Se o teste revelar que o modelo não atende à precisão desejada, teremos que voltar ao processo acima, selecionar outro conjunto de recursos (campos de dados), construir o modelo novamente e testá-lo. Essa será uma etapa iterativa até que o classificador atenda ao requisito de precisão desejada. Então, vamos testar nosso classificador.
Previsão de dados de teste
Para testar o classificador, usamos os dados de teste gerados no estágio anterior. Nós chamamos opredict método no objeto criado e passe o X matriz dos dados de teste, conforme mostrado no seguinte comando -
In [24]: predicted_y = classifier.predict(X_test)
Isso gera uma única matriz dimensional para todo o conjunto de dados de treinamento, dando a previsão para cada linha na matriz X. Você pode examinar esta matriz usando o seguinte comando -
In [25]: predicted_y
O seguinte é o resultado da execução dos dois comandos acima -
Out[25]: array([0, 0, 0, ..., 0, 0, 0])
A saída indica que o primeiro e os três últimos clientes não são os candidatos potenciais para o Term Deposit. Você pode examinar toda a gama para classificar os clientes potenciais. Para fazer isso, use o seguinte snippet de código Python -
In [26]: for x in range(len(predicted_y)):
if (predicted_y[x] == 1):
print(x, end="\t")
O resultado da execução do código acima é mostrado abaixo -
A saída mostra os índices de todas as linhas que são prováveis candidatos à assinatura do TD. Agora você pode fornecer essa saída para a equipe de marketing do banco, que coletará os detalhes de contato de cada cliente na linha selecionada e continuará com seu trabalho.
Antes de colocar este modelo em produção, precisamos verificar a precisão da previsão.
Verificando a precisão
Para testar a precisão do modelo, use o método de pontuação no classificador conforme mostrado abaixo -
In [27]: print('Accuracy: {:.2f}'.format(classifier.score(X_test, Y_test)))
A saída da tela de execução deste comando é mostrada abaixo -
Accuracy: 0.90
Isso mostra que a precisão do nosso modelo é de 90%, o que é considerado muito bom na maioria das aplicações. Portanto, nenhum ajuste adicional é necessário. Agora, nosso cliente está pronto para executar a próxima campanha, obter a lista de clientes em potencial e persegui-los para a abertura do TD com uma provável alta taxa de sucesso.