Mineração de dados - Aplicativos e tendências

A mineração de dados é amplamente utilizada em diversas áreas. Há uma série de sistemas de mineração de dados comerciais disponíveis hoje e, ainda assim, existem muitos desafios neste campo. Neste tutorial, discutiremos os aplicativos e a tendência da mineração de dados.

Aplicativos de mineração de dados

Aqui está a lista de áreas onde a mineração de dados é amplamente usada -

  • Análise de Dados Financeiros
  • Indústria de varejo
  • Indústria de Telecomunicações
  • Análise de dados biológicos
  • Outras aplicações científicas
  • Detecção de intruso

Análise de Dados Financeiros

Os dados financeiros no setor bancário e financeiro são geralmente confiáveis ​​e de alta qualidade, o que facilita a análise sistemática de dados e a mineração de dados. Alguns dos casos típicos são os seguintes -

  • Projeto e construção de data warehouses para análise de dados multidimensionais e mineração de dados.

  • Previsão de pagamento de empréstimos e análise da política de crédito do cliente.

  • Classificação e agrupamento de clientes para marketing direcionado.

  • Detecção de lavagem de dinheiro e outros crimes financeiros.

Indústria de varejo

Data Mining tem sua grande aplicação no setor de varejo porque coleta grande quantidade de dados sobre vendas, histórico de compras de clientes, transporte de mercadorias, consumo e serviços. É natural que a quantidade de dados coletados continue a se expandir rapidamente devido à crescente facilidade, disponibilidade e popularidade da web.

A mineração de dados no setor de varejo ajuda a identificar padrões e tendências de compra do cliente que levam à melhoria da qualidade do atendimento ao cliente e boa retenção e satisfação do cliente. Aqui está a lista de exemplos de mineração de dados no setor de varejo -

  • Projeto e construção de data warehouses com base nos benefícios da mineração de dados.

  • Análise multidimensional de vendas, clientes, produtos, tempo e região.

  • Análise de eficácia de campanhas de vendas.

  • Fidelização de clientes.

  • Recomendação de produtos e referência cruzada de itens.

Indústria de Telecomunicações

Hoje a indústria de telecomunicações é uma das indústrias mais emergentes, fornecendo vários serviços, como fax, pager, telefone celular, mensageiro de internet, imagens, e-mail, transmissão de dados web, etc. Devido ao desenvolvimento de novas tecnologias de informática e comunicação, o A indústria de telecomunicações está se expandindo rapidamente. Esta é a razão pela qual a mineração de dados se tornou muito importante para ajudar e entender o negócio.

A mineração de dados no setor de telecomunicações ajuda a identificar os padrões de telecomunicações, detectar atividades fraudulentas, fazer melhor uso dos recursos e melhorar a qualidade do serviço. Aqui está a lista de exemplos para os quais a mineração de dados melhora os serviços de telecomunicações -

  • Análise multidimensional de dados de telecomunicações.

  • Análise de padrões fraudulentos.

  • Identificação de padrões incomuns.

  • Associação multidimensional e análise de padrões sequenciais.

  • Serviços de telecomunicações móveis.

  • Uso de ferramentas de visualização na análise de dados de telecomunicações.

Análise de dados biológicos

Nos últimos tempos, temos visto um enorme crescimento no campo da biologia, como genômica, proteômica, genômica funcional e pesquisa biomédica. A mineração de dados biológicos é uma parte muito importante da Bioinformática. A seguir estão os aspectos em que a mineração de dados contribui para a análise de dados biológicos -

  • Integração semântica de bancos de dados genômicos e proteômicos heterogêneos e distribuídos.

  • Alinhamento, indexação, pesquisa de similaridade e análise comparativa de múltiplas sequências de nucleotídeos.

  • Descoberta de padrões estruturais e análise de redes genéticas e vias de proteínas.

  • Associação e análise de caminhos.

  • Ferramentas de visualização em análise de dados genéticos.

Outras aplicações científicas

Os aplicativos discutidos acima tendem a lidar com conjuntos de dados relativamente pequenos e homogêneos para os quais as técnicas estatísticas são apropriadas. Uma grande quantidade de dados foi coletada de domínios científicos, como geociências, astronomia, etc. Uma grande quantidade de conjuntos de dados está sendo gerada por causa das rápidas simulações numéricas em vários campos, como clima e modelagem de ecossistema, engenharia química, dinâmica de fluidos, etc. A seguir estão as aplicações de mineração de dados no campo das Aplicações Científicas -

  • Armazéns de dados e pré-processamento de dados.
  • Mineração baseada em grafos.
  • Visualização e conhecimento específico do domínio.

Detecção de intruso

A invasão se refere a qualquer tipo de ação que ameace a integridade, a confidencialidade ou a disponibilidade dos recursos da rede. Neste mundo de conectividade, a segurança se tornou o principal problema. Com o aumento do uso da Internet e a disponibilidade de ferramentas e truques para intrusão e ataque à rede, a detecção de intrusão tornou-se um componente crítico da administração da rede. Aqui está a lista de áreas nas quais a tecnologia de mineração de dados pode ser aplicada para detecção de intrusão -

  • Desenvolvimento de algoritmo de mineração de dados para detecção de intrusão.

  • Análise de associação e correlação, agregação para ajudar a selecionar e construir atributos discriminantes.

  • Análise de dados de fluxo.

  • Mineração de dados distribuída.

  • Ferramentas de visualização e consulta.

Produtos de sistema de mineração de dados

Existem muitos produtos de sistema de mineração de dados e aplicativos de mineração de dados específicos de domínio. Os novos sistemas e aplicativos de mineração de dados estão sendo adicionados aos sistemas anteriores. Além disso, esforços estão sendo feitos para padronizar as linguagens de mineração de dados.

Escolhendo um sistema de mineração de dados

A seleção de um sistema de mineração de dados depende dos seguintes recursos -

  • Data Types- O sistema de mineração de dados pode lidar com texto formatado, dados baseados em registros e dados relacionais. Os dados também podem estar em texto ASCII, dados de banco de dados relacional ou dados de armazém de dados. Portanto, devemos verificar qual formato exato o sistema de mineração de dados pode manipular.

  • System Issues- Devemos considerar a compatibilidade de um sistema de mineração de dados com diferentes sistemas operacionais. Um sistema de mineração de dados pode ser executado em apenas um sistema operacional ou em vários. Existem também sistemas de mineração de dados que fornecem interfaces de usuário baseadas na web e permitem dados XML como entrada.

  • Data Sources- As fontes de dados referem-se aos formatos de dados nos quais o sistema de mineração de dados irá operar. Alguns sistemas de mineração de dados podem funcionar apenas em arquivos de texto ASCII, enquanto outros em múltiplas fontes relacionais. O sistema de mineração de dados também deve oferecer suporte a conexões ODBC ou OLE DB para conexões ODBC.

  • Data Mining functions and methodologies - Existem alguns sistemas de mineração de dados que fornecem apenas uma função de mineração de dados, como classificação, enquanto alguns fornecem várias funções de mineração de dados, como descrição de conceito, análise OLAP orientada para descoberta, mineração de associação, análise de ligação, análise estatística, classificação, previsão, agrupamento análise de outlier, pesquisa de similaridade, etc.

  • Coupling data mining with databases or data warehouse systems- Os sistemas de mineração de dados precisam ser acoplados a um banco de dados ou sistema de data warehouse. Os componentes acoplados são integrados em um ambiente de processamento de informações uniforme. Aqui estão os tipos de acoplamento listados abaixo -

    • Sem acoplamento
    • Acoplamento solto
    • Acoplamento semi-apertado
    • Acoplamento Tenso
  • Scalability - Existem dois problemas de escalabilidade na mineração de dados -

    • Row (Database size) Scalability- Um sistema de mineração de dados é considerado escalonável por linha quando o número ou as linhas são aumentados 10 vezes. Não leva mais de 10 vezes para executar uma consulta.

    • Column (Dimension) Salability - Um sistema de mineração de dados é considerado escalonável em coluna se o tempo de execução da consulta de mineração aumentar linearmente com o número de colunas.

  • Visualization Tools - A visualização na mineração de dados pode ser categorizada da seguinte forma -

    • Visualização de dados
    • Visualização de resultados de mineração
    • Visualização do processo de mineração
    • Mineração de dados visuais
  • Data Mining query language and graphical user interface- Uma interface de usuário gráfica fácil de usar é importante para promover a mineração de dados interativa e guiada pelo usuário. Ao contrário dos sistemas de banco de dados relacionais, os sistemas de mineração de dados não compartilham a linguagem de consulta de mineração de dados subjacente.

Tendências em mineração de dados

Os conceitos de mineração de dados ainda estão evoluindo e aqui estão as últimas tendências que vemos neste campo -

  • Exploração de aplicativos.

  • Métodos de mineração de dados escalonáveis ​​e interativos.

  • Integração de mineração de dados com sistemas de banco de dados, sistemas de data warehouse e sistemas de banco de dados web.

  • SStandardização da linguagem de consulta de mineração de dados.

  • Mineração de dados visuais.

  • Novos métodos de mineração de tipos complexos de dados.

  • Mineração de dados biológicos.

  • Mineração de dados e engenharia de software.

  • Mineração da web.

  • Mineração de dados distribuída.

  • Mineração de dados em tempo real.

  • Mineração de dados de vários bancos de dados.

  • Proteção de privacidade e segurança da informação na mineração de dados.