Agile Data Science - Introdução
A ciência de dados ágil é uma abordagem de uso da ciência de dados com metodologia ágil para o desenvolvimento de aplicativos da web. Ele se concentra na saída do processo de ciência de dados adequado para efetuar mudanças em uma organização. A ciência de dados inclui a construção de aplicativos que descrevem o processo de pesquisa com análise, visualização interativa e agora também o aprendizado de máquina aplicado.
O principal objetivo da ciência de dados ágil é -
documentar e orientar a análise de dados explicativos para descobrir e seguir o caminho crítico para um produto atraente.
A ciência de dados ágil é organizada com o seguinte conjunto de princípios -
Iteração Contínua
Este processo envolve iteração contínua com tabelas de criação, gráficos, relatórios e previsões. A construção de modelos preditivos exigirá muitas iterações de engenharia de recursos com extração e produção de insight.
Produto intermediário
Esta é a lista de trilhas das saídas geradas. Diz-se até que experimentos fracassados também produzem resultados. O rastreamento da saída de cada iteração ajudará a criar uma saída melhor na próxima iteração.
Experiências de protótipo
Os experimentos de protótipo envolvem a atribuição de tarefas e a geração de resultados de acordo com os experimentos. Em uma determinada tarefa, devemos iterar para obter um insight e essas iterações podem ser melhor explicadas como experimentos.
Integração de dados
O ciclo de vida de desenvolvimento de software inclui diferentes fases com dados essenciais para -
customers
desenvolvedores e
o negócio
A integração de dados abre caminho para melhores perspectivas e resultados.
Valor de dados da pirâmide
O valor da pirâmide acima descreve as camadas necessárias para o desenvolvimento da “ciência de dados ágil”. Ele começa com uma coleção de registros com base nos requisitos e registros individuais de encanamento. Os gráficos são criados após a limpeza e agregação de dados. Os dados agregados podem ser usados para visualização de dados. Os relatórios são gerados com estrutura adequada, metadados e tags de dados. A segunda camada da pirâmide do topo inclui análise de previsão. A camada de previsão é onde mais valor é criado, mas ajuda na criação de boas previsões com foco na engenharia de recursos.
A camada superior envolve ações nas quais o valor dos dados é direcionado de forma eficaz. A melhor ilustração dessa implementação é “Inteligência Artificial”.