• Elaine Figueiredo

Análise profunda de dados - Deep Analysis - Deep Analytics


Ideias e estratégias devem ser alinhadas, selecionadas e aplicadas no momento certo

A análise profunda é um processo aplicado em Ciência de Dados que analisa, extrai e organiza grandes quantidades de dados de uma forma aceitável, útil e benéfica para uma organização, indivíduo ou aplicativo de software de análise.

Recupera informações direcionadas dos armazenamentos de dados por meio de metodologias de processamento de dados.

Geralmente extrai informações de conjuntos de dados hospedados em uma arquitetura complexa e distribuída, com a implementação de algoritmos e técnicas de análise de dados. O processo de análise profunda requer operação em uma enorme quantidade de dados, geralmente em petabytes e exabytes.

O fluxo de trabalho de análise de dados está espalhado por vários nós de servidor ou de computação para acelerar o processo.

É acoplada ou parte dos aplicativos de business intelligence, que aplicam mecanismos de pesquisa baseados em consultas aos armazenamentos de dados para analisar e extrair a melhor correspondência de dados e converter essas informações em relatórios, tabelas e gráficos especializados.

Perform in-deep analysis, essa etapa pode não estar presente em todos os projetos de Data Science. É nessa fase que realizamos passos de seleção de features, implementamos e aplicamos modelos estatísticos e de Machine Learning para validar hipóteses.

Suponha que seu problema seja criar um modelo preditivo que identifique quando um cliente deixará sua plataforma.

Precisaremos então criar um modelo mais complexo e automatizados para que os stakeholders tenham informações suficientes para tomar decisões sobre possíveis churns. (churn rate é uma métrica que aponta o número de clientes que deixaram de fazer negócios com a empresa em um determinado período de tempo).

“- Mas porque é uma etapa as vezes ausente?”

Porque alguns problemas são resolvidos na etapa anterior, de exploração de dados, e não exigem a aplicação de uma metodologia mais complexa para sua resolução

Para auxiliar nessa etapa, contamos com bibliotecas como a scikit-learn, que encapsula vários modelos de Classificação, Regressão, Clusterização, Redução de dimensionalidade e etc.

Além disso, algumas ferramentas estão começando a disponibilizar plugins para análises mais complexas, como a opção de forecasting do Power BI.


2 visualizações0 comentário