Algoritmos Preditivos

Elaine Figueiredo
12 de jul. de 2022
5 min de leitura

Atualizado: 5 de jun. de 2023

A Inteligência Artificial (IA) tem diversos significados e aplicações práticas.

A IA é um fator de transformação para os negócios e pode permitir um trabalho mais eficiente e eficaz do que nunca. Assim, certamente terá um impacto significativo no mercado de trabalho e nas economias dos países como um todo.

A característica mais valiosa da Inteligência Artificial (IA) para os negócios é sua capacidade de fazer previsões, calculando de forma muito mais ágil e precisa a probabilidade de ocorrência de um determinado resultado.

No mundo dos negócios, temos que fazer previsões o tempo todo. Precisamos prever, por exemplo, se haverá maior lucro vendendo grandes volumes a baixo custo ou pequenos volumes a um preço alto; ou em que produto ou serviço obteremos o melhor retorno sobre investimento (ROI) do nosso orçamento de marketing.

Tradicionalmente, essas predições dependiam, em grande parte, do instinto [da sorte] e da experiência de mercado dos tomadores de decisão. As previsões também eram orientadas por dados, porém o pouco tempo disponível para a avaliação da cada vez maior massa de dados e a escassez de mão de obra qualificada dificultou muito o uso desse recurso pelos seres humanos.

Entenda o que são os algoritmos preditivos

Num cenário onde empresas obtém grande quantidade de informação sobre clientes e concorrentes e não sabem muito bem o que fazer com ela. Dessa forma, conhecer algoritmos que favorecem a tomada de decisão é um passo rumo a evolução do modo como negócios são realizados.

Um dos fundamentos dessa evolução é o algoritmo preditivo. Para diferenciar melhor um algoritmo preditivo dos demais e também situar o leitor deve-se explicar o que são algoritmos que “aprendem” e porque os dados iniciais são tão importantes. Convém ressaltar que abordaremos algoritmos preditivos como uma vertente da inteligência artificial, mais em específico do aprendizado de máquina.

Introdução aos algoritmos de aprendizado de máquina

Há diversos tipos de algoritmos utilizados no treinamento de modelos e análise de dados. Todos eles têm uma coisa em comum, dependem de uma quantidade (e qualidade) de exemplos para extrair conhecimento. Geralmente, quanto maior esse número de exemplos melhor, pois torna o modelo mais adequado à realidade. Essa é uma das características de modelos de aprendizado de máquina. Esses algoritmos diferenciam-se entre si na forma como utilizam esses exemplos e em como apresentam os resultados (suas saídas). Pode-se citar dois exemplos: os algoritmos de regressão e os de predição. Para entender melhor o de predição explicaremos primeiro o de regressão, e isso é mais fácil com um exemplo.

Digamos que se queira saber por quanto devo vender uma casa. Primeiro devemos obter os preços das casas à venda no mesmo bairro juntamente com outras características, como tamanho, vagas de garagem, números de quartos, etc. Treinamos o modelo com esses dados e agora ele está apto a fornecer o preço dessa casa, mesmo que seja uma combinação de características que não foi apresentada ao modelo anteriormente. Essa capacidade de generalizar está presente em diversos modelos de aprendizado de máquina.

Existe uma limitação nesse caso. Se desejarmos saber qual alteração de preços dessa cara durantes os meses o algoritmo de regressão já não serve mais. Para isso utilizamos um algoritmo preditivo.

Algoritmos preditivos

A característica principal de um algoritmo preditivo é que sua entrada é constituída de uma série temporal. Assim, sua saída (ou o resultado) é o que acontece depois dos exemplos apresentados. Por exemplo, se forem fornecidos a um algoritmo preditivo a variação do preço de várias casas durante 3 anos, após o treinamento ele é capaz de fornecer respostas sobre o preço nos meses posteriores. Aqui entra novamente a capacidade de generalizar.

As possibilidade estão nos mais diversos cenários. Exemplos:

Gerenciamento de risco: definição do melhor portfólio para maximizar o retorno.
Bolsa de ações: valor das ações em função de suas variações mensais.
Detecção de fraudes: identificação de candidatos a fraudar baseado em comportamento financeiro.
Variação de estoque: necessidade de reposição levando em consideração as vendas dos meses anteriores.
Progressão de doenças: com o conhecimento do estado de diversos órgãos é possível prever a evolução de doenças.
Operação de equipamentos: demanda operacional baseada em outros indicadores da indústria.
Aplicações de TI: demanda operacional dos data centers ou da computação em nuvem em função do tráfego de dados anterior.
CRM: evolução do relacionamento com o cliente baseados no volume de vendas e outros indicadores.

Quanto maior a quantidade de exemplos melhor o modelo? Pois este é o grande trunfo do que todos conhecem como Big Data. Juntamente com a capacidade de separar o treinamento de modelos em diferentes clusters, essa tendência atual favorece os modelos preditivos e permite a obtenção de respostas ainda melhores.

As aplicações de algoritmos de aprendizado de máquina são infinitas, desde que existam dados para treinamento. Para que a empresa, independentemente de seu tamanho, esteja no topo, o gestor ou diretor de TI deve acompanhar e estudar essas aplicações.

O aprendizado de máquina, no qual está inserido o algoritmo preditivo, e demais modelos de inteligência artificial são o que há de mais recente em tomadas de decisões. Mantenha a atenção nessas tecnologias que sua empresa não ficará para trás.

O que é aprendizado de máquina?

O aprendizado de máquina ocorre quando um algoritmo ou um programa de computador consegue melhorar sua performance nas tarefas que desempenha com base na experiência, utilizando inteligência artificial. Essa experiência ocorre com a alimentação de dados e informações colhidas a partir de interações com o mundo real.

Dessa forma, podemos dividir o aprendizado de máquina em supervisionado, que busca responder um target, ou seja, há uma variável explícita a ser respondida; e não supervisionado, em que busca-se identificar grupos ou padrões a partir dos dados, sem um objetivo específico a ser alcançado.

Aprendizado Supervisionado - robo aprendizado supervisionado

O aprendizado supervisionado ocorre quando o modelo aprende a partir de resultados pré-definidos, utilizando os valores passados da variável target para aprender quais devem ser seus resultados de saída. Estes mesmos valores servem como “supervisão” destas previsões, permitindo o ajuste nas previsões com base nos erros. Isso é considerado aprendizado supervisionado, pois o modelo possui uma referência daquilo que está certo e daquilo que está errado.

Aprendizado não supervisionado

No aprendizado não supervisionado não existem resultados pré-definidos para o modelo utilizar como referência para aprender.

Leitura dos dados sem supervisão: Por exemplo, você apresenta para o modelo um conjunto de dados com várias informações sobre plantas (como comprimento do caule, cor da folha, espessura da raiz, etc.) e pede para o modelo separar esses dados em 5 categorias.

Nesse caso, você não especificou para o modelo o que caracteriza cada categoria, o modelo irá sozinho tentar encontrar semelhanças e diferenças entre os dados de maneira que essa separação em 5 categorias seja a melhor possível. Como não há uma referência (ou critério específico) para o modelo seguir, define-se que esse aprendizado é não supervisionado.

Esse é apenas um exemplo de aprendizado não supervisionado, também chamado de clustering. Existem ainda outros modelos mais complexos de aprendizado não supervisionado como autoencoders, deep belief nets, GANs (Redes Adversárias Generativas), entre outros. Explicar cada um deles fugiria do propósito desse artigo, afinal estamos apenas introduzindo o assunto.

Desempenho dos aprendizados

Normalmente estamos muito interessados no desempenho que nosso modelo de machine learning terá, afinal de contas, de nada adianta um modelo extremamente complexo que não nos entregue um resultado confiável.

No aprendizado supervisionado, medir o desempenho de um modelo é muito fácil. Simplesmente separamos os dados em treino e teste e avaliamos os resultados simulando a realidade que o modelo encontrará quando estiver em uso. O desempenho do modelo pode ser verificado de forma bastante objetiva.

Já no aprendizado não supervisionado muitas vezes não temos essa mesma objetividade na avaliação do modelo criado. Afinal, se a referência para o modelo seguir não existe, também não existe uma referência para o avaliar. Portanto, em grande parte das vezes, você (cientista de dados) será responsável por analisar o resultado apresentado, verificando (no caso de clustering, por exemplo) se os grupos criados fazem sentido e se a aplicação final será útil ou não.

Algoritmos Preditivos

Entenda o que são os algoritmos preditivos

Introdução aos algoritmos de aprendizado de máquina

Algoritmos preditivos

O que é aprendizado de máquina?

Posts recentes

Comentários