Artigos

Inteligência Artificial: a batalha entre dados e algoritmos

Há uma batalha contínua entre dados e algoritmos no desenvolvimento de aplicações de Inteligência Artificial ? Quem está ganhando?

 

Não há dúvida de que a Inteligência Artificial é um dos pontos tecnológicos mais efervescentes. Segundo o estudo do GartnerO valor comercial da inteligência artificial em todo o mundo, 2017-2025“, é que o volume de soluções de negócios empresariais baseadas em plataformas de Inteligência Artificial crescerá drasticamente em todo o mundo, com um aumento de 70%, em 2018 em relação ao ano anterior. E isso pode triplicar em 2022, quando o negócio deve valer US$ 3,900 bilhões.

A explosão da Inteligência Artificial tem transformado profundamente a sociedade moderna, impulsionado pela capacidade computacional cada vez maior e as quantidades continuamente crescentes de dados e informações disponíveis hoje. Isso afetará todos os aspectos de nossas vidas e será uma das tecnologias mais disruptivas dos próximos anos.
Para mim, é claro que, como diretor de uma empresa voltada para auxiliar seus clientes na transformação digital, a adoção de soluções utilizando Inteligência Artificial é a base das atividades diárias e dos motivos de debate com colegas e clientes. Hoje, lendo a imprensa especializada e fóruns de discussão na Internet, parece haver uma batalha entre dados e algoritmos, para suportar os melhores aplicativos baseados em IA. É possível ler artigos que parecem ser quase expressões de facções opostas; tendenciosa de acordo com a preferência de dados sobre algoritmos ou vice-versa.
O que caracteriza a Inteligência Artificial do ponto de vista tecnológico é o método/modelo de aprendizagem com o qual a inteligência se torna habilidosa em uma tarefa ou ação (daí a distinção entre os vários Machine Learning, Aprendizagem Profunda, etc). Portanto, tanto dados quanto os algoritmos são necessários para o desenvolvimento de uma aplicação baseada em IA.
Existe realmente uma batalha entre dados e algoritmos?
Já faz muito tempo desde que deixei a Faculdade de Ciências Estatísticas em Bolonha (Itália), mas com todos os investimentos que estamos fazendo na empresa no campo de Machine Learning e Inteligência Artificial em geral, eu estou frequentemente envolvido nessas áreas em interessantes discussões de projetos com meus colegas, que lideram o departamento Digital, e felizmente são muito mais experientes do que eu.
Do meu ponto de vista, se é verdade que – como afirma Geraldo Salandra – “Inteligência Artificial é o foguete, mas os dados são o combustível“, também é verdade e inegável que a IA é uma combinação de dados e algoritmos.
Não há dúvida de que sem combustível (ou seja, dados) você não vai a lugar algum, mas tenha em mente que também é verdade que a escolha do algoritmo correto pode compensar a má qualidade dos dados, e é igualmente certo que escolher um algoritmo errado pode empobrecer os efeitos de excelentes dados.

Devemos assumir que os dados são mais importantes que os algoritmos?

Eu não acho que é sempre assim. Eu entendo o valor fundamental da infraestrutura de dados e análise para alimentar os algoritmos de Inteligência Artificial.
Em nossa experiência cotidiana, “coleta e preparação de dados” são, de fato, as atividades que requerem mais tempo para o desenvolvimento de aplicações baseadas em Inteligência Artificial, comparadas com aquelas para a seleção e desenvolvimento de um modelo. É por isso que investimos muito para fornecer aos nossos clientes a melhor infraestrutura de dados para alimentar e treinar algoritmos.
Mas nos algoritmos é necessário um ótimo trabalho: ninguém pode dizer com certeza qual algoritmo terá o melhor desempenho sem antes ter tentado diferentes. Elaborar e comparar algoritmos e modelos para escolher os adequados é uma atividade crucial para definir o sucesso de uma solução de IA:
  •  Qual algoritmo devo usar?
  •  Quantas horas de treinamento de algoritmo tenho à minha disposição?
  •  Qual é o tipo, a qualidade e o tamanho dos dados disponíveis para mim?
A qualidade do conjunto de dados influenciará diretamente o sucesso do modelo preditivo. Com foco nos dados, é possível transformar um banco de dados ruim em um que vale a pena ser usado na aplicação da Inteligência Artificial, mas também é essencial escolher o algoritmo e modelo corretos que se ajustam aos dados disponíveis e que são consistentes com os dados dos objetivos de negócio.
Aqui estamos nós: o negócio. A palavra que muitas vezes falta nos artigos que li, onde a prioridade dos dados sobre os algoritmos é debatida ou vice-versa, são precisamente “negócios”. A disponibilidade de uma grande quantidade de dados de boa qualidade e algoritmos relevantes permite melhores informações e aplicações; mas obter esse tipo de dados e algoritmos não é apenas uma questão técnica: habilidades empresariais profundas são necessárias para gerar valor significativo e aplicativos de inteligência artificial para empresas.

Dados e algoritmos não se opõem, mas são aliados em uma estratégia orientada para os negócios.

Filippo Di Cesare

é natural de Bologna na Itália e formado em Ciências Econômicas e Estatísticas pela Università di Bologna. Após alguns anos trabalhando em multinacionais do setor de pesquisa de mercado, ingressou no setor de Tecnologia da informação, onde atua há quase 20 anos. Em sua trajetória profissional, passou por importantes empresas italianas assim como multinacionais do setor, ocupando posições de crescente responsabilidade. Em 2010, chegou ao Grupo Engineering onde foi nomeado Diretor de Vendas da Divisão de Governo pela matriz na Itália. Em 2016 assumiu o cargo de Diretor Presidente na Engineering do Brasil e Argentina, com o desafio de manter a linha de crescimento, definindo e implementando novas estratégias que elevem ainda mais o sucesso da filial brasileira.

Comentários

PUBLICIDADE