DeepMind revela a ciência de uso geral ‘espetacular’ ai


Deepmind diz que a AlphaEvolve ajudou a melhorar o design de chips de IA.Crédito: Christian Ohde/Imago via Alamy
O Google DeepMind usou modelos de chatbot para apresentar soluções para grandes problemas em matemática e ciência da computação.
O sistema, chamado AlphaEvolve, combina a criatividade de um grande modelo de linguagem (LLM) com algoritmos que podem examinar as sugestões do modelo para filtrar e melhorar as soluções. Foi descrito em um white paper divulgado pela empresa em 14 de maio.
DeepMind atinge o marco na solução de problemas de matemática – o próximo grande desafio da IA
“O artigo é bastante espetacular”, diz Mario Krenn, que lidera o laboratório de cientistas artificiais no Instituto Max Planck para a Ciência da Luz em Erlangen, Alemanha. “Acho que a AlphaEvolve é a primeira demonstração bem-sucedida de novas descobertas baseadas em LLMs de uso geral”.
Além de usar o sistema para descobrir soluções para abrir problemas de matemática, o DeepMind já aplicou a técnica de inteligência artificial (AI) aos seus próprios desafios práticos, diz Pushmeet Kohli, chefe de ciência da empresa em Londres.
A AlphaEvolve ajudou a melhorar o design da próxima geração de unidades de processamento de tensores – computando chips desenvolvidos especialmente para a IA – e encontrou uma maneira de explorar com mais eficiência a capacidade de computação mundial do Google, economizando 0,7% do total de recursos. “Isso teve um impacto substancial”, diz Kohli.
AI de uso geral
A maioria das aplicações bem-sucedidas da IA na ciência até agora-incluindo a ferramenta de designação de proteínas Alphafold-envolveu um algoritmo de aprendizado que foi criado à mão por sua tarefa, diz Krenn. Mas o AlphaEvolve é de uso geral, tocando nas habilidades do LLMS para gerar código para resolver problemas em uma ampla gama de domínios.
O DeepMind descreve o AlphaEvolve como um ‘agente’, porque envolve o uso de modelos de IA interagindo. Mas tem como alvo um ponto diferente no processo científico de muitos outros sistemas científicos de IA ‘agênticos’, que foram usados para revisar a literatura e sugerir hipóteses.
O AlphaEvolve é baseado na família Gemini da empresa. Cada tarefa começa com o usuário inserindo uma pergunta, critérios para avaliação e uma solução sugerida, para a qual o LLM propõe centenas ou milhares de modificações. Um algoritmo de ‘avaliador’ avalia as modificações em relação às métricas para uma boa solução (por exemplo, na tarefa de atribuir trabalhos de computação do Google, os pesquisadores querem desperdiçar menos recursos).
Como o chatgpt ‘pensa’? Psicologia e neurociência crack aberto Modelos de idiomas grandes
Com base em que as soluções são consideradas as melhores, o LLM sugere novas idéias e, com o tempo, o sistema evolui uma população de algoritmos mais fortes, diz Matej Balog, cientista da IA da DeepMind que co-liderou a pesquisa. “Exploramos esse conjunto diversificado de possibilidades de como o problema pode ser resolvido”, diz ele.
O AlphaEvolve se baseia no sistema FunSearch da empresa, que em 2023 demonstrou usar uma abordagem evolutiva semelhante para superar os seres humanos em problemas não resolvidos em matemática1. Comparado ao FunSearch, o AlphaEvolve pode lidar com peças de código muito maiores e enfrentar algoritmos mais complexos em uma ampla gama de domínios científicos, diz Balog.
Deepmind diz que o AlphaEvolve criou uma maneira de realizar um cálculo, conhecido como multiplicação de matrizes, que em alguns casos é mais rápido que o método mais conhecido, que foi desenvolvido pelo matemático alemão Volker Straassen em 19692. Tais cálculos envolvem multiplicação de números em grades e são usados para treinar redes neurais. Apesar de ser de uso geral, o AlphaEvolve superou o Alfatensor, uma ferramenta de IA descrita pela empresa em 2022 e projetada especificamente para a Matrix Mechanics3.