Mundo

A IA verdadeiramente inteligente poderia tocar pelas regras, não importa quão estranha

Patrícia Campos Mello 5 horas atrás

0 0 5 minutos de leitura

Para construir modelos de IA seguros, mas poderosos, comece testando sua capacidade de jogar jogos em tempo real

Por Vinay K. Chaudhri Editado por Dan Vergano

Ilustração de dois robôs parados um para o outro em uma mesa enquanto jogava xadrez — Um desafio de jogo proposto para o jogo avaliaria o AIS sobre o quão bem eles podem se adaptar e seguir novas regras

Tic-tac-toe é tão simples quanto os jogos-mas como Scientific AmericanO lendário colaborador do Martin Gardner apontou há quase 70 anos, possui variações complexas e aspectos estratégicos. Eles variam de jogos “reversos”-onde o primeiro jogador a fazer três seguidos perde-para versões tridimensionais jogadas em cubos e além. Os jogos de Gardner, mesmo se eles confundirem uma mente humana típica, podem nos apontar para uma maneira de tornar a inteligência artificial mais humana.

Isso ocorre porque os jogos em sua infinita variedade – com regras que devem ser imaginadas, entendidas e seguidas – são parte do que nos torna humanos. Navegar regras também é um desafio fundamental para os modelos de IA, pois eles começam a se aproximar do pensamento humano. E, como as coisas estão, é um desafio em que a maioria desses modelos fica aquém.

Isso é um grande negócio, porque se houver um caminho para a inteligência geral artificial, o objetivo final da pesquisa de aprendizado de máquina e da IA, só pode ocorrer na construção de AIS capazes de interpretar, se adaptar e seguir rigidamente as regras que estabelecemos para elas.

Sobre apoiar o jornalismo científico

Se você está gostando deste artigo, considere apoiar nosso jornalismo premiado por assinando. Ao comprar uma assinatura, você está ajudando a garantir o futuro das histórias impactantes sobre as descobertas e idéias que moldam nosso mundo hoje.

Para impulsionar o desenvolvimento de tal IA, devemos desenvolver um novo teste – vamos chamá -lo de teste de Gardner – na qual uma IA fica surpresa com as regras de um jogo e deve jogar por essas regras sem intervenção humana. Uma maneira simples de alcançar a surpresa é divulgar as regras somente quando o jogo começar.

O teste de Gardner, com desculpas ao teste de Turing, é inspirado e se baseia no trabalho pioneiro da IA sobre jogo em geral (GGP), um campo em grande parte moldado pelo professor da Universidade de Stanford, Michael Genesereth. Nas competições do GGP, o AIS em execução em laptops padrão enfrenta outras IAs em jogos cujas regras – escritas em uma linguagem matemática formal – são reveladas apenas no início. O teste propôs aqui promover uma nova fronteira: aceitar regras de jogo expressas em uma linguagem natural como o inglês. Uma vez um objetivo distante, isso agora está ao alcance das AIs modernas por causa dos recentes avanços em grandes modelos de idiomas (LLMs), como aqueles que poderão Chatgpt e que se enquadram nas famílias de Claude e Llama.

O desafio proposto deve incluir uma bateria de testes que possam se concentrar inicialmente em jogos que foram básicos de competições GGP, como Connect Four, Hex e Pentago. Também deve aproveitar uma impressionante variedade de jogos sobre os quais Gardner escreveu. O design dos testes pode se beneficiar do envolvimento da vibrante comunidade internacional de pesquisa GGP, desenvolvedores dos modelos de IA da Frontier e, é claro, dos fãs obstinados de Martin Gardner.

Mas, para passar no novo teste, não é suficiente criar um sistema de IA que seja bom em jogar um jogo predeterminado específico ou até muitos. Em vez disso, uma IA deve ser projetada para dominar qualquer jogo de estratégia em tempo real. Os jogos de estratégia exigem capacidade humana de pensar e além de várias etapas, lidar com respostas imprevisíveis, adaptar -se às mudanças nos objetivos e ainda estar em conformidade com um conjunto de regras estrito.

Esse é um grande salto dos principais modelos de IA de jogo de hoje, que dependem de conhecer as regras com antecedência para treinar seus algoritmos. Considere, por exemplo, Alphazero, o modelo revolucionário de IA capaz de jogar três jogos – Chess, Go e Shogi (xadrez japonês) – em um nível sobre -humano. O Alphazero aprende através de uma técnica conhecida como “auto-jogo”-ela joga repetidamente contra uma cópia de si mesma e, a partir dessa experiência, fica melhor com o tempo. O auto-jogo, no entanto, exige que as regras de cada jogo sejam definidas antes do treinamento. A capacidade do Alphazero de dominar jogos complexos é, sem dúvida, impressionante, mas é um sistema quebradiço: se você apresentar o Alphazero com um jogo diferente daqueles que aprendeu, será completamente confuso. Por outro lado, um modelo de IA com bom desempenho no novo teste proposto seria capaz de se adaptar a novo regras, mesmo na ausência de dados; isso jogaria qualquer jogo e siga qualquer nova regra definida com poder e precisão.

Esse último ponto – precisão – é importante. Você pode solicitar muitos sistemas de IA generativos a executar variantes em jogos simples, e eles jogarão junto: o ChatGPT pode jogar uma variante 4 × 4 ou 5 × 5 do TIC-TAC-TOE, por exemplo. Mas um prompt de LLM é melhor pensar como uma sugestão, em vez de um conjunto concreto de regras – é por isso que muitas vezes precisamos persuadir, chiar e provar LLMs a fazer exatamente o que queremos. Uma inteligência geral que passaria no teste de Gardner, por outro lado, seria, por definição, seria capaz de seguir as regras perfeitamente: não seguir uma regra exatamente significaria falhar no teste.

Ferramentas especializadas que operam sem realmente entender as regras tendem a colorir fora das linhas, reproduzindo erros passados dos dados de treinamento, em vez de aderir às regras que definimos. É fácil imaginar cenários do mundo real nos quais esses erros podem ser catastróficos: em um contexto de segurança nacional, por exemplo, são necessários recursos de IA que podem aplicar com precisão regras de engajamento dinamicamente ou negociar diferenças sutis, mas cruciais nas autoridades legais e de comando. Nas finanças, o dinheiro programável está emergindo como uma nova forma de moeda que pode obedecer às regras de propriedade e transferibilidade – e aplicar mal essas regras pode levar a um desastre financeiro.

Ironicamente, a construção de sistemas de IA que podem seguir regras rigorosamente tornaria possível criar inteligências de máquinas que são muito mais humanas em sua flexibilidade e capacidade de se adaptar a situações incertas e novas. Quando pensamos em jogadores de jogos humanos, tendemos a pensar em especialistas: Magnus Carlsen é um ótimo jogador de xadrez, mas pode não estar tão quente no Texas Hold’em. O ponto, porém, é que os humanos são capaz de generalização; Se Carlsen desistisse de xadrez, ele poderia ser um candidato decente para o Campeonato Mundial de Pentamind, que celebra o melhor jogador de jogos completos.

Jogo jogando com um novo conjunto de regras é crucial para a próxima evolução da IA, porque potencialmente nos deixará criar AIS que será capaz De qualquer coisa – mas que também seguirá meticulosamente e confiável as regras que definimos para elas. Se queremos IA poderosa, mas segura, testar sua capacidade em jogar jogos em tempo real pode ser o melhor caminho a seguir.

Fonte

Patrícia Campos Mello 5 horas atrás

0 0 5 minutos de leitura