Computador aprende o significado de palavras através de jogos

Baseando suas estratégias sobre o texto de um manual de jogo, um computador infere os significados das palavras sem a supervisão humana.

Os computadores são ótimos para o tratamento de palavras quando o significado delas não é importante: programas de edição de texto permitem que você reorganize e formate o texto como quiser e motores de busca podem rapidamente encontrar uma palavra em qualquer lugar na web. Mas entender o significado das palavras em qualquer língua seria possível para um computador?

Uma maneira de testar a capacidade de compreensão seria fazer o computador analisar e acompanhar um conjunto de instruções para uma tarefa desconhecida. E, de fato, nos últimos anos, pesquisadores de Ciência da Computação e do Laboratório de Inteligência Artificial do MIT começaram a projetar sistemas de aprendizagem de máquina que fazem exatamente isso, com resultados surpreendentemente bons.

Regina Barzilay e seus alunos de graduação S.R.K. Branavan e David Silver do London University College, baseados em trabalho anterior de Regina Barzilay, fizeram os computadores executar uma tarefa bastantecomplicada: aprender a jogar “Civilization” – um jogo de computador no qual o jogador orienta o desenvolvimento de uma cidade em um império através dos séculos da história humana. Quando os pesquisadores implementaram um sistema de aprendizagem de máquina para que o computador pudesse usar o “manual do jogador” para guiar o desenvolvimento de uma estratégia de jogo, a taxa de vitórias saltou de 46 por cento a 79 por cento.

“Jogos são usados como teste para técnicas de inteligência artificial simplesmente por causa de sua complexidade”, diz Branavan. “Toda ação que você toma no jogo não tem um resultado pré-determinado, porque o jogo ou o adversário pode reagir de forma aleatória ao que você faz. Então você precisa de uma técnica que possa lidar com cenários muito complexos.”

Além disso, diz Barzilay, os manuais dos jogos têm “textos muito vagos. Eles não lhe dizem como ganhar. Eles apenas dão conselhos muito gerais e sugestões e você tem que descobrir um monte de outras coisas do seu próprio jeito.”

O extraordinário do sistema de Barzilay e Branavan é que ele começa com quase nenhum conhecimento prévio sobre a tarefa que precisa desempenhar ou a linguagem na qual as instruções são escritas. Ele possui uma lista de ações do que pode fazer (como dar cliques com o botão direito ou esquerdo do mouse, ou mover o cursor), ele tem acesso às informações exibidas na tela e tem, ainda, alguma forma de medir o seu sucesso (como, por exemplo, ver se ganhou o jogo). Mas ele não sabe quais ações correspondem às palavras no conjunto de instruções e não sabe o que os objetos no mundo do jogo representam.

Então, inicialmente, seu comportamento é quase totalmente aleatório. Mas como ele executa várias ações e palavras diferentes aparecem na tela, ele pode procurar essas palavras no conjunto de instruções. Ele também pode pesquisar o texto ao redor das palavras associadas e desenvolver hipóteses sobre as ações que essas palavras correspondem. Para as hipóteses que consistentemente levam a bons resultados é dado maior peso, enquanto que aquelas que constantemente levam a maus resultados são descartadas.

O programa desenvolvido ganhou 79 por cento dos jogos que jogou, enquanto que uma versão que não lidava com as instruções escritas venceu apenas 46 por cento. Os pesquisadores também testaram um algoritmo mais sofisticado de aprendizagem de máquina que evitou a entrada de texto, mas usaram técnicas adicionais para melhorar o seu desempenho. Este algoritmo venceu apenas 62 por cento dos seus jogos.

“Se você me perguntasse antes, se eu achava que nós poderíamos fazer isso ainda, eu teria dito não”, diz Eugene Charniak, professor da Universidade de Ciência de Computação na Universidade de Brown. “Você está construindo algo em que você tem muito pouca informação sobre o domínio, mas você obter pistas do domínio de si mesmo.”

O objetivo principal do projeto, que foi apoiado pela National Science Foundation, foi demonstrar que os sistemas de computador que aprendem o significado das palavras através de exploração e interação com seus ambientes são um assunto promissor para futuras pesquisas.

Link original (em inglês): http://web.mit.edu/newsoffice/2011/language-from-games-0712.html