Nova inteligência do Facebook pode vencer os melhores jogadores de pôquer do mundo

15 de julho de 2019
Getty Images

Saiba mais sobre a tecnologia desenvolvida em parceria com a Carnegie Mellon University

Resumo:

  • A inteligência artifical Pluribus aprende com base em suas próprias jogadas na modalidade Texas Hold’em;
  • Quanto mais jogadores de pôquer na partida, mais difícil para a IA conseguir vencer;
  • Em média, a tecnologia levaria US$ 5 em fichas por mão e US$ 1.000 por hora jogada.

Talvez seja a hora dos jogadores de pôquer trocarem suas fichas por dinheiro depois que pesquisadores do Facebook e da Carnegie Mellon University criaram um bot de inteligência artificial que tem potencial para derrotar os melhores profissionais na modalidade Texas Hold’em sem limites; a mais famosa do jogo de cartas, em que participam até seis jogadores por partida.

LEIA MAIS: 11 dicas de um campeão do pôquer para ganhar tudo no trabalho

O pôquer sempre foi considerado um “grande desafio” no campo da IA. O fato de o jogo ter informações desconhecidas (você não sabe as cartas dos seus oponentes) significa que o sucesso depende de blefe e outras táticas não aplicáveis em uma série de outros jogos. Isso tornou o pôquer resistente a técnicas de inteligência artificial que funcionam em outros tipos de competição. Pesquisadores já conseguiram desenvolver IAs que derrotam um adversário no Texas Hold’em sem limites, partidas com múltiplos jogadores têm sido difíceis de decifrar.

Chamada de Pluribus, a IA jogadora de pôquer do Facebook foi criada por Noam Brown, pesquisador da própria rede social, e Tuomas Sandholm, professor da Universidade Carnegie Mellon. O trabalho acadêmico foi publicado na revista “Science”, na quinta-feira (11).

A Pluribus dominou as partidas disputadas contra versões anteriores de si mesma. Esse método autodidata significa que ela não recebeu dados de humanos ou mesmo observou jogos de outros sistemas de inteligência artificial.

“A IA começa do zero, jogando aleatoriamente e melhora gradualmente à medida que determina quais ações e qual distribuição de probabilidade sobre elas leva a melhores resultados em relação as estratégia anteriores”, dizem Brown e Sandholm no artigo. Esta estratégia já foi usada antes. O Google DeepMind, por exemplo, usou a tática para crackear o Go, e o OpenAI fez o mesmo para vencer uma partida do game “Dota 2”.

Pesquisadores têm usado jogos como uma plataforma de teste para seus agentes de inteligência artificial por décadas. Nos últimos anos, avanços na computação permitiram melhores conjuntos de dados e técnicas de IA mais sofisticadas. Os gigantes da tecnologia estão investindo pesado na área, na esperança de que os avanços nos jogos levem a avanços em outras áreas, como saúde, ciência e energia.

“Essas inovações têm implicações importantes além do pôquer, porque as interações de soma zero entre dois jogadores (em que um jogador vence e o outro perde) são comuns em jogos recreativos, mas são muito raras na vida real”, escrevem os pesquisadores em um blog. “Cenários do mundo real – como licitação em um leilão on-line ou tráfego de navegação – normalmente envolvem vários atores.”

VEJA TAMBÉM: As 13 melhores citações sobre o futuro da inteligência artificial

A Pluribus venceu jogadores profissionais bem ranqueados tanto em jogos com um humano e cinco AIs como em partidas com cinco humanos e uma AI. Entre os profissionais estavam Chris Ferguson, campeão do World Series of Poker, e Darren Elias, jogador americano profissional que detém o recorde de maior número de títulos do World Poker Tour.

Não havia dinheiro em jogo, mas os pesquisadores afirmam que, se cada ficha valesse um dólar, a Pluribus teria ganho em média US$ 5 por mão e cerca de US$ 1.000 por hora jogando contra cinco pessoas.

A Pluribus é uma versão superalimentada de outro bot de inteligência artificial chamado Libratus, que derrotou profissionais em jogos Texas Hold’em de dois jogadores, em 2017.

Diferente do Libratus, a Pluribus contém um algoritmo de busca on-line que pode avaliar suas opções pesquisando alguns movimentos à frente, bem como algoritmos de reprodução automática mais rápidos.

A combinação desses dois fatores tornou possível treinar a Pluribus usando relativamente pouco poder de processamento e memória. Os pesquisadores dizem que precisaram de apenas US$ 150 em recursos de computação em nuvem. “Essa eficiência contrasta com outros projetos recentes de inteligência artificial, que exigiam o equivalente a milhões de dólares em recursos de computação para treinamento”, escrevem eles.

 

O que dizem os profissionais

“É bem difícil jogar contra a Pluribus”, diz Ferguson. “É difícil apostar em qualquer tipo de mão. A AI também é muito boa em fazer apostas finas (thin value) no river e extrair valor de boas mãos.”

Elias acrescentou que a principal força da Pluribus é a capacidade de usar estratégias mistas, que é o que os humanos tentam fazer.

“É uma questão de execução para os seres humanos – para fazer isso de uma forma aleatória e consistente”, diz ele. “A maioria das pessoas simplesmente não consegue. O bot não estava apenas jogando contra alguns profissionais do meio da estrada. Ele estava jogando com alguns dos melhores jogadores do mundo”

Enquanto Pluribus pode causar arrepio na espinha dos jogadores profissionais de pôquer, que ganham a vida vencendo torneios online, eles não precisam se preocupar em enfrentar a IA em sua próxima partida.

“Não estamos transformando em open source. Um dos motivos é que o pôquer é jogado comercialmente e sentimos que o open source poderia impactar negativamente a comunidade”, diz o porta-voz do Facebook, Ari Entin.

Siga FORBES Brasil nas redes sociais:

Facebook

Twitter

Instagram

YouTube

Baixe o app de Forbes Brasil na Play Store e na App Store