AlphaGo – Biblioteca

AlphaGo é um agente de inteligência artificial (IA) especializado para jogar Go, um jogo de estratégia de tabuleiro chinês, contra concorrentes humanos. AlphaGo é um projeto do Google DeepMind.

A habilidade de criar um algoritmo de aprendizado que pode vencer um jogador humano em jogos estratégicos é uma medida do desenvolvimento da IA. AlphaGo é projetado como uma IA de auto-aprendizagem e joga contra si mesmo para dominar o complexo jogo estratégico de Go. Existem versões do AlphaGo que batem jogadores humanos mas novas versões ainda estão sendo criadas.

Go é um jogo de tabuleiro chinês similar ao xadrez com dois jogadores, um usando peças pretas e um branco, colocando uma peça em cada jogada. As peças são colocadas em uma grade que varia em tamanho de acordo com o nível de jogo até 19x19 pontos de colocação. O objectivo é capturar mais território (espaços vazios) ou peças inimigas, cercando-as com as suas peças. Apenas as posições que são horizontais e verticais em relação aos jogadores precisam de ser cobertas para capturar; não é necessário que sejam todas diagonais. As peças ou território podem ser capturadas individualmente ou em grupos.

Chess pode ser um jogo de tabuleiro mais famoso com peças brancas e pretas, mas Go tem um googol com mais jogadas possíveis. O número de posições possíveis faz uma abordagem tradicional de força bruta, como foi usado com o Big Blue da IBMs no xadrez, impossível com os computadores atuais. Essa diferença na complexidade do problema exigiu uma nova abordagem.

AlphaGo é baseado em um algoritmo de busca em árvore de Monte Carlo, olhando para uma lista de movimentos possíveis a partir de seu repertório de aprendizagem da máquina. Algoritmos e aprendizagem diferem entre as várias versões do AlphaGo. AlphaGo Master, a versão que venceu o campeão mundial de Go jogador Ke Jie, usa o aprendizado supervisionado. AlphaGo Zero, a versão de aprendizagem não supervisionada de AlphaGo, aprende jogando contra si mesmo. Primeiro, a IA joga aleatoriamente, depois com uma sofisticação crescente. Its increased sophistication is such that it consistently beats the Master version that dominates human players.

Watch SciShow cover AlphaGo in the video below: