Resumo:
- O português brasileiro e o europeu têm diferenças na formação de frases e nos gêneros das palavras;
- A equipe do Pygmallion é composta de linguistas que implementa os idiomas do mundo inteiro nos sistemas do Google;
- As informações coletadas são adaptadas pelos profissionais da língua e engenheiros de software com base na cultura de cada país.
Dispositivos que respondem por comando de voz são comuns no dia a dia. No caso dos aparelhos com sistema operacional Android, a função é ativada a partir do comando “ok, Google”. A função reconhece sua voz, interpreta o que foi dito e busca o melhor resultado. O processo parece simples, quase banal. Mas ele compreende o trabalho complicado de uma equipe de linguistas da gigante.
A nova aposta do Google para o mercado brasileiro, o Nest Mini, lançado em 11 de novembro (e nos EUA em outubro), é um dos ápices do recurso, também presente como Google Assistente em smartphones e outros dispositivos de internet das coisas (IoT). A caixa de som inteligente se integra a aos celulares, outras caixas, televisores, luzes e em termostatos, possibilitando ações nos dispositivos usando apenas a voz.
LEIA MAIS: Google oferece recompensa de US$ 1 milhão para quem conseguir hackear seus smartphones
Para que a tecnologia funcione como planejado, não é necessário só programação. O Google tem uma equipe interna, chamada Pygmallion, dedicada à compreensão de linguagem natural. O time é composto por 70 linguistas de todas as partes do mundo, que são responsáveis por diversos idiomas e por ensinar uma inteligência artificial (IA) a compreender as características de uma língua. A brasileira Larissa Rinaldi, especialista e doutora em linguística, fonologia gestual e aquisição de linguagem, é a encarregada pelo português brasileiro e o europeu. Ela conta sobre como funciona a aquisição de linguagem pelo dispositivo e como o Google está agora investindo em reconhecimento de sentimentos de fala.
Desafios
O português falado no Brasil e o de Portugal têm diversas diferenças. “Precisamos desenvolver conteúdos específicos para cada lugar. Não adianta fazer um só para os dois”, explica Larissa sobre os trabalhos dedicados em cada país. Diz ainda que fazer algo generalista não tem as “características e a identidade nacional”.
Nos idiomas falados em mais de um local, como inglês e espanhol, o desafio se repete. Para isso, é preciso a captação, o entendimento e a reprodução de que gêneros (masculino ou feminino) e de flexão de substantivos (singular ou plural). Por exemplo, quando um usuário quiser saber a altura do Monte Everest, a forma como a máquina irá ouvir e responder varia para cada local.
No português europeu e brasileiro, a especialista do Google aponta que a forma como as palavras são usadas e como as frases são construídas variam bastante. “Em Portugal, eles usam o termo ‘meter um música’, mas o uso do verbo aqui é dúbio. Por isso, temos de criar diferentes padrões para cada cultura”, justifica Larissa.
Uma particularidade do nosso português é uso do sujeito oculto. Por exemplo, quando um usuário perguntar “Quando foi o último show dos Beatles?”, e em seguida questionar “cantaram ‘Yellow Submarine’?”, a IA deve ter a capacidade de associar a segunda dúvida a primeira, sabendo que ainda se refere à banda. “Lidar com isso é bem complexo, por isso, a equipe de linguística atua com os engenheiros de software. Não adianta só coletar informações e jogá-las no sistema, precisamos ver a forma de adaptar cada um”, conta Larissa Rinaldi.
A linguista ainda relembra um momento marcante, entre 2013 e 2015. Quando começou a trabalhar com linguagem natural, integrava uma equipe de dez pesquisadores (mestres e doutores) responsáveis por “anotar palavras, funções sintáticas, morfológica, suas relações etc”, recorda Larissa sobre o processo de coleta de dados para a inteligência artificial”. O trabalho dos profissionais foi responsável por otimizar até as buscas no Google. A simples busca por “capinha celular” teve melhores resultados depois que o sistema entendeu, com as informações dos profissionais, a relação entre eles. “Quando ensinamos à máquina que ‘celular’ era um subjetivo que caracteriza a ‘capinha’, foi um avanço enorme para o buscador”, explica.
Futuro
Quando questionada sobre o que falta para que os sistemas de fala e IA alcancem a perfeição, Larissa diz que a tecnologia hoje é como nos primórdios dos computadores pessoais, em que as pessoas estão se acostumando.
“O primeiro caso que ainda precisamos alcançar é o de análise pragmática. Termos a capacidade de captar e fazer a máquina interpretar o tom e os sentimentos transmitidos pela voz”, detalha especialista. Para ela, quando isso for alcançado, “vamos ter algo realmente conversacional e totalmente dialógico. O que é mais difícil é aplicar isso aos diversos tópicos e assuntos. A gente já tem uma base para isso, apresentamos pesquisas e resultados em congressos”. Defende ainda que esse é um avanço que ninguém alcançou ainda, não só o Google.
Facebook
Twitter
Instagram
YouTube
LinkedIn
Baixe o app da Forbes Brasil na Play Store e na App Store.
Tenha também a Forbes no Google Notícias.