Elon Musk, a pessoa mais rica do mundo de acordo com o ranking da Forbes , passou as últimas semanas reclamando que o Twitter está subestimando a quantidade de bots de spam na rede social, além de não ter recebido acesso aos dados para fazer uma avaliação independente. Segundo o bilionário, essa é uma condição para fechar a aquisição da empresa.
O Twitter, por sua vez, estima que os bots sejam menos de 5% das contas ativas, número registrado em muitos anos de registros na SEC (Comissão de Valores Mobiliários dos Estados Unidos). Desde que Musk acessou esse número, sua fixação parecia uma forma de achar um pretexto para renegociar sua oferta de US$ 44 bilhões (R$ 214 bilhões) em meio à grande queda nos preços das ações de tecnologia.
Na última segunda-feira (6), o advogado de Musk enviou ao Twitter uma carta concisa dizendo que era melhor entregar os dados ou então eles iriam considerar a recusa uma violação do acordo, um argumento duvidoso que provavelmente não se sustentaria no tribunal – mas que eles poderiam usar para tornar as coisas desagradáveis para a empresa.
Ontem (8), foi divulgado um movimento do à Musk do próprio Twitter. A empresa está se preparando para dar a ele acesso à chamada API “firehose”, um fluxo de todos os tuítes postados. (Todos. Os. Tuítes). Isso resulta em algo como 500 milhões de posts do microblog por dia. Um porta-voz do Twitter não comentou sobre como exatamente compartilharão esse tesouro com Musk, dizendo apenas: “O Twitter tem e continuará compartilhando informações cooperativamente com Musk para consumar a transação de acordo com os termos do acordo de fusão. Acreditamos que este acordo é do melhor interesse de todos os acionistas. Pretendemos fechar a transação e fazer cumprir o acordo de fusão no preço e nos termos acordados.”
Leia mais: Elon Musk e Twitter: o que acontece agora?
Para ser claro, é um exagero a rede social fornecer a Musk um acesso tão amplo como esse, um movimento que significa dizer: Você quer dados? Aqui estão todos os dados que temos. Não estamos escondendo nada. Aprecie! “Ele não precisa de acesso a tudo. Você não quer ter acesso a tudo”, diz Goran Muric, cientista da computação do Instituto de Ciências da Informação da USC que trabalhou com APIs semelhantes do Twitter.
Na verdade, Musk provavelmente só precisa da “API decahose” que o Twitter disponibiliza para alguns pesquisadores, que é 10% de todos os tweets. A diferença entre os resultados obtidos do “decahose” e do “firehose” é equivalente à diferença entre “uma pesquisa e um censo”, explica Muric. As pesquisas funcionam com tamanhos de amostra menores e mais fáceis de usar. “E você pode ter várias pesquisas o tempo todo e resultados praticamente precisos” que se encaixam com o que um censo mais amplo produziria, diz Muric.
Claro, é divertido ver o Twitter fazer uma jogada típica de Musk contra o próprio Musk – para tentar, ostensivamente, chamar seu blefe. Mas é improvável que a decisão dê um fim significativo à disputa entre o bilionário e a empresa que ele quer comprar. E não apenas porque Musk levará um tempo considerável para fazer uma análise de bots no Twitter, uma tarefa que exige uma equipe de pesquisadores que precisará construir laboriosamente um software para revisar os tuítes. Embora Musk possa usar seu acesso à API firehose para obter uma estimativa da atividade de bot no Twitter, parece quase inevitável que seu número não corresponda ao do Twitter.
Para começar, sua definição do que constitui uma conta de bot pode ser muito diferente da do Twitter. Musk pode definir um bot como quiser. Não há uma definição universalmente aceita, mesmo entre os principais pesquisadores da área.
“Se você colocar duas pessoas na sala e perguntar sobre a definição de qualquer coisa, elas terão uma opinião diferente – e especialmente sobre a definição do que é um bot no Twitter”, diz Muric. “Então, talvez, se alguém tuitar mais de 1.000 tuítes em um dia, ele é um bot, certo? Mas talvez outra pessoa diga: Deveria ser se eles tuitaram mais de 50 vezes”.
A melhor ferramenta para identificar bots, Botometer, que vem de uma equipe da Universidade de Indiana, oferece apenas um indicador aproximado da atividade do bot, fornecendo uma pontuação de probabilidade para saber se uma conta é um bot, nunca uma certeza. Com tanto espaço de manobra, Musk provavelmente pode usar a “API firehose” para reunir as conclusões que melhor se adequarem ao seu objetivo, o que, novamente, parece ser encontrar algum motivo para forçar o Twitter a aceitar um preço reduzido.
Além disso, não está claro se mesmo um esforço de boa fé por parte de Musk poderia replicar totalmente o processo do Twitter, correspondendo à sua estimativa interna. Para ser preciso, o Twitter disse que os bots representam menos de 5% de seus “usuários ativos diários monetizáveis”, um número criado pelo próprio Twitter. Com mais frequência, um aplicativo relatará usuários ativos mensais, pessoas que efetuaram login pelo menos uma vez nos últimos 30 dias.
Portanto, é incerto se até mesmo um Musk bem-intencionado poderia usar a “API firehose” para calcular o mesmo número de ativos diários monetizáveis usuários. Sua equação pode acabar com um numerador (o número de bots) e um denominador (aqueles usuários ativos diários monetizáveis) diferentes dos da aritmética do Twitter.
Outra questão: o que acontece se Musk detectar algum outro problema no Twitter ao passar pela “API firehose”? Brandon Silverman, fundador da ferramenta de dados de mídia social CrowdTangle, comprada pelo Facebook, apontou no Twitter que a plataforma pode acabar piorando a situação para si mesma.