“Eu diria que as férias chegaram na hora certa”, responde uma líder. Isso é um eufemismo. Cinco dias após o lançamento do ChatGPT em novembro, 1 milhão de usuários sobrecarregaram seus servidores com perguntas triviais, sugestões de poesia e solicitações de receitas (A Forbes estima que agora são mais de 5 milhões). A OpenAI, silenciosamente, roteou parte da carga para seu supercomputador de treinamento, milhares de unidades de processamento gráfico (GPUs) interconectadas construídas sob medida com aliados como Microsoft e Nvidia, enquanto trabalha a longo prazo em seus próximos modelos , como o tão esperado GPT-4, que ficou em segundo plano.
À medida que o grupo se reúne, os servidores do ChatGPT em capacidade máxima ainda recusam os usuários. No dia anterior, ele caiu por duas horas. No entanto, em meio ao cansaço, esta sala cheia de funcionários, todos na faixa dos 20 e 30 anos, claramente apreciam seus papéis em um momento histórico. “A IA será debatida como o tema mais quente de 2023. E quer saber? Isso é apropriado”, diz Bill Gates, a pessoa responsável por uma mudança de paradigma anterior semelhante – conhecida como software. “Isso é tão importante quanto o PC, como a internet.”
Os mercados concordam. Avaliada em US$ 29 bilhões (R$ 146 bilhões) após um compromisso de investimento de US$ 10 bilhões (R$ 50 bilhões) da Microsoft, a OpenAI – especificamente, Brockman, 34, e seu chefe, o CEO Sam Altman, 37 – serve como garoto-propaganda de algo extraordinário. Mas dificilmente está sozinho. Na geração de imagens, a Amazon apoia discretamente a Stability AI (valor recente: US$ 1 bilhão – R$ 5 bilhões), cujo impetuoso CEO, Emad Mostaque, 39, aspira ser o Amazon Web Services da categoria.
A Hugging Face (US$ 2 bilhões – R$ 10 bilhões) fornece ferramentas para gigantes como Intel e Meta construírem e executarem modelos competitivos por conta própria. Abaixo dos provedores de IA generativa nesta pilha de tecnologia em desenvolvimento, Scale AI (US$ 7,3 bilhões – R$ 36,87 bilhões) e outros fornecem infraestrutura; acima deles, um ecossistema de aplicativos se desenvolve, canalizando a IA para um software especializado que pode alterar fundamentalmente os empregos de advogados e vendedores.
Existe hype? Bastante. A avaliação relatada para a OpenAI, prevendo agressivamente uma receita de US$ 200 milhões para 2023 (em comparação com a receita esperada de cerca de US$ 30 milhões (R$ 151 milhões) no ano passado, de acordo com parte de uma apresentação anterior para investidores observada pela Forbes), implicaria um múltiplo de preço para vendas no futuro, em comparação com um 10x ou 20x mais típico. (OpenAI recusou-se a comentar sobre suas finanças, exceto para dizer que o investimento foi multianual e multibilionário.)
Não importa que os insurgentes da IA não sejam disruptores puros – Amazon, Google, Microsoft, Nvidia e outros já lucram fornecendo a infraestrutura de nuvem que sustenta grande parte da categoria. O Google em particular, com seus enormes recursos e mais de uma década de pesquisa em aprendizado de máquina, é o “elefante na sala”, diz o investidor Mike Volpi da Index Ventures.
Desafios sociais? Esses também. Há potencial para viés e discriminação nos modelos, sem falar no uso indevido por pessoas mal-intencionadas. Brigas legais estão surgindo sobre a propriedade do trabalho gerado por IA e os dados reais usados para ensiná-los. Depois, há o objetivo final que alguns, como os líderes da OpenAI, vislumbram: uma “inteligência artificial geral” consciente e auto aperfeiçoada que poderia reimaginar o capitalismo (a esperança de Altman) – ou ameaçar a humanidade (o medo de outros, incluindo o de Elon Musk).
Mas, ao falar com mais de 60 pesquisadores, investidores e empreendedores da categoria, fica claro que essa corrida do ouro da IA também tem algo que faltou em outras maneiras recentes: substância comercial prática e até entediante. A corrida para incorporar ferramentas nos fluxos de trabalho da empresa, grandes e pequenas, já começou. As chamadas para trechos de código baseados em IA, ou APIs, aumentaram dez vezes em 2022, com mais aceleração em dezembro, de acordo com o provedor Rapid. Um estudo recente da Cowen com mais de 100 compradores de software corporativo descobriu que a IA emergiu como a principal prioridade de gastos entre as tecnologias emergentes. Os modelos ChatGPT e OpenAI estão chegando ao enorme conjunto de produtos da Microsoft, como Outlook e Word, com a maioria dos fabricantes de software de negócios prontos para seguir o exemplo rapidamente.
LEIA MAIS: Criador do Gmail diz que o ChatGPT vai acabar com o Google
Seu ponto de inflexão de IA também tem raízes em Londres, a sede da Estabilidade de Mostaque. Em agosto, logo após o lançamento beta do modelo de imagem da OpenAI, DALL-E, Mostaque lançou o Stable Diffusion, que permite a qualquer um transformar instantaneamente uma linha de texto em uma obra de arte ou transformar uma selfie monótona em um retrato dramático. Ao contrário do modelo proprietário da OpenAI, o Stability não possui o Stable Diffusion, que é de código aberto. Mas se tornou a maior força motriz e lucrativa por trás do projeto até agora. Em qualquer dia, 10 milhões de pessoas usam a difusão estável – mais do que qualquer outro modelo.
Essa adoção rápida provou ser um ponto de virada. Anteriormente, a IA existia em três reinos. O primeiro foi acadêmico: um artigo seminal demonstrando o poder das redes neurais, uma base fundamental do GPT e outros grandes modelos de linguagem (assim chamados porque podem escanear, traduzir e gerar texto) foi publicado há mais de uma década. A segunda foi demonstrativa: o Deep Blue criou uma corrida armamentista de acrobacias, com a unidade DeepMind da Alphabet criando no xadrez e no antigo jogo de tabuleiro Go. O terceiro foi incremental: aplicativos como o Gmail, que funciona sem IA, mas é melhor com recursos como o preenchimento automático.
LEIA MAIS: O que é ChatGPT e como ele pode ser útil no dia a dia
Agora, a IA generativa explodiu, o grupo de música eletrônica Chainsmokers usou o Stable Diffusion para renderizar um videoclipe recente, e Mostaque prevê que em breve será usado para gerar filmes inteiros. O Museu Dalí em St. Petersburg, Flórida, está usando o DALL-E para ajudar os visitantes a visualizar seus sonhos, e uma ferramenta de geração de imagens semelhante da startup Midjourney provocou indignação online quando foi usada para criar uma obra de arte que ganhou o prêmio máximo na Feira Estadual do Colorado.
“Acho que este é um momento do Sputnik”, diz o CEO da Stripe, Patrick Collison, ex-chefe de Brockman, que diz estar ansioso para que as ferramentas de IA traduzam vídeos do YouTube ao vivo e os agrupem por temas identificados por IA.
Isso, por sua vez, acelerou as aspirações comerciais em toda a indústria. Stability’s Mostaque dispensou toda a sua equipe durante as férias – ele próprio dormia a maior parte do tempo, interrompido apenas por ligações de pânico alimentadas pelo GPT de diretores das principais escolas do Reino Unido – com a ideia de que 2023 se tornaria cansativo enquanto ele tentava enfrentar não apenas OpenAI, mas Google e Meta. Sua mensagem para a equipe: “Vocês todos vão morrer em 2023.”
As maiores empresas de tecnologia do mundo aceitaram o desafio. No Google, os fundadores herméticos Sergey Brin e Larry Page retornaram à sede como parte de um “código vermelho” promulgado pelo CEO Sundar Pichai para abordar o ChatGPT e seus semelhantes; na Microsoft, o cofundador há muitos anos aposentado Bill Gates disse à Forbes que agora gasta cerca de 10% de seu tempo se reunindo com várias equipes sobre seus roteiros de produtos.
LEIA MAIS: Tudo o que você precisa saber sobre o ChatGPT da OpenAI
Em vez disso, a Microsoft parece prestes a se tornar a líder do setor. Em 2019, Brockman e sua equipe perceberam que não poderiam pagar pela computação em larga escala que o GPT precisaria com o dinheiro que conseguiram arrecadar como uma organização sem fins lucrativos, inclusive de nomes como Peter Thiel e Musk. A OpenAI criou uma entidade com fins lucrativos para dar capital aos funcionários e contratar patrocinadores tradicionais, e Altman entrou a bordo em tempo integral. O CEO da Microsoft, Satya Nadella, comprometeu US$ 1 bilhão (R$ 5 bilhões) com a OpenAI na época e garantiu uma grande e crescente base de clientes em seu serviço de nuvem, o Microsoft Azure.
Agora, o investimento de US$ 10 bilhões (R$ 50 bilhões) da Microsoft se traduzirá na implantação do ChatGPT no pacote de software Office da Microsoft. O analista da RBC Capital Markets, Rishi Jaluria, que cobre a Microsoft, imagina um mundo “divisor de águas” em um futuro próximo, no qual os funcionários convertem documentos do Word em apresentações elegantes do PowerPoint com o apertar de um botão.
LEIA MAIS: ChatGPT tem recorde de crescimento da base de usuários
O grande debate dessa nova era da IA gira em torno de outra abreviação: “AGI”, ou inteligência artificial geral — um sistema consciente e autodidata que poderia, teoricamente, superar o controle humano. Ajudar a desenvolver essa tecnologia com segurança continua sendo a principal missão da OpenAI, dizem seus executivos. “A questão mais importante não será como fazer progresso técnico, mas quais serão os valores”, diz Brockman. No Stability, Mostaque zomba do objetivo como equivocado: “Não me importo com AGI. Se você quiser fazer AGI, pode trabalhar para OpenAI. Se você deseja obter coisas que vão para as pessoas, você vem até nós.”
Apoiadores da OpenAI, como o bilionário Reid Hoffman, que doou para sua organização sem fins lucrativos por meio de sua fundação de caridade, afirmam que alcançar um AGI seria um bônus, não um requisito para benefício global. Altman admite que tem “refletido muito” sobre se reconheceremos o AGI caso ele chegue. Atualmente, ele acredita que “não será um momento cristalino; será uma transição muito mais gradual.” Mas os pesquisadores alertam que o impacto potencial dos modelos de IA precisa ser debatido agora, pois uma vez liberados, eles não podem ser retirados. “É como uma espécie invasora”, diz Aviv Ovadya, pesquisador do Centro de Internet e Sociedade de Harvard. “Precisaremos de formulação de políticas na velocidade da tecnologia.”
LEIA MAIS: O que é algoritmo do pensamento e o que ele tem a ver com ChatGPT?
As leis de direitos autorais são outro campo de batalha. Microsoft e OpenAI são alvo de uma ação coletiva alegando “pirataria” de código de programadores. (Ambas as empresas recentemente apresentaram moções para rejeitar as reivindicações e se recusaram a fazer mais comentários.) A Stability foi recentemente processada pela Getty Images, que alega que a Stable Diffusion foi treinada ilegalmente em milhões de suas fotos proprietárias. Um porta-voz da empresa disse que ainda está analisando os documentos.
Ainda mais perigosos são os maus atores que podem usar deliberadamente a IA generativa para disseminar a desinformação – digamos, vídeos fotorrealistas de um tumulto violento que nunca realmente aconteceu. “Confiar nas informações faz parte da base da democracia”, diz Fei-Fei Li, codiretor do Instituto de Stanford para Inteligência Artificial Centrada no Homem. “Isso será profundamente impactado.”
Quem terá que responder a essas perguntas depende em parte de como o mercado de IA em rápido crescimento toma forma. “Nos anos 90, tínhamos AltaVista, Infoseek e cerca de dez outras empresas semelhantes, e você podia sentir no momento como se algumas delas estivessem indo para a lua”, diz Eric Vishria, sócio da Benchmark. “Agora eles se foram.”
Há outro aspecto pouco discutido desse acordo: a OpenAI pode obter acesso a vastos novos armazenamentos de dados do pacote Office da Microsoft – crucial, pois os modelos de IA exploram os documentos disponíveis na internet até a exaustão. O Google, é claro, já tem esse tesouro. Suas enormes divisões de IA trabalham com ela há anos, principalmente para proteger seus próprios negócios. Um bando de lançamentos de IA acelerados agora é esperado para 2023.
Na Stability, Mostaque se esforça para explicar seu negócio como focado na indústria criativa, mais como Disney e Netflix – acima de tudo, ficando fora do caminho do Google. “Eles têm mais GPUs do que você, mais talentos do que você, mais dados do que você”, diz ele. Mas Mostaque fez sua própria barganha faustiana com a Amazon. Uma parceria com a Stability permitiu que a líder em nuvem fornecesse mais de 4.000 chips Nvidia AI para a Stability montar um dos maiores supercomputadores do mundo. Mostaque diz que, há um ano, a Stability tinha apenas 32 dessas GPUs.
“Eles fecharam um negócio incrivelmente atraente”, diz ele. Por um bom motivo: a sinergia fornece uma fonte de lucro óbvia da computação em nuvem executada na Amazon Web Services e pode gerar conteúdo para seu braço de entretenimento Studios. Mas, além disso, o jogo da Amazon é uma questão em aberto.
Não se esqueça do pai da Apple e do Facebook Meta, que também possuem grandes unidades de IA. A Apple lançou recentemente uma atualização que integra o Stable Diffusion diretamente em seus sistemas operacionais mais recentes. Na Meta, o cientista-chefe de IA, Yann LeCun, reclamou com os repórteres e no Twitter sobre o burburinho do ChatGPT. Depois, há muitas startups que procuram construir ao redor e contra OpenAI, Stability e outros tipos. Clem Delangue, o CEO de 34 anos da Hugging Face, que hospeda o modelo de código aberto Stable Diffusion, prevê uma espécie de Aliança Rebelde, um ecossistema diversificado de IA menos dependente de qualquer jogador de Big Tech. Caso contrário, Delangue argumenta que os custos de tais modelos carecem de transparência e dependerão de subsídios da Big Tech para permanecerem viáveis. “É lavagem de dinheiro na nuvem”, diz ele.
Os players iniciantes existentes, como Jasper, um redator baseado em IA que criou ferramentas em cima do GPT e gerou uma receita estimada em US$ 75 milhões (R$ 378 milhões) milhões no ano passado, estão lutando para se manter acima da onda. A empresa já mudou o foco para usuários individuais, alguns dos quais pagavam US$ 100 (R$ 505,11) ou mais por mês por recursos agora cobertos pelo ChatGPT, com os próprios aplicativos planejados da OpenAI ainda por chegar. “Esse material é quebrado tão rapidamente que é como se ninguém tivesse uma vantagem”, diz o CEO Dave Rogenmoser.
Isso também se aplica ao OpenAI, o maior prêmio e o maior alvo do grupo. Em janeiro, uma startup fundada por ex-pesquisadores da OpenAI chamada Anthropic (apoiada mais recentemente por Sam Bankman-Fried, da empresa falida FTX), lançou seu próprio chatbot chamado Claude. O bot se compara ao ChatGPT em muitos aspectos, apesar de ter sido desenvolvido por uma fração do custo, diz o CEO da Scale AI, Alexandr Wang, um fornecedor de software de infraestrutura para ambos. “[Levanta] a questão: o que são os fossos? Acho que não há uma resposta clara.”