Por dentro dos bastidores bilionários do ChatGPT

Alex Konrad e Kenrick Cai

6 de fevereiro de 2023

Forbes

“A popularidade do ChatGPT foi inesperada dentro da empresa.”, afirma Ethan Pine, fundador da OpenAI

Em uma sala de conferências comum dentro do escritório da OpenAI, isolada da chuva de meados de janeiro que atinge São Francisco, o presidente da empresa, Greg Brockman, examina os “níveis de energia” da equipe que supervisiona o novo modelo de inteligência artificial da empresa, o ChatGPT. “Como estamos indo entre ‘tudo está pegando fogo e todo mundo queimado’ para ‘todo mundo acabou de voltar das férias e está tudo bem’? Qual é o espectro?” ele pergunta.

“Eu diria que as férias chegaram na hora certa”, responde uma líder. Isso é um eufemismo. Cinco dias após o lançamento do ChatGPT em novembro, 1 milhão de usuários sobrecarregaram seus servidores com perguntas triviais, sugestões de poesia e solicitações de receitas (A Forbes estima que agora são mais de 5 milhões). A OpenAI, silenciosamente, roteou parte da carga para seu supercomputador de treinamento, milhares de unidades de processamento gráfico (GPUs) interconectadas construídas sob medida com aliados como Microsoft e Nvidia, enquanto trabalha a longo prazo em seus próximos modelos , como o tão esperado GPT-4, que ficou em segundo plano.

À medida que o grupo se reúne, os servidores do ChatGPT em capacidade máxima ainda recusam os usuários. No dia anterior, ele caiu por duas horas. No entanto, em meio ao cansaço, esta sala cheia de funcionários, todos na faixa dos 20 e 30 anos, claramente apreciam seus papéis em um momento histórico. “A IA será debatida como o tema mais quente de 2023. E quer saber? Isso é apropriado”, diz Bill Gates, a pessoa responsável por uma mudança de paradigma anterior semelhante – conhecida como software. “Isso é tão importante quanto o PC, como a internet.”

Os mercados concordam. Avaliada em US$ 29 bilhões (R$ 146 bilhões) após um compromisso de investimento de US$ 10 bilhões (R$ 50 bilhões) da Microsoft, a OpenAI – especificamente, Brockman, 34, e seu chefe, o CEO Sam Altman, 37 – serve como garoto-propaganda de algo extraordinário. Mas dificilmente está sozinho. Na geração de imagens, a Amazon apoia discretamente a Stability AI (valor recente: US$ 1 bilhão – R$ 5 bilhões), cujo impetuoso CEO, Emad Mostaque, 39, aspira ser o Amazon Web Services da categoria.

A Hugging Face (US$ 2 bilhões – R$ 10 bilhões) fornece ferramentas para gigantes como Intel e Meta construírem e executarem modelos competitivos por conta própria. Abaixo dos provedores de IA generativa nesta pilha de tecnologia em desenvolvimento, Scale AI (US$ 7,3 bilhões – R$ 36,87 bilhões) e outros fornecem infraestrutura; acima deles, um ecossistema de aplicativos se desenvolve, canalizando a IA para um software especializado que pode alterar fundamentalmente os empregos de advogados e vendedores.

Existe hype? Bastante. A avaliação relatada para a OpenAI, prevendo agressivamente uma receita de US$ 200 milhões para 2023 (em comparação com a receita esperada de cerca de US$ 30 milhões (R$ 151 milhões) no ano passado, de acordo com parte de uma apresentação anterior para investidores observada pela Forbes), implicaria um múltiplo de preço para vendas no futuro, em comparação com um 10x ou 20x mais típico. (OpenAI recusou-se a comentar sobre suas finanças, exceto para dizer que o investimento foi multianual e multibilionário.)

Não importa que os insurgentes da IA não sejam disruptores puros – Amazon, Google, Microsoft, Nvidia e outros já lucram fornecendo a infraestrutura de nuvem que sustenta grande parte da categoria. O Google em particular, com seus enormes recursos e mais de uma década de pesquisa em aprendizado de máquina, é o “elefante na sala”, diz o investidor Mike Volpi da Index Ventures.

Desafios sociais? Esses também. Há potencial para viés e discriminação nos modelos, sem falar no uso indevido por pessoas mal-intencionadas. Brigas legais estão surgindo sobre a propriedade do trabalho gerado por IA e os dados reais usados para ensiná-los. Depois, há o objetivo final que alguns, como os líderes da OpenAI, vislumbram: uma “inteligência artificial geral” consciente e auto aperfeiçoada que poderia reimaginar o capitalismo (a esperança de Altman) – ou ameaçar a humanidade (o medo de outros, incluindo o de Elon Musk).

Mas, ao falar com mais de 60 pesquisadores, investidores e empreendedores da categoria, fica claro que essa corrida do ouro da IA também tem algo que faltou em outras maneiras recentes: substância comercial prática e até entediante. A corrida para incorporar ferramentas nos fluxos de trabalho da empresa, grandes e pequenas, já começou. As chamadas para trechos de código baseados em IA, ou APIs, aumentaram dez vezes em 2022, com mais aceleração em dezembro, de acordo com o provedor Rapid. Um estudo recente da Cowen com mais de 100 compradores de software corporativo descobriu que a IA emergiu como a principal prioridade de gastos entre as tecnologias emergentes. Os modelos ChatGPT e OpenAI estão chegando ao enorme conjunto de produtos da Microsoft, como Outlook e Word, com a maioria dos fabricantes de software de negócios prontos para seguir o exemplo rapidamente.

Um quarto de século depois que o programa Deep Blue da IBM derrotou o grande mestre de xadrez Garry Kasparov, a mudança para a inteligência artificial finalmente chegou. “É um momento emocionante”, disse Altman, tímido à imprensa, à Forbes, “mas minha esperança é que ainda seja extremamente cedo”.

Seu ponto de inflexão de IA também tem raízes em Londres, a sede da Estabilidade de Mostaque. Em agosto, logo após o lançamento beta do modelo de imagem da OpenAI, DALL-E, Mostaque lançou o Stable Diffusion, que permite a qualquer um transformar instantaneamente uma linha de texto em uma obra de arte ou transformar uma selfie monótona em um retrato dramático. Ao contrário do modelo proprietário da OpenAI, o Stability não possui o Stable Diffusion, que é de código aberto. Mas se tornou a maior força motriz e lucrativa por trás do projeto até agora. Em qualquer dia, 10 milhões de pessoas usam a difusão estável – mais do que qualquer outro modelo.

Essa adoção rápida provou ser um ponto de virada. Anteriormente, a IA existia em três reinos. O primeiro foi acadêmico: um artigo seminal demonstrando o poder das redes neurais, uma base fundamental do GPT e outros grandes modelos de linguagem (assim chamados porque podem escanear, traduzir e gerar texto) foi publicado há mais de uma década. A segunda foi demonstrativa: o Deep Blue criou uma corrida armamentista de acrobacias, com a unidade DeepMind da Alphabet criando no xadrez e no antigo jogo de tabuleiro Go. O terceiro foi incremental: aplicativos como o Gmail, que funciona sem IA, mas é melhor com recursos como o preenchimento automático.

O que nenhum deles tinha era a magia de brincar com a tecnologia em primeira mão que fez do Stability um avanço tão grande. Sua viralidade da noite para o dia foi suficiente para os investidores oferecerem à empresa uma avaliação de US$ 1 bilhão (R$ 5 bilhões) e mais de US$ 100 milhões (R$ 505 milhões) em financiamento em agosto, duas semanas após seu lançamento – praticamente sem receita.

Agora, a IA generativa explodiu, o grupo de música eletrônica Chainsmokers usou o Stable Diffusion para renderizar um videoclipe recente, e Mostaque prevê que em breve será usado para gerar filmes inteiros. O Museu Dalí em St. Petersburg, Flórida, está usando o DALL-E para ajudar os visitantes a visualizar seus sonhos, e uma ferramenta de geração de imagens semelhante da startup Midjourney provocou indignação online quando foi usada para criar uma obra de arte que ganhou o prêmio máximo na Feira Estadual do Colorado.

“Acho que este é um momento do Sputnik”, diz o CEO da Stripe, Patrick Collison, ex-chefe de Brockman, que diz estar ansioso para que as ferramentas de IA traduzam vídeos do YouTube ao vivo e os agrupem por temas identificados por IA.

À medida que o Stability proliferou, o OpenAI já havia decidido arquivar o ChatGPT para se concentrar em alternativas focadas no domínio, salvando a interface para uma versão posterior maior. Mas em novembro, ele havia revertido o curso. E em janeiro, quando o sistema de ensino público da cidade de Nova York proibiu o ChatGPT em seus computadores e um professor da Wharton que testou o programa deu nota “B” em seu exame final, a empresa ofereceu uma versão paga de teste da ferramenta para alguns usuários. “A Stable Diffusion jogou uma bomba na mistura, tornando as coisas dramaticamente mais acessíveis”, diz o investidor da Sequoia Pat Grady, um apoiador da OpenAI. “Isso realmente acendeu um fogo no OpenAI e fez com que eles se tornassem muito mais focados comercialmente.”

Isso, por sua vez, acelerou as aspirações comerciais em toda a indústria. Stability’s Mostaque dispensou toda a sua equipe durante as férias – ele próprio dormia a maior parte do tempo, interrompido apenas por ligações de pânico alimentadas pelo GPT de diretores das principais escolas do Reino Unido – com a ideia de que 2023 se tornaria cansativo enquanto ele tentava enfrentar não apenas OpenAI, mas Google e Meta. Sua mensagem para a equipe: “Vocês todos vão morrer em 2023.”

As maiores empresas de tecnologia do mundo aceitaram o desafio. No Google, os fundadores herméticos Sergey Brin e Larry Page retornaram à sede como parte de um “código vermelho” promulgado pelo CEO Sundar Pichai para abordar o ChatGPT e seus semelhantes; na Microsoft, o cofundador há muitos anos aposentado Bill Gates disse à Forbes que agora gasta cerca de 10% de seu tempo se reunindo com várias equipes sobre seus roteiros de produtos.

Google deve ter a vantagem. Em 2017, os pesquisadores da empresa inventaram o “T” no GPT, publicando um artigo sobre transformadores que, ao analisar o contexto de uma palavra em uma frase, tornou os grandes modelos de linguagem mais práticos. Um de seus autores, Aidan Gomez, lembra-se de implantar a tecnologia primeiro no Google Tradutor, depois na Pesquisa, Gmail e Documentos. Como é usado, no entanto, permanece principalmente nos bastidores – ou em suporte a produtos de publicidade, a maior parte de suas vendas – deixando os consumidores deslumbrados. “Eu estava esperando que o mundo começasse a pegar isso e construir com ele, e não estava acontecendo”, diz Gomez, que lançou seu próprio desafiante OpenAI, Cohere, em 2019. “Nada estava mudando.” Dos oito autores do artigo, seis deixaram o Google para abrir suas próprias empresas; outro saltou para o OpenAI.

Em vez disso, a Microsoft parece prestes a se tornar a líder do setor. Em 2019, Brockman e sua equipe perceberam que não poderiam pagar pela computação em larga escala que o GPT precisaria com o dinheiro que conseguiram arrecadar como uma organização sem fins lucrativos, inclusive de nomes como Peter Thiel e Musk. A OpenAI criou uma entidade com fins lucrativos para dar capital aos funcionários e contratar patrocinadores tradicionais, e Altman entrou a bordo em tempo integral. O CEO da Microsoft, Satya Nadella, comprometeu US$ 1 bilhão (R$ 5 bilhões) com a OpenAI na época e garantiu uma grande e crescente base de clientes em seu serviço de nuvem, o Microsoft Azure.

Agora, o investimento de US$ 10 bilhões (R$ 50 bilhões) da Microsoft se traduzirá na implantação do ChatGPT no pacote de software Office da Microsoft. O analista da RBC Capital Markets, Rishi Jaluria, que cobre a Microsoft, imagina um mundo “divisor de águas” em um futuro próximo, no qual os funcionários convertem documentos do Word em apresentações elegantes do PowerPoint com o apertar de um botão.

Durante anos, a questão do big data para grandes empresas tem sido como transformar hordas de dados em insights geradores de receita, diz Pegah Ebrahimi, cofundador da FPV Ventures, ex-CIO da unidade de banco de investimento do Morgan Stanley. Agora, os funcionários perguntam como podem implantar ferramentas de IA para analisar catálogos de vídeo ou incorporar chatbots em seus próprios produtos. “Muitos deles fizeram esse exercício nos últimos meses e chegaram à conclusão de que sim, é interessante e há lugares onde poderíamos usá-lo”, diz ela.

O grande debate dessa nova era da IA gira em torno de outra abreviação: “AGI”, ou inteligência artificial geral — um sistema consciente e autodidata que poderia, teoricamente, superar o controle humano. Ajudar a desenvolver essa tecnologia com segurança continua sendo a principal missão da OpenAI, dizem seus executivos. “A questão mais importante não será como fazer progresso técnico, mas quais serão os valores”, diz Brockman. No Stability, Mostaque zomba do objetivo como equivocado: “Não me importo com AGI. Se você quiser fazer AGI, pode trabalhar para OpenAI. Se você deseja obter coisas que vão para as pessoas, você vem até nós.”

Apoiadores da OpenAI, como o bilionário Reid Hoffman, que doou para sua organização sem fins lucrativos por meio de sua fundação de caridade, afirmam que alcançar um AGI seria um bônus, não um requisito para benefício global. Altman admite que tem “refletido muito” sobre se reconheceremos o AGI caso ele chegue. Atualmente, ele acredita que “não será um momento cristalino; será uma transição muito mais gradual.” Mas os pesquisadores alertam que o impacto potencial dos modelos de IA precisa ser debatido agora, pois uma vez liberados, eles não podem ser retirados. “É como uma espécie invasora”, diz Aviv Ovadya, pesquisador do Centro de Internet e Sociedade de Harvard. “Precisaremos de formulação de políticas na velocidade da tecnologia.”

No curto prazo, esses modelos e as empresas de alto nível por trás deles enfrentarão questões prementes sobre a ética de suas criações. OpenAI e outros jogadores usam fornecedores terceirizados para rotular alguns de seus dados e treinar seus modelos sobre o que está fora dos limites, perdendo algum controle sobre seus criadores. Uma revisão recente de centenas de descrições de trabalho escritas usando o ChatGPT por Kieran Snyder, CEO da fabricante de software Textio, descobriu que quanto mais personalizado o prompt, mais atraente a saída da IA - e mais potencialmente tendenciosa. As proteções da OpenAI sabem como impedir a entrada de termos explicitamente sexistas ou racistas. Mas a discriminação por idade, deficiência ou religião passou despercebida. “É difícil escrever regras editoriais que filtrem as inúmeras maneiras pelas quais as pessoas são fanáticas”, diz ela.

As leis de direitos autorais são outro campo de batalha. Microsoft e OpenAI são alvo de uma ação coletiva alegando “pirataria” de código de programadores. (Ambas as empresas recentemente apresentaram moções para rejeitar as reivindicações e se recusaram a fazer mais comentários.) A Stability foi recentemente processada pela Getty Images, que alega que a Stable Diffusion foi treinada ilegalmente em milhões de suas fotos proprietárias. Um porta-voz da empresa disse que ainda está analisando os documentos.

Ainda mais perigosos são os maus atores que podem usar deliberadamente a IA generativa para disseminar a desinformação – digamos, vídeos fotorrealistas de um tumulto violento que nunca realmente aconteceu. “Confiar nas informações faz parte da base da democracia”, diz Fei-Fei Li, codiretor do Instituto de Stanford para Inteligência Artificial Centrada no Homem. “Isso será profundamente impactado.”

Quem terá que responder a essas perguntas depende em parte de como o mercado de IA em rápido crescimento toma forma. “Nos anos 90, tínhamos AltaVista, Infoseek e cerca de dez outras empresas semelhantes, e você podia sentir no momento como se algumas delas estivessem indo para a lua”, diz Eric Vishria, sócio da Benchmark. “Agora eles se foram.”

O investimento da Microsoft na OpenAI, que vem com um acordo majoritário de participação nos lucros até que recupere seu investimento, mais uma participação limitada nos lucros adicionais, não tem precedentes, incluindo sua promessa de que a OpenAI eventualmente retornará ao controle sem fins lucrativos. (Altman e Brockman, respectivamente, chamam isso de “cancelamento de segurança” e “disjuntor automático” para evitar que a OpenAI concentre energia se ficar muito grande.) Alguns observadores da indústria veem o negócio com mais ironia como uma quase aquisição, ou pelo menos um aluguel, que mais beneficia Nadella. “Toda vez que íamos até eles para dizer: ‘Ei, precisamos fazer essa coisa estranha que você provavelmente vai odiar’, eles diziam: ‘Isso é incrível’”, diz Altman sobre o acordo. (A Microsoft se recusou a discutir os termos do acordo.)

Há outro aspecto pouco discutido desse acordo: a OpenAI pode obter acesso a vastos novos armazenamentos de dados do pacote Office da Microsoft – crucial, pois os modelos de IA exploram os documentos disponíveis na internet até a exaustão. O Google, é claro, já tem esse tesouro. Suas enormes divisões de IA trabalham com ela há anos, principalmente para proteger seus próprios negócios. Um bando de lançamentos de IA acelerados agora é esperado para 2023.

Na Stability, Mostaque se esforça para explicar seu negócio como focado na indústria criativa, mais como Disney e Netflix – acima de tudo, ficando fora do caminho do Google. “Eles têm mais GPUs do que você, mais talentos do que você, mais dados do que você”, diz ele. Mas Mostaque fez sua própria barganha faustiana com a Amazon. Uma parceria com a Stability permitiu que a líder em nuvem fornecesse mais de 4.000 chips Nvidia AI para a Stability montar um dos maiores supercomputadores do mundo. Mostaque diz que, há um ano, a Stability tinha apenas 32 dessas GPUs.

“Eles fecharam um negócio incrivelmente atraente”, diz ele. Por um bom motivo: a sinergia fornece uma fonte de lucro óbvia da computação em nuvem executada na Amazon Web Services e pode gerar conteúdo para seu braço de entretenimento Studios. Mas, além disso, o jogo da Amazon é uma questão em aberto.

Não se esqueça do pai da Apple e do Facebook Meta, que também possuem grandes unidades de IA. A Apple lançou recentemente uma atualização que integra o Stable Diffusion diretamente em seus sistemas operacionais mais recentes. Na Meta, o cientista-chefe de IA, Yann LeCun, reclamou com os repórteres e no Twitter sobre o burburinho do ChatGPT. Depois, há muitas startups que procuram construir ao redor e contra OpenAI, Stability e outros tipos. Clem Delangue, o CEO de 34 anos da Hugging Face, que hospeda o modelo de código aberto Stable Diffusion, prevê uma espécie de Aliança Rebelde, um ecossistema diversificado de IA menos dependente de qualquer jogador de Big Tech. Caso contrário, Delangue argumenta que os custos de tais modelos carecem de transparência e dependerão de subsídios da Big Tech para permanecerem viáveis. “É lavagem de dinheiro na nuvem”, diz ele.

Os players iniciantes existentes, como Jasper, um redator baseado em IA que criou ferramentas em cima do GPT e gerou uma receita estimada em US$ 75 milhões (R$ 378 milhões) milhões no ano passado, estão lutando para se manter acima da onda. A empresa já mudou o foco para usuários individuais, alguns dos quais pagavam US$ 100 (R$ 505,11) ou mais por mês por recursos agora cobertos pelo ChatGPT, com os próprios aplicativos planejados da OpenAI ainda por chegar. “Esse material é quebrado tão rapidamente que é como se ninguém tivesse uma vantagem”, diz o CEO Dave Rogenmoser.

Isso também se aplica ao OpenAI, o maior prêmio e o maior alvo do grupo. Em janeiro, uma startup fundada por ex-pesquisadores da OpenAI chamada Anthropic (apoiada mais recentemente por Sam Bankman-Fried, da empresa falida FTX), lançou seu próprio chatbot chamado Claude. O bot se compara ao ChatGPT em muitos aspectos, apesar de ter sido desenvolvido por uma fração do custo, diz o CEO da Scale AI, Alexandr Wang, um fornecedor de software de infraestrutura para ambos. “[Levanta] a questão: o que são os fossos? Acho que não há uma resposta clara.”

Na OpenAI, Brockman aponta para uma cláusula no estatuto sem fins lucrativos da empresa que promete, caso outra empresa esteja perto de alcançar a inteligência artificial geral, encerrar o trabalho da OpenAI e fundi-la no projeto concorrente. “Eu não vi ninguém adotar isso”, diz ele. Altman também não se incomoda com os detalhes das corridas de cavalos. O ChatGPT pode superar a pesquisa do Google? “As pessoas estão perdendo totalmente a oportunidade se você está focado nas notícias de ontem”, ele reflete. “Estou muito mais interessado em pensar no que vem além.”

Ler a seguir: 15 tendências para 2023 »

ChatGPTgoogleinteligência artificial (IA)MicrosoftOpenAI