Há uma nova empresa no cenário, cuja missão é facilitar a biologia da programação. A startup europeia chamada Cradle, está saindo do sigilo, depois de construir sua plataforma. A empresa, que atua em Delft, na Holanda, e Zurich, na Suiça, acaba de anunciar uma rodada de financiamento inicial de 5,5 milhões de euros (R$ 30,6 milhões na cotação atual) liderada pela Index Ventures, Kindred Capital e investidores anjos, incluindo John Zimmer, cofundador e presidente da Lyft, e Emily Leproust, CEO e fundadora da Twist Bioscience. Com dois locais – um em Delft, na Holanda, e outro em Zurique, na Suíça –, a Cradle abrange o mundo da biologia e da IA (inteligência artificial), uma poderosa fusão de tecnologias que ameaça interromper a maneira como os cientistas projetam proteínas.
Não se deixe enganar pelo foco aparentemente estreito da empresa em proteínas. Elas não são apenas algo que comemos – embora a engenharia de carne, ovo e laticínios sem origem animal seja de fato um grande foco da biologia sintética. As proteínas também são máquinas biológicas versáteis que sustentam quase todas as funções nas células vivas e têm tantos usos fora da biologia.
LEIA MAIS: Cocriagro, o hub de inovação que conecta startups do agronegócio
Pense nas enzimas usadas em detergentes, cosméticos e têxteis; ou anticorpos que fazem terapias poderosas; ou, na verdade, qualquer outra área da biotecnologia em que as proteínas catalisam reações para fabricar produtos, como produtos químicos a granel e especiais, aromas e fragrâncias, biocombustíveis, materiais e muito mais. Existem inúmeros usos para essas biomoléculas, e a Cradle quer obter ainda mais aplicações com a capacidade de projetar proteínas personalizadas que executam tarefas versáteis.
O cofundador e CEO da Cradle, Stef van Grieken, se autodescreve como “fornecedor de proteínas finas”. Ele passou a última década trabalhando no Google AI, liderando o desenvolvimento de vários aplicativos de aprendizado de máquina, bem como no X, a “fábrica moonshot” do Google, avaliando a viabilidade de projetos em estágio inicial. Durante seu mandato no Google, Grieken ficou fascinado com a linguagem das proteínas – como as sequências de aminoácidos se traduzem em padrões de dobramento específicos e formam estruturas que permitem que as proteínas executem suas funções sofisticadas. Desde então, ele tem trabalhado na ideia de combinar a tecnologia de processamento de linguagem natural com nossa compreensão de como a sequência de proteínas se traduz em função para fazer melhores previsões para o design racional dessas proteínas.
As proteínas de design são uma indústria multibilionária: o mercado está projetado para atingir US$ 3,9 bilhões (R$ 21 bilhões) até 2024, impulsionado em grande parte pela terapêutica baseada em proteínas. Mas poderia ser ainda maior: há um enorme potencial de ramificação para outras áreas da biologia sintética, se projetar proteínas personalizadas não fosse tão difícil. A maneira como a engenharia de proteínas é feita atualmente é por tentativa e erro no laboratório, e a taxa de sucesso típica de atingir as especificações do projeto é inferior a 1%. Para aumentar as chances de sucesso, os biólogos podem usar ferramentas de software como Rosetta ou AlphaFold para prever a estrutura da proteína com base em sua sequência. As proteínas começam como apenas cadeias de aminoácidos que se dobram em formas 3D como origami. Mas, prever o padrão de dobramento é um problema incrivelmente complexo, e um programa como o Rosetta requer anos de treinamento e milhares de computadores para funcionar.
A Cradle está abordando o problema de maneira diferente: eles estão usando um modelo generativo para “fazer engenharia reversa” de proteínas. Você pode ter ouvido falar ou até mesmo usado modelos generativos como DALL-E que podem criar novas imagens com base em uma entrada descritiva. Os fundadores da Cradle pensaram em aplicar o mesmo princípio para projetar novas arquiteturas de proteínas. Em vez de usar modelos de estrutura de sequência, eles usam algoritmos de aprendizado de máquina treinados em dados reais. O usuário pode especificar que tipo de proteína deseja projetar e a plataforma fornecerá uma lista de possíveis sequências que podem criar essa estrutura.
E a melhor parte é que você não precisa ser um especialista em aprendizado de máquina para usá-lo. “Os modelos de aprendizado de máquina generativo de autoaprendizagem e autoaperfeiçoamento da Cradle baseiam-se em avanços recentes no ‘processamento de linguagem natural’ para prever quais partes do código genético de uma proteína um biólogo precisará alterar, melhorando significativamente as chances de um cientista alcançar resultados experimentais positivos, sem a necessidade de experiência em aprendizado de máquina”, disse o CEO em um comunicado à imprensa. “Através deste método, Cradle acredita que pode reduzir o tempo e o custo de colocar um produto de biologia sintética no mercado em uma ordem de magnitude.”
Hoje, a maioria das empresas de biotecnologia e biologia sintética são deixadas por conta própria quando se trata de proteínas de engenharia. Os principais players no campo da engenharia de proteínas incluem Thermo Fischer, Danaher, Agilent Technologies e Bio-Rad, bem como empresas menores como Codexis, Genscript, Caribou Biosciences, Arzeda e Impossible Foods. Mas, para muitas empresas de biologia sintética, a engenharia de proteínas é um meio para um fim, e o que elas realmente estão focando são as aplicações posteriores de proteínas personalizadas. Cradle quer fornecer a eles uma ferramenta para melhorar suas chances de sucesso: “Queremos ajudar as equipes a projetar proteínas com menos experimentos e mais bem-sucedidos”, disse Grieken.
A Cradle em si não é uma empresa de biologia sintética nem de aprendizado de máquina – ambas são. “Não queríamos ser apenas uma empresa de aprendizado de máquina; você realmente tem que entender a biologia também”, disse Grieken. Com experiência em tecnologia de aprendizado de máquina e habilidades laboratoriais superiores que os membros de sua equipe trouxeram de empresas como Google, IBM, Zymergen e Perfect Day, a equipe de apenas 13 pessoas da Cradle construiu uma plataforma de trabalho em menos de um ano. Não há muitas outras empresas neste espaço. A Cyrus Bio, fundada pelo desenvolvedor da Rosetta, David Baker, professor da Universidade de Washington, é outra que usa o design de proteínas auxiliado por IA para o desenvolvimento de novas terapêuticas.
Para combinar com as diversas origens da equipe Cradle, a empresa atraiu investidores de diferentes áreas de tecnologia, incluindo a fundadora da empresa de síntese de DNA Twist Bioscience, Emily Leproust, e o presidente da Lyft, John Zimmer. O interesse da empresa que pega carona pode surpreender a princípio; mas muitos dos avanços no aprendizado de máquina vieram de outras áreas da tecnologia. O próprio cofundador da empresa, Jelle Prins, veio da Uber e esteve envolvido no design e construção dos primeiros aplicativos para muitas empresas de sucesso como Uber e Booking.com.
E é isso que acontece quando diferentes áreas da deep tech colidem: nasce uma galáxia de novas possibilidades. Grieken prevê que sua empresa potencialize as inovações da biologia sintética na área de produtos químicos e ingredientes, ciência e engenharia de materiais e outras áreas. “Esperamos ser um catalisador para que muitas outras empresas sejam construídas, porque o custo de colocar [produtos] no mercado deve cair”, diz ele. “Se você puder construir um produto de base biológica com uma equipe de 15 pessoas em alguns anos e apenas alguns milhões de dólares, isso seria um sucesso.”
O software da Cradle já está sendo usado por várias empresas, e elas querem distribuí-lo o mais amplamente possível. É por isso que a plataforma é gratuita para acadêmicos. A Cradle também está oferecendo termos de IP amigáveis, onde os usuários não precisam pagar royalties sobre nenhum produto desenvolvido usando a plataforma, bem como total privacidade e segurança para proteger segredos comerciais. “Queremos disponibilizar a todos para democratizar a engenharia de proteínas”, é a visão do CEO da Cradle.