A Biohub, empresa fundada por Mark Zuckerberg e sua esposa, Priscilla Chan, está lançando um modelo de IA (Inteligência Artificial) treinada para estudar a biologia das proteínas e, assim, projetar estruturas que possam ser úteis e mais precisos em tratamentos. O anúncio foi feito no site da empresa.
As proteínas são responsáveis por transportar oxigênio, combater vírus, formar músculos, regular células e fortalecer o sistema imunológico. No entanto, mesmo com o avanço da predição de suas estruturas, muitas delas ainda não são estudadas e suas funções seguem sendo um mistério.
Por isso, a empresa está lançando uma nova geração de Modelos Evolutivos em Escada (ESM, na sigla em inglês), que aprende com as sequências de proteínas pela evolução e usa esse conhecimento para representar, mapear, prever e projetar proteínas.
O sistema inclui três artefatos:
- ESMFold2, um modelo de última geração que prevê a estrutura de proteínas e impulsiona o projeto de novas proteínas;
- ESM Atlas, um mapa de 6,8 bilhões de sequências e 1,1 bilhão de estruturas previstas;
- e ESMC, um modelo de linguagem de proteínas de última geração treinado em aproximadamente 2,8 bilhões de sequências extraídas de toda a vida.
Segundo a Biohub, o modelo de IA pode ajudar no desenvolvimento de proteínas que se ligam a alvos moleculares específicos, sendo capaz de projetar proteínas com alta afinidade de ligação. Os resultados foram validados contra cinco alvos relevantes em oncologia e imunologia.
“Acreditamos que este seja um momento importante no design de proteínas. Quando as representações digitais da biologia se tornarem suficientemente precisas, os designs de proteínas poderão ser testados computacionalmente antes de chegarem à bancada de laboratório”, afirma a empresa.
Como o modelo de IA funciona?
O ESMC é o modelo mais recente de um programa de pesquisa que desenvolveu o primeiro modelo de linguagem transformer para sequências de proteínas em 2019. O treinamento desse modelo deve internalizar as propriedades fundamentais que governam a biologia das proteínas, ou seja, as regras que regem como elas se dobram, interagem e funcionam.
As proteínas são formadas por uma cadeia de aminoácidos que, quando unidos, podem formar uma vasta gama de combinações. A ordem desses aminoácidos determina como a cadeia se dobra em uma estrutura tridimensional, e esse dobramento determina qual função a proteína desempenhará no organismo.
Em estudos iniciais, os pesquisadores descobriram que os modelos aprendiam além das sequências dos aminoácidos. Eles foram capazes de codificar a estrutura e a função biológica das proteínas, incluindo propriedades que nunca haviam sido explicitamente demonstradas ao modelo.
Como isso pode ser usado na medicina?
Depois de aprender padrões biológicos das proteínas, o modelo conseguiu prever o formato tridimensional das moléculas, entender suas funções e, até mesmo, criar proteínas inéditas no computador.
Tudo isso possui o potencial de ser usado, futuramente, na medicina. Com a ajuda do modelo, pode ser possível projetar uma proteína que se liga a um alvo molecular específico com força e seletividade, com maior potencial terapêutico — e de forma muito mais rápida do que as abordagens clássicas da bioquímica.
Esse avanço é particularmente importante porque, atualmente, para um tratamento baseado em proteínas (como um anticorpo contra câncer) ser criado, os cientistas precisam descobrir qual proteína se liga ao alvo certo e se ela faz isso de forma precisa. É a chamada “medicina de precisão”. Porém, esse é um processo altamente custoso e demorado.
Com a IA, é possível simular proteínas e prever quais têm mais chances de funcionar contra um alvo específico. Segundo a Biohub, a ESMFold2 conseguiu criar anticorpos virtualmente com potencial terapêutico real ao analisar padrões biológicos das proteínas.
Para testar essa funcionalidade, os pesquisadores escolheram proteínas ligadas ao câncer, ao crescimento tumoral e ao sistema imunológico, como EGFR, PD-L1 e CTLA-4. A IA, então, gerou dezenas de milhares de proteínas, em cerca de dois dias, para testar qual funcionaria melhor contra esses alvos. Depois, calculou quais eram mais estáveis e tinham mais chances de virar um tratamento.
Segundo os resultados, ao aumentar o poder computacional da IA, a taxa de sucesso melhorou bastante, especialmente nos anticorpos mais difíceis de se ligarem aos alvos. Posteriormente, as melhores proteínas criadas pela IA foram testadas em laboratório e algumas foram capazes de se ligarem corretamente aos alvos de forma estável, demonstrando capacidade terapêutica.
“Embora as doenças sigam padrões comuns, grande parte delas é individual, e para certas doenças, como o câncer e doenças raras, o potencial é mais imediato. Demonstramos que a ESM pode projetar ligantes de proteínas validados em laboratório para cinco alvos clinicamente relevantes em poucos dias. O que este trabalho muda é a velocidade da etapa inicial desse processo, possibilitada porque essas ferramentas agora estão disponíveis para qualquer pesquisador, em qualquer lugar, que queira utilizá-las”, diz o comunicado da Biohub.

