Pesquisar
- Publicado
- Autores
-
Equipe do Google Deepmind Alphafold e Equipe Isomorphic Labs
Atualização do progresso: Nosso mais recente modelo de alfafold mostra uma precisão significativamente melhorada e expande a cobertura além das proteínas para outras moléculas biológicas, incluindo ligantes
Desde o seu lançamento em 2020, o Alphafold revolucionou como as proteínas e suas interações são entendidas. Google DeepMind e Laboratórios isomórficos tem trabalhado juntos para construir os fundamentos de um modelo de IA mais poderoso que expande a cobertura além de apenas proteínas para toda a gama de moléculas biologicamente relevantes.
Hoje estamos compartilhando uma atualização no progresso em direção à próxima geração de alfafold. Nosso modelo mais recente agora pode gerar previsões para quase todas as moléculas no Banco de dados de proteínas (PDB), freqüentemente atingindo a precisão atômica.
Desbloqueia um novo entendimento e melhora significativamente a precisão em várias classes de biomoléculas-chave, incluindo ligantes (pequenas moléculas), proteínas, ácidos nucleicos (DNA e RNA) e aqueles que contêm modificações pós-traducionais (PTMs). Esses diferentes tipos de estrutura e complexos são essenciais para entender os mecanismos biológicos dentro da célula e têm sido desafiadores para prever com alta precisão.
As capacidades e desempenho expandidos do modelo podem ajudar a acelerar os avanços biomédicos e a realizar a próxima era da ‘biologia digital’ – fornecendo novas idéias sobre o funcionamento de vias de doença, genômica, materiais biorrenowable, imunidade de plantas, alvos terapêuticos potenciais, mecanismos para design de drogas e design de drogas e Novas plataformas para ativar a engenharia de proteínas e a biologia sintética.
Série de estruturas previstas em comparação com a verdade do solo (branca) do nosso mais recente modelo de alfafold.
Acima e além da dobragem de proteínas
Alphafold foi um avanço fundamental para a previsão de proteínas de cadeia única. Alphafold-Multimer Em seguida, expandiu -se para complexos com múltiplas cadeias de proteínas, seguidas pelo alphafold2.3, que melhorou o desempenho e expandiu a cobertura para complexos maiores.
Em 2022, as previsões da estrutura de Alphafold para quase todas as proteínas catalogadas conhecidas pela ciência foram disponibilizadas gratuitamente através do Banco de dados de estrutura de proteínas alfafoldem parceria com o Instituto Europeu de Bioinformática da EMBL (EMBL-EBI).
Até o momento, 1,4 milhão de usuários em mais de 190 países acessaram o banco de dados do Alphafold, e cientistas de todo o mundo usaram as previsões da Alphafold para ajudar a avançar a pesquisa sobre tudo, desde acelerar as vacinas contra a malária e o avanço da descoberta de medicamentos ao câncer até o desenvolvimento de enzimas de consumo de plástico para a poluição por agrupamento .
Aqui, mostramos as habilidades notáveis de Alphafold para prever estruturas precisas além da dobragem de proteínas, gerando previsões de estrutura altamente precisas entre ligantes, proteínas, ácidos nucleicos e modificações pós-traducionais.
Desempenho entre complexos proteicos-ligantes (A), proteínas (B), ácidos nucleicos (C) e modificações covalentes (D).
Acelerando a descoberta de medicamentos
A análise precoce também mostra que nosso modelo supera bastante o alphafold2.3 em alguns problemas de previsão da estrutura de proteínas que são relevantes para a descoberta de medicamentos, como a ligação ao anticorpo. Além disso, prever com precisão as estruturas proteicas-ligantes é uma ferramenta incrivelmente valiosa para a descoberta de medicamentos, pois pode ajudar os cientistas a identificar e projetar novas moléculas, que podem se tornar medicamentos.
O padrão atual da indústria é usar ‘métodos de encaixe’ para determinar as interações entre ligantes e proteínas. Esses métodos de ancoragem requerem uma estrutura de proteína de referência rígida e uma posição sugerida para o ligante se ligar.
Nosso modelo mais recente define uma nova barra para a previsão da estrutura de proteínas-ligantes, superando os melhores métodos de acoplamento relatados, sem exigir uma estrutura de proteína de referência ou a localização da bolsa do ligante-permitindo previsões para proteínas completamente novas que não foram estruturalmente caracterizadas antes.
Ele também pode modelar em conjunto as posições de todos os átomos, permitindo representar a flexibilidade inerente total das proteínas e ácidos nucleicos à medida que interagem com outras moléculas – algo que não é possível usando métodos de encaixe.
Aqui, por exemplo, são três casos publicados recentemente, terapeuticamente relevantes em que as estruturas previstas de nosso modelo mais recente (mostradas em cores) correspondem de perto às estruturas determinadas experimentalmente (mostradas em cinza):
- Porcn: Uma molécula anticâncer em estágio clínico ligado ao seu alvo, juntamente com outra proteína.
- Kras: Complexo ternário com um ligante covalente (uma cola molecular) de um importante alvo de câncer.
- PI5P4Kγ: Inibidor alostérico seletivo de uma lipídio quinase, com múltiplas implicações de doença, incluindo câncer e distúrbios imunológicos.
Previsões para porcn (1), kras (2) e pi5p4kγ (3).
Os laboratórios isomórficos estão aplicando este modelo de alfafold de próxima geração ao design terapêutico de medicamentos, ajudando a caracterizar com rapidez e precisão muitos tipos de estruturas macromoleculares importantes para o tratamento de doenças.
Novo entendimento da biologia
Ao desbloquear a modelagem de estruturas de proteínas e ligantes, juntamente com os ácidos nucleicos e aqueles que contêm modificações pós-traducionais, nosso modelo fornece uma ferramenta mais rápida e precisa para examinar a biologia fundamental.
Um exemplo envolve a estrutura de Caslambda ligado a crRNA e DNAparte do Família Crispr. Caslambda compartilha a capacidade de edição do genoma do Sistema CRISPR-CAS9comumente conhecido como ‘tesoura genética’, que os pesquisadores podem usar para alterar o DNA de animais, plantas e microorganismos. O tamanho menor de Caslambda pode permitir um uso mais eficiente na edição do genoma.
Estrutura prevista de Caslambda (Cas12L) ligada ao crRNA e DNA, parte do subsistema CRISPR.
A versão mais recente da capacidade da Alphafold de modelar esses sistemas complexos mostra que a IA pode nos ajudar a entender melhor esses tipos de mecanismos e acelerar seu uso para aplicações terapêuticas. Mais exemplos são Disponível em nossa atualização de progresso.
Avançando a exploração científica
O salto dramático de nosso modelo no desempenho mostra o potencial da IA para melhorar bastante a compreensão científica das máquinas moleculares que compõem o corpo humano – e o mundo mais amplo da natureza.
Alphafold já catalisou grandes avanços científicos em todo o mundo. Agora, a próxima geração de Alphafold tem o potencial de ajudar a promover a exploração científica em velocidade digital.
Nossas equipes dedicadas nos laboratórios do Google DeepMind e Isomorphic fizeram grandes progressos a seguir nesse trabalho crítico e esperamos compartilhar nosso progresso contínuo.