Jan 03, 2024
Projeto de novo de luciferases usando aprendizado profundo
Natureza volume 614, páginas
Nature volume 614, páginas 774–780 (2023)Citar este artigo
68k acessos
4 Citações
494 Altmétrica
Detalhes das métricas
O design de enzimas de novo procurou introduzir sítios ativos e bolsos de ligação ao substrato que se prevê catalisar uma reação de interesse em andaimes nativos geometricamente compatíveis1,2, mas foi limitado pela falta de estruturas de proteínas adequadas e pela complexidade da sequência de proteínas nativas – relacionamentos de estrutura. Aqui, descrevemos uma abordagem de 'alucinação familiar' baseada em aprendizado profundo que gera um grande número de estruturas de proteínas idealizadas contendo diversas formas de bolso e sequências projetadas que as codificam. Usamos esses andaimes para projetar luciferases artificiais que catalisam seletivamente a quimioluminescência oxidativa dos substratos sintéticos da luciferina difenilterazina3 e 2-desoxicoelenterazina. Os sítios ativos projetados posicionam um grupo arginina guanidínio adjacente a um ânion que se desenvolve durante a reação em um bolso de ligação com alta complementaridade de forma. Para ambos os substratos de luciferina, obtemos luciferases projetadas com alta seletividade; a mais ativa delas é uma enzima pequena (13,9 kDa) e termoestável (com temperatura de fusão superior a 95 °C) que possui uma eficiência catalítica na difenilterazina (kcat/Km = 106 M−1 s−1) comparável à da luciferases nativas, mas uma especificidade de substrato muito maior. A criação de biocatalisadores altamente ativos e específicos a partir do zero com amplas aplicações em biomedicina é um marco importante para o design de enzimas computacionais, e nossa abordagem deve permitir a geração de uma ampla gama de luciferases e outras enzimas.
A luz bioluminescente produzida pela oxidação enzimática de um substrato de luciferina por luciferases é amplamente utilizada para bioensaios e imagens em pesquisas biomédicas. Como nenhuma fonte de luz de excitação é necessária, os fótons luminescentes são produzidos no escuro; isso resulta em maior sensibilidade do que a imagem de fluorescência em modelos de animais vivos e em amostras biológicas nas quais a autofluorescência ou fototoxicidade é uma preocupação4,5. No entanto, o desenvolvimento de luciferases como sondas moleculares ficou para trás em relação aos kits de ferramentas de proteínas fluorescentes bem desenvolvidos por várias razões: (i) muito poucas luciferases nativas foram identificadas6,7; (ii) muitos daqueles que foram identificados requerem múltiplas pontes dissulfeto para estabilizar a estrutura e, portanto, são propensos a mal dobramento em células de mamíferos8; (iii) a maioria das luciferases nativas não reconhece luciferinas sintéticas com propriedades fotofísicas mais desejáveis9; e (iv) imagens multiplexadas para seguir múltiplos processos em paralelo usando pares mutuamente ortogonais de luciferase-luciferina foram limitadas pela baixa especificidade de substrato das luciferases nativas10,11.
Procuramos usar o design de proteína de novo para criar luciferases pequenas, altamente estáveis, bem expressas nas células, específicas para um substrato e que não precisam de cofatores para funcionar. Escolhemos uma luciferina sintética, difenilterazina (DTZ), como substrato alvo devido ao seu alto rendimento quântico, emissão com desvio para o vermelho3, farmacocinética in vivo favorável12,13 e falta de cofatores necessários para a emissão de luz. Esforços anteriores de design de enzimas computacionais reaproveitaram principalmente andaimes de proteínas nativas no Protein Data Bank (PDB)1,2, mas há poucas estruturas nativas com bolsos de ligação apropriados para DTZ, e os efeitos das mudanças de sequência em proteínas nativas podem ser imprevisíveis (projetado feixes helicoidais também foram usados como andaimes enzimáticos14,15,16, mas estes são limitados em número e a maioria não possui bolsos adequados para ligação de DTZ). Para contornar essas limitações, nos propusemos a gerar um grande número de andaimes de proteínas pequenas e estáveis com bolsos de tamanho e forma apropriados para DTZ e com relações estrutura-sequência claras para facilitar a incorporação subsequente do sítio ativo. Para identificar as dobras de proteínas que são capazes de hospedar esses bolsos, primeiro inserimos DTZ em 4.000 proteínas nativas de ligação a pequenas moléculas. Descobrimos que muitas dobras semelhantes ao fator de transporte nuclear 2 (NTF2) têm bolsos de ligação com complementaridade de forma e tamanho apropriados para a colocação de DTZ (traços rosa na Fig. 1e) e, portanto, selecionamos a superfamília semelhante a NTF2 como a topologia alvo.