Projeto de novo de luciferases usando aprendizado profundo

Notícias

LarLar / Notícias / Projeto de novo de luciferases usando aprendizado profundo

Jan 03, 2024

Projeto de novo de luciferases usando aprendizado profundo

Natureza volume 614, páginas

Nature volume 614, páginas 774–780 (2023)Citar este artigo

68k acessos

4 Citações

494 Altmétrica

Detalhes das métricas

O design de enzimas de novo procurou introduzir sítios ativos e bolsos de ligação ao substrato que se prevê catalisar uma reação de interesse em andaimes nativos geometricamente compatíveis1,2, mas foi limitado pela falta de estruturas de proteínas adequadas e pela complexidade da sequência de proteínas nativas – relacionamentos de estrutura. Aqui, descrevemos uma abordagem de 'alucinação familiar' baseada em aprendizado profundo que gera um grande número de estruturas de proteínas idealizadas contendo diversas formas de bolso e sequências projetadas que as codificam. Usamos esses andaimes para projetar luciferases artificiais que catalisam seletivamente a quimioluminescência oxidativa dos substratos sintéticos da luciferina difenilterazina3 e 2-desoxicoelenterazina. Os sítios ativos projetados posicionam um grupo arginina guanidínio adjacente a um ânion que se desenvolve durante a reação em um bolso de ligação com alta complementaridade de forma. Para ambos os substratos de luciferina, obtemos luciferases projetadas com alta seletividade; a mais ativa delas é uma enzima pequena (13,9 kDa) e termoestável (com temperatura de fusão superior a 95 °C) que possui uma eficiência catalítica na difenilterazina (kcat/Km = 106 M−1 s−1) comparável à da luciferases nativas, mas uma especificidade de substrato muito maior. A criação de biocatalisadores altamente ativos e específicos a partir do zero com amplas aplicações em biomedicina é um marco importante para o design de enzimas computacionais, e nossa abordagem deve permitir a geração de uma ampla gama de luciferases e outras enzimas.

A luz bioluminescente produzida pela oxidação enzimática de um substrato de luciferina por luciferases é amplamente utilizada para bioensaios e imagens em pesquisas biomédicas. Como nenhuma fonte de luz de excitação é necessária, os fótons luminescentes são produzidos no escuro; isso resulta em maior sensibilidade do que a imagem de fluorescência em modelos de animais vivos e em amostras biológicas nas quais a autofluorescência ou fototoxicidade é uma preocupação4,5. No entanto, o desenvolvimento de luciferases como sondas moleculares ficou para trás em relação aos kits de ferramentas de proteínas fluorescentes bem desenvolvidos por várias razões: (i) muito poucas luciferases nativas foram identificadas6,7; (ii) muitos daqueles que foram identificados requerem múltiplas pontes dissulfeto para estabilizar a estrutura e, portanto, são propensos a mal dobramento em células de mamíferos8; (iii) a maioria das luciferases nativas não reconhece luciferinas sintéticas com propriedades fotofísicas mais desejáveis9; e (iv) imagens multiplexadas para seguir múltiplos processos em paralelo usando pares mutuamente ortogonais de luciferase-luciferina foram limitadas pela baixa especificidade de substrato das luciferases nativas10,11.

Procuramos usar o design de proteína de novo para criar luciferases pequenas, altamente estáveis, bem expressas nas células, específicas para um substrato e que não precisam de cofatores para funcionar. Escolhemos uma luciferina sintética, difenilterazina (DTZ), como substrato alvo devido ao seu alto rendimento quântico, emissão com desvio para o vermelho3, farmacocinética in vivo favorável12,13 e falta de cofatores necessários para a emissão de luz. Esforços anteriores de design de enzimas computacionais reaproveitaram principalmente andaimes de proteínas nativas no Protein Data Bank (PDB)1,2, mas há poucas estruturas nativas com bolsos de ligação apropriados para DTZ, e os efeitos das mudanças de sequência em proteínas nativas podem ser imprevisíveis (projetado feixes helicoidais também foram usados ​​como andaimes enzimáticos14,15,16, mas estes são limitados em número e a maioria não possui bolsos adequados para ligação de DTZ). Para contornar essas limitações, nos propusemos a gerar um grande número de andaimes de proteínas pequenas e estáveis ​​com bolsos de tamanho e forma apropriados para DTZ e com relações estrutura-sequência claras para facilitar a incorporação subsequente do sítio ativo. Para identificar as dobras de proteínas que são capazes de hospedar esses bolsos, primeiro inserimos DTZ em 4.000 proteínas nativas de ligação a pequenas moléculas. Descobrimos que muitas dobras semelhantes ao fator de transporte nuclear 2 (NTF2) têm bolsos de ligação com complementaridade de forma e tamanho apropriados para a colocação de DTZ (traços rosa na Fig. 1e) e, portanto, selecionamos a superfamília semelhante a NTF2 como a topologia alvo.

 92). We then installed catalytic sites in these scaffolds and designed the first shell-protein side chain–h-CTZ interactions using the histidine and arginine substrate interaction geometries that were most successful in the first round for DTZ. To design the remainder of the sequence, we used ProteinMPNN32, which can result in better stability, solubility and accuracy than RosettaDesign. After filtering on the basis of the AlphaFold2-predicted pLDDT, Cα RMSD, contact molecular surface and Rosetta-computed binding energies (see Supplementary Methods), we selected and experimentally expressed 46 designs in E. coli and identified 2 (HTZ3-D2 and HTZ3-G4) that had luciferase activity with the h-CTZ luciferin substrate. Both designs were highly soluble, monodisperse and monomeric, and the luciferase activities were of the same order of magnitude as LuxSit (Extended Data Fig. 4). The success rate increased from 3/7,648 to 2/46 sequences in the second round, probably owing to the knowledge of active-site geometry from the first round and the increased robustness of the ProteinMPNN method of sequence design./p>