Em formação

Superpondo DNA

Superpondo DNA


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Tenho uma série de modelos de proteínas com DNA acoplado. Agora quero sobrepor o DNA a uma molécula de DNA de referência e extrair a distância translacional aplicada e o ângulo de rotação usado.

Posso sobrepor moléculas de DNA com Chimera, mas não consigo extrair a distância translacional e o ângulo de rotação que foi aplicado para sobrepor.

Eu também dei uma olhada no MODELLER, mas parece que o MODELLER não pode não sobrepor DNA.

Alguém conhece algum software / código pelo qual eu possa extrair as informações que desejo?


Experimente isso com BioPython:

de Bio.PDB.PDBSuperimposer import PDBSuperimposer como superimposer de Bio.PDB.PDBParser import PDBParser parser = PDBParser () sup = superimposer () struct_1 = parser.get_structure ("XXXX", "first_pdb") struct_2 = parser.get_structure ("XXXX "," second_pdb ") atoms1 = struct_1.get_atoms () atoms2 = struct_2.get_atoms () sup.set_atoms (atoms1, atoms2) print sup.rotrans # imprime a matriz de conversão de rotação do SVD #então para completar o alinhamento sup.apply ()

Você pode olhar aqui para mais detalhes. SuperPoser


Base estrutural para restaurar a ligação e transativação de DNA específico de sequência para mutante p53 por mutações supressoras ☆

A proteína supressora de tumor p53 sofre mutação em mais de 50% dos cânceres invasivos. Cerca de 30% das mutações são encontradas em seis códons principais de “pontos quentes” localizados em seu domínio central de ligação ao DNA. Para obter uma visão estrutural dos efeitos deletérios de tais mutações e seu resgate por mutações supressoras, determinamos as estruturas cristalinas do domínio central p53 incorporando a mutação de ponto quente R249S, o domínio central incorporando R249S e uma mutação supressora de segundo local H168R (referido como o mutante duplo R249S / H168R) e seu complexo específico de sequência com DNA e do mutante triplo R249S / H168R / T123A. Os estudos estruturais foram acompanhados por experimentos de transativação e apoptose. As estruturas cristalinas mostram que a região na vizinhança do local de mutação no mutante R249S exibe uma gama de conformações [tipo selvagem (wt) e várias conformações do tipo mutante] devido à perda de interações de estabilização mediadas por R249 no wt proteína. Como consequência, a superfície da proteína que é crítica para a formação de complexos funcionais p53-DNA, por meio de interações proteína-proteína e proteína-DNA, é amplamente distorcida nas conformações mutantes, explicando assim a proteína & # x27s "perda de função" como um fator de transcrição. A estrutura desta região é restaurada em R249S / H168R e R249S / H168R / T123A e é posteriormente estabilizada no complexo de R249S / H168R com DNA. Nossos dados funcionais mostram que a introdução de H168R como uma mutação supressora de segundo local restaura parcialmente a capacidade de transativação da proteína e que esse efeito é ainda amplificado pela adição de uma mutação de terceiro local T123A. Essas descobertas, juntamente com dados relatados anteriormente sobre p53 wt e mutante, fornecem uma estrutura estrutural para a compreensão da disfunção de p53 como resultado de mutações oncogênicas e seu resgate por mutações supressoras e para um projeto de droga potencial que visa restaurar a atividade wt para proteínas p53 aberrantes.


Superpondo DNA - Biologia

Todos os artigos publicados pela MDPI são disponibilizados imediatamente em todo o mundo sob uma licença de acesso aberto. Nenhuma permissão especial é necessária para reutilizar todo ou parte do artigo publicado pela MDPI, incluindo figuras e tabelas. Para artigos publicados sob uma licença Creative Common CC BY de acesso aberto, qualquer parte do artigo pode ser reutilizada sem permissão, desde que o artigo original seja claramente citado.

Os artigos de destaque representam a pesquisa mais avançada com potencial significativo de alto impacto no campo. Artigos de destaque são submetidos a convite individual ou recomendação dos editores científicos e passam por revisão por pares antes da publicação.

O artigo pode ser um artigo de pesquisa original, um estudo de pesquisa substancial que frequentemente envolve várias técnicas ou abordagens ou um artigo de revisão abrangente com atualizações concisas e precisas sobre os últimos avanços no campo que revisa sistematicamente os avanços mais interessantes na área científica literatura. Este tipo de papel fornece uma perspectiva sobre as futuras direções de pesquisa ou possíveis aplicações.

Os artigos do Editor’s Choice são baseados nas recomendações dos editores científicos de periódicos MDPI de todo o mundo. Os editores selecionam um pequeno número de artigos publicados recentemente na revista que eles acreditam ser particularmente interessantes para os autores ou importantes neste campo. O objetivo é fornecer um instantâneo de alguns dos trabalhos mais interessantes publicados nas várias áreas de pesquisa da revista.


Discussão

O avanço fundamental da microscopia de DNA é gerar imagens físicas de espécimes biológicos usando uma reação química não estruturada e autônoma. Isso o torna uma modalidade de imagem microscópica distinta em si. Como tecnologia, traçamos um paralelo próximo entre a microscopia de DNA e a super-resolução óptica: ambas tiram proveito da física estocástica para reduzir a incerteza de medição além do que pode parecer superficialmente ser um limite imposto pela física.

No entanto, os dois diferem de várias maneiras fundamentais. A microscopia óptica de super-resolução se baseia na mecânica quântica da decadência da energia fluorescente. A microscopia de DNA, no entanto, depende inteiramente da entropia termodinâmica. No momento em que marcamos biomoléculas com UMIs no protocolo de microscopia de DNA, a amostra ganha fontes pontuais de DNA estratificadas espacialmente e quimicamente distinguíveis. Esse processo, portanto, introduz um gradiente químico espacial na amostra que não existia anteriormente. Uma vez que essas fontes pontuais começam a se amplificar por PCR e se difundir, esse gradiente espacial começa a desaparecer. Essa homogeneização entrópica da amostra é o que faz com que diferentes nuvens de difusão de UMI interajam e se formem UEIs. É, portanto, esse aumento na entropia do sistema que mais diretamente direciona a reação de microscopia de DNA para registrar informações significativas sobre uma amostra.

Um ponto-chave de fraqueza para a microscopia de DNA continua a ser a resolução do espaço vazio, e trabalhos futuros serão necessários para eliminar esse obstáculo para produzir reconstruções de alta qualidade de amostras em grandes extensões onde há lacunas. É possível que uma abordagem baseada em “marcos”, em que sequências de DNA específicas sejam depositadas em locais físicos conhecidos para auxiliar no processo de reconstrução da imagem, venha a se provar a maneira mais econômica de se conseguir isso. Melhores técnicas analíticas para corrigir distorções em larga escala podem ser igualmente eficazes, sem complicar o próprio experimento. No entanto, o fato de a microscopia de DNA ser realizada inteiramente por pipeta significa que um grande número de amostras pode ser facilmente processado simultaneamente. A tecnologia é, portanto, estruturalmente conducente a um rendimento massivo.

A microscopia de DNA oferece uma nova forma de imagem sem ótica que alavanca as grandes economias de escala no sequenciamento de DNA. A tecnologia não requer o sacrifício da resolução espacial para a precisão da sequência, uma vez que se beneficia, ao invés de sofrer, da alta densidade do sinal e não depende da resolução óptica de "pontos" limitados por difração no local. Ao usar a própria química como meio de aquisição de imagem, a microscopia de DNA desacopla a resolução espacial da profundidade de penetração do espécime (de outra forma ligada pelas propriedades da radiação eletromagnética) e, assim, evita uma compensação imposta pela física da propagação de ondas.

Finalmente, como não depende de equipamento especializado e pode ser realizado em um formato de múltiplos poços com pipetas normais de laboratório, a microscopia de DNA é altamente escalonável. É totalmente compatível com multiplex (imagem de qualquer modelo de PCR) e usa profundidade de sequenciamento como um mostrador para aprimorar detalhes espaciais e genéticos. Além disso, como a microscopia de DNA lê a variação de um único nucleotídeo em sequências biológicas de DNA ou RNA, ela resolve espacialmente a variação potencial astronomicamente grande que existe em mutações somáticas, splicing de RNA estocástico, edição de RNA e formas semelhantes de diversidade genética em populações de células . Demonstramos que ele consegue isso com alta precisão em longos comprimentos de leitura.

Nosso desenvolvimento de um sistema de microscopia codificado quimicamente deixa em aberto questões teóricas e experimentais fundamentais. Por um lado, futuros aprimoramentos experimentais e computacionais ajudarão a resolver melhor escalas de grande comprimento que incluem lacunas espaciais. Por outro lado, o UEI, por funcionar eficazmente nesses experimentos como um análogo do DNA do fóton, iluminou um papel potencial mais amplo do DNA como meio para registros biológicos artificiais. Mais diretamente, a microscopia de DNA pode ser aplicada, em princípio, além do transcriptoma, por exemplo, diretamente a sequências de DNA ou a proteínas detectadas com anticorpos marcados com DNA. Olhando para o futuro, uma exploração completa de estruturas espaciais individuais e idiossincráticas no mundo biológico, codificando-as em bases de DNA, em vez de pixels fotônicos, pode revelar novas camadas de informação, de outra forma escondidas pelos limites da imagem ótica e baseada em elétrons.


RESULTADOS E DISCUSSÃO

Antes de discutir as distribuições de íons em torno dos oligômeros AGCT e ATGC, podemos primeiro perguntar se o uso do sistema CHC é de fato útil. Para testar isso, usaremos os átomos de fósforo pertencentes ao oligômero AGCT como exemplo.

Começamos registrando a posição de cada um desses átomos a partir de cada instantâneo de 1 ps ao longo da trajetória de 1 μs, usando as coordenadas helicoidais curvilíneas definidas na seção de metodologia. Cada átomo de fósforo é descrito por sua radial R, longitudinal D e angular UMA coordenadas (ver Figura 1). Isso implica que as flutuações gerais mais significativas do oligômero (alongamento, torção e flexão) não afetarão as coordenadas helicoidais que descrevem seus átomos constituintes. Para testar isso, primeiro geramos uma estrutura de DNA média a partir da trajetória. Em seguida, calculamos seu eixo helicoidal com Curves + (37) e o usamos para converter as coordenadas helicoidais instantâneas dos átomos de fósforo de cada instantâneo para um sistema de coordenadas cartesiano comum. A dispersão nas posições de cada átomo de fósforo pode então ser usada para gerar as superfícies de isodensidade mostradas à direita da Figura 1 (plotado usando Chimera (39, 40)). Mais quantitativamente, podemos calcular as flutuações quadradas médias (RMSF) para cada átomo de fósforo e comparar os valores com os obtidos simplesmente superpondo as coordenadas cartesianas de cada instantâneo. Os resultados na Figura 2 mostram que o método CHC leva a valores de RMSF menores em quase todos os casos. Esta redução é particularmente interessante no centro de cada fita, onde as flutuações gerais do oligômero não deveriam ter um efeito significativo.

As flutuações quadradas médias (Å) para os átomos de fósforo do oligômero AGCT são menores quando calculadas usando a análise CHC mapeada no espaço cartesiano (linhas pretas), do que simplesmente sobrepondo instantâneos da simulação de dinâmica molecular (linhas vermelhas). Observe que os fosfatos pertencentes às duas fitas são mostrados consecutivamente na direção 5′-3 ′.

As flutuações quadradas médias (Å) para os átomos de fósforo do oligômero AGCT são menores quando calculadas usando a análise CHC mapeada no espaço cartesiano (linhas pretas), do que simplesmente sobrepondo instantâneos da simulação de dinâmica molecular (linhas vermelhas). Observe que os fosfatos pertencentes às duas fitas são mostrados consecutivamente na direção 5′-3 ′.

Analisar a posição dos átomos de DNA em coordenadas helicoidais também é útil para fornecer posições de referência para ajudar na análise das distribuições de íons. Isso é ilustrado na Figura 3, onde plotamos as distribuições de fósforo no espaço de coordenadas helicoidal usando os três possíveis gráficos 2D: DA (canto superior esquerdo), DR (canto superior direito) e RA (inferior esquerdo). o DA plot (obtido pela soma da densidade de fósforo em todas as distâncias radiais R) mostra uma visão "desembrulhada" e "desenrolada" do oligômero. As densidades de fosfato de cada fita, consequentemente, levam a uma coluna de distribuições em constante UMA valores, com a menor separação entre as duas colunas correspondendo ao sulco menor da dupla hélice. No DR plot (obtido pela soma de todos os ângulos UMA), todos os átomos de fósforo são vistos a uma distância constante (R = 10,25 Å) do eixo helicoidal. Esta distância pode ser usada para definir um raio útil delimitando as ranhuras helicoidais, conforme mostrado pelo círculo branco no RA gráfico (obtido pela soma de todas as distâncias axiais D) Aqui, todas as distribuições de átomos de fósforo são sobrepostas e seguem de perto o R = Círculo de raio de 10,25 Å.

Distribuições médias de fósforo calculadas usando CHC para a trajetória AGCT de 1 μs e plotadas em vários planos: DA (canto superior esquerdo), DR (canto superior direito), RA (inferior esquerdo). O gráfico inferior direito mostra o RA plano para os átomos de açúcar C1 ′ da mesma trajetória. A escala de cor azul a vermelho representa o aumento da molaridade. DR e RA os gráficos mostram o raio médio dos átomos de fósforo do eixo helicoidal como uma linha branca e como um círculo branco, respectivamente. o DA e RA os gráficos mostram os limites do sulco menor, definidos pelas posições C1 ′ médias, como uma linha branca e como vetores radiais brancos, respectivamente. RA os gráficos também têm um vetor radial vertical indicando o centro do sulco principal.

Distribuições médias de fósforo calculadas usando CHC para a trajetória AGCT de 1 μs e plotadas em vários planos: DA (canto superior esquerdo), DR (canto superior direito), RA (inferior esquerdo). O gráfico inferior direito mostra o RA plano para os átomos de açúcar C1 ′ da mesma trajetória. A escala de cor azul a vermelho representa o aumento da molaridade. DR e RA os gráficos mostram o raio médio dos átomos de fósforo do eixo helicoidal como uma linha branca e como um círculo branco, respectivamente. o DA e RA os gráficos mostram os limites do sulco menor, definidos pelas posições C1 ′ médias, como uma linha branca e como vetores radiais brancos, respectivamente. RA os gráficos também têm um vetor radial vertical indicando o centro do sulco principal.

A Figura 3 contém um outro gráfico (canto inferior direito) correspondente a um RA análise dos átomos de açúcar C1 ′. Esses átomos constituem um guia útil para a posição do sulco menor, uma vez que refletem a posição das ligações glicosídicas. Observe que as densidades C1 ′ são mais estreitas do que as dos átomos de fósforo, pois são menos afetadas pelas flutuações do backbone, mas também porque, estando mais próximas do eixo helicoidal, são menos afetadas por efetivamente desenrolar a hélice B-DNA na hélice espaço de coordenadas (um efeito mais visível para os átomos de fósforo mais distantes no DA e RA parcelas). Desenhar vetores radiais através do centro das distribuições C1 ′ nos permite definir o sulco menor como situado entre UMA valores de 33 ° e 147 °. Nós pegamos os valores restantes de UMA pertencer ao sulco principal, uma vez que não atribuímos regiões especificamente aos backbones de fosfodiéster. Completamos o sistema de referência visual em RA plota adicionando uma linha ao longo da bissetriz externa dos vetores C1 ′ para indicar o centro do sulco principal. Observe que os vetores C1 ′ também podem ser usados ​​para mostrar a posição do sulco menor em 1D UMA plotagens (onde se tornam linhas verticais) e, da mesma forma, o raio de fósforo pode ser adicionado como uma linha vertical em 1D R plotagens (veja abaixo).

Devemos ressaltar que a utilidade da abordagem CHC depende de ter um eixo helicoidal bem definido. Curves + calcula um eixo curvilíneo que corre entre os pares de bases terminais do oligômero. No entanto, se ocorrer desfiamento significativo, isso pode levar a perturbações do eixo que serão refletidas nas coordenadas helicoidais usadas para descrever as posições atômicas (ou iônicas). Além disso, a posição dos íons além das extremidades do eixo helicoidal não será registrada.

Antes de prosseguir com a análise das distribuições de íons em torno do DNA, precisamos considerar a questão da convergência. Conforme mostrado abaixo, as principais densidades de íons ocorrem nas ranhuras de DNA (R ≤ 10,25 Å) e entre pares de bases sucessivos (definido aqui como N − 0.2 ≤ DN + 1,2 para uma etapa de par de base NpN + 1). Testamos, portanto, a convergência observando as populações médias de íons de potássio em função do tempo para as etapas de par de bases exclusivas pertencentes ao tetranucleotídeo central e nos sulcos maiores ou menores associados. Os resultados para o oligômero AGCT são mostrados na Figura 4 e os dados correspondentes para ATGC na Figura Suplementar S4. Ambas as figuras mostram que pelo menos 300 ns de simulação são necessários para atingir populações de íons estáveis ​​(e, em alguns casos, mudanças não desprezíveis podem ocorrer até 500 ns).

Populações de K + com média de tempo dentro das ranhuras de DNA para as etapas de par de bases exclusivas (T8pA9, A9pG10, G10pC11) pertencentes ao tetranucleotídeo central do oligômero AGCT para durações crescentes (ns) da trajetória de dinâmica molecular.

Populações de K + com média de tempo dentro das ranhuras de DNA para as etapas de par de bases exclusivas (T8pA9, A9pG10, G10pC11) pertencentes ao tetranucleotídeo central do oligômero AGCT para durações crescentes (ns) da trajetória de dinâmica molecular.

Um segundo teste de convergência é mostrado na Figura 5, onde simplesmente geramos as coordenadas cartesianas médias para o oligômero AGCT usando instantâneos de 1 ps e incluindo a posição de todos os íons K + (azul) e Cl - (verde). Quando a média é feita ao longo de algumas dezenas de nanossegundos de simulação, os íons tendem a amostrar volumes limitados da célula de simulação (15) e são, portanto, claramente distinguíveis. No entanto, após 1 μs de simulação, todas as posições médias dos íons coincidem na origem da célula de simulação, mostrando que eles tiveram tempo para amostrar completamente a célula de simulação completa de maneira equivalente, satisfazendo o princípio da ergodicidade.

Conformação média do oligômero AGCT (desenho de linha preta) e as localizações médias associadas dos íons K + (esferas azuis) e Cl - (esferas verdes) calculados para aumentar as durações da trajetória da dinâmica molecular.

Conformação média do oligômero AGCT (desenho de linha preta) e as localizações médias associadas dos íons K + (esferas azuis) e Cl - (esferas verdes) calculados para aumentar as durações da trajetória da dinâmica molecular.

Tendo mostrado que uma convergência razoável foi alcançada, nos voltamos para uma análise geral das distribuições de íons de potássio em torno do oligômero AGCT. Começamos com 1D R, D e UMA plotagens mostradas na Figura 6. A distância radial R gráfico, que também é uma função de distribuição radial, mostra dois picos dentro das ranhuras e um além do raio do átomo de fósforo (indicado pela linha vertical). Observe que a molaridade máxima para o pico mais próximo do eixo helicoidal atinge quase 14 vezes o valor em massa, ao passo que, em 30 Å, o valor caiu ligeiramente abaixo da molaridade em massa efetiva (0,336 M, levando em consideração os íons K + extras adicionados a atingir a neutralidade). A distância do eixo D gráfico mostra duas características interessantes: primeiro, três perfis repetidos que estão em registro com a sequência de base de repetição e que mostram fortes picos de molaridade em três etapas consecutivas de GpC, segundo, uma diminuição na densidade de íons em direção às extremidades do oligômero, refletindo a densidade decrescente de fosfato (41). Por último, o angular UMA o gráfico mostra que os picos de densidade do íon potássio ocorrem em ambas as ranhuras.

Distribuições 1D K + em média ao longo da trajetória AGCT de 1 μs. A linha vertical no R gráfico indica a posição radial dos átomos de fósforo, enquanto a distância mais curta entre as duas linhas verticais no UMA o gráfico delimita o sulco menor usando a posição angular dos átomos de açúcar C1 ′ (ver Figura 3).

Distribuições 1D K + em média ao longo da trajetória AGCT de 1 μs. A linha vertical no R gráfico indica a posição radial dos átomos de fósforo, enquanto a distância mais curta entre as duas linhas verticais no UMA o gráfico delimita o sulco menor usando a posição angular dos átomos de açúcar C1 ′ (ver Figura 3).

Podemos refinar ainda mais essa análise passando para representações 2D. A Figura 7 mostra o DA e RA gráficos para íons de potássio, novamente em torno do oligômero AGCT (com amostragem radial limitada a 15 Å). Isso nos permite identificar o R pico mais próximo do eixo helicoidal (visto na Figura 6) como ligação de íons no centro do sulco principal, enquanto no lado do sulco menor há uma densidade mais difusa com dois máximos (ver o DA e RA parcelas). Antes de preencher os detalhes das distribuições de íons de potássio, vale a pena comparar esses resultados com os dos ânions de cloro. A Figura Suplementar S5 mostra que os ânions de cloro quase não têm densidade dentro do raio do fósforo, embora comecem a penetrar quando a densidade do fosfato diminui em direção às extremidades do oligômero (ver o DR enredo). Como esperado, essa penetração ocorre principalmente no lado do sulco principal mais largo (ver o RA enredo).

Distribuições 2D K + em média ao longo da trajetória AGCT de 1 μs: DA plano (canto superior esquerdo), DR plano (canto superior direito), RA plano (inferior). Os resultados são plotados como molaridades, conforme mostrado pelas barras coloridas, com uma escala de azul a vermelho indicando valores crescentes.

Distribuições 2D K + em média ao longo da trajetória AGCT de 1 μs: DA plano (canto superior esquerdo), DR plano (canto superior direito), RA plano (inferior). Os resultados são plotados como molaridades, conforme mostrado pelas barras coloridas, com uma escala de azul a vermelho indicando valores crescentes.

A fim de completar a análise de íons de potássio, é útil olhar para as distribuições de íons 3D reconstruídas a partir das coordenadas helicoidais instantâneas usando um único eixo helicoidal médio (como para os cálculos RMSF na Figura 2). Essas distribuições são mostradas como gráficos de isodensidade na Figura 8. A imagem à esquerda mostra a conformação média do DNA como um diagrama de fios com distribuições de íons K + em dois níveis de isodensidade: 15 M (volumes sólidos vermelhos) e 5 M (malha verde). A imagem certa mostra as mesmas isodensidades, mas com uma visão superficial do DNA que ajuda a localizar os íons dentro das ranhuras maiores e menores. Como já visto na Figura 4, as maiores densidades de íons ocorrem no sulco principal das etapas de GpC, enquanto as maiores densidades de sulco menor ocorrem nas etapas de TpA.

Distribuições 3D K + obtidas mapeando a análise de CHC da trajetória AGCT de 1 μs no espaço cartesiano em relação à estrutura média do DNA, mostrada como um desenho de linha à esquerda (G: azul, C: verde, A: vermelho, T: laranja ) e como uma superfície acessível por solvente cinza à direita. Superfícies de isodensidade de molaridade para íons de potássio são plotadas em 15 M (vermelho sólido) e 5 M (malha verde).

Distribuições 3D K + obtidas mapeando a análise de CHC da trajetória de 1 μs AGCT no espaço cartesiano em relação à estrutura média do DNA, mostrada como um desenho de linha à esquerda (G: azul, C: verde, A: vermelho, T: laranja ) e como uma superfície acessível por solvente cinza à direita. Superfícies de isodensidade de molaridade para íons de potássio são plotadas em 15 M (vermelho sólido) e 5 M (malha verde).

Nesta fase, é útil comparar o oligômero AGCT com os resultados obtidos para a sequência ATGC. Embora o último oligômero tenha uma estrutura geral B-DNA semelhante e o mesmo equilíbrio 50/50 de pares de bases AT e GC, sua distribuição de íons é bastante diferente, conforme mostrado pelas imagens 3D na Figura Suplementar S6. O uso das mesmas superfícies de isodensidade da Figura 8 deixa claro que as densidades locais de K + ocupam volumes menores em ambas as ranhuras. No sulco principal, eles estão novamente localizados em GpC, enquanto no sulco menor as densidades são consideravelmente mais fracas e associadas a etapas ApT.

Usando as informações 3D, podemos agora retornar ao 2D RA gráficos para uma análise detalhada e quantitativa para as etapas individuais do par de bases e para cada ranhura. A Figura 9 mostra os resultados para etapas de par de bases únicas do tetranucleotídeo central de cada oligômero: TpA, ApG e GpC para o oligômero AGCT e ApT, TpG e GpC para o oligômero ATGC. Em cada caso, as populações médias de íons dentro das ranhuras são mostradas (correspondendo aos dados já plotados na Figura 4). É surpreendente que as etapas de GpC no oligômero AGCT tenham íons de potássio fortemente localizados em seus sulcos principais quase 80% do tempo. Este valor diminui um pouco, mas ainda excede 60%, para a mesma etapa no oligômero ATGC. Esses principais sítios de ligação de íons levam a molaridades locais acima de 50 M, quase 150 vezes maiores do que as concentrações de íons de potássio em massa. Os locais de ligação de íons secundários, ocupados cerca de 25-35% do tempo, ocorrem no sulco menor das etapas de TpA e no sulco principal das etapas de ApG para AGCT, e também nos sulcos principais das etapas de ApT e TpG para ATGC.

2D RA Distribuições de K + para várias etapas de dinucleotídeo dentro dos tetranucleotídeos centrais dos oligômeros AGCT e ATGC, em média ao longo das trajetórias de 1 μs correspondentes. A escala de cor azul a vermelho indica valores crescentes de molaridade. Em cada gráfico, os números nos semicírculos superior e inferior indicam a ocupação média de K + nos sulcos maior e menor, respectivamente.

2D RA Distribuições de K + para várias etapas de dinucleotídeo dentro dos tetranucleotídeos centrais dos oligômeros AGCT e ATGC, em média ao longo das trajetórias de 1 μs correspondentes. A escala de cor azul a vermelho indica valores crescentes de molaridade. Em cada gráfico, os números nos semicírculos superior e inferior indicam a ocupação média de K + nos sulcos maior e menor, respectivamente.

Finalmente, consideramos a questão de se a ligação de cátions dentro das ranhuras do DNA está relacionada a flutuações na largura da ranhura. Esta questão tem sido objeto de extensas discussões (1, 4, 12, 15, 20), argumentando-se que os cátions ligados devem ser capazes de neutralizar a repulsão de fosfato e levar ao estreitamento do sulco. As conclusões, no entanto, não eram claras, em parte porque era difícil definir o que "estar dentro das ranhuras" significava de um ponto de vista geométrico. Podemos agora revisitar esta questão à luz da análise de íons CHC. Para isso, adicionamos as variações da largura da ranhura à distância do eixo 1D D gráficos de densidade de íons K +, onde a soma ao longo R agora foi limitado às ranhuras (R = 0–10,25 Å) e a soma dos ângulos UMA foi limitado ao sulco menor ou maior. A Figura 10 mostra os resultados para o oligômero AGCT. Para este caso, há uma oscilação nítida de ambas as larguras de sulco (linhas pontilhadas), em registro com a sequência de repetição do tetranucleotídeo. Essa oscilação está relacionada a picos na densidade do íon, mas observe que as ranhuras são largas quando a densidade do íon nas ranhuras é alta. Essas descobertas são contraditórias a um argumento baseado no estreitamento do sulco devido à compensação da repulsão do fosfato. No oligômero ATGC (ver Figura Suplementar S7), as larguras do sulco variam significativamente menos ao longo da sequência (exceto nas extremidades do oligômero), mas novamente não há indicação de que a ligação do íon leva ao estreitamento do sulco. A confirmação dessas descobertas exigirá, no entanto, o estudo de uma gama mais ampla de sequências de bases.

Variações na molaridade de K + ao longo dos sulcos de DNA (linhas sólidas) do oligômero AGCT. Os valores são calculados em média ao longo da trajetória de AGCT de 1 μs e comparados com as variações na largura da ranhura (linhas pontilhadas). As variações da largura do sulco são representadas graficamente em Å em relação aos respectivos valores mínimos (maior: 10,0 Å, menor: 3,5 Å) na mesma escala que as molaridades. Esquerda: groove principal. À direita: sulco menor.

Variações na molaridade de K + ao longo dos sulcos de DNA (linhas sólidas) do oligômero AGCT. Os valores são calculados em média ao longo da trajetória de AGCT de 1 μs e comparados com as variações na largura da ranhura (linhas pontilhadas). As variações da largura do sulco são representadas graficamente em Å em relação aos respectivos valores mínimos (maior: 10,0 Å, menor: 3,5 Å) na mesma escala que as molaridades. Esquerda: groove principal. À direita: sulco menor.


CONCLUSÃO

Dobrar alguns segmentos de nucleotídeos de uma cadeia macromolecular como um bastão rígido e fino da teoria da elasticidade é um dos modelos conceituais mais simples para dobrar macromoléculas de DNA ou RNA em grampos de cabelo. Com esta ideia simples, mostramos que B-DNA de fita simples pode ser deformado em loops em gancho que correspondem não apenas a todos os dados de NMR publicados disponíveis para loops TTT de trinucleotídeo (5), mas também as estruturas PDB de tri e tetra-loops de DNA. Mostramos, além disso, que A-RNA de fita simples pode ser deformado com a mesma metodologia de dobramento em tetraloops UUCG. Observe que as formas dos grampos de DNA e RNA são diferentes, mas são bem reproduzidas pela mesma metodologia aplicada com as diferentes condições finais impostas pelas geometrias helicoidais B-DNA ou A-RNA. Esses resultados tendem a demonstrar que as propriedades elásticas das cadeias de açúcar-fosfato desempenham um papel fundamental para entender as formas de dobramento do DNA e do RNA em grampos de cabelo. Até agora, vários tipos principais de interações foram invocados para explicar a notável estabilidade de todos os grampos de cabelo em estudo: ligações de hidrogênio específicas, empilhamento e interações hidrofóbicas. As cadeias de açúcar-fosfato parecem se dobrar ao longo das linhas mais suaves de menor energia de deformação (dada pela teoria da elasticidade) e a maioria dos ângulos de torção permanecem próximos de seus valores iniciais (B-DNA ou A-RNA). Isso sugere que, para essas moléculas, as propriedades elásticas das cadeias de açúcar-fosfato são uma importante contribuição estrutural e energética para o dobramento em grampo que pode ser responsável por sua estabilidade extraordinária.

De acordo com as descrições usuais, os grampos de cabelo são hastes emparelhadas de base dupla helicoidal encimadas por uma sequência de alça de nucleotídeos desemparelhados ou incompatíveis. Na visão proposta, essas incompatibilidades estranhas (G · A em tetra‐ e tri-loops, A · A em triloop AAA, ou U · G em UUCG) devem ser considerados como pares de bases muito bons que satisfazem os requisitos geométricos impostos por a dobra do BCE. Em contraste, observe que os pares de bases Watson-Crick não atenderiam bem a esses requisitos.

Os novos ângulos de parâmetro, Ω, oferecem uma simplificação muito coerente das descrições de loops em gancho contendo pares de bases G · A, A · A ou U · G. Mais estudos são necessários para verificar se outros hairpins podem ser reproduzidos com a abordagem BCE e descritos em termos de ângulos de parâmetro, Ω. Se assim for, eles forneceriam as primeiras medições quantitativas para classificar e compreender as estruturas de alças em gancho de DNA e RNA e, possivelmente, de muitas outras macromoléculas biológicas importantes.


Resultados

Determinação da estrutura

Para fins de cristalização, usamos uma forma truncada de ApeXPF compreendendo os resíduos 19-231 (denotado como ApeXPF em todo). Em solução, o ApeXPF forma homodímeros, assim como faz os homodímeros intimamente relacionados Sulfolobus solfataricus XPF (SsoXPF) (Lally et al, 2004 Roberts et al, 2004). ApeXPF pode ser estimulado por um PCNA heterotrimérico para clivar estruturas de flap 3 ', no entanto, SsoXPF tem uma atividade mais robusta em um ensaio de nuclease e, portanto, usamos SsoXPF para a análise mutacional (Figura Suplementar S1). Tentamos cristalizar ApeXPF na presença de DNA com uma ampla gama de retalhos 3 ′, grampos de cabelo e estruturas em Y, e em alguns casos obtivemos cristais, mas nenhum com boas propriedades de difração. Os cristais trigonais foram eventualmente obtidos usando um duplex de DNA de 15 meros, eles difrataram com resolução de 2,8 Å e contêm um único dímero ApeXPF (Tabela I). A estrutura foi resolvida por substituição molecular usando como modelo de pesquisa o domínio de nuclease ApeXPF derivado de uma estrutura parcialmente refinada de resíduos 19-150 (Lally et al, 2004 Materiais e métodos). Os mapas de densidade de elétrons iniciais faseados apenas nos domínios de nuclease mostraram boa densidade para o (HhH)2 e o DNA duplex (Figura Suplementar S2) e permitiu o rastreamento de toda a molécula além do ligante interdomínio de um protômero, que está desordenado. A estrutura final foi refinada para um R-fator de 23,0% e R-livre de 29,0% com resolução de 2,8 Å (Tabela I).

Proteína ApeXPF ApeXPF ApeXPF
Forma Nativo 1 mM K2OsO4 Nativo + dsDNA
Fonte de raios X Estação 14.2, SRS Estação 14.2, SRS Estação 9.6, SRS
Comprimento de onda (Å) 1.0000 1.0000 0.9780
Grupo espacial C2 C2 P3221
Parâmetros de célula unitária (Å) uma=210, b=42.7, c=118.7 uma=209, b=42.8, c=119.9 uma=b=141.3, c=85.3
β = 121,4 ° β = 121,4 °
Zuma 4 4 2
Nº de medições 52 273 (7746) 33 163 (4880) 125 841 (8403)
Nº de reflexos únicos 14 887 (2159) 9471 (1414) 21 619 (2463)
Limite de resolução (Å) 3.2 (3.37–3.2) 3.6 (3.79–3.6) 2.8 (2.95–2.8)
Integridade 99.9 (100) 98.5 (99.9) 97.5 (92.8)
Rsym 6.2 (30.8) 5.0 (32.1) 8.3 (39.9)
Média eu/ σ (eu) 10.6 (2.4) 13.1 (2.3) 13.7 (2.8)
Ranômalo 5.0 (23.1)
Rderivado 26.0 (31.2)
R-fator 0.24 0.23
R-gratuitamente 0.31 0.29
Modelo 6516 átomos de proteína 3357 átomos de proteína, 608 átomos de DNA, 6 íons sulfato, 1 íon Mg, 7 H2O
R.m.s. comprimentos de ligação (Å) 0.02 0.021
R.m.s. ângulos de ligação (graus) 1.9 2.2
Ramachandran plot a a Porcentagem de resíduos localizados nas regiões mais favoráveis ​​/ adicionalmente permitidas do plot de Ramachandran.
86.9%/12.6% 90.0%/8.9%
  • Os valores entre parênteses referem-se à camada de resolução mais alta indicada na linha de limite de resolução.
  • a Porcentagem de resíduos localizados nas regiões mais favoráveis ​​/ adicionalmente permitidas da parcela de Ramachandran.

Cristais monoclínicos de ApeXPF cultivados sem DNA contêm dois dímeros de ApeXPF e difratados com resolução de 3,2 Å. Esta estrutura foi resolvida por substituição molecular usando os dois domínios da estrutura ligada ao DNA separadamente como modelos de busca e guiada por sítios de átomos pesados ​​identificados a partir de um derivado de osmato (ver Materiais e métodos). Dois dos quatro protômeros tinham densidade contínua incluindo a sequência de linker, enquanto os outros dois tinham linkers de interdomínio desordenados. Esta estrutura foi refinada para um R-fator de 24,0% e R-livre de 31,0% na resolução de 3,2 Å (Tabela I).

Estrutura da apo-ApeXPF

ApeXPF 19-231 tem dois domínios estruturados, um domínio de nuclease N-terminal (resíduos 19-148) e um (HhH)2 domínio (resíduos 165-226) conectado por um ligante de 15 resíduos (Figuras 1C e 2A). Como esperado por analogia com Hef (Nishino et al, 2003), tanto a nuclease quanto (HhH)2 os domínios formam dímeros independentes e fortemente associados com um domínio equivalente do segundo protômero. Nesse arranjo, os domínios são desacoplados. A estrutura do domínio da nuclease α / β está intimamente relacionada ao domínio da nuclease Hef e os protômeros fazem contatos de dímero semelhantes através de duas hélices (α4 e α5) e uma fita β de borda (β6) (Nishino et al, 2003). O sítio ativo encontra-se em uma grande fenda delimitada pelos elementos estruturais α1 ′, α2, α3 e uma alça entre as fitas β2 e β3 (Figura 1C). Esta fenda é alinhada com a esmagadora maioria dos resíduos conservados de XPF, incluindo a ligação de metal e resíduos catalíticos da sequência de assinatura E-R-K (E62-R63-K64) que corre ao longo da base da fenda como parte da fita β4. Há densidade em um local equivalente ao local de metal observado em Hef (Nishino et al, 2003). Densidade semelhante está presente no complexo ApeXPF – DNA, que devido à sua resolução mais alta mostra mais precisamente que a geometria de coordenação e a distância das cadeias laterais de D52 e E62 são consistentes com o fato de ser um íon metálico, presumivelmente magnésio.

Cada (HhH)2 domínio forma um domínio cinco-helicoidal integral com dois motivos funcionais de hélice-grampo-hélice relacionados por simetria pseudo-dupla (Thayer et al, 1995 Doherty et al, 1996 Shao e Grishin, 2000). Um domínio semelhante está presente em RuvA (código PDB 1C7Y) (Ariyoshi et al, 2000). O RuvA (HhH)2 domínio tem um r.m.s. diferença de 1,55 Å (54 átomos C-alfa) e 1,7 Å (53 átomos C-alfa) com o (HhH)2 domínios dos dois protômeros da estrutura ApeXPF – DNA. ApeXPF tem dois grampos de cabelo G-I-G nos resíduos 179–181 e 211–213. Embora o (HhH)2 dobra de domínio foi observada anteriormente (Thayer et al, 1995 Rafferty et al, 1996 Singh et al, 2002), esta é a primeira estrutura de um dímero de (HhH)2 domínios. Existem três contatos principais nesta interface de dímero predominantemente hidrofóbica (Figura 1C e Figura Suplementar S3). Estes giram em torno da hélice de conexão que liga os dois motivos HhH, resíduos da primeira hélice do primeiro motivo HhH e resíduos C-terminal ao segundo motivo HhH. Uma extensão C-terminal para o domínio contribui com o Y228 altamente conservado para a interface do dímero.

Os dois dímeros independentes na unidade assimétrica dos cristais de apo ApeXPF são muito semelhantes e ambos têm a região de ligação de um protômero totalmente estendida. Os eixos duplos locais relacionando os protômeros da nuclease e (HhH)2 dímeros de domínio, respectivamente, não são coincidentes, de modo que, em geral, o dímero ApeXPF não obedece à simetria dupla (Figura 2A). Cada um dos dímeros independentes apo ApeXPF está em contato próximo com outro dímero idêntico relacionado pela operação de um eixo duplo cristalográfico gerando um tetrâmero. O contato envolve duas regiões de ligação equivalentes que formam uma folha antiparalela de dois fios ao longo do eixo duplo (Figura Suplementar S4). A comparação de ambos os arranjos tetraméricos indica um r.m.s. diferença de 3,4 Å em átomos 802 C-alfa.

Estrutura de um complexo ApeXPF-dsDNA

A estrutura ApeXPF-dsDNA compreende dois protômeros ApeXPF (denotados A e B), junto com um duplex de DNA (fitas denotadas C e D) (Figura 2B). O duplex de DNA está ligado à nuclease e (HhH)2 domínios do protômero A, e este nós definimos como local I.No geral, o ApeXPF no complexo forma um dímero assimétrico em que o protômero A é mais compacto e tem um linker interdomínio ordenado (Figura 2B). A comparação das cadeias A das formas ligadas ao DNA e livres de DNA mostra que, quando seus domínios de nuclease estão sobrepostos, as duas orientações do (HhH)2 domínios são relacionados por uma rotação de 95 °, que é principalmente um fechamento em vez de torção (Figura 2C). Isso muda o (HhH)2 domínios por mais de 30 Å. O ligante forma uma região de dobradiça complexa com as principais flexões nos resíduos 151-155 e 164. Na forma ligada ao DNA, contribui com L163 para a interface entre a nuclease e (HhH)2 domínios (Figura 1C e Figura Suplementar S5).

A estrutura ApeXPF ligada ao DNA é dominada pela interação do (HhH)2 domínio do protômero A com dsDNA. Interações entre domínios entre a nuclease e (HhH)2 domínios do protômero A estabilizam ainda mais a conformação ApeXPF e enterram vários resíduos aromáticos na interface perto de W169 (Figura 1C e Figura Suplementar S5). O protômero B quase não faz contato com o DNA no local I, e sua nuclease e (HhH)2 domínio não interage com seu ligante interdomínio não é visto nos mapas de densidade de elétrons, mas deve adotar uma conformação estendida porque os resíduos 148 e 160 do protômero B estão separados por 29 Å. O ligante interdomínio foi sugerido como sendo sensível à proteólise devido à flexibilidade conformacional (Nishino et al, 2003). Portanto, dissolvemos os cristais de ApeXPF – dsDNA e confirmamos por SDS – PAGE que nenhuma clivagem proteolítica ocorreu, confirmando assim a integridade de ambos os ligantes (dados não mostrados).

O reconhecimento do local I envolve a ligação de um trecho de seis pares de bases do sulco menor pelo (HhH)2 domínio do protômero A e a interação de uma extremidade cega (representando uma descontinuidade ds / ss) com o domínio catalítico do protômero A. O trecho do sulco menor reconhecido pelo (HhH)2 domínio é apenas dois pares de bases do final do duplex e isso garante que quando a nuclease e (HhH)2 domínios tornam-se acoplados, o DNA duplex é orientado com a extremidade 3 'de uma fita adjacente a Y123 (Figura 3A e B). A extremidade 5 'da fita D encontra-se adjacente a um íon sulfato derivado da cristalização ligado a R126 de ambos os protômeros A e B. A ligação de DNA com uma polaridade oposta não seria possível, pois a pegada do grampo de cabelo HhH não poderia acomodar o sulco principal muito mais amplo . O grampo de cabelo G-I-G de um motivo HhH liga dois fosfatos de estrutura de T13 e G14 da fita de DNA C, enquanto o outro grampo de cabelo liga os fosfatos de T7 e C8 da fita de sentido oposto D (Figura 3A). Vários resíduos carregados positivamente imediatamente após os grampos de cabelo (R182, R183 e R187 do primeiro motivo HhH e K215 e R216 do segundo motivo HhH) também contribuem para a interação com o sulco menor. Destes, os contatos independentes de sequência incluem a interação de R187 com a estrutura de fosfato C12 da fita C e a penetração de R216 na ranhura menor para ligar o fosfato de estrutura de T7 (fita D). A orientação única do dsDNA é auxiliada por um contato dependente da sequência de R182 do primeiro motivo HhH com a guanina-14 da fita C. O domínio de nuclease do protômero A contata uma extremidade cega do duplex de DNA por meio de interações hidrofóbicas (resíduos A86, Y123 e G124 ) com as duas bases terminais A15 (fita C) e T1 (fita D) (Figura 3). A extremidade cega não é uma característica dos substratos XPF preferidos, mas aqui representa uma descontinuidade ds / ss e fica adjacente a uma ranhura hidrofóbica rasa (Figura 3B e C) que pode entrar em contato com ssDNA (ver abaixo).

Um modelo de dois locais para reconhecimento de junção ds / ssDNA por XPF

O (HhH)2 domínio do protômero A é um componente principal do local I, mas o (HhH)2 domínio do protômero B também é potencialmente capaz de se ligar ao DNA. Notamos que o eixo duplo que relaciona o (HhH)2 domínios dos protômeros A e B faz um ângulo próximo a 45 ° com o eixo helicoidal do dsDNA. Contatos de cristal impedem o protômero B (HhH)2 domínio de envolvimento de dsDNA na forma de cristal trigonal. Em vez disso, um íon sulfato ocupa uma posição equivalente à posição da espinha dorsal de fosfato do DNA ligado ao primeiro motivo HhH do protômero A. Portanto, modelamos como o protômero B's (HhH)2 domínio pode ligar o DNA. Como o (HhH)2 o eixo duplo do dímero do domínio está a 45 ° em relação ao eixo helicoidal do dsDNA, girar o dsDNA (fitas C e D) sobre este eixo duplo gera uma segunda molécula de dsDNA putativa (fitas C ′ e D ′) a 90 ° ao dsDNA experimentalmente observado (Figura 4A). A inspeção do DNA modelado no contexto do complexo cristalograficamente observado mostra uma extremidade do duplex C′D ′ perto do sítio ativo do domínio de nuclease do protômero A (Figura 4B). Um segundo sítio de ligação de DNA potencial (denotado sítio II), portanto, existe, que compreende o (HhH)2 domínio do protômero B e o sítio ativo do protômero A, embora esteja desocupado em nossa estrutura.

Também assumimos que ApeXPF tem preferências de substrato semelhantes a SsoXPF, que cliva 3 ′ flaps e duplexes cortados preferencialmente sobre duplexes abertos (Figura 4C Roberts et al, 2004). Ambos os substratos preferidos têm dois segmentos de dsDNA contíguos e, portanto, o duplex de DNA cristalográfico observado no local I pode representar o duplex a montante ou a jusante de tais substratos. Uma vez que XPF é conhecido por clivar apenas dentro do duplex a montante de um flap 3 ′ (Sijbers et al, 1996a, 1996b de Laat et al, 1998 Bastin-Shanower et al, 2003 Osman et al, 2003 Roberts et al, 2003), e a extremidade 3 ′ da fita C no local I é de 17 Å do local ativo do protômero A (e 35 Å do local ativo do protômero B), consideramos mais provável que o dsDNA se ligue no local I representa a parte a jusante de tal substrato. A fita C seria, portanto, parte da fita contínua (ou fita não danificada) (Figura 4B). Isso implicaria que o local II liga o duplex a montante, que seria processado pelo local ativo do protômero A. Este arranjo permitiria que os locais de clivagem XPF estivessem a montante da junção ds / ssDNA se o duplex atravesse o local ativo ou as fitas são separados. É evidente que para ambos (HhH)2 domínios para envolver o substrato de DNA simultaneamente, um substrato de flap 3 ′ teria que dobrar em quase 90 ° (Figura 4B).

A extremidade 3 ′ da fita C modelada encontra-se próxima ao centro catalítico do protômero A e adjacente aos resíduos absolutamente conservados R26 e R77 acessíveis ao solvente, fora da fenda catalítica (Figura 4D e E). A fita C ′ é, portanto, posicionada com a polaridade esperada para a fita clivada e com dsDNA adjacente ao sítio ativo, de acordo com os dados experimentais. A polaridade da fita C ′ (5′-3 ′) e a presença de dois íons sulfato adjacentes ao invariante Q81 e R61 sugerem como o flap 3 ′ é conduzido para o sítio ativo (Figura 4D e E). Uma visão mais próxima de como a fita clivada é posicionada dentro da fenda do sítio ativo requer estruturas de XPF com substratos de DNA mais longos e ramificados, um objetivo para o qual estamos trabalhando.

A extremidade 3 'da fita C no local I confina com um sulco hidrofóbico raso no domínio da nuclease que se estende entre as hélices α3 e α4 (Figura 3B e C). O sulco é forrado com vários resíduos aromáticos conservados centrados em F79, cujos espaçamentos se aproximam da separação da base, e isso sugere um sítio de ligação de ssDNA. Produtos com intervalo de comprimento variável com uma região de fita simples curta na fita contínua de DNA são gerados por SsoXPF, ERCC1-XPF e Mus81-Eme1, pois o local de clivagem está em qualquer lugar de 2 a 8 nucleotídeos 5 ′ da junção ds / ssDNA (Figura 1B ) (Sijbers et al, 1996a, 1996b de Laat et al, 1998 Bastin-Shanower et al, 2003 Osman et al, 2003 Roberts et al, 2003). O sulco hidrofóbico pode amarrar tal região que se estende da extremidade 5 'da fita modelada D' (e, portanto, representando a fita contínua não clivada em todos os substratos), permitindo o empilhamento ou intercalação com bases de DNA de um trecho de ssDNA com eletrostático contatos de R104, R108 e R110 para a estrutura fosfodiéster (Figura 3B). A mutação de F63 de SsoXPF para alanina (equivalente a F79 de ApeXPF) central para este sulco reduziu parcialmente a atividade catalítica (por duas a três vezes) e pode refletir o papel dominante desempenhado pelo DNA duplex em vez do intervalo de fita simples (Tabela II).

SsoXPF a a Usamos SsoXPF para esses ensaios, pois a enzima era mais robusta do que ApeXPF, conforme mostrado na Figura Suplementar S4.
Resíduo equivalente em ApeXPF Duplex espalhado kgato± s.e. (min -1 × 10 3) 3 ′ aba kgato± s.e. (min -1 × 10 3) kgato aba /kgato espalhado
Tipo selvagem 720±49 7200±880 10
R61A R77 3±0.1 840±23 280
F63A F79 277±27 4730±88 17
Q65A Q81 3.3±0.4 260±11 79

Um grupo de resíduos essenciais não catalíticos no local II

Experimentos anteriores indicaram que a mutação de R678 em XPF humano (equivalente a R26 de ApeXPF) resultou em uma perda completa de atividade (Enzlin e Scharer, 2002). Para estender esses resultados, investigamos a importância de R77 e Q81 fazendo as mutações equivalentes R61A e Q65A em SsoXPF. Usamos SsoXPF para esses ensaios devido à sua atividade mais robusta e à disponibilidade de PCNA heterotrimérico Sso recombinante. Ambas as mutações tiveram grandes efeitos na atividade catalítica da enzima tanto para um duplex espalhado quanto para um substrato de flap 3 '(Tabela II). Q81 de ApeXPF separa R26 / R77 do metal coordenado D52 e E62 do sítio ativo. Nós interpretamos esses dados como mostrando que R26 / R77 / Q81 definem uma região funcionalmente importante que faz fronteira com a fenda catalítica. Esses resíduos não são necessários para o enovelamento de proteínas e estão muito distantes do sítio ativo para participar diretamente na catálise. Uma possibilidade é que esses resíduos desempenhem um papel no reconhecimento do substrato, ancorando a espinha dorsal da fita C ′, a candidata do modelo para o retalho 3 ′. Foi demonstrado que ERCC1-XPF e SsoXPF humanos geram vários locais de clivagem perto do ponto de junção ds / ss, e vários produtos de clivagem se acumulam ao longo do tempo (de Laat et al, 1998 Roberts et al, 2004). Esta observação pode ser explicada usando nosso modelo. Amarrando o duplex a montante através do protômero B (HhH)2 domínio e R26 / R77 poderiam gerar prontamente um conjunto heterogêneo de posições de DNA ancoradas por simples rotação do duplex no local II em torno de seu eixo helicoidal. Isso permitiria o posicionamento de qualquer uma das várias ligações de fosfodiéster na fenda do local ativo, mas manteria a ligação do sulco menor ao (HhH)2 domínio.

Conservação estrutural dentro do XPF (HhH)2 domínio

Nossa estrutura identifica o (HhH)2 domínio como tendo um papel central na ligação ao DNA, de acordo com trabalho bioquímico recente em um isolado (HhH)2 domínio de SsoXPF e de UvrC (Singh et al, 2002 Roberts et al, 2004). Relatamos o primeiro exemplo de como (HhH)2 domínios dimerizam e, portanto, analisamos (HhH)2 conservação de sequência de domínio dentro dos quatro subgrupos distintos de sequências XPF: (1) XPFs eucarióticos (18 sequências), (2) semelhantes a ERCC1 (18 sequências), (3) XPFs euriarchaeais (20 sequências) e (4) XPFs crenarchaeais (quatro sequências). Os alinhamentos foram otimizados para corresponder aos resíduos do núcleo dentro dos cinco feixes helicoidais (Figura 1C Aravind et al, 1999 Shao e Grishin, 2000). O caráter hidrofóbico do (HhH)2 os resíduos da interface do dímero são conservados ao longo dos quatro grupos, indicando que eles provavelmente formarão o mesmo dímero. Surpreendentemente, o grupo semelhante a ERCC1 cataliticamente inativo mostra a maior conservação de (HhH)2 domínios, particularmente dentro dos dois motivos em gancho S-V-N-K-T-D (grampo 1) e G-eu-G-P-Q-K (grampo 2, resíduos absolutamente conservados estão em negrito). A conservação de resíduos carregados positivamente imediatamente após cada grampo de cabelo é típica de muitos funcionais (HhH)2 domínios, visto que esses resíduos se encontram espacialmente próximos à estrutura do DNA. Os XPFs euriarchaeal e crenarchaeal mostram a semelhança mais próxima entre os (HhH)2 domínio de ambos os grupos e cada um tem motivos conservados dentro e adjacentes a ambos os grampos de cabelo. O (HhH)2 domínios dentro de XPFs eucarióticos são mal conservados, não têm resíduos básicos em seus segundos grampos de cabelo e quase não têm resíduos de superfície invariantes. Resíduos de núcleo hidrofóbico são geralmente conservados entre XPFs eucarióticos, sugerindo que estes (HhH)2 os domínios mantêm sua integridade estrutural, mas sua função pode ter divergido ou até mesmo perdida.


1.2 Técnicas em Simulações Biomoleculares

1.2.1 Mecânica Molecular e Campos de Força

A paleta de métodos de química computacional tornou-se cada vez mais versátil. Partindo da química quântica, onde orbitais moleculares e elétrons que os ocupam são descritos, nos permite calcular qualquer propriedade física ou química que depende diretamente da distribuição de elétrons, chegando a simulações de dinâmica molecular de granulação grossa, onde grupos de átomos descritos como esferas interagindo pelas leis da mecânica newtoniana, fornecendo informações valiosas sobre a complexidade dos processos biológicos em uma escala maior de nível celular. Para efeito de comparação, um tamanho viável de um sistema tratado por cálculos de química quântica, ainda hoje, não excede algumas centenas de átomos, enquanto os métodos empíricos, por exemplo. a mecânica molecular (MM) pode facilmente lidar com várias centenas de milhares de átomos e, no caso de uma abordagem de granulação grossa, vários milhões de átomos. Assim, a última classe de métodos tornou-se popular entre os pesquisadores que lidam com sistemas bio-macromoleculares, que existem e funcionam em soluções aquosas ou ambientes lipídicos. O ambiente circundante pode ocupar até 90% de todos os átomos em um sistema modelo, e sua presença é crucial para a representação correta da matéria viva. O salto gigante no tamanho do sistema é possível devido à simplicidade razoável do funcional de energia potencial MM. A energia potencial é calculada somando os termos de energia que descrevem as interações entre os átomos ligados (ligações, ângulos e torções) e os termos que descrevem as interações não ligadas, como van der Waals e interações eletrostáticas (eqn (1.1)). (1,1)

Os termos vinculados representam o alongamento das ligações (eu), curvatura dos ângulos de valência (θ) e rotação de ângulos de torção (ω) cf.Figura 1.1. Três constantes de força: keu, kθ e Vn caracterizar o custo energético em relação ao valor de equilíbrio, necessário para aumentar o valor de um comprimento de ligação (eu0), ângulo (θ0) ou rotação em torno de um ângulo de torção. O termo de torção representa uma rotação periódica de um ângulo diedro com periodicidade n e fase γ. A energia não ligada é a soma da repulsão, atração e eletrostática entre átomos não ligados. O parâmetro εeu j está relacionado à profundidade do potencial de Lennard-Jones (LJ), r0eu j é a distância em que o potencial LJ tem seu mínimo. qeu é a carga atômica parcial, ε0 é a permissividade do vácuo, e reu j é a distância entre átomos eu e átomo j. Os potenciais LJ e Coulomb descrevem as interações não ligadas de curto alcance. As avaliações das interações eletrostáticas de longo alcance podem ser difíceis e frequentemente ignoradas além de uma distância de corte específica, resultando em aproximações em um cálculo. Com a introdução da soma de Ewald e da malha de partículas do método Ewald (PME), os cálculos eletrostáticos de longo alcance se tornaram significativamente mais precisos. 12,13

A simplicidade da forma funcional da energia potencial significa, por um lado, cálculos rápidos e fáceis e, por outro lado, que a precisão dos métodos empíricos é altamente dependente do conjunto de parâmetros derivados empiricamente que descrevem os átomos e suas interações. Esses parâmetros são derivados de ab initio ou cálculos de química quântica semi-empíricos em sistemas de modelos pequenos ou por ajuste a dados experimentais, por exemplo. Difração de raios-X e elétrons, espectroscopia de RMN e IV. A forma funcional da energia potencial e os parâmetros empiricamente derivados podem ser referidos como um campo de força.

Existem várias famílias de campos de força empíricos disponíveis, com diferentes graus de complexidade e orientadas para tratar diferentes tipos de sistemas. Os mais populares projetados para macromoléculas biológicas são AMBER, 14,15 CHARMM, 16 e GROMOS. 17 Outros campos de força, como OPLS 18 e COMPASS 19 foram originalmente desenvolvidos para simular matéria condensada GAFF 20, um campo de força desenvolvido para simular compostos orgânicos juntamente com bio-macromoléculas e GLYCAM 21, um campo de força desenvolvido especificamente para carboidratos. GAFF e GLYCAM são compatíveis com AMBER. Esses campos de força variam ligeiramente quanto à forma funcional do funcional de energia potencial, principalmente nos termos não ligados, bem como valores de parâmetros atômicos específicos. Para obter mais detalhes, o leitor deve consultar uma revisão recente sobre os avanços atuais nos campos de força empíricos para biomoléculas. 22 Para sistemas de granulação grossa, o campo de força mais comumente usado é MARTINI, 23,24 que foi parametrizado para lipídios, proteínas, carboidratos e ácidos nucléicos. Recentemente, foi desenvolvida uma ferramenta para parametrizar pequenas moléculas automaticamente. 25 O modelo MARTINI é baseado em um mapeamento de quatro para um, o que implica que cerca de quatro átomos pesados ​​têm granulação grossa em uma única esfera. As contas interagem predominantemente por parâmetros de Lennard-Jones, juntamente com ligações e ângulos harmônicos. 23 Outros modelos de granulação grossa comumente usados ​​são GROMOS 26 e Elba. 27

1.2.2 Técnicas Básicas de Simulação

Para explorar a paisagem de energia descrita pelo campo de força da mecânica molecular, ou seja para amostrar conformações moleculares, uma simulação é necessária. Essa também é a rota para relacionar os movimentos microscópicos e as posições dos átomos às grandezas macroscópicas ou termodinâmicas que podem ser medidas experimentalmente. 28 Existem dois métodos principais de simulação para amostrar sistemas biomoleculares: dinâmica molecular (MD) e Monte Carlo (MC) (Figura 1.2).

1.2.2.1 Dinâmica Molecular

A dinâmica molecular é baseada na segunda lei do movimento de Newton, que relaciona a força, F, agiu sobre um átomo para sua aceleração, uma, ou seja a segunda derivada da posição, q, com respeito ao tempo, t (eqn (1,2)) (1,2) onde m é a massa do átomo. Em uma simulação molecular, o tempo é discretizado e a posição após um tempo pequeno e finito, Δt pode ser calculado usando uma expansão de Taylor simples (eqn (1.3)) (1.3) e, portanto, é fácil ver que a posição q(t), velocidade dq(t) / dt e aceleração d 2 q(t) / dt 2 são suficientes para a propagação do sistema molecular. A aceleração pode ser calculada a partir da eqn (1.2) e a força F é obtido diferenciando a energia do sistema. 29

Uma simulação MD é configurada atribuindo velocidades e posições iniciais a todos os átomos no sistema.As velocidades são geralmente atribuídas aleatoriamente, enquanto as posições são normalmente tiradas de por exemplo. uma estrutura de cristal ou geometrias idealizadas. Depois disso, a força que atua em cada átomo é calculada, dando a direção do movimento. Os átomos são movidos nessa direção, dando novas forças em cada átomo, e o procedimento é então repetido várias etapas. Existem várias receitas numéricas que descrevem como essa integração de movimento é feita na prática, por exemplo. leapfrog, Verlet ou velocidade-Verlet. Eles diferem principalmente na estabilidade numérica e se eles, além de propagarem posições, também propagam as velocidades. 29

A principal limitação para uma amostragem eficiente com MD é o intervalo de tempo discreto, Δt. É desejável escolher um intervalo de tempo mais longo, o que daria simulações mais longas com menos recursos computacionais. No entanto, Δt é limitado pelo movimento mais rápido no sistema simulado. Para um sistema atomístico, o movimento mais rápido é a vibração da ligação entre um átomo de hidrogênio e um átomo de carbono, que limita Δt a cerca de 1 fs. Portanto, essas ligações são normalmente restritas nas simulações, permitindo um intervalo de tempo de 2 fs. Uma alternativa é aumentar a massa dos átomos de hidrogênio, diminuindo efetivamente a vibração da ligação. 30 Em simulações de granulação grossa, um intervalo de tempo muito maior é possível, normalmente entre 10 e 40 fs, dependendo do modelo. 23,27

Uma simulação obedecendo à segunda lei do movimento de Newton pode ser mostrada para amostrar um conjunto termodinâmico com número constante de partículas, volume e energia total (cinética + potencial). No entanto, os experimentos são geralmente realizados em temperatura constante e pressão ou volume constante. Para obter uma amostra de tal conjunto, as equações de movimento devem ser modificadas. No caso de temperatura constante, é necessário um termostato e existem muitos desses algoritmos. As abordagens comuns incluem (1) modificar as velocidades (por exemplo. acoplamento fraco), (2) introdução de partículas fictícias em um sistema estendido (por exemplo. Nos & # 233-Hoover), ou (3) introdução de atrito (por exemplo. Dinâmica de Langevin). Uma discussão extensa sobre diferentes termostatos está, entretanto, além do escopo deste capítulo introdutório e os leitores interessados ​​são encaminhados para uma revisão sobre o assunto. 31 Da mesma forma que a temperatura, a pressão constante pode ser introduzida por um baróstato que modifica o volume do sistema simulado. As abordagens comuns incluem (1) dimensionar as dimensões da caixa (por exemplo. acoplamento fraco), (2) introdução de partículas fictícias (por exemplo. Parinello-Rahman), ou (3) introdução de um pistão. Alguns termostatos e barostatos são mais adequados para sistemas longe do equilíbrio, enquanto outros são melhores para simulações de produção.

1.2.2.2 Simulações de Monte Carlo

O outro método de amostragem principal, Monte Carlo (MC), é uma técnica estatística onde novas conformações são geradas por um passeio aleatório no espaço de fase, atribuindo deslocamentos aleatórios aos graus de liberdade internos, ou seja ligações, ângulos e torções. Naturalmente, todas as conformações não são igualmente prováveis ​​e, portanto, a amostragem é tendenciosa de modo que as conformações são geradas com uma probabilidade prescrita pelo conjunto termodinâmico de interesse. A maneira mais comum de fazer isso é realizando um teste Metropolis – Hastings. 32,33 Em uma simulação Metropolis MC, uma nova conformação é aceita com a probabilidade, p (eqn (1.4)) p= min [1, exp (−Δvocê/kT)] (1.4) onde Δvocê é a diferença de energia entre a nova e a velha conformação, k é a constante de Boltzmann e T a temperatura absoluta. Na prática, a energia da nova conformação com a velha é comparada e se a nova conformação tiver menos energia, ela será retida para a próxima etapa. Se for maior em energia, o fator de Boltzmann exp (−Δvocê/kT) é comparado a um número aleatório uniforme entre 0 e 1, e se o fator de Boltzmann for maior do que o número aleatório, a nova conformação é mantida.

Uma simulação MC consiste em uma série de movimentos, que é uma receita de como amostrar graus de liberdade específicos. Isso pode ser um movimento de translação simples, onde o centro de massa de uma molécula é deslocado, uma rotação em torno de um ângulo de torção ou um movimento combinado e complicado de vários átomos da estrutura protéica. Um movimento é selecionado aleatoriamente seguido por um teste Metropolis da nova conformação e o procedimento é repetido por várias etapas.

O teste Metropolis ilustrado acima fornece um conjunto canônico, ou seja número constante de partículas, volume e temperatura. No entanto, ele pode ser modificado para permitir uma mudança de volume de forma que a pressão constante seja simulada. Além disso, moléculas inteiras, por exemplo. água, pode ser inserido e removido durante a simulação, levando a um grande conjunto canônico. 34 Assim, as simulações MC são mais versáteis do que as simulações MD, mas são fortemente dependentes da construção de movimentos eficientes. Além disso, uma vez que MC depende apenas das posições dos átomos, falta informação dinâmica, e MC não pode ser usado para por exemplo. estimar propriedades de transporte ou constantes de difusão.

1.2.2.3 Condições Limite

Um aspecto importante tanto do MD quanto do MC é a escolha das condições de contorno. 28 Normalmente, uma molécula é solvatada por uma concha de água finita ou inserida em uma bicamada lipídica, deixando alguns dos átomos voltados para o vácuo. Esta não é uma boa descrição física de um sistema biológico, e uma solução bem usada é estender o sistema periodicamente em todas as três direções para representar um sistema pseudo-infinito, removendo efetivamente o vácuo. As condições de contorno periódicas podem ser usadas com várias geometrias, uma caixa cúbica, um dodecaedro rômbico ou um octaedro truncado. Este último esquema é comum em simulações de macromoléculas biológicas solvatadas em água, pois permite o menor número de moléculas de solvente no sistema e, portanto, acelera o cálculo. Embora as condições de contorno periódicas sejam a escolha mais comum, existem outras soluções em uso, por exemplo. limites esféricos com adição de restrições. 35

1.2.2.4 Técnicas de amostragem aprimoradas

Como mencionado anteriormente, a amostragem eficiente é uma das principais limitações do MD e do MC. As trajetórias de DM podem não alcançar todas as conformações relevantes, por exemplo, estados transitórios de curta duração conectados com uma função biológica. Este problema pode ser resolvido empregando algoritmos de amostragem aprimorados, como metadinâmica, MD dirigido ou MD de troca de réplicas. Freqüentemente, o objetivo de tais amostragens aprimoradas é construir uma superfície de energia mais completa e / ou obter perfis de energia livre ou dados de potencial de força média (PMF). Alguns dos recursos mais avançados são abordados nos capítulos subsequentes deste livro; também encaminhamos o leitor para análises recentes sobre técnicas de amostragem aprimoradas. 36,37

1.2.3 Análise Básica de Dados

Após a simulação ter sido concluída, ela precisa ser analisada para extrair informações relevantes sobre o sistema de interesse. Isso pode ser bastante desafiador e depende muito do tipo de sistema simulado. Aqui, algumas estratégias comuns para análises serão descritas.

1.2.3.1 Proteínas

É comum estimar o equilíbrio de uma simulação de proteína calculando o desvio médio quadrático da raiz (RMSD eqn (1,5)) dos átomos do backbone em comparação com a conformação inicial, (1,5) onde N é o número de átomos, reu(t) a posição do átomo eu, no tempo t. Antes da análise, a proteína precisa ser ajustada à estrutura inicial para remover a translação e rotação geral. Embora esta seja uma análise direta e forneça uma indicação do equilíbrio local, é um método muito simples para avaliar a convergência global da simulação. Também é possível calcular um RMSD de pares entre cada instantâneo em uma simulação. Isso poderia ser usado, por exemplo, para avaliar o quão eficiente a amostragem tem sido, ou se a simulação ficou presa em um poço de energia local (Figura 1.3). Considerando que o RMSD fornece uma estimativa geral para a proteína inteira e uma abordagem para avaliar o grau de movimento de resíduos individuais é calcular a flutuação quadrática média da raiz (RMSF eqn (1.6)), que é simplesmente a variância da posição de um átomo : (1.6) onde T é o tempo total da simulação (ou número de instantâneos) e é a posição média. O RMSF pode ser relacionado ao fator B usado na cristalografia pela multiplicação por 8 / 3π. A análise pode ser feita por resíduo, onde todos os átomos de um resíduo são incluídos na média e podem, por exemplo, ser usados ​​para avaliar o movimento de cadeias laterais. Alternativamente, pode-se incluir apenas Cα átomos na análise para avaliar o movimento do backbone.

Para avaliar a compactação geral de uma proteína, o raio de giração pode ser calculado a partir da eqn (1.7): (1.7) onde M é a massa total da proteína, meu a massa do átomo eu e Rc o centro de massa. Esta é uma análise simples para determinar se a proteína é compacta ou estendida. Para obter análises mais específicas sobre a estrutura da proteína, pode-se analisar a estrutura secundária. É possível classificar cada aminoácido para determinar se ele faz parte de uma hélice, de uma folha beta ou de uma alça. Isso é útil para monitorar durante a simulação, a fim de detectar grandes mudanças conformacionais, ou seja perda de estrutura secundária. Movimentos mais complicados podem ser investigados com uma análise de componente principal (PCA). Esta é uma técnica estatística que reduz a dimensionalidade do problema em vez de olhar para todos os 3N coordenadas em uma simulação, o PCA reduz isso a alguns componentes principais que descrevem os movimentos principais. Os componentes principais são calculados a partir dos autovalores de uma matriz de covariância, descrevendo a covariância das posições dos átomos selecionados. Para uma proteína, normalmente o Cα átomos são analisados. O componente principal pode ser projetado no sistema simulado e visualizado, permitindo a inspeção direta dos movimentos principais. Isso poderia ser, por exemplo, um movimento respiratório de dois domínios de proteína ou o movimento para fora de uma área de loop após a ligação de uma pequena molécula.

1.2.3.2 Ácidos Nucleicos

O espaço conformacional do DNA ou RNA é bastante diverso e dinâmico, refletindo sua capacidade de mudar dependendo das propriedades físico-químicas do ambiente circundante, do motivo da sequência local e das interações com outras moléculas. Assim, além do RMSD e da análise das redes de contatos inter e intramoleculares, a avaliação das simulações de ácidos nucléicos é direcionada para a captura dessa interação conformacional. A geometria do DNA e, em certa medida, do RNA, pode ser descrita em termos de parâmetros helicoidais (passo e diâmetro da hélice), parâmetros de sulco (profundidade e largura), conformação do anel de furanose, seis ângulos de torção da espinha dorsal, rotacional (ponta e inclinação) e parâmetros de par de base de translação, seis parâmetros intra-base (fivela, hélice, abertura, cisalhamento, alongamento e escalonamento) e seis parâmetros inter-base (inclinação, rotação e torção, deslocamento, deslizamento e ascensão). Os programas mais populares que analisam simulações de ácidos nucléicos em termos dos graus de liberdade mencionados incluem Curves + e Canal, 38 e 3DNA. 39 Como os ácidos nucleicos existem e funcionam como sais, o comportamento dos contra-íons circundantes é parte integrante da análise, e agora pode ser feito com, por exemplo., o programa Canion. 40

1.2.3.3 Membranas

Para avaliar o equilíbrio de uma simulação de membrana, várias propriedades geométricas simples são normalmente calculadas, como a área e o volume por lipídeo, bem como a espessura da membrana. 41 A área e o volume podem ser calculados diretamente a partir das dimensões da caixa e assumindo a densidade da água. Existem vários tipos de espessuras que podem ser calculadas, mas uma simples é medir a distância entre os picos de densidade dos átomos de fosfato (ou equivalente). Também é comum calcular um parâmetro de ordem da cadeia de acil graxo (eqn (1.8)) (1.8), onde θ é o ângulo entre a bicamada normal e uma ligação carbono-deutério na cadeia acila, e os colchetes indicam uma média sobre a simulação. Para simulações de granulação grossa, a ligação entre dois átomos vizinhos substitui a ligação carbono-deutério. Portanto, não é correto comparar parâmetros de pedido de simulações atomísticas e de granulação grossa. Em ambos os casos, o parâmetro de ordem fornece informações sobre a fase da membrana, ou seja se estiver na fase fluida ou ordenada por líquido.

1.2.3.4 Moléculas Pequenas

Ao realizar simulações em pequenas moléculas (seja como entidades solvatadas, em um sistema maior de "massa" ou como parte de por exemplo. um complexo biomolecular), uma análise interessante para realizar é o agrupamento. Isso fornecerá informações sobre os diferentes tipos de conformações que a molécula atinge durante uma simulação e pode ser usado para avaliar se a simulação está presa em uma conformação local e para investigar a probabilidade de diferentes conformações. Há uma infinidade de métodos de agrupamento diferentes disponíveis e está fora do escopo deste texto discuti-los em qualquer extensão que o leitor interessado consulte a literatura. 42

1.2.4 Software

Nas últimas duas décadas, com o desenvolvimento de novos algoritmos de simulação e novas tecnologias no projeto de plataformas de hardware, as simulações moleculares aumentaram drasticamente em tamanho, comprimento e complexidade do sistema. O surgimento de uma variedade de pacotes de software de modelagem molecular padronizados, incluindo GROMACS, 43 Amber, 44 CHARMM, 45 GROMOS, 46 e NAMD, 47 transformou o campo da química computacional mercantilizando simulações moleculares e tornando-as acessíveis a um grupo mais amplo de pesquisadores . Todos esses pacotes têm qualidades e perfis complementares, com GROMACS e NAMD sendo dois dos mais populares. Considerando GROMACS e NAMD apenas como motores MD, não há diferença dramática quanto ao seu desempenho, ambos trabalham com uma variedade de campos de força e têm aceleração de GPU implementada. No entanto, pequenas diferenças devem ser mencionadas, como a possibilidade de realizar simulação QM / MM no GROMACS ou extensibilidade do NAMD & # 39s para scripts escritos pelo usuário. Ambos os pacotes são distribuídos gratuitamente com o código-fonte. Além disso, para NAMD, existem binários para download para uma variedade de plataformas. Isso pode ser útil para um iniciante em química computacional, pois a compilação do software MD pode nem sempre ser direta. Ambos GROMACS e NAMD são motores de dinâmica molecular paralela, projetados para simulações de alto desempenho de grandes sistemas biomoleculares, com GROMACS sendo melhor para simulações de sistemas menores em supercomputadores de tamanho médio. Para obter o melhor desempenho para um determinado sistema em um determinado supercomputador, recomendamos o benchmarking inicial. Para GROMACS e NAMD, uma ampla variedade de tutoriais está disponível. Pacotes de software externos, como PLUMED, 48 podem fornecer funcionalidade adicional, como técnicas aprimoradas de dinâmica molecular mencionadas acima.

Vários softwares são usados ​​para visualização e análise de trajetórias de dinâmica molecular. Entre as ferramentas mais populares e de acesso livre estão os programas de modelagem molecular VMD 49 e USCF Chimera. 50 VMD (dinâmica molecular visual) é um programa de visualização molecular especializado para exibir, animar e analisar trajetórias de dinâmica molecular, amplamente utilizado com qualquer software MD. O USCF Chimera, por outro lado, é um programa altamente extensível para visualização interativa e análise de estruturas moleculares e dados relacionados, incluindo mapas de densidade, conjuntos supramoleculares, alinhamentos de sequência, resultados de encaixe, trajetórias e conjuntos conformacionais. Ambos os programas podem ser usados ​​para criar ilustrações profissionais. VMD e USCF Chimera também podem realizar análises estruturais básicas, mas para uma avaliação mais extensa de trajetórias, como agrupamento ou modificações de topologias do sistema, AmberTools e, em particular, cpptraj 51 é recomendado.

1.2.5 Exemplos

Simulações moleculares têm sido utilizadas em inúmeras aplicações, para obter a estrutura e dinâmica de muitas biomoléculas a fim de elucidar funções bioquímicas, processos e vias. Em princípio, qualquer sistema molecular pode ser simulado e dois exemplos típicos são mostrados na Figura 1.4. Embora muitas das simulações tenham estudado macromoléculas individuais solvatadas em água ou um modelo de membrana, também houve algum esforço em observar montagens maiores. Já há uma década, Schulten e colegas de trabalho usaram um supercomputador maciçamente paralelo para estudar o vírus do mosaico do tabaco por satélite completo, descrito com um campo de força totalmente atômico. 52 Eles foram capazes de acumular 50 ns de tempo de simulação de um sistema contendo cerca de 1 milhão de átomos e concluíram que o capside do vírus se tornou instável após a remoção das moléculas de RNA do núcleo. Usando um modelo de granulação grossa, Sansom e colegas de trabalho simularam o vírion da influenza A, um sistema significativamente maior. 53 Usando um modelo CG, eles puderam simular na escala de tempo de microssegundos e, além disso, investigar alterações no envelope da membrana e na sensibilidade à temperatura.

Escalas de tempo longo, como microssegundos ou milissegundos, geralmente não são acessíveis ao usar um campo de força de todos os átomos. A exceção é se o hardware para fins especiais for usado como no trabalho de Shaw e colegas de trabalho. Eles relataram a primeira simulação contínua em milissegundos de uma proteína descrita com um campo de força de todos os átomos quando estudaram a estrutura dobrada do BPTI. 54 Vários estados conformacionais distintos foram encontrados, separados por grandes barreiras cinéticas. Shaw e colegas de trabalho também usaram técnicas de simulação para encontrar falhas nos campos de força da proteína atual, que não puderam ser detectadas anteriormente devido às simulações tipicamente curtas. Uma alternativa para executar trajetórias longas e contínuas que se tornou popular recentemente é a montagem de muitas simulações curtas usando modelos de estado de Markov. 55 Eles têm sido usados, por exemplo, para estudar o enovelamento de proteínas e como esse processo imensamente complicado é afetado pelo efeito do solvente e pela eletrostática. 56

Os exemplos mencionados acima representam extremos, tanto em termos de tamanho do sistema quanto de comprimento das simulações. Simulações moleculares de dimensões muito mais modestas são usadas rotineiramente para obter informações sobre processos biológicos e para complementar experimentos de laboratório úmido. Encontramos uma aplicação muito proveitosa de simulações no campo da enzimologia. 57 Aqui, o substrato, alguns resíduos do sítio ativo e águas e íons coordenadores são descritos com a mecânica quântica, enquanto o resto do sistema é descrito com um campo de força da mecânica molecular. Essas simulações têm sido usadas em inúmeras aplicações para, por exemplo, elucidar o mecanismo enzimático, entendendo a natureza do poder catalítico e do projeto da enzima. 57,58 Outra aplicação comum de simulação molecular é a estimativa de energias livres de ligação de pequenas moléculas, por exemplo. drogas, aos seus alvos.Jorgensen e colegas de trabalho usam rotineiramente essas simulações para ajudar em seu projeto de desenvolvimento de medicamentos. 59 Isso é feito introduzindo sistematicamente pequenos grupos químicos, como um grupo hidroxila ou metila, em um composto de chumbo e avaliando sua contribuição com a simulação de energia livre alquímica.

As ilustrações acima fornecem alguns exemplos do que é possível com simulações moleculares, com muitos mais fornecidos nos capítulos subsequentes deste livro.


Informação sobre o autor

Endereço atual: VIB / UGent, Ghent, Bélgica

Afiliações

Instituto de Pesquisa de Patologia Molecular (IMP), Viena BioCenter (VBC), Viena, Áustria

Marcin J. Suskiewicz, Bence Hajdusits, Rebecca Beveridge, Alexander Heuck, Lam Dai Vu, Robert Kurzbauer, Karl Mechtler, Anton Meinhart e Tim Clausen

Boehringer Ingelheim RCV GmbH & amp Co KG, Viena, Áustria

Katja Hauer, Vanessa Thoeny e Klaus Rumpel

Instituto de Biotecnologia Molecular da Academia Austríaca de Ciências (IMBA), Viena BioCenter (VBC), Viena, Áustria

Universidade Médica de Viena, Viena BioCenter (VBC), Viena, Áustria

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Contribuições

M.J.S. e T.C. projetou e realizou experimentos, analisou dados e escreveu o artigo com a contribuição de todos os autores B.H., A.H. L.D.V., R.K., K.H., V.T., K.R. e A.M. ajudou com análises bioquímicas e estruturais R.B e K.M. com medições espectrométricas de massa.

Autor correspondente


Assista o vídeo: SHOTCUT: SUPERPONER VIDEOS, IMÁGENES, LOGOS. Cómo poner un video arriba de otro. Tutorial 04 (Outubro 2022).