Em formação

10.4: O Código Genético - Biologia

10.4: O Código Genético - Biologia


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Descrevemos alegremente o propósito dos cromossomos do DNA como transportadores das informações para a construção das proteínas da célula, e o RNA como intermediário para fazê-lo. Exatamente como é, porém, que uma molécula composta de apenas quatro nucleotídeos diferentes unidos (embora milhares e até milhares de milhares deles), pode dizer à célula qual dos vinte e tantos aminoácidos deve se unir para formar uma proteína funcional ? A solução óbvia era que, uma vez que não há nucleotídeos únicos individuais suficientes para codificar para cada aminoácido, deve haver combinações de nucleotídeos que designam aminoácidos específicos. Um código duplo permitiria apenas 16 combinações diferentes (4 nucleotídeos possíveis na primeira posição x 4 nucleotídeos possíveis na segunda posição = 16 combinações) e não seria suficiente para codificar os 20 aminoácidos. No entanto, um código tripleto produziria 64 combinações, facilmente o suficiente para codificar 20 aminoácidos. O mesmo aconteceria com um código quádruplo ou quíntuplo, por falar nisso, mas isso seria um desperdício de recursos e, portanto, menos provável. Uma investigação posterior provou a existência de um código tripleto conforme descrito na tabela abaixo.

Com tantas combinações e apenas 20 aminoácidos, o que a célula faz com as outras possibilidades? O código genético é um código degenerado, o que significa que há redundância de modo que a maioria dos aminoácidos são codificados por mais de uma combinação tripla (códon). Embora seja um código redundante, não é um código ambíguo: em circunstâncias normais, um determinado códon codifica um e apenas um aminoácido. Além dos 20 aminoácidos, há também três “códons de parada” dedicados ao término da tradução. Os três códons de parada também têm nomes coloquiais: UAA (ocre), UAG (âmbar), UGA (opala), com UAA sendo o mais comum em genes procarióticos.

Os nomes coloquiais começaram quando os descobridores do UAG decidiram nomear o códon com o nome de um amigo cujo sobrenome traduzido para “âmbar”. Opala e ocre foram nomeados para dar continuidade à ideia de dar nomes de cores aos códons de parada.

Os códons de parada às vezes também são usados ​​para codificar o que agora é considerado o 21st e 22WL aminoácidos, selenocisteína (UGA) e pirrolisina (UAG). Descobriu-se que esses aminoácidos são consistentemente codificados em algumas espécies de prokarya e archaea.

Observe que não há códons de início dedicados: em vez disso, códigos AUG para metionina e para o início da tradução, dependendo das circunstâncias, conforme explicado a seguir. A Met inicial é uma metionina, mas em procariotos, é uma formil-metionina especialmente modificada (f-Met). O tRNA também é especializado e é diferente do tRNA que carrega metionina para o ribossomo para adição a um polipeptídeo em crescimento. Portanto, ao se referir a um tRNA iniciador carregado, a nomenclatura usual é fMet-tRNAeu ou fMet-tRNAf. Também parece haver um pouco mais de margem de manobra na definição do local de início em procariotos do que em eucariotos, já que algumas bactérias usam GUG ou UUG. Embora esses códons normalmente codifiquem valina e leucina, respectivamente, quando são usados ​​como códons iniciais, o tRNA iniciador traz f-Met.

Embora o código genético conforme descrito seja quase universal, existem algumas situações em que foi modificado e as modificações retidas em ambientes evolutivamente estáveis. As mitocôndrias em uma ampla gama de organismos demonstram mudanças estáveis ​​no código genético, incluindo a conversão do AGA da codificação da arginina em um códon de parada e a alteração do AAA da codificação da lisina para a codificação da asparagina. Raramente, uma mudança é encontrada na tradução de um genoma organísmico (nuclear), mas a maioria dessas alterações raras são conversões de ou para códons de parada.

Outras alterações menores no código genético também existem, mas a universalidade do código em geral permanece. Alguns DNAs mitocondriais podem usar diferentes códons iniciais: ribossomos mitocondriais humanos podem usar AUA e AUU. Em algumas espécies de levedura, os códons CGA e CGC para arginina não são usados. Muitas dessas mudanças foram catalogadas pelo National Center for Biotechnology Information (NCBI) com base no trabalho de Jukes e Osawa na Universidade da Califórnia em Berkeley (EUA) e na Universidade de Nagoya (Japão), respectivamente.


Código genético

Nossos editores irão revisar o que você enviou e determinar se o artigo deve ser revisado.

Código genético, a sequência de nucleotídeos no ácido desoxirribonucléico (DNA) e ácido ribonucléico (RNA) que determina a sequência de aminoácidos das proteínas. Embora a sequência linear de nucleotídeos no DNA contenha as informações para as sequências de proteínas, as proteínas não são feitas diretamente do DNA. Em vez disso, uma molécula de RNA mensageiro (mRNA) é sintetizada a partir do DNA e direciona a formação da proteína. O RNA é composto por quatro nucleotídeos: adenina (A), guanina (G), citosina (C) e uracila (U). Três nucleotídeos adjacentes constituem uma unidade conhecida como códon, que codifica um aminoácido. Por exemplo, a sequência AUG é um códon que especifica o aminoácido metionina. Existem 64 códons possíveis, três dos quais não codificam para aminoácidos, mas indicam o fim de uma proteína. Os 61 códons restantes especificam os 20 aminoácidos que constituem as proteínas. O códon AUG, além de codificar para a metionina, é encontrado no início de cada mRNA e indica o início de uma proteína. Metionina e triptofano são os únicos dois aminoácidos codificados por apenas um único códon (AUG e UGG, respectivamente). Os outros 18 aminoácidos são codificados por dois a seis códons. Como a maioria dos 20 aminoácidos é codificada por mais de um códon, o código é denominado degenerado.

O código genético, antes considerado idêntico em todas as formas de vida, diverge ligeiramente em certos organismos e nas mitocôndrias de alguns eucariotos. No entanto, essas diferenças são raras e o código genético é idêntico em quase todas as espécies, com os mesmos códons especificando os mesmos aminoácidos. A decifração do código genético foi realizada pelos bioquímicos americanos Marshall W. Nirenberg, Robert W. Holley e Har Gobind Khorana no início dos anos 1960.

Tripletos de nucleotídeos (códons) especificando diferentes aminoácidos são mostrados na tabela.


Biólogos criam células com 6 letras de DNA, em vez de apenas 4

Para revisar este artigo, visite Meu perfil e, em seguida, Exibir histórias salvas.

As células com um alfabeto genético expandido podem produzir uma gama mais ampla de proteínas. Imagem: Synthorx

Para revisar este artigo, visite Meu perfil e, em seguida, Exibir histórias salvas.

Uma das primeiras coisas que você aprende em Biologia 101 é que o código genético consiste em quatro letras: A, T, C e G. Cada uma representa um bloco de construção químico do DNA, a molécula que codifica as informações necessárias para construir a vida enquanto nós Sei. Mas e se não tivéssemos que nos contentar com apenas quatro letras? Agora, os cientistas realizaram algo antes considerado impossível: eles criaram células com um alfabeto genético expandido que inclui mais duas letras.

"Agora temos uma célula que sobrevive e vive com mais informações em seu genoma", disse Floyd Romesberg, biólogo sintético do Scripps Research Institute em La Jolla, Califórnia, que liderou o trabalho.

Ter mais cartas para trabalhar abre potencialmente a porta para uma grande variedade de novas moléculas. (Uma analogia grosseira: imagine quantas palavras novas malucas você poderia escrever com 39 letras em vez das habituais 26). Com mais refinamentos, as células sintéticas podem um dia ser usadas para criar - ou evoluir - proteínas que não existem na natureza, bem como novas sequências de DNA e RNA, qualquer uma das quais poderia ser útil para pesquisa, diagnóstico de doenças, ou criando novas terapias. Mas isso ainda está longe.

Romesberg diz que seu laboratório passou 15 anos desenvolvendo DNA com duas letras extras. Em termos químicos, as letras são nucleotídeos, os componentes do DNA cujas sequências fornecem instruções para a produção de proteínas. As células, você deve se lembrar, produzem proteínas transcrevendo DNA em RNA e usando o RNA como um modelo para unir aminoácidos em proteínas. As células também precisam copiar seu DNA cada vez que se dividem para formar mais células. O maior desafio, diz Romesberg, foi garantir que os dois novos nucleotídeos funcionassem bem com as enzimas que fazem todas essas cópias e transcrições.

Em 2012, os cientistas relataram um avanço: eles mostraram que o DNA de seis letras que eles & # x27d criaram poderia ser copiado e transcrito em RNA em experimentos em tubos de ensaio.

. Imagem: Database Center for Life Science (DBCLS)

Mas o DNA de seis letras poderia realmente funcionar no ambiente muito mais complexo e caótico de uma célula viva?

O novo estudo sugere que sim. Romesberg e seus colegas conseguiram persuadir E. coli bactérias em pegar seu DNA de seis letras e fazer cópias dele. As células & # x27 enzimas copiaram as duas novas letras, que os cientistas chamam de X e Y abreviadamente (não deve ser confundido com os cromossomos X e Y que diferenciam meninos de meninas), junto com as quatro usuais. As células cresceram um pouco mais lentamente do que o normal, mas por outro lado não pareciam piorar para o desgaste, relata a equipe hoje em Natureza.

O trabalho é uma grande conquista, diz Steven Benner, biólogo sintético da Foundation for Applied Molecular Evolution em Gainesville, Flórida. Ele diz que é a primeira vez que alguém mostra que as células vivas podem replicar o DNA "quotalien" construído a partir de outras partes além das quatro letras que ocorrem na natureza.

Os próximos passos, diz Romesberg, serão determinar se as células também podem transcrever os pares de bases não naturais em RNA e, em última instância, usá-los para fazer proteínas. Com um alfabeto genético maior, as células poderiam potencialmente codificar aminoácidos sintéticos não encontrados na natureza e fazer novas proteínas que seriam difíceis - senão impossíveis - de sintetizar diretamente.

Também deve ser possível enganar as células sintéticas em proteínas em evolução ou outras moléculas que são otimizadas para várias tarefas biológicas, diz Romesberg. Ele fundou uma empresa, a Synthorx, para explorar essas possibilidades.

De acordo com Benner, no entanto, o potencial comercial pode ser limitado pelo custo de fazer os precursores moleculares dos nucleotídeos X e Y, que devem ser adicionados ao fluido que banha as células bacterianas na configuração de Romesberg & # x27s. Por esse motivo, Benner está trabalhando em uma estratégia diferente: tentar reengenharia do metabolismo das células para sintetizar os precursores por conta própria. Mas essa abordagem tem seus próprios desafios. É um problema "terrivelmente difícil", disse Benner. Até agora, sua equipe projetou cinco das seis enzimas necessárias, diz ele. & quotMas o último é uma dor de cabeça. & quot

Romesberg insiste que o custo não será proibitivo. Além disso, diz ele, a necessidade de continuar alimentando as bactérias com os precursores X e Y é, na verdade, uma proteção importante: se alguns dos insetos escaparem do laboratório, eles rapidamente voltarão a produzir DNA natural de quatro letras.

Nesse ponto, Benner concorda. "O público está sempre perguntando, você vai criar um monstro que vai escapar e dominar o mundo", disse ele. Benner acha que esses medos são exagerados, especialmente neste caso. & quotSe sair do laboratório, & # x27s não irá ao zoológico de San Diego e começará a comer os pinguins. & quot


Resultados

Adequação do código genético em relação a erros de tradução

Considere o código genético natural. É constituído por 64 códons, cada um consistindo em três bases consecutivas de DNA (A, G, C, T) ou bases de RNA (A, G, C, U). Esses 64 códons são divididos em 21 conjuntos de sinônimos, cada um codificando um dos 20 aminoácidos naturais ou correspondendo a um sinal de parada, portanto, para cada códon, c, um aminoácido (ou sinal de parada) uma é atribuído por meio de uma função uma(c) Considere agora um erro durante a transcrição de DNA para RNA ou durante a tradução de RNA para proteína, em que o códon c é confundido com códon c'. Este erro, portanto, resulta em aminoácido uma(c) sendo substituído por aminoácido a '= a(c'). O custo associado é estimado por uma função g (a, a '), que mede a diferença entre os aminoácidos uma e uma'no que diz respeito às suas propriedades físico-químicas ou ao seu papel na (des) estabilização das estruturas proteicas quando uma ou uma' corresponde a um códon de parada, definimos g (a, a ') = 0. Diferentes funções de custo g será discutido na próxima seção. Seguindo Freeland e Hurst [23], a adequação Φ de um código é medida pela média do custo g sobre todos os códons c e todos os erros de base única c - & gt c '

Onde p(c' | c) é a probabilidade de leitura incorreta do códon c como códon c'. Se focarmos apenas nos erros de transcrição, como fazem Haig e Hurst em [22], então todos p (c '| c) os valores devem ser considerados iguais. Mas aqui consideramos os erros de tradução, como fazem Free-land e Hurst em [23] e, portanto, p(c' | c) muda conforme c e c 'diferem na primeira, segunda ou terceira base, e levam a uma transição ou transversão. Uma transição é a substituição de uma purina (A, G) por outra purina, ou uma pirimidina (C, U / T) por outra pirimidina, enquanto uma transversão troca purinas e pirimidinas. Com base em dados experimentais que indicam que as transições são mais comuns do que transversões [28,29,30,31], e que os erros na terceira base são mais frequentes do que os erros na primeira base, que são eles próprios mais frequentes do que os erros na segunda base [10,26,27], Freeland e Hurst [23] escolheram os seguintes valores de p(c' |c), que também usamos aqui:

p (c ' | c) = 1/ N se c e c 'diferem apenas na 3ª base,

p(c' | c) = 1/ N se c e c 'diferem apenas na 1ª base e causam uma transição,

p(c' | c) = 0.5/ N se c e c 'diferem apenas na 1ª base e causam uma transversão,

p(c' | c) = 0.5/ N se c e c 'diferem apenas na 2ª base e causam uma transição,

p(c' | c) = 0.1/ N se c e c 'diferem apenas na 2ª base e causam uma transversão,

p(c' | c) = 0 se c e c 'diferirem em mais de 1 base.

Onde N é um fator de normalização garantindo que Σc'p (c ' | c) = 1. Obviamente, essas probabilidades aproximam-se apenas aproximadamente dos verdadeiros vieses de transição / transversão e posição de base. No entanto, a aptidão computada do código genético tem se mostrado relativamente insensível aos seus valores precisos [34].

Incorporando frequências de aminoácidos na função de fitness

Voltemos agora às correlações entre o número de códons que codificam um aminoácido e a frequência desse aminoácido (ver Figura 1). King e Jukes [33], que primeiro notaram essa correlação, sugeriram que a maioria dos aminoácidos nos genomas surgiu por mutações aleatórias que não afetam as propriedades e a função das proteínas. Como consequência, o número de códons sinônimos determina a frequência dos aminoácidos.

Uma interpretação alternativa, assumindo uma cadeia de causalidade muito diferente, é que as frequências de aminoácidos são fixadas por suas propriedades físico-químicas. Por exemplo, o triptofano seria um aminoácido raro porque suas propriedades específicas raramente são necessárias nas proteínas ou porque é difícil de sintetizar. A correlação entre as frequências de aminoácidos e o número de códons sinônimos (Figura 1) seria então interpretada como sendo devida a um ajuste do código genético natural à frequência dos aminoácidos. As conclusões alcançadas usando essas duas interpretações opostas são abordadas na discussão.

Independentemente da cadeia de causalidade assumida, é natural esperar que um erro de códon substituindo um tipo de aminoácido frequente por outro leve a erros mais absolutos e, portanto, tenha mais consequências, pelo menos em média, do que um erro que afeta um aminoácido raro . As frequências com que os diferentes aminoácidos ocorrem nas proteínas, que são semelhantes em diferentes organismos (Tabela 1), são levadas em conta apenas de forma imperfeita na função de adequação Φ FH dada pela Equação (1), por causa da correlação imperfeita entre a frequência de aminoácidos e o número de códons sinônimos (Figura 1). Para contabilizar adequadamente as frequências de aminoácidos, propomos uma função de adequação modificada Φ faa :

Onde p (a) é a frequência relativa do aminoácido uma, e n(c) é o número de códons no bloco para o qual c pertence. Em outras palavras, n(c) é o número de sinônimos que codificam para o aminoácido uma(c) naquela c códigos para. Observe que a Equação (2) supõe que não há viés de códon, ou seja, os diferentes sinônimos de um determinado aminoácido aparecem com a mesma frequência.

Para medir o efeito da frequência de aminoácidos no valor da função de aptidão Φ faa , definimos, para efeito de comparação, outra função de aptidão Φ equif onde todos os aminoácidos são supostamente igualmente frequentes, isto é, p(uma) = 1/20:

Custo de substituir um aminoácido por outro

A função g (a,uma') nas Equações (1) e (2) mede o custo - no que diz respeito à estabilidade e estrutura da proteína - de substituir o aminoácido uma por uma'. Esse custo depende de diversos fatores físico-químicos e energéticos. As interações hidrofóbicas são conhecidas por constituir uma contribuição energética dominante para a estabilidade da proteína. Portanto, uma escolha natural para g consiste em tirar a diferença quadrática na hidrofobicidade h dos aminoácidos uma e uma':

g hidro (uma, uma') = (h(uma) - h(uma')) 2 (4)

Existem várias escalas de hidrofobicidade para aminoácidos. Testamos dois deles. O primeiro é a escala de polaridade definida por Woese et al. [35], que é o usado por Haig e Hurst [22] e Freeland e Hurst [23]. Na segunda escala, h (a) é a acessibilidade média de solvente do aminoácido uma derivado de um conjunto de 141 estruturas de proteínas bem resolvidas e refinadas com baixa identidade de sequência (ver Métodos), acessibilidades de solvente são calculadas usando SurVol [36]. Denotamos as funções de custo associadas como g pol e g Acesso , respectivamente.

Embora as forças hidrofóbicas dominem as proteínas, outros tipos de interações também contribuem para a estabilidade da proteína (ver [24,25] para revisões). Portanto, também tentamos conceber uma função de custo melhor g (a, a '), medindo com mais precisão a diferença entre os aminoácidos uma e uma'. Esta nova função é inspirada por cálculos recentes da mudança na energia livre de uma proteína quando um único aminoácido sofre mutação [37,38,39]. É obtido por mutação em sílico, em todas as proteínas do conjunto acima mencionado de 141 estruturas de proteínas e em todas as posições, os aminoácidos de tipo selvagem nos 19 outros possíveis, e avaliando as mudanças resultantes na dobragem de energia livre com potenciais de força médios derivados do mesmo conjunto de dados de estrutura. Os elementos da matriz M(uma,uma') são obtidos como a média de todas as mudanças de energia livre de dobramento computadas, que correspondem a uma substituição a → a '. Detalhes sobre o procedimento e o valor dos elementos da matriz M (a, a ') são fornecidos na seção Métodos. Esta matriz é considerada uma função de custo:

g mutação (uma, uma') = M(uma, uma') (5)

Com o propósito de comparar g mutação com uma matriz de referência que reflete exclusivamente a estrutura do código genético, definimos a função de custo:

g código (uma,uma') = 3 - Δ (uma,uma') (6)

onde Δ (uma,uma') é zero quando uma e uma' coincidir e, de outra forma, igual ao número mínimo de bases que devem ser alteradas para transformar uma codificação de códon para uma em um códon de codificação para uma'.

Como uma última função de custo, usada apenas para comparação com o trabalho anterior [34,40], consideramos as mutações pontuais aceitas 74-100 (PAM74-100) matriz de substituição [41], uma das matrizes mais comumente usadas no contexto de alinhamento de sequência de proteína:

g PAM (uma, uma') = PAM74-100 (uma,uma') (7)

Esta matriz é derivada do padrão de frequências de substituição de aminoácidos observadas em pares de sequências de proteínas homólogas altamente divergentes de ocorrência natural. No entanto, o uso desta matriz para medir a aptidão do código genético [34,40] tem sido criticado [42], pois as matrizes derivadas de padrões de substituição observados em proteínas homólogas refletem não apenas a similaridade entre os aminoácidos no que diz respeito a seus aspectos físico-químicos e energéticos propriedades, mas também a facilidade com que um aminoácido é transformado em outro e, portanto, sua proximidade no código genético. No entanto, como o PAM74-100 matriz é derivada de sequências de proteínas altamente divergentes, pode-se esperar que este efeito seja relativamente limitado. Este é realmente o caso, pois o coeficiente de correlação linear entre as entradas não-diagonais de g PAM e g código é apenas 0,43. No entanto, o coeficiente de correlação entre g mutação e g código ainda é muito menor, ou seja, 0,19, de modo que g mutação não pode de forma alguma haver suspeita de inclusão de informações sobre proximidade no código genético. Finalmente, observe que o coeficiente de correlação entre g mutação e g PAM é igual a 0,60 essas matrizes, portanto, compartilham características comuns, mas também contêm informações diferentes. Isso não é surpreendente, considerando que suas derivações usam pontos de partida muito diferentes (estruturas tridimensionais de proteínas em um caso, similaridade de sequência em outro).

O código genético versus códigos aleatórios

Para avaliar a robustez do código genético natural com relação a erros de tradução, calculamos as funções de aptidão Φ FH , Φ equif e Φ faa usando as Equações (1) a (3) para o código genético natural e comparando-o com os valores adaptativos correspondentes dos códigos aleatórios. Os códigos aleatórios são obtidos mantendo a estrutura do bloco de códons do código genético natural, onde cada bloco corresponde a sinônimos que codificam para o mesmo aminoácido (ou sinal de parada). Ao gerar um código aleatório, o sinal de parada é mantido atribuído ao mesmo bloco do código genético natural, enquanto os diferentes aminoácidos são trocados aleatoriamente entre os 20 blocos restantes. Assim, cada código aleatório é simplesmente especificado por uma função diferente a (c) nas Equações (1) a (3). Este é o procedimento usado anteriormente por Haig e Hurst [22] e Freeland e Hurst [23].

Assim, em um primeiro estágio, calculamos as funções de aptidão Φ equif e Φ faa para o código genético natural e para 10 9 códigos gerados aleatoriamente, usando as três funções de custo g pol , g Acesso e g mutação . Em seguida, calculamos a fração f de códigos aleatórios cujo valor de Φ é inferior ao do código natural. Essa fração é supostamente uma boa estimativa do mérito relativo do código genético natural em comparação com outros códigos. Os resultados são apresentados na Tabela 2. Parece que esta fração f é sempre menor para Φ faa do que para Φ equif . Isso é especialmente verdadeiro para a função de custo g mutação Onde f é 300 vezes menor. Este resultado indica que o código natural parece ser melhor otimizado em relação aos erros de tradução se as frequências de aminoácidos forem levadas em consideração.

Para investigar isso mais a fundo, analisamos qual das funções de custo g pol ,g Acesso ou g mutação o código genético parece ser melhor otimizado para. Nós comparamos a fração f dos melhores códigos para cada uma das funções de custo usando a função de adequação Φ faa . Para as funções de hidrofobicidade g pol e g Acesso , o resultado é praticamente o mesmo: f é cerca de 0,5-1,0 em 10 6. O erro estatístico relativo neste valor é da ordem de N -1/2, onde N é o número de códigos aleatórios melhor do que o natural que foi encontrado em nossa amostra de 10 9 códigos aleatórios, portanto, N é cerca de 650-1.200, e o erro é insignificante. Para a função de custo mutacional g mutação , f é várias ordens de magnitude menor, ou seja, 2 em 10 9.

Este resultado mostra que o código genético natural parece ainda mais ótimo se a função de custo g mutação é usado do que se as funções de custo baseadas na hidrofobicidade forem consideradas. Como g mutação foi calculado a partir de alterações de estabilidade de proteínas efetuadas por mutações pontuais, podemos concluir que o código genético é otimizado de forma a limitar o efeito de erros de tradução na estrutura tridimensional e estabilidade das proteínas codificadas. Observe que a melhoria trazida pela escolha de g mutação resulta do fato de que provavelmente representa melhor o custo de uma mutação do que uma mera diferença de hidrofobicidade, por exemplo, glicina, prolina e cisteína têm vizinhos próximos em hidrofobicidade, enquanto o custo de sua mutação é contabilizado por g mutação é alto. Isso se deve ao seu papel especial na determinação da estrutura da proteína: a glicina e a prolina podem adotar ângulos de torção de backbone essencialmente inacessíveis a outros aminoácidos, e a cisteína pode formar ligações dissulfeto.

Para verificar a importância deste resultado, calculamos a fração f de códigos aleatórios que superam o natural por aleatória escolhas das frequências de aminoácidos, distintas das frequências naturais p (a). Geramos 10 2 conjuntos de p(uma) valores, e, para cada um deles, estimou a fração f (em uma amostra de 10 6 códigos aleatórios). A porcentagem de conjuntos de frequência de aminoácidos aleatórios que resultam em uma fração inferior f do que as frequências naturais é mostrado na Tabela 3. Descobrimos que uma atribuição aleatória das frequências de aminoácidos não diminui / na maioria (pelo menos 97%) dos casos, e esta tendência persiste para todas as funções de custo g. Assim, a probabilidade de que a diminuição de f, observado na Tabela 2, ao passar de Φ equif para Φ faa , foi devido ao acaso é bastante limitado. Podemos, portanto, concluir que o código genético é otimizado de forma a levar em consideração as frequências naturais de aminoácidos.

Também investigamos se o resultado de que o código natural é melhor otimizado se as frequências de aminoácidos são levadas em consideração não depende crucialmente das frequências de aminoácidos usadas. Para isso, calculamos a fração f de códigos aleatórios com Φ inferior faa valor do que o código genético para os quatro conjuntos de frequências de aminoácidos listados na Tabela 1, que são calculados a partir de genomas de eucariotos, arquéias, bactérias e de todos esses genomas juntos. Os resultados acabaram sendo essencialmente insensíveis ao conjunto de frequência escolhido: as frações f diferem no máximo por um fator de dois, o que deixa todas as conclusões inalteradas.

Também incluímos na Tabela 2 os resultados com base na função de aptidão Φ FH . Pode-se argumentar que essa função leva em consideração parcialmente, mas de maneira imperfeita, as freqüências de aminoácidos. Na verdade, para esta função de adequação, cada códon recebe o mesmo peso, que corresponde a cada aminoácido sendo atribuído a uma frequência proporcional ao número de sinônimos n(uma) codificação para ele. No caso do código genético natural, esta frequência corresponde aproximadamente à frequência de aminoácidos, pois há uma correlação entre n(uma) e p(uma), conforme mostrado na Figura 1. Mas para códigos aleatórios, em que os aminoácidos são trocados aleatoriamente entre os blocos de códons, essa correspondência é interrompida. Assim, a forma como Φ FH leva em conta as frequências de aminoácidos depende do código considerado. Isso explica porque a fração f de códigos aleatórios melhores do que o natural é aproximadamente da mesma ordem usando Φ FH e Φ equif . Observe que f é sempre maior para Φ FH do que para Φ faa , indicando novamente a importância das frequências de aminoácidos na otimização do código genético.

Para efeito de comparação, adicionamos na Tabela 2 os valores da fração f de códigos aleatórios com um Φ menor faa valor do que o natural, usando as funções de custo g PAM e g código , que incluem informações sobre a estrutura do código genético. Com g PAM , a fração f é o mesmo que com g mutação , enquanto com g código , não encontramos nenhum código aleatório melhor do que o natural entre os 10 9 códigos aleatórios testados. Estimar f sem ter que gerar um conjunto maior, usamos o seguinte procedimento. Calculamos, a partir dos valores de Φ faa para os 10 9 códigos aleatórios, a função de probabilidade π (Φ) faa ter um determinado valor de Φ faa . Nós montamos registro(π (Φ) faa ) para um polinômio de quarto grau, e extrapolou essa curva até o valor de Φ faa para o código natural. Isso fornece uma estimativa da fração f de códigos aleatórios que têm um Φ menor faa valor. Observe que essa estimativa é essencialmente insensível ao grau do polinômio. Descobrimos com este procedimento que / é da ordem de 10 -17 com g código e, portanto, cerca de 10 8 vezes menor do que com g PAM eg mutação .

Não é surpreendente que a fração f de códigos aleatórios que se saem melhor do que o código natural é extremamente pequeno para g código , já que essa matriz reflete exclusivamente a proximidade dos aminoácidos no código genético e torna a questão da adequação do código tautóloga. Isso tem sido suspeito por g PAM função de custo também [42]. De fato, pode-se argumentar que g PAM contém informações sobre a proximidade dos aminoácidos no código genético, sobrepostas na medida desejada de sua similaridade na preservação da estrutura protéica, porque é calculado a partir de substituições de aminoácidos em famílias de proteínas evolutivamente relacionadas, que são mais frequentes entre os aminoácidos que estão mais próximos no código genético. O fato de que g PAM e g mutação rendimento semelhante f os valores (ver Tabela 2) podem ser considerados para indicar que esse não é o caso e, portanto, que ambas as funções de custo podem ser usadas de forma confiável para estimar a adequação do código contra erros de tradução. Esta interpretação suporta análises anteriores que usaram o g PAM matriz [34,40]. Pode-se, no entanto, também argumentar que g PAM descreve a estrutura da proteína menos bem do que g mutação e inclui um pouco mais informações sobre o código genético (conforme monitorado por coeficientes de correlação de 0,43 e 0,19 de g PAM e g mutação em relação a g código ) Esses dois efeitos tendem a se compensar, e pode-se esperar que produzam f valores para g PAM e g mutação . Portanto, parece mais seguro usar g mutação como função de custo, porque, pela própria definição, parece captar informações estruturais importantes e ser independente da estrutura do código.

Também investigamos o quão ótimo é o código genético em relação às trocas de aminoácidos que não afetam a degenerescência dos códons. Geramos exaustivamente todos os códigos alternativos que preservam a degenerescência dos aminoácidos e calculamos a fração f desses códigos que se saem melhor do que o código natural no que diz respeito a erros de tradução. Nós achamos isso f é da ordem de 10 -6 para as três funções de aptidão Φ faa , Φ equif e Φ FH (Tabela 4). É, portanto, semelhante ao f valor calculado no conjunto irrestrito de códigos alternativos para Φ equif e Φ FH , e muito maior para Φ faa . Este resultado simplesmente reflete a correlação entre a degenerescência do códon e a frequência de aminoácidos (Figura 1). Na verdade, essa correlação implica que uma proporção muito maior dos melhores códigos mantém a degenerescência, se a frequência dos aminoácidos for levada em consideração na função de adequação, como em Φ faa . Em contraste, em Φ equif e Φ FH a frequência de aminoácidos não é considerada e f é da mesma ordem com os conjuntos restritos e irrestritos.

Foi proposto que o código genético evoluiu de um código ancestral mais simples, codificando apenas alguns aminoácidos presentes nos primeiros tempos, e que novos aminoácidos aparecendo como derivados biossintéticos dos originais foram incorporados por subdivisão e redesignação de seus códons sinônimos [4,5,6,7]. Esta chamada hipótese de coevolução é apoiada pela observação de que aminoácidos biossinteticamente relacionados estão próximos dentro do código genético [6,43]. Para investigar a otimização do código genético na estrutura de coevolução, calculamos a fração f de códigos alternativos que funcionam melhor do que o código natural contra erros de tradução e que diferem do código natural por embaralhar os aminoácidos pertencentes à mesma via biossintética [34,44]. Os embaralhamentos permitidos são dados na legenda da Tabela 4. Descobrimos que f é igual a 2,9 × 10 -8, enquanto que é igual a 2 × 10 -9 para o conjunto irrestrito que permite todos os embaralhamentos (Tabela 4). Isso significa que a fração f de códigos melhores é um pouco maior no conjunto restrito à biossíntese do que no conjunto completo e, portanto, a taxa de otimalidade é ligeiramente mais baixa. Este resultado também pode ser visto de forma diferente. Ao considerar o número total de códigos nos dois conjuntos (que são da ordem de 10 8 e 10 18), isso significa que há apenas seis códigos que superam o código natural no conjunto restrito, enquanto há 10 9 desses códigos no conjunto irrestrito. This is particularly striking given that our definitions of cost functions and sets of biosynthetically related amino acids only constitute approximations [45]. We can thus conclude that the genetic code is quite robust against mistranslation in the space of all alternative codes, and is close to being fully optimal if historical biosynthetic constraints are taken into account.

A complementary measure of the optimality of the genetic code is its percentage of optimization, defined as 100%(Φ código - Φ quer dizer)/(Φ melhor - Φ quer dizer), onde Φ código is the fitness of the genetic code, Φ melhor fitness of the best of all possible codes and Φ quer dizer the average fitness over all codes [20,21,46]. This measure indicates how close the fitness value of the genetic code is to the fitness value of the optimal code. Note however that this optimality measure has no absolute meaning and may not be compared among fitness functions Φ defined on the basis of different cost functions g to illustrate this, consider the following example: if g hidro is defined by |h(a)-h(a')| ao invés de (h(a)-h(a')) 2 (see Equation (4)), the fraction f of better codes remains unchanged but the percentage of optimality does change [34]. It is, however, meaningful to compare the percentage of optimization of the genetic code in the unrestricted and biosynthesis restricted sets with a same g função. For Φ faa , we find that this percentage is equal to 97% and 98% in the two sets, respectively. This indicates that the fitness value of the genetic code is not very far from that of the best possible code, whether focusing on the subset of alternative codes preserving biosynthetic proximities, or considering all possible codes.


Opções de acesso

Obtenha acesso completo ao diário por 1 ano

Todos os preços são preços NET.
O IVA será adicionado mais tarde no check-out.
O cálculo do imposto será finalizado durante o checkout.

Obtenha acesso limitado por tempo ou ao artigo completo no ReadCube.

Todos os preços são preços NET.


Expanded palette

But Sebastian Greiss and Jason Chin have re-engineered the nematode worm's gene-reading machinery to include a 21st amino acid, not found in nature.

Dr Chin of the Medical Research Council's Laboratory of Molecular Biology (where Francis Crick and James Watson first cracked the structure of DNA) describes the technique as "potentially transformational": designer proteins could be created that are entirely under the researchers' control.

The development builds on techniques first developed at the Scripps Research Institute, in La Jolla, US, where Dr Chin worked 10 years ago.

The genetic code comes in four DNA letters, A,C,G and T the genetic machinery reads it in words three letters long, called codons, which stand for the individual amino acid blocks to be built into a growing protein.

At Scripps, researchers showed in a paper in PNAS how one of those three letter words could be re-assigned, so that cells would read it as an instruction to incorporate an unnatural amino acid, one not normally found in living organisms. But that was in the bacterium E. coli until now, no one had succeeded in doing the same in a whole animal.

Jonathan Hodgkin, professor of genetics at Oxford University, welcomes the new development, saying it "creates exciting new opportunities for research on C. elegans& quot.


Figura 4

Figure 4. Characterization of unnatural amino acid incorporation in yeast with the orthogonal MbPylRS/MilímetrostDNACUA Pyl pair. (A) Amber suppression efficiency of hSOD33TAG-His6 in yeast in the presence or absence of 1 (5 mM), 2 (10 mM), 3 (10 mM), 4 (2 mM), or 5 (1.3 mM) by anti-His6 western blot. Yeast cells containing the hSOD expression construct were transformed with the dicistronic SctDNAUCU Arg −MilímetrostDNACUA Pyl construct for expressing the orthogonal MilímetrostDNACUA Pyl in yeast and the appropriate aminoacyl-tRNA synthetase (aaRS). PylRS (wild-type MbPylRS), AcKRS (a variant of MbPylRS that has been evolved to use 2(3)), TfaKRS (a variant of MbPylRS that can use 3, see text), PcKRS (a variant of MbPylRS that has been evolved to use 4(2)). (B) Coomassie SDS-PAGE analysis of purified hSOD from expressions in the presence and absence of 1, 2, ou 3. Full protein MS (C−E) and Glu-C MS/MS (F−H) confirm the incorporation of unnatural amino acids 1 (C/F found 16691 ± 1.5 Da, expected 16691 Da), 2 (D/G found 16651 ± 1.5 Da, expected 16651) and 3 (E/H found 16705 ± 1.5 Da, expected 16705) at the genetically encoded site. hSOD is copurified as a heterodimer with yeast SOD (minor additional peak in spectra at 15722 Da identity was confirmed by Glu-C MS/MS). For full gels and western blots and larger versions of MS and MS/MS data see Supporting Information Figure 2.


Requirements of a Code

The information transfer from DNA to protein, called expressão genetica , occurs in two steps. Na primeira etapa, chamada transcrição , a DNA sequence is copied to make a modelo for protein synthesis called messenger ribonucleic acid (messenger RNA, or mRNA). During protein synthesis, ribossomos and transfer RNA (tRNA) use the genetic code to convert genetic information contained in mRNA into functional protein. (Formally speaking, the genetic code refers to the RNA-amino acid conversion code and not to DNA, though usage has expanded to refer more broadly to DNA.)

Mathematics reveals the minimum requirements for a genetic code. The ribosome must convert mRNA sequences that are written in four bases — A, G, U, and C — into proteins, which are made up of twenty different amino acids. A one base to one amino acid correspondence would code for only four amino acids (4 1 ). Similarly, all combinations of a two-base code (for example, AA, AU, AG, AC, etc.) will provide for only sixteen amino acids (4 2 ). However, blocks of three RNA bases allow sixty-four (4 3 ) combinations of the four nucleotides, which is more than enough combinations to correspond to the twenty distinct amino acids. So, the genetic code must use blocks of at least three RNA bases to specify each amino acid. (This reasoning assumes that each amino acid is encoded by the same size block of RNA.)

In addition, a ribosome must know where to start synthesizing a protein on an mRNA molecule and where to stop, and start and stop signals require their own RNA sequences. A series of experiments carried out in the 1960s confirmed these mathematical speculations, and went on to determine which triplet sequence (called a códon ) specifies which amino acid.

Indeed, the genetic code uses codons of three bases each, such as ACC or CUG. Therefore, the protein synthesis machinery reads every triplet of bases along the mRNA and builds a chain of amino acids — a protein — accordingly. Reading triplets, however, would allow a ribosome to start at any one of three positions within a given triplet (see Fig. 1). The position that the ribosome chooses is based on the location of the start signal and is called the "reading frame."

Experiments have shown all but three of the sixty-four possible codons that A, G, U, and C specify code for one amino acid each. This means that most amino acids are encoded by more than one codon. In other words, the genetic code is said to be redundant or degenerate. This redundancy allows the protein-synthesizing machinery of the cell to get by with less, as will be seen below. The three that don't, the "nonsense" codons, indicate the end of the protein-coding region of an mRNA, and are termed stop codons.


Expanding and Reprogramming the Genetic Code of Cells and Animals

Genetic code expansion and reprogramming enable the site-specific incorporation of diverse designer amino acids into proteins produced in cells and animals. Recent advances are enhancing the efficiency of unnatural amino acid incorporation by creating and evolving orthogonal ribosomes and manipulating the genome. Increasing the number of distinct amino acids that can be site-specifically encoded has been facilitated by the evolution of orthogonal quadruplet decoding ribosomes and the discovery of mutually orthogonal synthetase/tRNA pairs. Rapid progress in moving genetic code expansion from bacteria to eukaryotic cells and animals (C. elegans e D. melanogaster) and the incorporation of useful unnatural amino acids has been aided by the development and application of the pyrrolysyl–transfer RNA (tRNA) synthetase/tRNA pair for unnatural amino acid incorporation. Combining chemoselective reactions with encoded amino acids has facilitated the installation of posttranslational modifications, as well as rapid derivatization with diverse fluorophores for imaging.


19 Images of The Genetic Code Worksheet Answers

Hi there, Now we bring you some inspiring images that we've gathered in case you need them, for this time we are more concern related with The Genetic Code Worksheet Answers.

When we talk about The Genetic Code Worksheet Answers, below we can see particular variation of photos to complete your references. protein synthesis worksheet answer key, genetics monohybrid crosses worksheet answer key and breaking the code worksheet answers are three main things we want to show you based on the gallery title. Continue with more related things such genetic mutation worksheet answers, dna mutations practice worksheet answer key and simple genetics practice problems worksheet answers.

Our goal is that these The Genetic Code Worksheet Answers photos collection can be a guidance for you, give you more references and also help you get what you need. If you don't mind share your comment with us and our readers at comment form at last part of the page, and also, don't forget to tell people about this gallery if you know there are people out there that want references associated with these photos.

Dicas úteis para projetar planilhas:

Breaking the Code Worksheet Answers através da

Protein Synthesis Worksheet Answer Key através da

DNA Mutations Practice Answer Key através da

Simple Genetics Practice Problems Answers através da

Genetic Mutation Answers através da

Genetics Monohybrid Crosses Answer Key através da

Genetics Answer Key através da

Genetics Answer Key através da

Mutations Answer Key através da

Genetics Review Answers através da

Human Genetic Disorders através da

Genetic Engineering Answers através da

Mutations Answer Key através da

Gene Mutations Answer Key através da

Mutations Answer Key através da

Simple Genetics Practice Problems Answers através da

Genetic Variation Answers através da

AP Biology Genetics através da

DNA Structure Answers através da

Our website built from persons which are really appraise original work from every one, without exception! That's why we always keep the original photos without changing anything including the copyright mark. Also, we ensure to include the owner link where we found it, below each photos. Many message came to us about their right in relation with the images on our gallery. If you want to make sure what is your right, you need to contact the website on each pictures, actually we cannot determine what is your right. We notice you, if there is no watermark does not mean the images can be freely used without permission.


Assista o vídeo: Biologia - Código Genético - Visão Geral (Dezembro 2022).