Em formação

Existe referência para a composição dos genomas virais?

Existe referência para a composição dos genomas virais?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Em primeiro lugar, perdoe-me pela pergunta mal escrita.

Eu não sou biólogo. Não sou médico nem virologista. Na verdade, sou um físico, e há muito que tenho essa questão em mente.

O que estou tentando perguntar é se existe uma espécie de arquivo de texto ou um site (ou um livro) onde eu possa ler sobre "composição" de vírus.

"Composição" significa algo como

"Este é o rinovírus, e sua" composição "genética é ACTGCT" (é claro que acabei de inventar ...).

Não sei como me expressar com bons termos porque não estou familiarizado com este campo, então sinta-se à vontade para editar a pergunta se ela parecer pouco clara.

Novamente, o que estou pedindo é uma espécie de banco de dados de sequências genéticas sobre vírus e assim por diante.

Desde já, obrigado!


O NCBI abriga uma coleção de genomas virais no portal Viral Genomes. Atualmente, eles têm 5921 genomas virais e, acessando o link anterior, você pode navegar pelas sequências das principais famílias virais.

Se você tiver uma sequência de ácido nucléico ou de aminoácidos, ela pode ser pesquisada contra as sequências do NCBI aqui.

Uniprot também tem um projeto de anotação de sequência de proteína viral que eles descrevem como tal;

O conceito deste site é associar conhecimentos específicos para cada família de vírus com proteínas virais e sequências genômicas. Todas as informações disponíveis são apresentadas em uma ficha técnica de vírus concisa e acessível, associada à lista ordenada de entradas revisadas. O local cobre toda a virosfera conhecida. A seção de banco de dados permite o acesso a entradas de proteínas UniProtKB, bem como a bancos de dados específicos de virologia.

Nossos esforços estão atualmente direcionados à ontologia viral e à anotação de cepas de referência. Uma ontologia robusta permitirá uma definição mais precisa do envolvimento de cada proteína nas etapas de replicação viral. A anotação da cepa de referência se tornará a referência para cada um dos 334 gêneros.

Seu trabalho pode ser acessado através do uniprot.org ou do portal do projeto em; http://viralzone.expasy.org/


O conteúdo viral dos genomas humanos é mais variável do que pensávamos

Partes do DNA humano são de origem viral: muitas delas foram inseridas no material genético primordial de nossos ancestrais há muitos milhões de anos e foram herdadas por gerações sucessivas desde então. Assim, não se pensa que variam muito nos genomas dos humanos modernos. Retrovírus endógenos humanos (HERV) são de longe as sequências derivadas de vírus mais comuns em nosso genoma. Uma nova pesquisa publicada na Mobile DNA mostra um mecanismo que introduziu mais variação interindividual no conteúdo de HERV entre humanos do que anteriormente apreciado.

Existem partes do DNA humano que são de origem viral: muitas delas foram inseridas no material genético primordial de nossos ancestrais há muitos milhões de anos e foram herdadas por gerações sucessivas desde então. Retrovírus endógenos humanos (HERV) são de longe as sequências derivadas de vírus mais comuns em nosso genoma. A maioria das sequências de HERV foram assimiladas há muito tempo e, portanto, são compartilhadas por todos os indivíduos da população humana, mas nem todos são e sabe-se que alguns são encontrados em apenas um subconjunto de indivíduos. A maioria desses elementos HERV não fixados são conhecidos por descendem de eventos de inserção relativamente recentes que ainda estão segregando na população humana. Mas uma nova pesquisa publicada recentemente em DNA móvel mostra que outro mecanismo introduziu mais variação interindividual no conteúdo de HERV entre humanos do que anteriormente apreciado. Como isso pode ser?

Primeiro, é importante pensar sobre as características estruturais dos HERVs. Para serem integradas no cromossomo hospedeiro, essas sequências devem ser elementos de comprimento total chamados de provírus. Cada provírus é organizado em torno de um núcleo central contendo os genes codificadores virais ensanduichados entre longas sequências não codificantes repetidas em cada extremidade chamadas de repetições terminais longas (LTRs) (ver Figura 1). Após a integração, os dois LTRs de um provírus, que são idênticos no momento da inserção, freqüentemente se recombinam para formar o que é referido como um LTR solo. O processo de recombinação elimina genes virais internos junto com um dos dois LTRs, deixando para trás um único LTR. Foi estimado anteriormente que 90% de todos os HERVs no genoma humano são LTRs solo, e apenas 10% permanecem em sua forma proviral. Mas e se alguns desses elementos provirais ainda estiverem passando pela transição para se tornarem LTRs solo? Pesquisadores da University of Utah e da Cornell University começaram a investigar essa questão e avaliar até que ponto o processo de recombinação LTR poderia gerar variação de HERV entre os humanos.

A Dra. Jainy Thomas desenvolveu uma nova abordagem computacional que permitiria a eles rastrear uma grande quantidade de sequências de DNA de diversas populações humanas para encontrar o que presumivelmente seriam eventos raros de recombinação LTR. Dada a vasta quantidade de sequências de HERV em genomas humanos, a tarefa era semelhante a encontrar agulhas em um palheiro. Um conjunto de dados disponíveis publicamente, apoiado pela Fundação Simons, de sequências de genoma inteiras representando 130 populações genéticas diferentes foram pesquisadas por variantes de três famílias retrovirais diferentes: HERV-K (HML2), HERV-W e HERV-H. O pipeline que ela desenvolveu permitiu que a Dra. Thomas recuperasse a maioria das variantes do HERV previamente catalogadas e descobrisse muitas mais (Figura 2). Talvez não seja surpreendente que a maioria das variantes recém-descobertas fosse aparentemente rara, visto que foram encontradas em apenas um ou alguns indivíduos. Mas eles também foram inesperados, visto que muitos desses HERVs foram inseridos há muito tempo no DNA de nossos ancestrais e alguns foram até mesmo compartilhados com nossos parentes grandes símios e, portanto, considerados fixos na população humana. No entanto, a Dra. Thomas foi capaz de confirmar experimentalmente que várias dessas variantes segregam na população humana, validando assim a eficiência de sua abordagem computacional.


Microorganismos: vírus - genomas virais

Os genomas dos vírus são como qualquer outro genoma: eles contêm todos os genes necessários para se replicar. No entanto, os vírus são muito preguiçosos e usam a maior parte da maquinaria da célula hospedeira para fazer o que precisam para se replicar. Mais ou menos como naquela vez em que deixamos aquele carnie entrar em nossa casa, quando voltamos a secadora havia sumido ... e havia doze carnies e um jogo de arremesso de argola em seu lugar. Sim, assim mesmo.

Os vírus têm genes que codificam um mínimo de duas proteínas:

  • Replicase - uma enzima que replica o genoma
  • Capsídeo - uma proteína que protege o genoma.

Os vírus podem ter genes que codificam proteínas que auxiliam na infecção, sobrevivência ou outras habilidades virais úteis. (BTW: estes estão na ordem dos genes comuns aos raros):

  • Protease - enzima que processa proteínas virais e permite a montagem ou maturação para infectar outras células virais.
  • Glicoproteína - (apenas vírus com envelope) permite que o vírus entre em uma célula, tem como alvo tipos de células específicos para vírus e ajuda na montagem do vírus.
  • Proteínas de desligamento do hospedeiro - proteínas de vírus que desligam as atividades do hospedeiro para que apenas os genes do vírus sejam produzidos.
  • Proteínas de defesa anti-hospedeiro - o número e o tipo desses diferentes genes variam, dependendo do vírus. Essas proteínas impedem que o mecanismo de defesa do hospedeiro interrompa a replicação do vírus.

Esses genes são codificados em polímeros de RNA ou DNA e são de fita simples ou dupla.


Tipos de genomas de vírus

Uau. Isso foi muito, certo? Bem, fica pior. Enquanto a maioria dos genomas não é segmentada (o genoma está todo em um pedaço de RNA ou DNA), alguns genomas são segmentados, o que significa que há vários fragmentos de material genético que formam um genoma de vírus completo. Além disso, alguns genomas são lineares, o que significa que há um começo e um fim para o genoma, enquanto outros genomas são circulares (sem começo e sem fim. Mais ou menos como aquela canção de amizade, exceto por "amigos" que queremos dizer "pilhas de gosma microscópica ").

Isso parece muita sobrecarga de informações e nos solidarizamos. Para algo tão pequeno e aparentemente simples (como "Não acredito que não é manteiga"), os vírus são muito complexos (como os ingredientes de "Não acredito que não é manteiga"). O importante é que se você pode dizer a diferença entre vírus de RNA e DNA, e se é linear ou circular, e se é segmentado ou não, você pode imediatamente dizer muito sobre um vírus. Então, anexamos uma tabela para servir de guia para genomas de vírus.


Vírus de DNA

Os vírus podem ser classificados com base em proteínas codificado dentro do material genético viral ou genoma . Os vírus com genomas de ácido desoxirribonucléico (DNA) são chamados de vírus de DNA. Como todos os vírus, os vírus de DNA são pequenos quando comparados às células que infectam e, como tal, são parasitas intracelulares obrigatórios (parasitas que só podem se replicar dentro das células). Na célula apropriada, os vírus de DNA são capazes de programar a célula para replicar o vírus usando os genes contidos no genoma do DNA viral.

A forma extracelular de um vírus é conhecida como vírion. Para um vírus de DNA, o vírion é composto de um conjunto de genes de DNA protegidos por uma capa protetora chamada capsídeo. A pelagem é frequentemente caracterizada por regularidade e simetria em sua estrutura e é capaz de se ligar e invadir células. No caso de alguns vírus de DNA, o capsídeo pode ser circundado por uma membrana que é formada por membranas celulares. Na invasão de uma célula suscetível, o vírion é desmontado para liberar o genoma viral na célula, momento em que os genes dentro do DNA viral são transcritos, produzindo o ácido ribonucléico mensageiro viral (mRNA).

O mRNA viral é traduzido em proteína. Estas proteínas & # x0022primeiro & # x0022 são responsáveis ​​por alterar as funções celulares normais que, em alguns casos, permitem que a célula infectada evite o sistema imunológico. Estas proteínas & # x0022early & # x0022 também são importantes para promover a síntese do gene viral & # x0022late & # x0022 e preparar a célula para a produção de progênie vírus. Após a síntese tardia do gene, que inclui proteínas que são importantes para a replicação e o encapsulamento do vírus, os vírions descendentes são então liberados pela célula infectada para invadir outras células para que o processo possa ser repetido.

Existem seis famílias diferentes de vírus de DNA que infectam e podem causar doenças significativas em humanos. Estes podem ser subdivididos naqueles com genomas de DNA & # x0022small & # x0022 ou genomas de DNA & # x0022large & # x0022. Os vírus de DNA com genomas de DNA pequenos têm tamanhos de genoma de menos de 10 pares de quilobases , enquanto os vírus de DNA com genomas grandes têm mais de 30 pares de quilobases. Os vírus de DNA pequenos geralmente têm menos de dez genes codificados no genoma viral, enquanto os vírus de DNA grandes podem ter de cinquenta genes a bem mais de cem genes. Os vírus com genomas de DNA pequenos incluem o papilomavírus humano (HPV). O HPV infecta as células epiteliais da pele. Causa verrugas comuns nas mãos e nos pés e, em alguns casos, é importante para o desenvolvimento de câncer cervical em mulheres. A hepatite B é outro pequeno vírus de DNA que infecta o fígado, causa hepatite e está associado ao câncer de fígado. Adenovírus, herpesvírus e poxvírus são exemplos de grandes vírus de DNA que infectam humanos. Os adenovírus, dos quais existem muitos tipos, causam gastroenterite e doenças respiratórias em humanos.

Os vírus herpes são uma família muito diversa de vírus. Há um total de oito herpesvírus que infectam humanos e estabelecem uma infecção latente. Herpes

Outros vírus herpes que infectam humanos incluem o vírus Epstein-Barr, que causa mononucleose e é importante em uma variedade de cânceres humanos, e o vírus varicela-zóster, que causa varicela em crianças e herpes zoster em adultos. O último grande vírus de DNA que pode infectar humanos é a varíola. Antes da vacinação e erradicação da varíola na década de 1970, a varíola causava morbidade significativa nas populações humanas com algo em torno de 1 a 25 por cento dos casos resultando em morte.


Matéria escura viral: vírus gigantes têm genes metabólicos - mesmo que os vírus não tenham metabolismo

& # 8216Brown tide virus & # 8217 é um membro de uma classe chamada vírus gigantes. Os pesquisadores descobriram genes para os principais ciclos metabólicos celulares em muitos vírus gigantes, sugerindo que esses micróbios podem estar interagindo com seus hospedeiros de maneiras mais diversas do que se pensava anteriormente. Crédito: Dr. Chuan Xiao e Yuejiao Xian, da Universidade do Texas em El Paso.

Os pesquisadores da Virginia Tech descobriram genes para ciclos metabólicos celulares nos genomas de vírus gigantes.

Em fotos de satélite da Terra, nuvens de um verde brilhante florescem na superfície de lagos e oceanos enquanto as populações de algas explodem em água rica em nutrientes. Do ar, as algas parecem ser os atores principais no drama ecológico que se desenrola abaixo.

Mas aqueles organismos unicelulares que acreditamos influenciar o ambiente aquático na base da cadeia alimentar podem estar sob a influência de outra coisa: vírus cujos genes podem reconfigurar o metabolismo de seus hospedeiros.

Em um novo estudo publicado em Nature Communications, uma equipe de pesquisa da Virginia Tech relatou ter encontrado uma coleção substancial de genes para ciclos metabólicos - uma característica definidora da vida celular - em uma ampla gama de & # 8220 vírus gigantes & # 8221

Os vírus gigantes interrompem a narrativa familiar sobre os vírus: que eles são os menores habitantes do microbioma, pouco mais do que uma casca despojada de um organismo - apenas alguns genes & # 8217 de DNA ou RNA dobrado em uma casca tão pequena que você precisa de um microscópio eletrônico para vê-lo. Na verdade, os vírus gigantes, dez vezes maiores que seus primos mais compactos e com centenas ou mesmo milhares de genes, são tão diferentes do resto da família que, quando a primeira espécie foi descoberta em 1992, os pesquisadores os descartaram como bactérias.

Acabaram sendo classificados corretamente, mas mesmo assim considerados uma curiosidade isolada. Frank Aylward, um professor assistente de ciências biológicas no College of Science, que liderou a pesquisa, explicou que as pesquisas de rotina da diversidade viral muitas vezes não os detectavam por um motivo prosaico: eles são tão grandes que ficam presos nos filtros que os pesquisadores usam para separar vírus de bactérias e outros organismos maiores.

Mas, gradualmente, ficou claro que esses vírus de grandes dimensões estavam em toda parte - e especialmente abundantes em ambientes aquáticos, onde infectam organismos unicelulares como algas e protozoários. Isso é importante porque o metabolismo desses organismos comparativamente complexos - quais nutrientes eles consomem, quais resíduos eles produzem - influencia fortemente a saúde dos oceanos e lagos em que vivem e, em última instância, o ciclo de carbono do planeta.

& # 8220Eles & # 8217 estão em toda a biosfera. É que simplesmente não prestamos atenção a eles ”, disse Aylward.

Aylward começou a prestar atenção depois que o pesquisador de pós-doutorado Monir Moniruzzaman, o principal autor do novo estudo, ingressou no laboratório em 2018.

& # 8220Monir é o especialista em vírus gigante & # 8221 Aylward riu. & # 8220Ele não iria parar de falar sobre vírus gigantes, então finalmente eu disse, ok, vamos começar a trabalhar neles. & # 8221

Trabalhando a partir de bancos de dados de metagenoma publicamente disponíveis, que abrigam uma confusão de dados genéticos de uma vasta gama de organismos em uma variedade de ambientes, Moniruzzaman começou a desvendar genomas que pertenciam a vírus gigantes. Usando genes de vírus gigantes conhecidos como marcadores e padrões nos dados como pistas, ele reuniu genomas de 501 vírus gigantes, principalmente de ambientes marinhos e de água doce. Esses genomas continham os recursos padrão que você espera - genes que direcionam a construção da camada protetora do vírus e que permitem que ele infecte e mate seu hospedeiro.

Eles não esperavam ver tantos genes metabólicos. O metabolismo, a coleção de processos que as células usam para extrair energia dos nutrientes, é uma marca registrada da vida celular, ausente dos vírus quase por definição. No entanto, esses vírus gigantes pareciam ter genes ligados a várias vias metabólicas importantes nas células vivas.

Esses não foram os primeiros genes metabólicos que surgiram nos genomas virais, mas incluíam muitas funções que nunca haviam sido vistas nos vírus. Outros exemplos foram genes virais isolados que eram virtualmente idênticos às suas contrapartes celulares, sugerindo que foram adquiridos do hospedeiro por acaso durante uma infecção e colados no genoma do vírus & # 8217 há relativamente pouco tempo: vestígios de artefatos de invasões passadas em vez de ferramentas funcionais.

Os genes que Moniruzzaman e Aylward encontraram, por outro lado, compreendiam grandes porções de vias metabólicas familiares, mas tinham sua própria assinatura única.

& # 8220Isso implica que os vírus tiveram esses genes por milhões de anos, até bilhões de anos, e eles & # 8217são genes metabólicos específicos de vírus & # 8221 Aylward explicou.

Isso sugere que esses genes não são apenas fragmentos genéticos, mas componentes funcionais que o vírus desenvolve enquanto comanda seu hospedeiro. Nesse caso, dizem os pesquisadores, a implicação é que o vírus está alterando o metabolismo da célula.

& # 8220Uma vez que os vírus infectam uma célula, não podemos mais pensar na célula como sendo sua própria entidade autônoma & # 8221, diz Aylward. & # 8220Os aspectos fundamentais da fisiologia celular estão sendo reconectados por esses vírus após a infecção. & # 8221

Mudanças no metabolismo do hospedeiro podem alterar o equilíbrio dos nutrientes consumidos e liberados no meio ambiente, dando aos vírus influência sobre a biogeoquímica aquática. Mesmo que os vírus não estejam vivos, explica Aylward, & # 8220 eles estão alterando significativamente o curso da vida todos os dias no ambiente. & # 8221

A próxima etapa é descobrir como usar estudos experimentais que podem ajudar a descobrir como esses genes funcionam e interagem com o metabolismo nativo do hospedeiro. A equipe também vai investigar a evolução desses genes para determinar como eles entraram no genoma viral e quando.

A descoberta desses genes, que ampliam nossas idéias sobre como os vírus gigantes influenciam seu ambiente, tem implicações mais amplas para a virologia. Encontrar os blocos de construção para o metabolismo em algo que não está vivo obscurece a distinção entre o que está vivo e o que não está.

& # 8220Eu penso nesses diagramas de Venn, onde costumava haver muito pouca sobreposição e, quanto mais aprendemos, mais eles continuam a se sobrepor & # 8221 Aylward disse. & # 8220Agora & # 8217s chegou ao ponto em que existem realmente poucos genes que são encontrados apenas nas células e muito poucos genes que são encontrados apenas nos vírus. Em termos de repertórios genômicos, eles têm muito mais em comum do que poderíamos realmente esperar. & # 8221

Moniruzzaman suspeita que haja mais surpresas à espreita nesses genomas, recheados com o que ele descreve como & # 8220 matéria escura viral & # 8221 - genes que continuam surgindo em estudos de vírus gigantes, mas cujas funções ainda são desconhecidas.

& # 8220Não & # 8217você acha que eles & # 8217são fascinantes? Eu só acho que eles & # 8217são fascinantes & # 8221 Moniruzzaman maravilhas. & # 8220Eles & # 8217são apenas um saco de mistério. Eles são como uma grande floresta e você está em frente à floresta e não sabe o que há nela. E acho que é o momento certo para entender isso. Eu acho que eles são misteriosos, isso é o que eu acho. & # 8221

Referência: & # 8220 Evolução do genoma dinâmico e metabolismo virocélico complexo de vírus gigantes globalmente distribuídos & # 8221 por Mohammad Moniruzzaman, Carolina A. Martinez-Gutierrez, Alaina R. Weinheimer e Frank O. Aylward, 6 de abril de 2020, Nature Communications.
DOI: 10.1038 / s41467-020-15507-2

Esta pesquisa foi apoiada em parte por um prêmio Junior Faculty Award do Institute for Critical Technology and Applied Science. Aylward é um membro do corpo docente afiliado do Global Change Center, subordinado ao Fralin Life Sciences Institute.


RESULTADOS

IMG / VR v.2.0 é o maior sistema de gerenciamento de dados disponível publicamente para análise e visualização de genomas virais e fragmentos de genoma integrados com metadados associados dentro do Sistema Integrado de Genomas Microbianos e Microbiomas v.5.0 (IMG / M) (11).

Dados integrados em IMG / VR

Genomas virais e fragmentos de genoma

O sistema IMG / VR v.2.0 contém 755 999 genomas virais e fragmentos de genomas de genomas de vírus isolados cultivados (iVGs) e genomas de vírus não cultivados (UViGs). Isso representa um aumento de 3 vezes, em comparação com o primeiro lançamento público em 2016 (3, 10) (Figura 1) (3, 16). Os atuais 735 112 UViGs foram identificados a partir de 7986 amostras metagenômicas integradas no sistema IMG / M (11) de habitats geograficamente e ecologicamente diversos associados ao sistema de classificação e metadados Genomes OnLine Database (GOLD) (17). Além disso, os dados incluem um total de 8389 genomas virais de referência do banco de dados IMG / M (11). Essas referências representam genomas virais de alta qualidade com números de acesso BioProject, BioSample e Assembly do banco de dados de vírus NCBI. A anotação estrutural e funcional de todas as sequências é fornecida pelos pipelines de anotação do DOE Joint Genome Institute (18).

Taxa de crescimento de genomas virais previstos e fragmentos de genoma de metagenomas montados publicamente disponíveis. Crescimento durante os ciclos de atualização de IMG / VR para genomas virais totais (UViGs) e únicos (vOTUs) e fragmentos de genoma do sistema Integrated Microbial Genome & amp Microbiomes (IMG / M) usando o pipeline de descoberta de vírus metagenômico do JGI (16). Relatórios anteriores incluem o projeto do viroma da Terra (3) e o primeiro lançamento do IMG / VR (10).

Taxa de crescimento de genomas virais previstos e fragmentos de genoma de metagenomas montados disponíveis publicamente. Crescimento durante os ciclos de atualização IMG / VR para genomas virais totais (UViGs) e únicos (vOTUs) e fragmentos de genoma do sistema Integrated Microbial Genome & amp Microbiomes (IMG / M) usando o pipeline de descoberta de vírus metagenômico do JGI (16). Relatórios anteriores incluem o projeto do viroma da Terra (3) e o primeiro lançamento do IMG / VR (10).

Os UViGs foram identificados usando o pipeline de detecção viral do JGI, conforme descrito anteriormente (3, 16). Resumidamente, um conjunto curado de 25.000 famílias de proteínas virais (VPFs) foi usado como isca para identificar UViGs entre sequências metagenômicas montadas com mais de 5 kb seguido por filtragem iterativa. As previsões do pipeline são ajustadas para fornecer uma detecção altamente específica de vírus e retrovírus de DNA de fita dupla principalmente líticos (99,6% de precisão com 37,5% de taxa de recall) (16).

Para complementar o conteúdo de iVGs e UViGs, incorporamos um conjunto público de 12.498 genomas virais de alta confiança (profagos) detectados em genomas de hospedeiros microbianos (19). Este conjunto de dados foi usado para criar vOTUs adicionais (veja abaixo) e para melhorar as previsões de vírus do hospedeiro ajudando a conectar 3017 fragmentos do genoma com seus hospedeiros específicos.

Classificação OTU viral

Todas as 755.999 sequências virais em IMG / VR (iVGs, UViGs e profagos) foram agrupadas em unidades de táxons operacionais virais (vOTUs), de acordo com as recomendações dos novos padrões e melhores práticas para descrever sequências de genoma de vírus não cultivados (Roux et al., no prelo, Nature Biotech) Esses vOTUs foram gerados por meio de agrupamento de ligação única de sequências com pelo menos 95% de identidade de nucleotídeo média (ANI (20)) ao longo de pelo menos 85% do comprimento da sequência mais curta.

No total, 442 675 sequências (representando 58% do total) foram agrupadas em 110.384 vOTUs (indicadas com um 'vcPrefixo _ ’) variando em tamanho de 2 a 581 membros por cluster. A maioria desses vOTUs (51%) contém apenas dois membros, enquanto ∼6% tem 10 ou mais membros. As 317 778 sequências restantes (42% do total) eram singletons (indicadas com um 'sgPrefixo _ ’). Juntos, IMG / VR contém 428.162 vOTUs (incluindo clusters e singletons) (Figura 1). Notavelmente, o número total de novas sequências virais previstas e o número de vOTUs cresceram linearmente com o número de amostras rastreadas, indicando que as estimativas de diversidade de sequência viral não estão se aproximando da saturação, conforme observado anteriormente (3).

Previsão de especificidade de hospedeiro viral

A previsão de hospedeiro (s) putativo (s) para os UViGs foi dividida em duas categorias: previsão de hospedeiro específico e atribuição taxonômica em nível de domínio (vírus procarióticos e eucarióticos).

Hospedeiros virais específicos foram previstos usando as abordagens computacionais descritas anteriormente (3). Em primeiro lugar, propagamos as atribuições de hospedeiros dos clusters virais contendo iVGs (atualizado em junho de 2018) e do banco de dados profago publicado anteriormente (19), resultando na previsão do hospedeiro para 4212 UViGs de 671 clusters virais. Em segundo lugar, usamos correspondências entre as sequências virais e o sistema imune adaptativo CRISPR-Cas microbiano, que sequestra pequenas (de 25 a 65 pares de bases) sequências virais e as armazena dentro dos arranjos CRISPR microbianos como espaçadores (21). Esta abordagem levou à previsão do host para 37 656 UViGs (incluindo 4707 vOTUs e 7456 singletons). No total, conectamos 49 filos bacterianos e arquea e filos candidatos a sequências virais (Tabela 1). Esses métodos complementares nos permitiram descobrir conexões de vírus-hospedeiro até então desconhecidas, incluindo a identificação de vírus previstos para infectar hospedeiros de 12 filos para os quais nenhuma conexão vírus-hospedeiro existia até agora (Thermodesulphobacteria, Thaumarchaeota, Lentisphaerae, ca. Bathyarchaeota, ca. Micrarchaeota, ca. Desantisbacteria, ca. Aminicenantes, bem como filos candidatos dentro do CRP: ca. Wildermuthbacteria, ca. Moranbacteria, ca. Daviesbacteria, ca. Microgenomates e ca. Gracilibacteria) ,.

Filos de hospedeiros bacterianos e arqueológicos previstos com o número correspondente de UViGs. Os filos arquea são indicados com (A)

Filo hospedeiro. Contagem de contig viral.
Euryarchaeota (A) 218
Crenarchaeota (A) 58
ca. Micrarchaeota (A) 40
Thaumarchaeota (A) 6
ca. Bathyarchaeota (A) 4
Aigarchaeota (A) 4
Nanoarchaeota (A) 2
Termotoga (A) 1
Firmicutes 8123
Proteobacteria 5911
Bacteroidetes 3583
Actinobactérias 1971
Fusobacteria 1801
Spirochaetes 130
Verrucomicrobia 127
Synergistetes 58
Thermotogae 53
Cloroflexi 52
Cianobactéria 47
Chlorobi 47
Deinococcus-Thermus 32
Aquificae 26
Fibrobacteres 21
Planctomicetos 15
Clamídia 14
Ignavibacteriae 12
Caldiserica 9
ca. Atribactérias 9
Gemmatimonadetes 8
ca. Desantisbacteria 7
Armatimonadetes 5
ca. Marinimicrobia 5
ca. Fervidibacteria 4
ca. Cloacimonetes 4
ca. Microgenomates 3
Marinimicrobia 3
ca. Moranbacteria 3
ca. Parcubacteria 3
ca. Aminicenantes 2
ca. Saccharibacteria 2
Nitrospirae 2
Tenericutes 2
ca. Wildermuthbacteria 2
ca. Daviesbacteria 2
ca. Omnitrophica 1
Lentisphaerae 1
Acidobactérias 1
ca. Gracilibacteria 1
Thermodesulfobacteria 1
Filo hospedeiro. Contagem de contig viral.
Euryarchaeota (A) 218
Crenarchaeota (A) 58
ca. Micrarchaeota (A) 40
Thaumarchaeota (A) 6
ca. Bathyarchaeota (A) 4
Aigarchaeota (A) 4
Nanoarchaeota (A) 2
Termotoga (A) 1
Firmicutes 8123
Proteobacteria 5911
Bacteroidetes 3583
Actinobactérias 1971
Fusobacteria 1801
Spirochaetes 130
Verrucomicrobia 127
Synergistetes 58
Thermotogae 53
Cloroflexi 52
Cianobactéria 47
Chlorobi 47
Deinococcus-Thermus 32
Aquificae 26
Fibrobacteres 21
Planctomicetos 15
Clamídia 14
Ignavibacteriae 12
Caldiserica 9
ca. Atribactérias 9
Gemmatimonadetes 8
ca. Desantisbacteria 7
Armatimonadetes 5
ca. Marinimicrobia 5
ca. Fervidibacteria 4
ca. Cloacimonetes 4
ca. Microgenomates 3
Marinimicrobia 3
ca. Moranbacteria 3
ca. Parcubacteria 3
ca. Aminicenantes 2
ca. Saccharibacteria 2
Nitrospirae 2
Tenericutes 2
ca. Wildermuthbacteria 2
ca. Daviesbacteria 2
ca. Omnitrophica 1
Lentisphaerae 1
Acidobactérias 1
ca. Gracilibacteria 1
Thermodesulfobacteria 1

* Host phyla sem um vírus previamente conectado. Classificação dos filos microbianos de acordo com o sistema IMG / M.

† Filos candidatos do CPR.

Filos de hospedeiros bacterianos e arqueológicos previstos com o número correspondente de UViGs. Os filos arquea são indicados com (A)

Filo hospedeiro. Contagem de contig viral.
Euryarchaeota (A) 218
Crenarchaeota (A) 58
ca. Micrarchaeota (A) 40
Thaumarchaeota (A) 6
ca. Bathyarchaeota (A) 4
Aigarchaeota (A) 4
Nanoarchaeota (A) 2
Termotoga (A) 1
Firmicutes 8123
Proteobacteria 5911
Bacteroidetes 3583
Actinobactérias 1971
Fusobacteria 1801
Spirochaetes 130
Verrucomicrobia 127
Synergistetes 58
Thermotogae 53
Cloroflexi 52
Cianobactéria 47
Chlorobi 47
Deinococcus-Thermus 32
Aquificae 26
Fibrobacteres 21
Planctomicetos 15
Clamídia 14
Ignavibacteriae 12
Caldiserica 9
ca. Atribacteria 9
Gemmatimonadetes 8
ca. Desantisbacteria 7
Armatimonadetes 5
ca. Marinimicrobia 5
ca. Fervidibacteria 4
ca. Cloacimonetes 4
ca. Microgenomates 3
Marinimicrobia 3
ca. Moranbacteria 3
ca. Parcubacteria 3
ca. Aminicenantes 2
ca. Saccharibacteria 2
Nitrospirae 2
Tenericutes 2
ca. Wildermuthbacteria 2
ca. Daviesbacteria 2
ca. Omnitrophica 1
Lentisphaerae 1
Acidobactérias 1
ca. Gracilibacteria 1
Thermodesulfobacteria 1
Filo hospedeiro. Contagem de contig viral.
Euryarchaeota (A) 218
Crenarchaeota (A) 58
ca. Micrarchaeota (A) 40
Thaumarchaeota (A) 6
ca. Bathyarchaeota (A) 4
Aigarchaeota (A) 4
Nanoarchaeota (A) 2
Thermotogae (A) 1
Firmicutes 8123
Proteobacteria 5911
Bacteroidetes 3583
Actinobactérias 1971
Fusobacteria 1801
Spirochaetes 130
Verrucomicrobia 127
Synergistetes 58
Thermotogae 53
Cloroflexi 52
Cianobactéria 47
Chlorobi 47
Deinococcus-Thermus 32
Aquificae 26
Fibrobacteres 21
Planctomicetos 15
Clamídia 14
Ignavibacteriae 12
Caldiserica 9
ca. Atribactérias 9
Gemmatimonadetes 8
ca. Desantisbacteria 7
Armatimonadetes 5
ca. Marinimicrobia 5
ca. Fervidibacteria 4
ca. Cloacimonetes 4
ca. Microgenomates 3
Marinimicrobia 3
ca. Moranbacteria 3
ca. Parcubacteria 3
ca. Aminicenantes 2
ca. Saccharibacteria 2
Nitrospirae 2
Tenericutes 2
ca. Wildermuthbacteria 2
ca. Daviesbacteria 2
ca. Omnitrophica 1
Lentisphaerae 1
Acidobactérias 1
ca. Gracilibacteria 1
Thermodesulfobacteria 1

* Host phyla sem um vírus previamente conectado. Classificação dos filos microbianos de acordo com o sistema IMG / M.

† Filos candidatos do CPR.

Para realizar a atribuição de nível de domínio de contigs virais, foi desenvolvida uma nova abordagem que emprega famílias de proteínas de assinatura filogenética e a presença de VPFs que estão exclusivamente presentes em vírus procarióticos ou eucarióticos. Usando esta abordagem, a atribuição de host em nível de domínio foi possível para 65% dos genomas virais e fragmentos de genoma. A grande maioria do conteúdo de dados IMG / VR v.2.0 (92%) é classificada como vírus procarióticos e reflete que o pipeline de detecção viral JGI visa principalmente vírus de DNA de fita dupla e retrovírus.

Disponibilidade de pontuações de qualidade para genomas virais e fragmentos de genoma

A montagem de genomas virais a partir de metagenomas inevitavelmente produz uma mistura heterogênea de sequências que vão desde fragmentos curtos do genoma até genomas quase completos e até mesmo completos. Para ajudar os usuários a separar genomas virais completos e quase completos de fragmentos curtos, aplicamos um método de estimativa da integridade do genoma para classificar as sequências virais pela qualidade do genoma de acordo com os padrões propostos pela comunidade (Roux et al., no prelo, Nature Biotech) Resumidamente, contigs circulares são considerados genomas completos putativos, com correspondências espúrias removidas com base em sua comparação com o genoma de referência isolado mais próximo. Contigs lineares são primeiro agrupados junto com contigs circulares e genomas de referência isolados em grupos em nível de gênero. Se os tamanhos dos genomas completos de um grupo em nível de gênero são consistentes, o tamanho médio desses genomas completos é usado como um "tamanho de genoma previsto" para todos os contigs lineares neste grupo. No total, IMG / VR contém 11 220 genomas de vírus isolados acabados (iVGs), com mais 14 644 contigs circulares UViG identificados como prováveis ​​genomas completos. Um total de 15 505 contigs lineares foram classificados como 'genomas de rascunho de alta qualidade' com base em sua completude estimada de ≥90%, enquanto os 719 084 contigs lineares restantes foram classificados como 'fragmentos de genoma' devido à sua completude baixa (n = 188 377) ou falta de tamanho do genoma previsto (n = 522 731) (Figura 2). Embora esta classificação seja inteiramente baseada em em sílico previsões e exigiria em vitro experimentos e / ou isolamento do vírus para verificar a integridade do genoma, essas informações ainda são valiosas para usuários que desejam concentrar suas pesquisas em genomas virais previstos completos ou quase completos.

Distribuição e exemplo das diferentes categorias de qualidade do genoma viral em IMG / VR v.2.0. (UMA) Distribuição do número de sequências identificadas como "genoma concluído", "rascunho de genomas de alta qualidade" ou "fragmentos de genoma". (B) Comparação de três contigs de vOTU_00079, dois ‘esboços de genomas de alta qualidade’ e um ‘fragmento de genoma’. A categoria de qualidade do genoma foi baseada na integridade do genoma estimado (Roux et al., no prelo, Nature Biotech) Os genes são coloridos de acordo com sua anotação funcional. A coordenada inicial do mapa contig circular foi deslocada para coincidir com a dos mapas contig lineares.

Distribuição e exemplo das diferentes categorias de qualidade do genoma viral em IMG / VR v.2.0. (UMA) Distribuição do número de sequências identificadas como "genoma concluído", "rascunho de genomas de alta qualidade" ou "fragmentos de genoma". (B) Comparação de três contigs de vOTU_00079, dois ‘esboços de genomas de alta qualidade’ e um ‘fragmento de genoma’. A categoria de qualidade do genoma foi baseada na integridade do genoma estimado (Roux et al., no prelo, Nature Biotech) Os genes são coloridos de acordo com sua anotação funcional. A coordenada inicial do mapa contig circular foi deslocada para coincidir com a dos mapas contig lineares.

Recursos de navegação e análise de dados

A interface do usuário do IMG / VR v.2.0 segue os mesmos princípios organizacionais da versão original (10). A página inicial IMG / VR fornece links rápidos para as diferentes categorias de dados (‘Conjuntos de dados virais’, ‘vOTUs', Genomas virais'Com Host'Predição e genomas virais'Qualidade'Com base na integridade do genoma) no lado superior esquerdo, bem como'BLAST viral / espaçadorBotão '(canto inferior esquerdo) e links para download em massa do conteúdo de dados IMG / VR v.2.0 (Figura Suplementar S1). Os usuários também podem selecionar vírus com base em uma localização geográfica específica (ou locais do corpo humano) ou com base no tipo de habitat da amostra (lado superior e inferior direito, respectivamente) (Figura Suplementar S1).

Além disso, IMG / VR v.2.0 agora oferece ‘Scaffolds Cart’, ‘Genes Cart’ e ‘Carrinho de Funções’ recursos análogos aos do sistema IMG / M que estendem a coleta e o armazenamento temporário de até 20.000 entradas durante a sessão. Esses Carrinhos incluem várias ferramentas que podem ser usadas para genômica comparativa de UViGs, como ‘Perfil de função de andaime’, ‘Função Gene’, ‘Mapa do Cromossomo Genético’, ‘Alinhamento de sequência gênica' e 'Bairros de genes', Que permite aos usuários visualizar a sintaxe e o conteúdo funcional das sequências virais, bem como exportar os dados de interesse correspondentes (Figura 3).

Exemplo de recursos de análise em IMG / VR v.2.0. (1) UViGs foram selecionados a partir de um 'Conjuntos de dados virais'Amostra e adicionado ao'Carrinho de andaime’. (2) Do 'Encontrar funções'Famílias de proteínas tab (pfams) foram filtradas pelo texto' terminase 'obtendo pfams associados a esta função viral prevista. (3) Localizado no ‘Carrinho de andaime', a 'Perfil de função de andaime'Opção permite ao usuário ver a distribuição das funções selecionadas (pfams neste exemplo) contra a lista selecionada de UViGs. (4) Além disso, todos os genes dos UViGs selecionados podem ser adicionados aoGene Cart' Clicando 'Adicionar genes de andaimes selecionados ao carrinho’. (5) ‘Gene Cart'Funcionalidade permite que os usuários realizem (6) alinhamentos de genes ou proteínas de sequências selecionadas e visualização como um filograma ou (7) para exibir a vizinhança do gene dos genes selecionados (sublinhado em vermelho). A localização das ferramentas ou as etapas necessárias para recriar este exemplo são indicadas em uma caixa vermelha.

Exemplo de recursos de análise em IMG / VR v.2.0. (1) UViGs foram selecionados de um 'Conjuntos de dados virais'Amostra e adicionado ao'Carrinho de andaime’. (2) Do 'Encontrar funções'Famílias de proteínas tab (pfams) foram filtradas pelo texto ‘terminase’ obtendo pfams associados a esta função viral prevista. (3) Localizado no ‘Carrinho de andaime', a 'Perfil de função de andaime'Opção permite ao usuário ver a distribuição das funções selecionadas (pfams neste exemplo) contra a lista selecionada de UViGs. (4) Além disso, todos os genes dos UViGs selecionados podem ser adicionados aoGene Cart' Clicando 'Adicionar genes de andaimes selecionados ao carrinho’. (5) ‘Gene Cart'Funcionalidade permite que os usuários realizem (6) alinhamentos de genes ou proteínas de sequências selecionadas e visualização como um filograma ou (7) para exibir a vizinhança do gene dos genes selecionados (sublinhado em vermelho). A localização das ferramentas ou as etapas necessárias para recriar este exemplo são indicadas em uma caixa vermelha.

Perfil de função de andaime

Esta guia em ‘Carrinho de andaime'Permite que os usuários consultem uma lista selecionada de'Funções' incluindo qualquer um que possa ser encontrado sob o ‘Encontrar funções'Menu adicionado ao menu'Carrinho de funções'Contra UViGs de interesse adicionados ao'Carrinho de andaime’. Por exemplo, um usuário pode pesquisar todas as famílias de proteínas associadas à função de "terminase" para explorar sua presença e abundância em UViGs selecionados. Em seguida, os genes que codificam a função selecionada dos UViGs podem ser visualizados clicando em suas contagens.

Função do gene

Genes de UViGs selecionados (por exemplo, aqueles no 'Carrinho de andaime') Pode ser adicionado ao'Gene Cart'(Usando o'Adicionar genes de andaimes selecionados ao carrinho'), E sua associação com funções previstas pode ser revisada usando o 'Funções' botão.

Mapa do cromossomo do gene

De 'Gene Cart', Os usuários também podem visualizar a localização genômica dos genes selecionados usando o'Mapa cromossômico'Opção.

Alinhamento de sequência gênica

Alinhamentos de proteína ou sequência de DNA (usando Clustal Omega (22)) de genes selecionados de 'Gene Cart'Pode ser executado rapidamente e visualizado como filogramas retangulares clicando no botão'Alinhamento de Sequência' botão.

Bairros de genes

Vizinhança cromossômica (UViG) de genes selecionados de 'Gene Cart'Pode ser visualizado (usando a direcionalidade selecionada dos fios) clicando nesta guia.

Todas as informações de ‘Scaffolds’, ‘Genes’, e 'Funções' as tabelas podem ser acessadas independentemente clicando em seus links correspondentes ou podem ser exportadas em um formato de texto delimitado por tabulação usando o 'Exportar' botão. Árvores filogenéticas podem ser exportadas em um formato de arquivo Newick e imagens como arquivos SVG ou PNG.

Um novo sistema IMG / VR-ER (revisão de especialistas) (https://img.jgi.doe.gov/vr-er/), que exigirá um acesso de login / senha, permitirá que os usuários executem um trabalho intensivo em computação análises, análogo ao sistema IMG / M-ER (11).

Mapas do Google para localização geográfica de UViGs

UViGs de interesse agora podem ser selecionados na categoriaCarrinho de andaime'E visualizado em um mapa do Google. Na página inicial IMG / VR, um usuário pode acessar esta nova funcionalidade selecionando 'Carrinho de andaime" de 'Ecossistema'Caixa suspensa acima do mapa. O 'Carrinho de andaimeO item de menu só aparece no menu suspenso se houver UViGs selecionados no carrinho (Figura 4).

Visualização da localização geográfica de genomas virais selecionados. Genomas virais não cultivados e fragmentos de genoma (UViGs) podem ser acessados ​​de forma diferente. (1) Aqui, UViGs do cluster viral ‘Vc_2912’ foram selecionados a partir de ‘Aglomerados Virais'Link na página inicial IMG / VR e adicionado ao'Carrinho de andaime’. (2) 14 UViGs foram recuperados e uma tabela de recursos exibida (não mostrada na figura). (3) Para obter um mapa do Google com a localização dos UViGs selecionados, os usuários precisam voltar para a página inicial e selecionar 'Carrinho de andaime' de 'Ecossistema'Caixa suspensa acima do mapa. Os pinos do mapa (em vermelho) representam contagens de localização de contigs virais e podem conter várias amostras. Os pinos do mapa são agrupados em clusters (número em negrito em um quadrado colorido com base no número de membros dentro do cluster) de acordo com a biblioteca de utilitários da API JavaScript do Google Map. (4) Conforme você aumenta o zoom em qualquer uma das localizações do cluster, o número no cluster diminui e você começa a ver os marcadores individuais no mapa a partir dos quais UViGs específicos podem ser selecionados. Diminuir o zoom do mapa consolida os marcadores em grupos novamente.

Visualização da localização geográfica de genomas virais selecionados. Genomas virais não cultivados e fragmentos de genoma (UViGs) podem ser acessados ​​de forma diferente. (1) Aqui, UViGs do cluster viral ‘Vc_2912’ foram selecionados a partir de ‘Aglomerados Virais'Link na página inicial IMG / VR e adicionado ao'Carrinho de andaime’. (2) 14 UViGs foram recuperados e uma tabela de recursos exibida (não mostrada na figura). (3) Para obter um mapa do Google com a localização dos UViGs selecionados, os usuários precisam voltar para a página inicial e selecionar 'Carrinho de andaime' de 'Ecossistema'Caixa suspensa acima do mapa. Os pinos do mapa (em vermelho) representam contagens de localização de contigs virais e podem conter várias amostras. Os pinos do mapa são agrupados em clusters (número em negrito em um quadrado colorido com base no número de membros dentro do cluster) de acordo com a biblioteca de utilitários da API JavaScript do Google Map. (4) Conforme você aumenta o zoom em qualquer uma das localizações do cluster, o número no cluster diminui e você começa a ver os marcadores individuais no mapa a partir dos quais UViGs específicos podem ser selecionados. Diminuir o zoom do mapa consolida os marcadores em grupos novamente.

Recursos aprimorados de pesquisa de similaridade de sequência

Opções de pesquisa de similaridade de sequência (canto inferior esquerdo da página inicial sob o item ‘Explosão viral / espaçadora') Foram estendidos em IMG / VR v.2.0 (Figura 5) para permitir consultas BLAST (23) de sequências enviadas pelo usuário contra o nucleotídeo viral ou bancos de dados de aminoácidos com pontos de corte de valor e personalizáveis. Da mesma forma, as sequências de nucleotídeos enviadas pelo usuário podem ser consultadas usando BLASTn contra um banco de dados de sequências espaçadoras CRISPR previstas derivadas de metagenomas montados ou genomas isolados, a fim de encontrar correspondências com hospedeiros ou habitat (s) em potencial.

Pesquisa em bancos de dados IMG / VR v.2.0. (UMA) Localização da ferramenta de detonação em IMG / VR v.2.0 (caixa vermelha tracejada). (B) Interface do usuário para sequências de explosão. Os usuários podem selecionar entre pesquisas de nucleotídeos ou proteínas, selecionando o programa blastn ou blastp ao consultar "Sequências Virais’. Para pesquisas de nucleotídeos, os usuários podem usar adicionalmente o espaçador exibido 'Blast Databases’.

Pesquisa em bancos de dados IMG / VR v.2.0. (UMA) Localização da ferramenta de detonação em IMG / VR v.2.0 (caixa vermelha tracejada). (B) Interface do usuário para sequências de explosão. Os usuários podem selecionar entre pesquisas de nucleotídeos ou proteínas, selecionando o programa blastn ou blastp ao consultar "Sequências Virais’. Para pesquisas de nucleotídeos, os usuários podem usar adicionalmente o espaçador exibido 'Blast Databases’.

Download em massa de conteúdo de dados IMG / VR v.2.0

Além da interface da web que permite aos usuários consultar e analisar genomas virais e fragmentos de genomas, o IMG / VR v.2.0 agora oferece opções de download em massa para todas as sequências virais, famílias de proteínas virais (VPFs) e metadados associados. Isso permite que os usuários realizem análises adicionais e cálculos em grande escala usando suas próprias ferramentas e recursos computacionais. Os dados da sequência viral podem ser baixados por meio do Portal do Genoma do Joint Genome Institute (https://genome.jgi.doe.gov/portal/IMG_VR/IMG_VR.home.html) sob o item ‘Download', Ou da guia'Baixar banco de dados IMG / VR‘Botão no canto inferior esquerdo da página inicial IMG / VR (https://img.jgi.doe.gov/vr/) (Figura Suplementar S2). Os arquivos disponíveis para download incluem as sequências de nucleotídeos e aminoácidos (em formato FASTA), bem como uma tabela de metadados extensos, incluindo associação de sequências com vOTUs, qualidade e integridade do genoma, especificidade prevista do hospedeiro, bem como informações do habitat. Versões anteriores de IMG / VR também estão disponíveis para download nas mesmas páginas.


Teste sua compreensão

  1. Os vírus são vivos ou não? Explique sua resposta.
  2. Em relação à saúde humana, qual é um uso positivo dos vírus pelos cientistas?
  3. Pensamento crítico: as interações entre o vírus da AIDS e as células que ele infecta são líticas ou se transformam? Explique seu raciocínio.
  4. Pensamento crítico: compare uma abordagem defensiva e outra ofensiva para combater um vírus no nível celular.

Literatura primária relacionada

  • T. Asselah, P. Marcellin e R. F. Schinazi, Tratamento da infecção pelo vírus da hepatite C com agentes antivirais de ação direta: 100% cura ?, Liver Int., 38 (S1): 7–13, 2018 DOI: https://doi.org/10.1111/liv.13673
  • K. M. Stedman, recombinação viral: Ecologia, evolução e patogênese, Vírus, 10 (7): 358, 2018 DOI: https://doi.org/10.3390/v10070358
  • A. J. W. te Velthuis e E. Fodor, Influenza vírus RNA polimerase: Insights sobre os mecanismos de síntese de RNA viral, Nat. Rev. Microbiol., 14 (8): 479-493, 2016 DOI: https://doi.org/10.1038/nrmicro.2016.87
  • K. Voskarides, E. Christaki e G. K. Nikolopoulos, Influenza virus-Host co-evolution: A predator-presy relationship ?, Frente. Immunol., 9: 2017, 2018 DOI: https://doi.org/10.3389/fimmu.2018.02017

Leitura Adicional

  • P. Lostroh, Biologia molecular e celular de vírus, CRC Press, 2019
  • T. Shors, Compreendendo os vírus, 3d ed., Jones e Bartlett Learning, 2017
  • MedlinePlus: infecções virais
  • Instituto Suíço de Bioinformática: ViralZone
  • Escola de Medicina da Universidade de Washington: vírus: da estrutura à biologia

Para saber mais sobre como assinar o AccessScience ou para solicitar um teste sem risco desta referência científica premiada para sua instituição, preencha suas informações e um membro de nossa equipe de vendas entrará em contato com você o mais rápido possível.

Deixe seu bibliotecário saber sobre o portal premiado para as informações científicas mais confiáveis ​​e precisas.


Conteúdo

O termo 'pangenome' foi definido com seu significado atual por Tettelin et al. em 2005 [2], ele deriva 'pan' da palavra grega παν, que significa 'todo' ou 'tudo', enquanto o genoma é um termo comumente usado para descrever o material genético completo de um organismo. Tettelin et al. aplicou o termo especificamente a bactérias, cujo pangenoma "inclui um genoma central contendo genes presentes em todas as cepas e um genoma dispensável composto de genes ausentes de uma ou mais cepas e genes que são únicos para cada cepa." [2]

Core Edit

É a parte do pangenoma que é compartilhada por todos os genomas do conjunto testado. Alguns autores dividiram o núcleo pangenoma em núcleo duro, aquelas famílias de genes homólogos que têm pelo menos uma cópia da família compartilhada por cada genoma (100% dos genomas) e o núcleo macio ou núcleo estendido, [15] as famílias distribuídas acima um certo limite (90%). Em um estudo que envolve os pangenomos de Bacillus cereus e Staphylococcus aureus, alguns deles isolados da estação espacial internacional, os limiares usados ​​para segmentar os pangenomas foram os seguintes: "Nuvem", "Shell" e "Núcleo" correspondendo a famílias de genes com presença em & lt10%, 10 a 95% e & gt95 % dos genomas, respectivamente. [16]

O tamanho do genoma central e a proporção do pangenoma dependem de vários fatores, mas são especialmente dependentes da similaridade filogenética dos genomas considerados. Por exemplo, o núcleo de dois genomas idênticos também seria o pangenome completo. O núcleo de um gênero sempre será menor do que o núcleo do genoma de uma espécie. Os genes que pertencem ao genoma central são frequentemente relacionados a funções de manutenção e ao metabolismo primário da linhagem, no entanto, o gene central também pode conter alguns genes que diferenciam as espécies de outras espécies do gênero, ou seja, que podem estar relacionadas à patogenicidade ao nicho adaptação. [17]

Edição de Shell

É a parte do pangenoma compartilhada pela maioria dos genomas de um pangenome. [18] Não existe um limite universalmente aceito para definir o genoma da concha; alguns autores consideram uma família de genes como parte do pangenoma da concha se for compartilhada por mais de 50% dos genomas do pangenoma. [19] Uma família pode fazer parte da casca por várias dinâmicas evolutivas, por exemplo, pela perda de genes em uma linhagem onde antes fazia parte do genoma central, como é o caso das enzimas do operon triptofano em Actinomyces, [20] ou por ganho de gene e fixação de uma família de genes que anteriormente fazia parte do genoma dispensável, como é o caso de trpF gene em vários Corynebacterium espécies. [21]

Edição dispensável

O genoma dispensável são aquelas famílias de genes compartilhadas por um subconjunto mínimo de genomas no pangenoma, [22] ele inclui singletons ou genes presentes em apenas um dos genomas. Também é conhecido como nuvem ou genoma periférico. As famílias de genes nesta categoria estão frequentemente relacionadas à adaptação ecológica.

O pan-genoma pode ser classificado como aberto ou fechado com base no valor alfa da lei de Heap: N = k n - α < displaystyle N = kn ^ <- alpha >> [23] [15]

Normalmente, o software pangenome pode calcular os parâmetros da lei de heap que melhor descrevem o comportamento dos dados.

Abrir a edição do pangenome

Um pangenoma aberto ocorre quando em uma linhagem taxonômica continua aumentando o número de novas famílias de genes e esse incremento não parece ser assintótico, independentemente de quantos novos genomas são adicionados ao pangenoma. Escherichia coli é um exemplo de espécie com um pangenome aberto. Algum E. coli O tamanho do genoma está na faixa de 4.000 a 5.000 genes e o tamanho do pangenoma estimado para esta espécie com aproximadamente 2.000 genomas é composto por 89.000 famílias de genes diferentes. [24] O pangenoma da bactéria do domínio também é considerado aberto.

Edição Pangenome Fechada

Um pangenoma fechado ocorre em uma linhagem quando apenas algumas famílias de genes são adicionadas quando novos genomas são incorporados à análise de pangenome, e a quantidade total de famílias de genes no pangenoma parece ser assintótica a um número. Acredita-se que parasitismo e espécies especialistas em algum nicho ecológico tendem a apresentar pangenomos fechados. Staphylococcus lugdunensis é um exemplo de uma bactéria comensal com pan-genoma fechado. [25]

Pangenome Edit

O conceito original de pangenome foi desenvolvido por Tettelin et al. [2] quando eles analisaram os genomas de oito isolados de Streptococcus agalactiae, onde eles descreveram um genoma central compartilhado por todos os isolados, respondendo por aproximadamente 80% de qualquer genoma único, além de um genoma dispensável que consiste em genes parcialmente compartilhados e específicos da cepa. A extrapolação sugeriu que o reservatório do gene no S. agalactiae O pan-genoma é vasto e novos genes únicos continuariam a ser identificados mesmo após o sequenciamento de centenas de genomas. [2] O pangenoma compreende a totalidade dos genes descobertos nos genomas sequenciados de uma determinada espécie microbiana e pode mudar quando novos genomas são sequenciados e incorporados à análise.

O pangenoma de uma linhagem genômica é responsável pela variabilidade do conteúdo do gene intra-linhagem. O pangenoma evolui devido a: duplicação de genes, ganho e perda de genes e interação do genoma com elementos móveis que são moldados por seleção e deriva. [26] Alguns estudos apontam que os pangenomos procariontes são o resultado de evolução adaptativa, não neutra, que confere às espécies a capacidade de migrar para novos nichos. [27]

Supergenome Edit

O supergenoma pode ser considerado o tamanho real do pangenoma se todos os genomas de uma espécie forem sequenciados. [28] É definido como todos os genes acessíveis para serem ganhos por uma determinada espécie. Não pode ser calculado diretamente, mas seu tamanho pode ser estimado pelo tamanho do pangenoma calculado a partir dos dados do genoma disponíveis. Estimar o tamanho do genoma dispensável pode ser preocupante devido à sua dependência da ocorrência de genes e genomas raros. Em 2011, a fluidez genômica foi proposta como uma medida para categorizar a similaridade em nível de gene entre grupos de isolados sequenciados. [29] Em algumas linhagens, os supergenomas apareceram infinito, [30] como é o caso do domínio Bacteria. [31]

Metapangenome Edit

'Metapangenome' foi definido como o resultado da análise de pangenomas em conjunto com o ambiente onde a abundância e prevalência de clusters de genes e genomas são recuperados por meio de metagenomas shotgun. [32] A combinação de metagenomas com pangenomes, também conhecido como "metapangenomics", revela os resultados em nível de população da filtragem específica de habitat do pool de genes pangenomic. [33]


Outros autores consideram que a Metapangenômica expande o conceito de pangenoma ao incorporar sequências de genes obtidas de microrganismos não cultivados por uma abordagem metagenômica. Um metapangenome compreende tanto sequências de genomas montados em metagenoma (MAGs) quanto de genomas obtidos de microrganismos cultivados. [34] A metaangenômica foi aplicada para avaliar a diversidade de uma comunidade, adaptação de nicho microbiano, evolução microbiana, atividades funcionais e redes de interação da comunidade. [35] A plataforma Anvi'o desenvolveu um fluxo de trabalho que integra análise e visualização de metapangenomas gerando pangenomas e estudando-os em conjunto com metagenomas. [32]

Editar pangenome procarionte

Em 2018, 87% das sequências do genoma completo disponíveis eram bactérias que alimentavam o interesse dos pesquisadores no cálculo de pangenomas procariotos em diferentes níveis taxonômicos. [22] Em 2015, o pangenome de 44 cepas de Streptococcus pneumoniae a bactéria mostra poucos novos genes descobertos com cada novo genoma sequenciado (veja a figura). Na verdade, o número previsto de novos genes caiu para zero quando o número de genomas excede 50 (observe, entretanto, que este não é um padrão encontrado em todas as espécies). Isso significaria que S. pneumoniae tem um 'pangenome fechado'. [37] A principal fonte de novos genes em S. pneumoniae era Streptococcus mitis a partir do qual os genes foram transferidos horizontalmente. O tamanho do pan-genoma de S. pneumoniae aumentou logaritmicamente com o número de cepas e linearmente com o número de sítios polimórficos dos genomas amostrados, sugerindo que os genes adquiridos se acumulam proporcionalmente à idade dos clones. [36] Outro exemplo de pan-genoma procarionte é Prochlorococcus, o conjunto do genoma central é muito menor do que o pangenoma, que é usado por diferentes ecótipos de Prochlorococcus. [38] O pan-genoma aberto foi observado em isolados ambientais, como Alcaligenes sp. [39] e Serratia sp., [40] mostrando um estilo de vida simpátrico. No entanto, o pangenome aberto não é exclusivo para microrganismos de vida livre, um estudo de 2015 sobre Prevotella bactérias isoladas de humanos, compararam os repertórios de genes de suas espécies derivados de diferentes locais do corpo humano. Ele também relatou um pan-genoma aberto mostrando vasta diversidade de pool de genes. [41]

Archaea também tem alguns estudos de pangenome. Halobacteria pangenome mostra as seguintes famílias de genes nos subconjuntos de pangenome: core (300), componentes variáveis ​​(Softcore: 998, Cloud: 36531, Shell: 11784). [42]

Pangenome Eucarioto Editar

Organismos eucariotos, como fungos, animais e plantas, também mostraram evidências de pangenomos. Em quatro espécies de fungos cujo pangenome foi estudado, entre 80 e 90% dos modelos de genes foram encontrados como genes centrais. Os demais genes acessórios estiveram principalmente envolvidos na patogênese e resistência antimicrobiana. [43]

Em animais, o pangenome humano está sendo estudado. Em 2010, um estudo estimou que um pan-genoma humano completo conteria ∼19-40 Megabases de uma nova sequência não presente no genoma de referência existente. [44] Em 2021, o consórcio Human Pangenome tem o objetivo de reconhecer a diversidade do genoma humano.

Entre as plantas, há exemplos de estudos de pangenoma em espécies modelo, tanto diplóides [9] como poliplóides, [10] e uma lista crescente de culturas. [45] [46] Um conceito emergente baseado em planta é o de pan-NLRome, que é o repertório de proteínas de repetição rica em leucina ligadora de nucleotídeos (NLR), receptores imunes intracelulares que reconhecem proteínas patógenas e conferem resistência a doenças. [47]

Vírus pangenome Editar

O vírus não tem necessariamente genes amplamente compartilhados por clados, como é o caso do 16S em bactérias e, portanto, o genoma central de todo o domínio do vírus está vazio. No entanto, vários estudos calcularam o pangenome de algumas linhagens virais. O genoma central de seis espécies de pandoravírus compreende 352 famílias de genes de apenas 4,7% do pangenoma, resultando em um pangenoma aberto. [48]

O número de genomas sequenciados está crescendo continuamente "simplesmente aumentar a escala dos canais de bioinformática estabelecidos não será suficiente para alavancar todo o potencial de tais conjuntos de dados genômicos ricos". [49] Os gráficos de pangenome são estruturas de dados emergentes projetadas para representar pangenome e mapear com eficiência as leituras para eles. Eles foram revisados ​​por Eizenga et al [50]

À medida que o interesse pelos pangenomas aumentou, várias ferramentas de software foram desenvolvidas para ajudar a analisar esse tipo de dados. Para iniciar uma análise pangenômica, o primeiro passo é a homogeneização da anotação do genoma. [23] O mesmo software deve ser usado para anotar todos os genomas usados, como GeneMark [51] ou RAST. [52] Em 2015, um grupo revisou os diferentes tipos de análises e ferramentas que um pesquisador pode ter disponíveis. [53] Existem sete tipos de software desenvolvidos para analisar pangenomas: Aqueles dedicados a agrupar genes homólogos identificam SNPs traçam perfis pangenômicos constroem relações filogenéticas de genes ortólogos / famílias de cepas / isolados, anotação de pesquisa baseada em função e / ou curadoria e visualização. [53]

As duas ferramentas de software mais citadas para análise pangenômica no final de 2014 [53] foram Panseq [54] e o pipeline de análise de pan-genomas (PGAP). [55] Outras opções incluem BPGA - A Pan-Genome Analysis Pipeline para procarióticos genomas, [56] GET_HOMOLOGUES, [57] Roary. [58] e PanDelos. [59] Em 2015, uma revisão focada em pangenomos procariotos [60] e outra para pan-genomas de plantas foi publicada. [61] Entre os primeiros pacotes de software projetados para pangenomes de plantas estavam o PanTools. [62] e GET_HOMOLOGUES-EST. [11] [57] Em 2018, o panX foi lançado, uma ferramenta da web interativa que permite a inspeção da história evolutiva de famílias de genes. [63] panX pode exibir um alinhamento de genomas, uma árvore filogenética, mapeamento de mutações e inferência sobre ganho e perda da família na filogenia do genoma central. Em 2019, OrthoVenn 2.0 [64] permitiu a visualização comparativa de famílias de genes homólogos em diagramas de Venn até 12 genomas. Em 2020, o Anvi'o [1] estava disponível como uma plataforma multiômica que contém análises pangenômicas e metapangenômicas, bem como fluxos de trabalho de visualização. No Anvi'o, os genomas são exibidos em círculos concêntricos e cada raio representa uma família de genes, permitindo a comparação de mais de 100 genomas em sua visualização interativa.

Em 2020, uma comparação computacional de ferramentas para extrair conteúdos pangenômicos baseados em genes (como GET_HOMOLOGUES, PanDelos, Roary e outros) foi lançada. [65] As ferramentas foram comparadas de uma perspectiva metodológica, analisando as causas que levam uma determinada metodologia a superar outras ferramentas. A análise foi realizada levando-se em consideração diferentes populações bacterianas, que são geradas sinteticamente por meio de parâmetros evolutivos variáveis. Os resultados mostram uma diferenciação do desempenho de cada ferramenta que depende da composição dos genomas de entrada.


Existe referência para a composição dos genomas virais? - Biologia

Borodovsky M. e Ekisheva S.
Problemas e soluções na análise de sequência biológica
Cambridge University Press, 2006
Editora | DOI | Amazon | Revisão | Revisão 2 | Tradução russa

StartLink +
Karl Gemayel, Alexandre Lomsadze e Mark Borodovsky
"StartLink +: Prediction of Gene Starts in Prokaryotic Genomes by an Algorithm Integrating Independent Sources of Evidence"
bioRxiv

BRAKER2
Tomáš Brůna, Katharina J. Hoff, Alexandre Lomsadze, Mario Stanke, Mark Borodovsky
"BRAKER2: Anotação automática do genoma eucariótico com GeneMark-EP + e AUGUSTUS apoiados por um banco de dados de proteínas"
Artigo | bioRxiv

GeneMark-EP +
Tomáš Brůna, Alexandre Lomsadze, Mark Borodovsky
"GeneMark-EP +: predição de genes eucarióticos com autotreinamento no espaço de genes e proteínas"
NAR Genomics and Bioinformatics, Volume 2, Issue 2, 2020
PubMed | Artigo | bioRxiv

GeneMarkS-2
Alexandre Lomsadze, Karl Gemayel, Shiyuyun Tang e Mark Borodovsky
"A modelagem da transcrição sem líder e dos genes atípicos resulta em uma predição mais precisa do gene em procariotos"
Genome Res. 28 de julho de 2018 (7): 1079-1089
PubMed | Artigo | bioRxiv

PGAP
Tatiana Tatusova, Michael DiCuccio, Azat Badretdin, Vyacheslav Chetvernin, Eric P. Nawrocki, Leonid Zaslavsky, Alexandre Lomsadze, Kim D. Pruitt, Mark Borodovsky e James Ostell
"Canal de anotação do genoma procariótico NCBI"
Pesquisa de ácidos nucléicos, 24 de junho de 2016, doi: 10.1093 / nar / gkw569
PubMed | Artigo

BRAKER1
Katharina J. Hoff, Simone Lange, Alexandre Lomsadze, Mark Borodovsky e Mario Stanke
"BRAKER1: Unsupervised RNA-Seq-Based Genome Annotation with GeneMark-ET and AUGUSTUS"
Bioinformática, 2016 março 132 (5): 767-9. doi: 10.1093 / bioinformática / btv661. Epub 11 de novembro de 2015
PubMed | Artigo

GeneMarkS-T
Tang S., Lomsadze A e Borodovsky M.
"Identificação de regiões codificantes de proteínas em transcritos de RNA"
Pesquisa de ácidos nucléicos, 13 de abril de 2015, doi: 10.1093 / nar / gkv227
PubMed | Artigo

GeneMark-ET
Lomsadze A., Burns P.D. e Borodovsky M.
"Integração de mapeamento de RNA-Seq lê em treinamento automático de algoritmo de descoberta de genes eucarióticos."
Pesquisa de ácidos nucléicos, 2 de julho de 2014, doi: 10.1093 / nar / gku557
PubMed | Artigo

MetaGeneMark
Zhu W., Lomsadze A. e Borodovsky M.
"Ab initio identificação de genes em sequências metagenômicas. "
Pesquisa de ácidos nucléicos, 2010, Vol.38, No.12, e132, doi: 10.1093 / nar / gkq275
PubMed | Artigo | Materiais Suplementares

GeneMark-ES, versão 2
Ter-Hovhannisyan V., Lomsadze A., Chernoff Y. e Borodovsky M.
"Predição de genes em novos genomas de fungos usando um algoritmo ab initio com treinamento não supervisionado."
Genome Research, 2008, 18 de dezembro (12): 1979-90
PubMed | Artigo | Materiais Suplementares

GeneMark-ES, versão 1
Lomsadze A., Ter-Hovhannisyan V., Chernoff Y. e Borodovsky M.
"Identificação de genes em novos genomas eucarióticos por algoritmo de autotreinamento."
Pesquisa de ácidos nucléicos, 2005, vol. 33, No. 20, 6494-6506
PubMed | Artigo

GeneMark Web Server
Besemer J. e Borodovsky M.
"GeneMark: software da web para localização de genes em procariotos, eucariotos e vírus."
Pesquisa de ácidos nucléicos, 2005, vol. 33, Web Server Issue, pp. W451-454
PubMed | Artigo

VIOLINO
Mills R., Rozanov M., Lomsadze A., Tatusova T. e Borodovsky M.
"Melhorando a anotação do gene em genomas virais completos."
Pesquisa de ácidos nucléicos, 2003, vol. 31, No. 23, 7041-7055
PubMed | Artigo

GeneMarkS
Besemer J., Lomsadze A. e Borodovsky M.
"GeneMarkS: um método de autotreinamento para predição de genes começa em genomas microbianos. Implicações para encontrar motivos de sequência em regiões regulatórias."
Pesquisa de ácidos nucléicos, 2001, Vol. 29, No. 12, 2607-2618
PubMed | Artigo

Modelos Heurísticos
Besemer J. e Borodovsky M.
"Abordagem heurística para derivar modelos para descoberta de genes."
Pesquisa de ácidos nucléicos, 1999, vol. 27, No. 19, pp. 3911-3920
PubMed | Artigo

Quadro por quadro
Shmatkov A.M., Melikyan A.A., Chernousko F.L. e Borodovsky M.
"Encontrando genes procarióticos pelo algoritmo 'quadro a quadro': o gene de direcionamento começa e genes sobrepostos."
Bioinformática, 1999, vol. 15, No. 11, pp. 874-886
PubMed | Artigo

GeneMark-Genesis
Hayes W. e Borodovsky M.
"Como interpretar um genoma bacteriano anônimo: abordagem de aprendizado de máquina para identificação de genes."
Genome Research, 1998, Vol. 8, nº 11, pp. 1154-1171
PubMed | Artigo

GeneMark.hmm
Lukashin A. e Borodovsky M.
"GeneMark.hmm: novas soluções para descoberta de genes."
Pesquisa de ácidos nucléicos, 1998, vol. 26, nº 4, pp. 1107-1115
PubMed | Artigo

GeneMark
Borodovsky M. e McIninch J.
"GeneMark: reconhecimento de gene paralelo para ambas as fitas de DNA."
Computadores e Química, 1993, Vol. 17, No. 19, pp. 123-133
Resumo | Artigo

Borodovsky M.Yu., McIninch J.
"Reconhecimento de genes na sequência de DNA com ambigüidades"
Biossistemas. , 1993 Vol 30 (1-3), pp.161-71
PubMed | Artigo

Modelos de cadeia de Markov de três periódicos
Borodovsky M.Yu., Sprizhitskii Y.A., Golovanov E.I. e Aleksandrov A.A.
"Padrões estatísticos em estruturas primárias das regiões funcionais do genoma em Escherichia Coli."
Biologia Molecular, 1986, Vol. 20, pp. 826-833, 833-840, 1144-1150
Artigo

Antonov I, Coakley A, Atkins JF, Baranov PV, Borodovsky M.
"Identificação da natureza das transições de quadro de leitura observadas em genomas procarióticos."
Pesquisa de ácidos nucléicos, 2013, 41(13):6514-30
PubMed | Artigo

Burns PD, Li Y, Ma J, Borodovsky M.
"UnSplicer: mapeamento de leituras de RNA-seq spliced ​​em genomas compactos e filtragem de splicing ruidoso."
Pesquisa de ácidos nucléicos, 19 de novembro de 2013
PubMed | Artigo | Materiais Suplementares

Antonov I., Baranov P. e Borodovsky M.
"Banco de dados GeneTack: genes com frameshifts em genomas procarióticos e sequências de mRNA eucarióticas"
Pesquisa de ácidos nucléicos, Vol. 41, No. D1 (2013): D152-D156.
PubMed | Artigo

Tang S., Antonov I. e Borodovsky M.
"MetaGeneTack: ab initio detecção de frameshifts em sequências metagenômicas. "
Bioinformática, Vol. 29, No. 1 (2013): 114-116.
PubMed | Artigo

Martin J., Zhu W., Passalacqua K., Bergman N. e Borodovsky M.
"Bacillus anthracis organização do genoma à luz de todo o sequenciamento do transcriptoma. "
BMC Bioinformática, 2010, 11 (Suplemento 3): S10 doi: 10.1186 / 1471-2105-11-S3-S10
PubMed | Artigo | Materiais Suplementares

Antonov I. e Borodovsky M.
"GeneTack: Identificação de frameshift em sequências de codificação de proteínas pelo algoritmo de Viterbi."
J Bioinformática e Biologia Computacional, Vol. 8, No. 3 (2010): 1-17.
Medline | Artigo

Azad R.K. e Borodovsky M.Y.
"Métodos probabilísticos de identificação de genes em genomas procarióticos: conexões com a teoria HMM."
Briefings em Bioinformática, 2004, Vol. 5, No. 2, pp. 118-130
PubMed | Artigo

Azad R.K. e Borodovsky M.
"Efeitos da escolha da estrutura do modelo de sequência de DNA na precisão da identificação do gene."
Bioinformática, 2004, Vol. 20, No. 7, pp. 993-1005
PubMed | Artigo

Leia BA, Kegel J, Klute MJ, Kuo A, Lefebvre SC, et al.
"Pan genoma do fitoplâncton Emiliania sustenta sua distribuição global."
Natureza. 2013, 499(7457):209-13
PubMed | Artigo

Junhuan Xu et al.
Descoberta de genes em sequências EST do fungo da ferrugem da folha do trigo Puccinia triticina esporos sexuais, esporos assexuados e haustórios, em comparação com outros fungos da ferrugem e da ferrugem do milho.
BMC Genomics, 24 de março de 2011 10.1186 / 1471-2164-12-161
Artigo

Blanc G, Duncan G, Agarkova I, Borodovsky M, Gurnon J, Kuo A, et al.
"O genoma de Chlorella variabilis NC64A revela adaptação à fotossimbiose, coevolução com vírus e sexo enigmático"
Plant Cell. 2010, 22 (9): 2943-55.
PubMed | Artigo

Guillaume Blanc et al.
o Chlorella variabilis O genoma NC64A revela adaptação à fotossimbiose, coevolução com vírus e sexo críptico
A célula vegetal, 17 de setembro de 2010 10.1105 / tpc.110.076406.
Artigo

Jason Stajich et al.
Insights sobre a evolução de fungos multicelulares a partir dos cromossomos do cogumelo reunidos Coprinopsis cinerea (Coprinus cinereus)
Proc Natl Acad Sci USA, 29 de junho de 2010 107 (26): 11889-94.
Artigo

Svetlana Ekisheva e Mark Borodovsky
"Precisão uniforme das estimativas de máxima verossimilhança para modelos probabilísticos de sequências biológicas."
Metodologia e Computação em Probabilidade Aplicada, Fevereiro de 2009 10.1007 / s11009-009-9125-7
Artigo

Mitrophanov A.Yu. e Borodovsky M.
"Estimativa da taxa de convergência para o modelo TKF91 de evolução do comprimento da sequência biológica"
Math Biosci., 2007 Out209 (2): 470-85. Epub, 13 de março de 2007.
PubMed | Artigo

Piriyapongsa J., Polavarapu N., Borodovsky M. e McDonald J.
"Exonização dos elementos transponíveis LTR no genoma humano"
BMC Genomics, 288: 291 de agosto de 2007.
PubMed | Artigo

Mitrophanov A.Yu., Churchward G. e Borodovsky M.
"Controle de virulência de Streptococcus pyogenes: Modelagem do sistema de transdução de sinal CovR / S"
J Theor Biol., Maio de 2007 7246 (1): 113-28. Epub, 21 de novembro de 2006.
PubMed | Artigo

Aydin Z., Altunbasak Y. e Borodovsky M.
"Previsão de estrutura secundária de proteína para uma única sequência usando modelos de semi-Markov ocultos."
BMC Bioinformática, Março de 2006 307: 178
PubMed | Artigo

Kim S.B., Tsui K. e Borodovsky M.
"Teste múltiplo em tabelas de contingência em grande escala: inferindo padrões de associação de aminoácidos em pares em folhas beta"
Int. J. Pesquisa e aplicações de bioinformática, 2006, vol. 2, No. 2, pp 193-217
Artigo

Ekisheva S. e Borodovsky M.
"Modelos probabilísticos para sequências biológicas: seleção e estimativa de máxima verossimilhança"
Int. J. Pesquisa e aplicações de bioinformática, 2006, vol. 2, No. 3, pp 305-324
Artigo

Mitrophanov A.Yu. e Borodovsky M.
"Significância estatística na análise da sequência biológica."
Briefings em Bioinformática, 2006, vol. 7, nº 1, pp. 2-24
PubMed | Artigo

Mitrophanov A.Yu., Lomsadze A. e Borodovsky M.
"Sensibilidade de modelos de Markov ocultos."
Journal of Applied Probability, 2005, vol. 42, pp. 632-642
Artigo

Kattenhorn L.M., Mills R., Wagner M., Lomsadze A., Makeev V., Borodovsky M., Ploegh H.L. e Kessler B.M
"Identificação de proteínas associadas com virions de citomegalovírus murino."
Journal of Virology, 2004, Vol. 78, nº 20, pp. 11187-11197
PubMed | Artigo

Jean-F. Túmulo et al.
A sequência completa do genoma do patógeno gástrico Helicobacter pylori
Natureza, 1997, 7 de agosto, 388 (6642): 539-47.
Artigo

Carol Bult et al.
Seqüência completa do genoma do archaeon metanogênico, Methanococcus jannaschii
Ciência, Agosto de 1996, Vol. 273. não. 5278, pp. 1058-1073
Artigo

Kleffe J. e Borodovsky M.
“Primeiro e segundo momento de contagem de palavras em textos aleatórios gerados por cadeias de Markov”
Comput. Appl. Biosci., 1992, vol. 8, nº 5, pp. 433-441
PubMed | Artigo


Informações dos autores

Relatório do revisor 1: Dr. Eugene Koonin (Centro Nacional de Informações sobre Biotecnologia, EUA)

Este é um artigo verdadeiramente emocionante que relata a descoberta de uma entidade completamente inesperada, um híbrido aparente entre um vírus ssDNA relacionado a circovírus e um vírus RNA relacionado a tombusvírus. Essa descoberta é de grande interesse em dois níveis. Em primeiro lugar, que eu saiba, essa quimera entre vírus de RNA e DNA - não apenas dessas famílias em particular, mas em geral - nunca foi observada antes. Claro, existem muitos exemplos de mistura e correspondência no mundo dos vírus, mas de alguma forma eles até agora foram confinados ao mesmo tipo de ácido nucléico. Em segundo lugar, este trabalho destaca o novo caminho para a descoberta em virologia - o caminho metagenômico. Esta é literalmente uma expedição de pesca, com todas as suas vantagens e desvantagens. A principal vantagem é a capacidade de descobrir essencialmente tudo o que está "lá fora", mesmo em baixa abundância, sem a necessidade de procedimentos laboriosos e tendenciosos de crescimento de vírus e hospedeiros. Mas, aqui está também a limitação severa da metagenômica: nem o hospedeiro nem, estritamente falando, o vírus são identificados pelos padrões regulares de microbiologia e virologia. Em qualquer caso como este, mas mais especialmente quando uma quimera bizarra foi descoberta, é crucial mostrar o mais convincentemente possível que a sequência apresentada é de fato o genoma do vírus, em vez de algum artefato de montagem ou clone quimérico. Acho que isso é feito de forma satisfatória neste trabalho, por PCR inverso de uma amostra ambiental independente. Portanto, acredito que este seja um vírus real. Além disso, é notável que os homólogos mais próximos da proteína Rep e da proteína do capsídeo foram detectados em outras amostras metagenômicas, as do GOS. É extremamente intrigante se eles representam o mesmo tipo de genomas quiméricos ou se o evento proposto de recombinação de RNA-DNA é relativamente recente, e esses vizinhos são os parentes mais próximos das respectivas famílias de vírus de RNA e DNA. Com o genoma do BSL-RDHV lançado, isso não deve ser muito difícil de testar. Em um plano mais geral, não se pode deixar de imaginar quantas dessas maravilhas inesperadas do mundo dos vírus aguardam em todos os tipos de ambientes e, de forma mais prática, se os critérios para reconhecer um novo vírus vão mudar em breve.

Eu tenho alguns pequenos problemas específicos com o artigo.-O título pode ser interpretado como um pouco enganador, pois "link evolutivo" parece implicar que o (s) vírus (s) ssDNA evoluíram de vírus (s) ssRNA (s) ou vice-versa. Eu sugeriria mencionar o genoma quimérico no próprio título.

Resposta do autor : O título foi revisado.

Estou surpreso com a metodologia empregada para construir as árvores ('cladogramas de agrupamento bruto') na Figura 3. Por que usar esta abordagem tosca em vez do método de máxima verossimilhança regular (RaxML) e talvez até mesmo um método Bayesiano adicional? Não que eu espere que o resultado mude drasticamente, mas o novo vírus é interessante e incomum o suficiente para investir um esforço razoável para tornar a análise filogenética o mais robusta possível.

Resposta do autor : Esta seção foi revisada e alinhamentos muito mais extensos são apresentados e análises filogenéticas realizadas (Figuras 3 , 4 e 6 ).

Acho bastante estranha a ênfase na similaridade na organização do genoma entre o vírus ssDNA circular que o BSL-RDHV aparentemente é e os tombusvírus ssRNA. A semelhança com circovírus não é muito mais direta? Para mim, isso se parece com um circovírus no qual a proteína do capsídeo foi substituída por uma de um vírus do tipo tombus.

Resposta do autor : Isso foi revisado ao longo do texto. No entanto, descobrimos que o arranjo do genoma é muito diferente da maioria dos circovírus, portanto, mantivemos a Figura1.

Relatório do revisor 2: Dr. Mart Krupovic (nomeado pelo Dr. Patrick Forterre) (Institut Pasteur, França):

Diemer e Stedman relatam a caracterização de um suposto genoma viral, que foi obtido no decorrer de uma análise metagenômica de amostras de viroma coletadas no Lago Boiling Springs. O genoma viral putativo (BSL-RDHV) codifica quatro proteínas, duas das quais compartilham similaridade de sequência com proteínas de vírus previamente caracterizados. Uma dessas proteínas está relacionada às proteínas de iniciação de replicação de círculo rolante da superfamília II típicas que são abundantemente encontradas em vírus de DNA e plasmídeos. Surpreendentemente, o outro é mais semelhante às proteínas do capsídeo de vírus de RNA de sentido positivo icosaédrico eucariótico. A observação de que os genes para duas funções virais essenciais - formação de vírions e replicação do genoma - são aparentemente derivados de vírus / replicons de RNA e DNA não relacionados para formar uma nova entidade viral quimérica, embora não inteiramente nova (ver abaixo). As descobertas apresentadas neste artigo avançam substancialmente nosso entendimento não apenas sobre a diversidade genética na virosfera, mas também sobre os mecanismos potenciais responsáveis ​​pelo surgimento de novos tipos virais. Portanto, acho que definitivamente vale a pena publicar o artigo. No entanto, algumas partes do manuscrito ainda podem ser aprimoradas conforme detalhado abaixo.

Antecedentes: Esta seção consiste em cinco linhas que elogiam a utilidade da metagenômica no estudo da evolução do vírus, seguidas por alguns parágrafos, que se assemelham aos Resultados ao invés da Introdução. Dado que o artigo trata da evolução dos vírus, a seção Antecedentes pode fornecer algumas informações sobre as hipóteses atuais sobre a origem dos vírus e os mecanismos de sua evolução. Isso permitiria aos leitores apreciar mais plenamente o significado das descobertas apresentadas na seção Resultados. Os autores podem achar úteis as revisões recentes sobre este assunto por (Koonin e Dolja, 2011 Krupovic et al., 2011 Forterre e Prangishvili, 2009). Dolja VV, Koonin EV: Origens comuns e diversidade dependente do hospedeiro de viromas de plantas e animais. Curr Opin Virol 2011, 1 (5): 322–31. Krupovic M, Prangishvili D, Hendrix RW, Bamford DH: Genomics of bacterial and archaeal virus: dynamics within the procaryotic virosphere. Microbiol Mol Biol Rev 2011, 75 (4): 610–35. Forterre P, Prangishvili D: A origem dos vírus. Res Microbiol 2009, 160 (7): 466–72.

Resposta do autor : Esta seção foi amplamente revisada.

Resultados: I. Proteína da cápside: A semelhança da proteína da cápside BSL-RDHV com as dos vírus de RNA parece ser altamente significativa (especialmente para o CP do vírus Sclerophthora macrospora A). No entanto, a semelhança está confinada aos domínios S e P dos CPs de vírus de RNA, que cobrem apenas a região central da proteína do capsídeo BSL-RDHV (resíduos 156-302). O BSL-RDHV é 542 aa. Os autores poderiam comentar sobre as regiões N- e C-terminais do BSL-RDHV CP, que não são mostradas no alinhamento apresentado na Figura S1?

Resposta do autor : Revisamos o texto para discutir esses aspectos e incluímos tabelas de ocorrências do BLASTp e alinhamentos extensos (Figuras 2 6 ).

Essas regiões compartilham similaridade de sequência com proteínas nos bancos de dados? Qual é a sua estrutura secundária prevista? Eles são propensos a se dobrar em domínios funcionais independentes? Como isso pode afetar a formação do capsídeo? Além disso, os autores devem fornecer mais informações sobre o Sclerophthora macrospora vírus A (SmV-A) e o Plasmopara halstedii vírus A (PhV-A), os dois vírus que compartilham a maior similaridade de sequência com o CP do BSL-RDHV. Afirmar o fato de que são vírus ssRNA não classificados não é suficiente. Por exemplo, qual é o intervalo de hospedeiros de SmV-A e PhV-A (se conhecido), qual é a relação genômica entre esses vírus e tembusvírus, etc.

Resposta do autor : Esta seção também foi revisada e esperamos que este trabalho estimule a pesquisa sobre os vírus SmV-A e PhV-A subestimados, uma vez que eles também podem fornecer informações sobre o mecanismo de formação dos genomas do vírus BSL RDHV-like.

Talvez esta informação possa fornecer algumas dicas sobre a origem do BSL-RDHV? A organização do domínio S-P não é típica para todos os vírus icosaédricos (+) ssRNA. As informações sobre o quão difundido esta arquitetura CP está entre os vírus de RNA seriam muito interessantes. Ele é encontrado apenas em Tombusviridae e em alguns vírus não classificados?

Resposta do autor : Esta configuração S-P só é conhecida e demonstrada por cristalografia de raios-X no grupo “semelhante a carmovírus” de Tombusviridae.

Pelo alinhamento (Figura S1), parece que o domínio S é consideravelmente mais conservado entre BSL-RDHV e tombusvírus. O mesmo se aplica quando BSL-RDHV CP é comparado apenas com SmV-A e PhV-A?

Resposta do autor : Como acima, esta seção foi consideravelmente revisada.

Além disso, a organização SP não é chamada de “configuração double jelly-roll”, como os autores afirmam na página 5. Double jelly roll fold é encontrada em diversos vírus dsDNA e é estruturalmente bastante diferente daquela do CP de tombusvírus (Krupovic e Bamford , 2008). Krupovic M, Bamford DH: Evolução do vírus: até onde se estende a linhagem viral de duplo barril beta? Nat Rev Microbiol 2008, 6 (12): 941–8.

Resposta do autor : Isso foi corrigido.

Além disso, a coloração Qres do modelo CP na Figura 2A não é muito significativa e pode ser eliminada.

Resposta do autor : Descobrimos que, uma vez que o alinhamento não indica um alto grau de similaridade de sequência de aminoácidos no domínio P das proteínas CP, uma avaliação estrutural é garantida para melhor fundamentar as reivindicações de transferência interviral e homologia do BSL e CPs do tipo SP de tombusvírus. Que a conguência estrutural se estende por toda a estrutura é melhor demonstrado com uma pontuação Qres.

II. Proteína rep: Os autores podem apresentar brevemente as proteínas de iniciação de replicação de círculo rolante (RCR Reps). Os RCR Reps contêm três motivos conservados (não apenas o sítio ativo Tyr): Ilyina TV, Koonin EV: Motivos de sequência conservada nas proteínas iniciadoras para a replicação do DNA de círculo rolante codificado por diversos replicons de eubactérias, eucariotos e arqueobactérias. Nucleic Acids Res 1992, 20 (13): 3279 ± 85. Todos os três motivos são conservados no BSL-RDHV? A Figura S2 mostra um alinhamento entre os domínios de nuclease de RCR Reps de BSL-RDHV e PCV2 (a propósito, a legenda não corresponde a esta figura). Um conjunto mais inclusivo de RCR Reps pode ser comparado (e não apenas para a nuclease, mas também para o domínio helicase).

Resposta do autor : Veja a Figura revisada6.

Além disso, o fato de haver uma alça de haste precedendo o gene Rep não sugere necessariamente a natureza de fita simples do genoma BSL-RDHV no vírion (página 6, segundo parágrafo). Os vírus dsDNA também usam RCR Reps para replicação (por exemplo, corticovírus PM2).

Resposta do autor : Embora não exclua completamente a possibilidade de que o vírus BSL RDHV abriga um genoma de fita dupla dentro do vírion, o tronco-loop, a similaridade de sequência com o Rep PCV e a avaliação estrutural Rep indicam fortemente uma fita simples genoma semelhante ao circovírus e ciclo de replicação. Até que os vírions possam ser produzidos e o DNA extraído para análise, isso não pode ser demonstrado definitivamente. Experimentos para detectar ssDNA em amostras de BSL estão em andamento. Além disso, nenhuma similaridade de sequência detectável entre BSL / circoviral e PM2 Rep foi detectada, e nenhuma similaridade de sequência de ácido nucleico foi detectada entre as origens de replicação de BSL e PM2, indicando que o vírus de BSL provavelmente não está relacionado ao corticovírus PM2.

III. As árvores: sugiro substituir as árvores de agrupamento bruto (Figura 3) por alinhamentos correspondentes, uma vez que tais árvores não são muito significativas. A Figura 3A mostra a árvore CP de BSL-RDHV, tombusvírus, vírus satélite, geminivírus e nanovírus. Os autores dizem que o BSL-RDHV se aglomera com tombusvírus, “com a exclusão das proteínas do capsídeo encontradas em vírus ssDNA que infectam plantas que também codificam Rep”. Nenhuma dessas outras proteínas (para as quais há informações sobre a estrutura disponível) possui os domínios S e P, enquanto a informação sobre o nanovírus CP, que eu saiba, não está disponível de todo. Portanto, não faz sentido colocar na mesma árvore proteínas que podem nem mesmo ser homólogas. Da mesma forma para a Figura 3B, que mostra a árvore de RCR Reps - a semelhança entre os Reps de microvírus e circovírus está confinada aos três motivos do domínio de nuclease (Rep microviral também não tem o domínio de helicase). Os arquivos suplementares 2 (pontuações Blast) e 3 (números de acesso) devem ser combinados. Também seria útil se os autores pudessem complementar a tabela com os valores de identidade de pares.

Resposta do autor : Isso foi feito.

Conclusões: "... a recombinação de RNA-DNA foi apenas inferida": Talvez pudesse ser mencionado aqui que numerosos genomas de vírus de RNA (de diferentes famílias) foram recentemente descobertos nos genomas de vários hospedeiros eucarióticos, o que sugere que a recombinação de RNA-DNA pode ser não tão incomum quanto se acreditava anteriormente.

Resposta do autor : Isso foi adicionado e veja a resposta do autor ao Avaliador 3.

Os autores apontam “que a transferência lateral de genes do capsídeo ocorreu entre um ancestral dos vírus de satélite ssRNA e um geminivírus ou nanovírus de ssDNA circular durante a coinfecção [32]”. No entanto, o que sugerimos na ref [32] é que os geminivírus se originaram de plasmídeos de bactérias fitopatogênicas (fitoplasma) pela aquisição do gene codificador do capsídeo de um vírus de RNA infectante de plantas, ou seja, a recombinação ocorreu entre dois DNAs não relacionados (plasmídeo) e RNA (vírus) replicons para dar origem a um novo elemento - o ancestral dos geminivírus. A alegação de que "proteínas do capsídeo do vírus de satélite ssRNA são encontradas exclusivamente em genomas ssDNA das famílias Geminiviridae e Nanoviridae grandes e bem caracterizadas" também não é suportada: (i) não há evidência de que o CP nanoviral adote a dobra de gelatina (embora isso é provavelmente verdade), (ii) entre os vírus de DNA, esta dobra não está restrita a geminivírus, pois também é encontrada em CPs de parvovírus e microvírus (e certos vírus dsDNA), (iii) mais importante, a dobra única do jelly roll é mais amplamente difundido em vírus com genomas de RNA (12 famílias diferentes!). A sugestão de que “vírus de satélite ssRNA provavelmente adquiriram suas proteínas do capsídeo de gemini e nanovírus” não tem fundamento. O fato de que “satélite, gemini e nanovírus muitas vezes co-infectam os mesmos hosts” por si só não é uma prova, especialmente considerando que o parceiro principal durante a coinfecção para vírus de satélite ssRNA são outros vírus ssRNA (com CPs de jelly roll).

Resposta do autor : Decidimos remover este exemplo particular como um possível precedente para a recombinação interviral de RNA-DNA porque as alegações afirmadas em Krupovic et.al., 2009 ainda não foram comprovadas. Concordamos que a própria dobra do jelly-roll provavelmente se originou em vírus de RNA, e que uma filogenia do gene CP indica uma ancestralidade comum entre os CPs de satélite de RNA, DNA gemini e nanovírus. No entanto, consideramos especulativa a afirmação de que os CPs de gemini e nanovírus foram direta e recentemente obtidos de um vírus semelhante a um satélite de RNA. Embora a investigação das trajetórias evolutivas da dobra do rolo gelatinoso e a determinação de sua origem final nos grupos de vírus de DNA sejam certamente uma perspectiva intrigante, tal esforço está além do escopo deste relatório.

Os autores preferem um cenário em que “o gene da cápside foi transferido de um vírus ssRNA para um vírus ssDNA no predecessor da suposta família RDHV”. No entanto, os autores podem ter certeza de que na origem do ancestral RDHV havia um vírus e não um plasmídeo? Em princípio, o aceitador do gene do capsídeo do tipo tombusvírus poderia ser qualquer tipo de replicon (por exemplo, um plasmídeo) com um RCR Rep semelhante ao circovírus. Além disso, os plasmídeos também poderiam estar na origem dos circovírus, como nós temos apontado anteriormente.

Resposta do autor : A sequência da proteína Rep de BSL tem pouca semelhança com o plasmídeo Reps, embora demonstre uma semelhança substancial com Reps semelhantes a circovírus. A menos que haja outros plasmídeos não caracterizados com Reps semelhantes a circovírus, os dados indicam que é mais provável que a recombinação tenha ocorrido em um genoma semelhante a circovírus. Embora seja concebível que os circovírus tenham, em última análise, se originado de plasmídeos, o baixo nível de divergência de sequência entre BSL RDHV Rep, CP e outras proteínas relacionadas indicam uma aquisição recente da proteína CP por um ancestral já semelhante a circovírus. A hipótese alternativa exigiria a evolução convergente da BSL e dos CPs do tipo tombusvirus, o que consideramos altamente improvável.

Último parágrafo das Conclusões: Em minha opinião, é um exagero dizer que as observações apresentadas neste artigo implicam os vírus na transição do Mundo do RNA para o Mundo do DNA.

Resposta do autor : Esta seção da conclusão foi modificada para maior clareza, mas gostaríamos de confirmar nossa diferença de opinião sobre este assunto.

No entanto, certamente concordo que as descobertas “estendem a teoria modular da evolução do vírus para abranger uma gama muito mais ampla de possibilidades”. O que também acho intrigante sobre esses vírus quiméricos é como sua descoberta pode impactar nossas visões sobre a linha do tempo das origens dos vírus, bem como nossas tentativas de conceber níveis mais elevados de classificação de vírus. Freqüentemente, presume-se que os vírus surgiram na mesma época ou mesmo antes dos organismos celulares, enquanto a possibilidade de que novos grupos de vírus possam estar surgindo na biosfera contemporânea raramente é discutida. Com base na hipótese de Koonin e Ilyina (1992), sugerimos que os geminivírus podem representar um tal grupo de “novos” vírus [32]. Koonin EV, Ilyina TV: As proteínas de replicação de Geminivírus estão relacionadas a proteínas iniciadoras de replicação de DNA de círculo rolante de plasmídeo procariótico. J Gen Virol 1992, 73: 2763–6. O RDHV pode ser um exemplo ainda mais convincente de apoio ao surgimento contínuo de novos grupos de vírus a partir de elementos genéticos móveis pré-existentes (vírus e plasmídeos).

Resposta do autor : Estamos totalmente de acordo com a sua avaliação.

Para classificação de vírus de ordem superior, eu pessoalmente prefiro a visão centrada em capsido (Krupovic e Bamford, 2009, 2010), de acordo com a qual determinantes para a arquitetura do vírion são herdados em um determinado grupo viral de seu ancestral comum, enquanto determinantes genéticos para outros funcionais módulos (por exemplo, para proteínas de replicação do genoma) movem-se com relativa liberdade para dentro e para fora desses genomas virais. Em outras palavras, o movimento dos módulos funcionais ocorre em relação aos genes que codificam o capsídeo. Krupovic M, Bamford DH: A evolução das polimerases virais reflete a origem e evolução dos vírus? Nat Rev Microbiol 2009, 7 (3): 250. Krupovic M, Bamford DH: Ordem para o universo viral. J Virol 2010, 84 (24): 12476–9. Em contraste, de acordo com outra linha de pensamento, diferentes módulos funcionais nos genomas virais merecem peso igual ao considerar as relações entre os vírus: Koonin EV, Wolf YI, Nagasaki K, Dolja VV: A complexidade do mundo dos vírus. Nat Rev Microbiol 2009, 7 (3): 250. Lawrence JG, Hatfull GF, Hendrix RW: Imbroglios de taxonomia viral: troca genética e falhas de abordagens fenéticas. J Bacteriol 2002, 184 (17): 4891–905. Portanto, dependendo do ponto de vista, o RDHV pode ser considerado um parente dos tombusvírus, que teve seu mecanismo de replicação do genoma original (RdRp) substituído por um gene para RCR Rep. Por outro lado, também pode ser visto como um circovírus no qual o gene ancestral CP foi substituído por um gene de um tombusvírus. O que os autores pensam sobre a classificação (e afiliação aos táxons virais existentes) de RDHV e outros vírus quiméricos, que provavelmente serão descobertos no futuro?

Resposta do autor : Esses pontos são altamente intrigantes de se considerar e este comentário é muito apreciado. Primeiro, o uso contínuo de metagenômica promete ter um efeito marcante nos esquemas atuais de taxonomia de vírus. Podemos apenas supor quais são os efeitos do vírus BSL RDHV e seus parentes sobre essas estruturas taxonômicas. Em segundo lugar, esta questão relativa às trajetórias dos módulos Rep e CP traz à tona uma questão importante a respeito da origem dos vírus ssDNA linear e circular. É improvável que o genoma BSL semelhante ao RDHV tenha evoluído incrementalmente a partir de um vírus de RNA contendo RdRp. No entanto, a noção de que os vírus ssDNA linear e circular evoluíram primeiro a partir de vírus ssRNA de tal maneira, primeiro por conversão em DNA e, em seguida, por meio da aquisição de um domínio RCRE (o domínio Rep S3H também sendo derivado de um vírus RNA), ao contrário ter surgido em grande parte por meio de trocas modulares é certamente um tópico muito digno de investigação.

Relatório do revisor 3: Dra. Arcady Mushegian (Escola de Medicina da Universidade de Kansas, EUA)

O manuscrito de Diemer e Stedman relata a existência do novo vírus, caracterizado por genoma circular de DNA de fita simples e uma nova configuração de dois genes, ou seja, 1. proteína de replicação semelhante a nanovírus ou circovírus com o usual corte de DNA previsto e Domínios NTPase e 2.a proteína do capsídeo do jelly-roll claramente relacionada às proteínas do capsídeo de vírus de RNA de fita positiva (tombusvirudae) e dois vírus de RNA não classificados de fungos. Os experimentos indicam que a amostra metagenômica do lago quente contém o genoma circular completo e que genomas semelhantes provavelmente existem nas amostras do oceano (nesse caso, sua forma circular não foi mostrada, mas provavelmente será). Esta é uma descoberta fascinante de um novo grupo de vírus, sugerindo o antigo ato de troca de material genético entre genomas de vírus de RNA e DNA. Apoio totalmente a publicação deste estudo, mas devo solicitar que algumas das declarações mais abrangentes no artigo sejam moderadas, a fim de melhor concordar com as evidências. Abstract: “pouco se sabe sobre sua origem coletiva e história evolutiva” --- veja o próximo comentário. Ibid. “Atualmente não é possível determinar se os principais grupos de vírus surgiram independentemente, ou se eles têm uma história evolutiva compartilhada” --- a hipótese de que os vírus de RNA surgiram antes do advento dos genomas de DNA, quando os genomas que codificam proteínas eram feitos de RNA, não é razoável. Isso seria um argumento para as origens independentes, ou pelo menos separadas no tempo, dos genomas de vírus de DNA e RNA. Portanto, a palavra 'coletivo' na primeira frase está fazendo um trabalho pesado que provavelmente não deveria. Por outro lado, os vírus retro-transcritos e os vírus de RNA parecem satisfazer a definição de qualquer um de dois 'grupos principais de vírus', mas há muitas evidências de que eles têm uma história evolutiva compartilhada, pelo menos em sua enzima de replicação.

Resposta do autor : Esta seção foi amplamente revisada.

Ibid. “Nenhum mecanismo para recombinação de RNA-DNA foi ainda identificado” --- e quanto ao retrohoming dos íntrons do grupo II?

Resposta do autor : A seguinte passagem foi adicionada à seção de conclusões com base nas sugestões feitas por Mushegian e Krupovic: ”A presença de genes de vírus de RNA não retrovirais em genomas celulares [[61–66]] sugere que existe algum mecanismo celular que permite a recombinação de RNA-DNA no lugar de uma RT derivada de vírus. Embora o fenômeno retro-homing do íntron do grupo II [[67]] e as trocas mediadas por transposon não foram observadas para mediar a transferência de gene lateral interviral, estes ou mecanismos baseados em células hospedeiras semelhantes podem ter facilitado a formação dos vírus BSL semelhantes a RDHV. ”

p.5: O apelido “vírus híbrido de RNA-DNA” (RDHV) deve desaparecer. Este é um nome totalmente enganador. Os autores mostram evidências abundantes de um vírus semelhante a circovírus ou nanovírus com genoma de DNA de fita simples que, no passado, adquiriu uma proteína do capsídeo de um vírus de RNA. No entanto, agora é um vírus de DNA. Este não é nem mesmo o primeiro exemplo desse tipo de mosaicismo - as proteínas BL1 / BC1 dos geminivírus bipartidos são semelhantes à família 30 K de proteínas de movimento dos vírus de RNA de plantas, mas ninguém chama os geminivírus bipartidos de "vírus DNA-RNA" por causa disso . Os genomas de RNA de closterovírus codificam homólogos de proteínas celulares HSP70, mas esses vírus também não são vírus de RNA-DNA. Nome descritivo como “Boiling Spring Lake Virus 1” ou algo desse tipo deve servir. Observe que esta objeção ao “RDHV” não é uma guerra de nomenclatura, mas visa estabelecer o registro molecular correto.

Resposta do autor : O apelido “RDHV” é mencionado no texto como provisório. Sentimos que um nome descritivo sucinto para este novo tipo de genoma de vírus é garantido, pelo menos temporariamente. Outros nomes concebíveis parecem insuficientes para descrever um novo e provavelmente amplo grupo de vírus e sua ancestralidade, e seriam significativamente mais confusos ou excessivamente complicados (por exemplo, "um vírus Boiling Springs Lake do Mar dos Sargaços"). Concordamos totalmente que o genoma descoberto representa um vírus de DNA. Assim que tivermos identificado o hospedeiro e / ou estrutura do vírus, iremos propor um nome taxonomicamente apropriado por meio do ICTV (e deixar a guerra de nomenclatura acirrar).

p.5 e mais tarde: Tenho certeza de que há um argumento direto de similaridade de sequência sobre a relação evolutiva da proteína do capsídeo “RDHV” e tombusvírus. Pude obter uma semelhança estatisticamente significativa entre o primeiro e o último por meio das abordagens PSI-BLAST e HHPred. Recomendo que os autores façam o mesmo. Em vez disso, estamos lendo “A estrutura prevista da proteína do capsídeo BSL RDHV é congruente com a configuração do duplo jelly-roll do domínio S-P encontrada no ssRNA Tomato Bushy Stunt (TBSV) e melon Necrotic Spot (MNSV) tombusvírus [12, 13]. As sequências de aminoácidos são moderadamente conservadas entre as três proteínas com base em BLOSUM80 [14], enquanto a porcentagem de identidade de sequência é baixa (Figura 2A) (consulte a Figura 1 adicional para alinhamento). ” Isso é ambíguo: se os argumentos de estatísticas de pesquisa de banco de dados / similaridade de sequência (não o mesmo que identidade de sequência!) Não são suficientes para estabelecer a similaridade evolutivamente significativa, então não há base para o encadeamento e modelagem de estrutura e se os argumentos de similaridade de sequência eram usado, por que não dizer isso?

Resposta do autor : Esta seção foi amplamente revisada e Figuras adicionadas (Figuras 2 6 ).

p. 7: “O cenário mais parcimonioso” --- mais parcimonioso do que outros cenários?

Resposta do autor : Esta seção também foi revisada. Veja a resposta a Krupovic com relação à origem dos vírus ssDNA linear e circular.

pp. 7–8: Várias menções de vírus de RNA de satélite parecem inadequadas - os tombusvírus não são satélites e nem os vírus fúngicos são discutidos no artigo?

Resposta do autor : Estas referências foram esclarecidas.

pp. 8–9: (último parágrafo do artigo) “Supondo que os vírus de RNA precederam evolutivamente todos os grupos de vírus de DNA [33, 34], a evidência de transferência de genes de vírus de RNA para DNA complementa a teoria do RNA primeiro [35].” --- Eu não entendo o que isso significa. Em primeiro lugar, se presumirmos que os vírus de RNA precederam evolutivamente todos os grupos de vírus de DNA, então temos uma resposta parcial à pergunta que se dizia ser atualmente impossível de responder no Resumo (ver acima). Em segundo lugar, “complementar” mais ou menos significa fornecer uma parte ausente ou uma linha de argumento compatível adicional, correto? Não tenho certeza do que o vírus descrito neste estudo tem a ver com a precedência evolutiva dos vírus de RNA sobre os vírus de DNA: certamente, para que esse vírus surja, tanto os vírus de RNA quanto os de DNA já devem existir?

Resposta do autor : Este parágrafo final foi revisado e esclarecido.


Assista o vídeo: Genomas virais (Outubro 2022).