Em formação

Polimorfismos de nucleotídeo único e doenças

Polimorfismos de nucleotídeo único e doenças


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Estou escrevendo um relatório sobre como os polimorfismos de nucleotídeo único ocorrem em cada uma dessas regiões:

  1. Locais de ligação do fator de transcrição (TF)
  2. Sinais epigênticos
  3. Variantes de emenda
  4. Sítios de ligação de microRNA
  5. Regiões de codificação

pode causar doenças. Sugestão de literatura relacionada de você ou apenas informações que você sabe que seriam gratas


SNPs em todas essas regiões irão modificar a sequência de DNA. Os efeitos dependerão de onde exatamente está o SNP. Vou resumir as condições em que os efeitos podem ser máximos

  1. Sítios de ligação de fatores de transcrição (TFs): SNP nas posições de nucleotídeos que se ligam aos aminoácidos de reconhecimento no TF
  2. Sinais epigênticos: C-> X [x: A, G, T] SNPs podem interromper pontos de acesso de metilação de DNA
  3. Variantes de emenda: SNPs em locais doadores / aceitadores de emenda podem causar retenção de íntron
  4. Sítios de ligação de microRNA: SNP na região de semente pode abolir o direcionamento de miRNA
  5. Regiões de codificação: certos SNPs podem criar códons de parada prematura para, por exemplo, CAG (Gln) -> UAG (parar)

há muito trabalho em SNPs. Se você pesquisar no pubmed por todas essas categorias, obterá muitos artigos de pesquisa, bem como resenhas.


Biologia / DNA

Introdução

Polimorfismos de nucleotídeo único (SNPs) são variações de pares de bases (bp) em locais específicos no genoma. Por definição, uma variação genética em um único locus bp não é considerada um SNP, a menos que pelo menos dois alelos tenham frequências de mais de 1% em uma grande população de indivíduos não relacionados. O genoma humano haplóide consiste em aproximadamente 3 bilhões de pb. O número de SNPs é estimado em 10-11 milhões, o que dá uma média de um SNP por 275 bp. A grande maioria dos SNPs tem apenas dois alelos porque a taxa de mutação em uma determinada posição bp é extremamente baixa e é altamente improvável que duas mutações pontuais ocorram na mesma posição ao longo do tempo. Por esse motivo, os SNPs têm sido usados ​​extensivamente para mapear a história das populações, identificando a distribuição dos alelos SNP entre as populações existentes e passadas. Os marcadores SNP também são a melhor escolha para a construção de um conjunto denso de marcadores polimórficos que podem ser usados ​​para estudar a associação entre os marcadores e uma determinada característica ou doença.

Os SNPs têm muitos usos potenciais em investigações genéticas forenses, incluindo estimativa de etnia, características humanas ou doenças. Essas questões são tratadas em outros artigos deste livro. Aqui, o uso de SNPs para identificação humana é discutido.


Estudos genômicos do bagre: progresso e perspectivas

Yulin Jin,. Zhanjiang Liu, em Genomics in Aquaculture, 2016

Polimorfismos de nucleotídeo único

Polimorfismos de nucleotídeo único (SNPs) são polimorfismos causados ​​por mutações pontuais que dão origem a diferentes alelos contendo bases alternativas em uma determinada posição do nucleotídeo dentro de um locus. Devido à sua alta abundância no genoma, os SNPs já servem como o tipo de marcador predominante. Muitas técnicas de sequenciamento e métodos de bioinformática são aplicados para o desenvolvimento e identificação de SNP, como sequenciamento shotgun aleatório, sequenciamento direcionado de amplicon de PCR, sequenciamento de RNA e mineração bioinformática de bancos de dados de ESTs (Liu e Cordes, 2004). Para a identificação de SNPs derivados de ESTs, padrões de qualidade foram estabelecidos a fim de reduzir a possibilidade de erros de sequenciamento (Wang et al., 2008). Contigs com pelo menos quatro sequências com a sequência de alelo menor sendo representada pelo menos duas vezes forneceram uma alta taxa de validação de SNP. Usando recursos EST de bagres do canal, Wang et al. (2010) identificaram mais de 300.000 SNPs putativos. Com base no RNA-Seq, mais de 2 milhões de SNPs putativos foram identificados a partir do bagre canal, enquanto quase 2,5 milhões de SNPs putativos foram identificados a partir do bagre azul usando a tecnologia de sequenciamento de DNA de próxima geração (Liu et al., 2011). Destes SNPs putativos, um conjunto de SNPs filtrados foi identificado, que incluiu 342.104 SNPs intraespecíficos para o bagre do canal, 366.269 SNPs intraespecíficos para o bagre azul e 420.727 SNPs interespecíficos entre o bagre do canal e o bagre azul. Esses SNPs filtrados foram distribuídos em 16.562 genes únicos no peixe-gato do canal e 17.423 genes únicos no peixe-gato azul (Liu et al., 2011). Recentemente, o novo sequenciamento do genoma de 4 populações de aquicultura de bagres de canal principal, bem como uma população natural, forneceu um total de 8,4 milhões de SNPs putativos (Sun et al., 2014). Os SNPs identificados fornecem um recurso muito necessário para estudos genéticos na comunidade científica de bagres, contribuindo para o desenvolvimento de plataformas de genotipagem de alta densidade e econômicas. A validação e o teste desses SNPs usando matrizes de SNP formarão a base material para estudos de associação de genoma e seleção baseada em genoma inteiro em bagres (Liu et al., 2011, 2014).


Polimorfismo de nucleotídeo único (SNP): significado, origem e outros detalhes

Um polimorfismo de nucleotídeo único ou SNP (pronuncia-se & # 8216snip & # 8217) é uma pequena mudança genética, ou variação, que pode ocorrer dentro de uma sequência de DNA.

As quatro letras de nucleotídeos A (adenina), C (citosina), T (timina) e G (guanina) especificam o código genético.

A variação do SNP ocorre quando um único nucleotídeo, como um A, substitui uma das outras três letras de nucleotídeo & # 8211 C, G ou T (Fig. 20-1).

Pela definição clássica de polimorfismo, a frequência da variação terá que ser de pelo menos 1% para qualificar a mudança de nucleotídeo como um polimorfismo. Aquelas alterações de nucleotídeos que ocorrem em menos de 1% seriam chamadas de variante rara.

Como apenas 1,1 a 1,4% das sequências de DNA de uma pessoa codificam proteínas, a maioria dos SNPs é encontrada fora das sequências de codificação. SNPs situados fora da região codificadora normalmente não deveriam ter qualquer impacto no fenótipo de um organismo. Os SNPs encontrados em uma sequência de codificação são de interesse particular para os pesquisadores, pois são mais propensos a alterar a função biológica de uma proteína, embora essas mudanças tenham efeito muito menos drástico do que o das mutações.

Devido aos recentes avanços no campo da identificação e caracterização de genes, tem havido uma grande onda de descobertas de SNPs. Encontrar mudanças de nucleotídeo único em todo o genoma humano parece um trabalho gigantesco, mas, nos últimos 20 anos, os pesquisadores desenvolveram uma série de técnicas que tornam isso possível.

Cada técnica usa um método não idêntico semelhante para comparar regiões selecionadas de uma sequência de DNA obtida de vários indivíduos que compartilham uma característica comum. Em cada teste, o resultado mostra uma diferença nas amostras de DNA quando um SNP é detectado em um indivíduo em um pool em teste.

Distribuição de SNPs:

Os SNPs não são distribuídos uniformemente pelo genoma. Um grande número de SNPs é distribuído por toda a região não codificadora do genoma. Como essas regiões estão livres de pressão de seleção, essas mudanças são selecionadas de forma neutra e fixadas ao longo do tempo. Os padrões de distribuição dos SNPs são variáveis, mesmo em um único cromossomo.

Por exemplo, regiões responsáveis ​​pela apresentação de antígenos ao sistema imunológico, presentes no cromossomo 6, apresentam variabilidade de nucleotídeos muito alta em contraste com outras regiões do mesmo cromossomo.

A Origem, Sobrevivência e Fixação de SNPs:

O SNP é a principal fonte de variação no genoma e é responsável por 90% de todo o polimorfismo humano.

Existem dois tipos de substituição de base de nucleotídeo:

A transformação, que representa quase dois terços de todos os SNPs, ocorre entre purinas (por exemplo, A & gt G) ou pirimidinas (por exemplo, C & gt T).

A conversão ocorre entre purinas e pirimidinas (por exemplo, A & gt C e G & gt T).

Um SNP passa por uma série de procedimentos de seleção antes de ser finalmente estabelecido.

Sua vida pode ser dividida aproximadamente em 4 fases:

1) Aparecer por meio de mutações pontuais.

2) Sobreviver à pressão seletiva da natureza.

3) Espalhar através das gerações.

4) Estabelecendo-se como pelo menos 1% de todos os alelos.

A alteração mais frequente em humanos é a mutação de CpG para TpG (uma transição responsável por aproximadamente 25% de todas as mutações). Esse mecanismo causa diminuição no número de dinucleotídeos CG no genoma, uma vez que muitos eventualmente se tornam TG, enquanto novos locais CpG serão criados por outras mutações menos frequentes.

Uma vez que apenas 1,1% a 1,4% dos códigos do genoma para proteínas, os SNPs provavelmente ocorrem em sequências não codificantes com mais frequência. Mesmo que o SNP ocorra em uma sequência de codificação, na maioria das vezes ele pode ter um efeito sutil e não deletério nas proteínas expressas. As mudanças responsáveis ​​pelos efeitos deletérios são eventualmente removidas do genoma pela seleção natural. Portanto, para atingir o status de um SNP, uma mutação pontual deve ser não deletéria para ser selecionada (Miller e Kwok, 2001).

Predisposição genética:

As doenças mais comuns em humanos não são causadas por uma variação genética dentro de um único gene, mas são influenciadas por interações complexas entre vários genes, bem como por fatores ambientais e de estilo de vida. Embora os fatores ambientais e de estilo de vida contribuam para o fenótipo de uma doença, é difícil medir e avaliar seu efeito geral no processo de uma doença.

A probabilidade de um indivíduo desenvolver uma doença com base em genes e fatores hereditários é chamada de predisposição genética. Fatores genéticos conferem suscetibilidade ou resistência a uma doença e determinam a gravidade ou progressão da doença.

A maioria dos fatores de predisposição ainda são desconhecidos. Os pesquisadores descobriram que é difícil desenvolver testes de triagem para a maioria das doenças e distúrbios. A associação fenotípica de certos SNPs codificantes com um distúrbio daquele gene específico levou à identificação do aspecto funcional dos SNPs.

O polimorfismo de nucleotídeo único também pode ser usado como uma ferramenta para identificar genes responsáveis ​​pela doença ou genes que conferem um determinado fenótipo da doença. Ao estudar trechos de sequência de DNA que foram encontrados para abrigar um SNP associado a um traço de doença, os pesquisadores podem começar a revelar genes relevantes associados a uma doença.

Compreender o papel dos fatores genéticos nas doenças também permitirá aos pesquisadores avaliar melhor o papel dos fatores não genéticos - como habitat, criação, comportamento, dieta, estilo de vida e atividade física na doença.

Como os fatores genéticos também afetam a resposta de um indivíduo a uma terapia medicamentosa, os SNPs serão úteis para ajudar os pesquisadores a determinar e compreender por que os indivíduos diferem em suas habilidades de metabolizar certos medicamentos, bem como para determinar por que um indivíduo pode experimentar um efeito colateral adverso a uma droga específica.

Portanto, a recente descoberta dos SNPs promete revolucionar não só o processo de detecção de doenças, mas também a prática da medicina personalizada, preventiva e curativa.

Aplicação do SNP em Estudos Farmacogenômicos:

As taxas de resposta a medicamentos principais e comuns variam abertamente entre os indivíduos (Tabela 1). SNPs atribuem de forma importante a este fenômeno. O uso de SNPs para estudar a genética da resposta a medicamentos tem o potencial de ajudar na criação da medicina personalizada, conforme explicado na (Fig. 20.2). Como mencionado anteriormente, os SNPs também podem estar associados ao metabolismo, ou seja, absorvância e depuração de agentes terapêuticos.

Atualmente, não existe uma triagem genética padrão de genes que metabolizam drogas para determinar como um paciente responderá a um determinado medicamento. Um tratamento comprovadamente eficaz em um paciente pode ser ineficaz em outros. Alguns pacientes também podem apresentar reações imunológicas adversas a um determinado medicamento.

Portanto, as empresas farmacêuticas limitam sua produção de medicamentos para os quais um paciente "médio" responderá. Como resultado, um grupo relativamente menor de pacientes que abrigam qualquer variação genética putativa (por exemplo, um SNP), que os torna incapazes de metabolizar essa droga, permanece sem tratamento. Muitos medicamentos que podem beneficiar esse pequeno grupo de pacientes nunca chegam ao mercado, pois trariam menos lucro para as indústrias farmacêuticas.

* SSRI = Habitantes Seletivos de Recaptação de Serotonina

Os dados apresentados na tabela acima (retirados do Physicians Desk Reference, 54th edn., Medical Economics Company, 2000) mostram a limitação da eficácia dos medicamentos prescritos para melhorar a doença entre os indivíduos afetados e ressalta a importância de explorar de forma personalizada medicamento baseado na composição genética dos indivíduos.

A era pós-genômica revelou associação de SNP com certas doenças humanas direta ou indiretamente. Por exemplo, estudos genéticos mostraram uma relação intrincada entre:

(a) SNPs no gene F5 do fator de coagulação e trombose venosa profunda,

(b) Alteração genética no gene do receptor de quimiocina CCR5 e susceptibilidade à infecção por HIV e relação entre um hospedeiro de outros SNPs e doenças (McCarthy e Hilfiker, 2000).

Essas associações exemplificam a abordagem do gene candidato e, portanto, podem ser benéficas para identificar a condição de predisposição à doença em um indivíduo (Tabela 2). Similares, associações também são observadas entre SNP e variações de resposta aos medicamentos em indivíduos (Tabela 3). Por exemplo, variantes genéticas em uma enzima de metabolização de drogas (tiopurina metiltransferase TPMT) foram associadas a reações adversas a drogas (Snow & amp Gibson, 1995) de forma semelhante, a variação no promotor ALOX5 modula a resposta ao tratamento anti-asma (Drazen et al. 1999) . SNPs no gene da Apolipoproteína E (APOE) foram associados à resposta ao inibidor da colinesterase em pacientes com Alzheimer & # 8217s.

Os efeitos diretos do SNP também são observados em várias doenças comuns. Recentemente, SNPs responsáveis ​​pelo aumento do risco de diabetes foram identificados. Uma variante genética comum devido a um SNP é o gene gama do receptor ativado por proliferador de peroxissoma (PPAR), presente em cerca de 25% dos pacientes com diabetes tipo 2 na população, e acredita-se que torna os indivíduos mais propensos ao diabetes (Altshuler et al. 2000).

Embora essas variações tenham um efeito modesto sobre o risco individual, ainda afetam uma grande parte da população humana. Em contraste com a identificação do envolvimento direto de SNPs na doença, a identificação e o uso de SNPs no gene responsável pelo metabolismo e desintoxicação de drogas são limitados.

Como lendas da resposta ao medicamento após a administração do medicamento, & # 8216responderantes e não respondentes & # 8217 só podem ser identificados depois de receber o medicamento. Isso torna a identificação de indivíduos de uma população difícil (McCarthy e Hilfiker, 2000). Um estudo correlativo do efeito de uma droga em uma grande população já conhecida, seguido por uma triagem SNP de genes suspeitos, seguida por interpretação estatística, pode acabar sendo útil na compreensão da relação SNP-fenótipo.

No futuro, o medicamento mais apropriado para um indivíduo pode ser determinado e usado para tratamento por meio da análise do perfil SNP de um paciente. A capacidade de direcionar um medicamento para os indivíduos com maior probabilidade de se beneficiar, conhecido como & # 8216 medicina personalizada & # 8217, permitiria às empresas farmacêuticas trazer muito mais medicamentos para o mercado e permitir que os médicos prescrevessem terapias individualizadas específicas para as necessidades de um paciente.

As informações podem ser integradas a outros recursos, como estrutura de proteínas. Usando uma abordagem computacional, os SNPs de codificação podem ser plotados na estrutura da proteína 3D e as mudanças observadas podem ser correlacionadas com o fenótipo.

A aplicação de dados estruturais à pesquisa sobre variação genética é de imensa utilidade para estudos sobre as bases genéticas da variação fenotípica. A indústria farmacêutica pode lucrar com o gene de metabolização de drogas & # 8216SNP e banco de dados de mutação & # 8217 contendo informações sobre a estrutura do polimorfismo, porcentagem na população com os genótipos variantes e seu efeito fenotípico em resposta ao tratamento com drogas.

Importância estrutural e funcional dos SNPs:

Além dos SNPs que ocorrem na sequência de codificação dos genes, a importância funcional dos SNPs também foi observada em DNA não codificante (por exemplo, íntrons), incluindo reguladores (por exemplo, promotores, intensificadores, etc.). Um bom exemplo de SNP funcional está em uma região não codificadora é o gene tau. A estrutura do RNA do elemento regulador de splicing do exão 10 da tau foi recentemente decifrada e demonstrou formar uma estrutura de haste-alça dobrada estável.

Outros exemplos são:

SNP intrônico afetando sites de emenda:

A região de codificação e as mutações intrônicas no gene tau causam demência frontotemporal e parkinsonismo ligado ao cromossomo 17. Mutações intrônicas e algumas mutações missense aumentam o splicing in-of exon 10, levando a uma proporção aumentada de isoformas tau de quatro repetições para três repetições (Varani et al. 1999).

SNPs do promotor que afetam a expressão gênica:

Os SNPs podem afetar a expressão do gene se estiverem no promotor ou em qualquer outra sequência de controle do gene. Fatores de transcrição e a RNA polimerase se ligam diferencialmente aos promotores com base no contexto da sequência, influenciando o padrão de expressão do gene. Evidências recentes mostram que SNPs na região promotora de TNF-α, IL-1β e poucas outras citocinas aumentam sua expressão, tornando os indivíduos mais imunes a algumas infecções bacterianas e outras infecções patogênicas (El-Omar et al. 2000).

SNPs nas regiões de codificação que afetam a estrutura da proteína:

Alterações sutis no DNA podem resultar em alterações drásticas na estrutura da proteína, conforme discutido. Foi estabelecida a relação estrutural e funcional da apolipoproteína (apo) E no metabolismo das lipoproteínas, doenças cardíacas e doenças neurodegenerativas, incluindo a doença de Alzheimer & # 8217s. ApoE é uma proteína de 299 aminoácidos com dois domínios funcionais.

O domínio do terminal amino contendo os resíduos 1-191 contém a região de ligação ao receptor da lipoproteína de baixa densidade (LDL), e o domínio do terminal carboxila contém os principais elementos de ligação aos lipídeos.

As três isoformas humanas comuns - apoE2, apoE3 e apoE4 - diferem apenas em duas posições na proteína, mas têm propriedades metabólicas muito diferentes e impactos dramáticos nas doenças (Fig. 20.3). ApoE3 (Cys-112, Arg-158) liga-se normalmente ao receptor de LDL e está associada ao metabolismo lipídico normal, enquanto apoE2 (Cys-112, Cys-158) se liga de forma defeituosa ao receptor de LDL e está associada ao distúrbio genético tipo III hiperlipoproteinemia. ApoE4 (Arg-112, Arg-158) liga-se normalmente ao receptor de LDL, mas está associada a níveis elevados de colesterol e, portanto, a um risco aumentado de doença cardiovascular (Morrow et al. 2002). Além disso, foi observado que apoE4 é um importante fator de risco para a doença de Alzheimer & # 8217s.

Uma série de estudos de caso recentes sobre o efeito do SNP na estrutura e função das proteínas não só mostraram a alteração estrutural específica da proteína na doença, mas também forneceram informações sobre os mecanismos reguladores da proteína nativa. A presença de uma mutação pontual (Leu55Pro) na α1-antiquimotripsina, um inibidor de protease da superfamília das serpinas, causa sua perda de atividade (Sunyaev et al. 2001).

A mudança na proteína devido à mutação pontual causa doença pulmonar obstrutiva. Da mesma forma, uma mutação pontual na apolipoproteína A-1 humana (ApoA-1) está associada à doença cardíaca coronária (Sunyaev et al. 2001). Esses estudos sobre os efeitos das alterações de um único nucleotídeo na estrutura da proteína nos fornecem informações sobre a causa da doença e as funções das proteínas.

Estudos semelhantes foram realizados no receptor opioide mu, oprm 1. O receptor opioide mu é o principal local de ação para os opioides mais comumente usados, incluindo morfina, heroína, fentanil e metadona. O SNP mais prevalente presente em cerca de 10% da população é uma substituição de nucleotídeo na posição 118 (118 A & gt G), com mudança de aminoácido prevista em um local putativo de N-glicosilação.

Embora a proteína variante resultante do SNP 118 A & gt G não tenha mostrado afinidades de ligação alteradas para a maioria dos peptídeos opioides e alcalóides testados, o receptor da variante 118 A & gt G ligou-se à beta-endorfina, um opioide que ativa o receptor opioide, se liga aproximadamente 3 vezes mais firmemente do que a forma alélica mais comum do receptor.

Além disso, a beta-endorfina é aproximadamente 3 vezes mais potente no receptor da variante 118 A & gt G do que na forma alélica comum na ativação induzida por agonista de canais de potássio acoplados à proteína G. Estes resultados sugeriram que o SNP 118 A & gt G no gene do receptor opióide pode ter implicações para a fisiologia normal e vulnerabilidade para desenvolver diversas doenças, incluindo as doenças aditivas (Bond et al. 1998).

A relação dos SNPs com a pressão arterial (PA) também foi estabelecida. Alterações de nucleotídeo único no gene do angiotensinogênio (AGT) são observadas, o que é comum em pessoas com pressão alta. Um isolado genético religioso norte-americano, Huterites, foi testado quanto à associação entre a variação nas pressões sanguíneas sistólica e diastólica e o polimorfismo de inserção / deleção da enzima conversora de angiotensina, ACE e 2 polimorfismos de proteína de AGT (viz., M235T e T174M).

Os genótipos do códon 174 foram significativamente associados à variação da pressão arterial sistólica em homens e foram responsáveis ​​por 3,1% da variação total. Os homozigotos para o AGT174M tiveram a PA média mais alta, seguidos pelos heterozigotos e os homozigotos para o AGT174T tiveram a PA média mais baixa (Hegele et al. 1996).

SNPs como marcadores genéticos:

A maioria dos SNPs não é responsável por um estado de doença. Em vez disso, eles podem servir como marcadores biológicos para rastrear um ou mais genes de doenças no mapa do genoma humano. Como os SNPs ocorrem com frequência em todo o genoma e são relativamente estáveis, eles servem como excelentes marcadores biológicos. Os marcadores biológicos são segmentos de DNA com uma localização física pré-identificada no cromossomo, que podem ser facilmente rastreados e usados ​​para construir um mapa cromossômico da posição de genes conhecidos em relação uns aos outros.

Esses mapas permitem estudar a identificação de características resultantes da interação de mais de um gene. Portanto, essa estratégia desempenha um papel importante em casos de distúrbios genéticos complexos. Os marcadores SNP, embora bialélicos, são preferidos aos marcadores microssatélites, pois as mutações recorrentes são geralmente muito raras no caso de SNPs.

O National Center for Biotechnology Information (NCBI) desempenha um papel importante em facilitar a identificação e catalogação de SNPs através da criação e manutenção do banco de dados SNP público (dbSNP), que pode ser acessado pela comunidade biomédica em todo o mundo e tem o objetivo de facilitar muitos áreas de pesquisa biológica.

SNP em estudos de desequilíbrio de ligação:

Alelos particulares em loci vizinhos tendem a ser co-herdados. Para loci fortemente ligados, isso pode levar à associação entre alelos na população - uma propriedade conhecida como desequilíbrio de ligação (LD) (Ardlie et al. 2002). O fenômeno de LD pode ser explicado com base na co-segregação de dois alelos fortemente ligados em uma população, onde uma forma do haplótipo é selecionada quando a população experimenta um gargalo.

Mais tarde, o haplótipo selecionado se torna o haplótipo fundador, conforme mostrado na (Fig. 20.4). A mutação e a recombinação têm o impacto mais evidente no LD. Fatores adicionais que contribuem para a extensão e distribuição de LD são deriva genética, crescimento populacional, mistura populacional, migração, seleção natural, recombinação variável e taxas de mutação e conversão gênica.

Medidas de LD:

O desequilíbrio de ligação entre dois pontos A e B pode ser calculado pela expressão:

Onde PAB é a frequência do haplótipo que consiste nos alelos A e B

PUMA e PB são as frequências dos alelos A e B nos loci A e B, respectivamente.

A erosão LD ocorre ao longo do tempo e da distância. Portanto, o fator & # 8216time & # 8217 e & # 8216distance & # 8217 deve ser levado em consideração para o cálculo do LD.

Se D0 é a extensão do desequilíbrio em um ponto de partida entre dois alelos, r distantes um do outro, o desequilíbrio t gerações posteriores (Dt):

Doenças Complexas e SNP:

A maioria dos genes responsáveis ​​pelos principais distúrbios monogênicos foram mapeados por clonagem posicional. Esses distúrbios seguem o padrão mendeliano de herança. Doenças como diabetes, câncer, asma, artrite reumatóide não apresentam nenhum padrão claro dessa herança. Esses distúrbios são chamados de doenças complexas ou multifatoriais.

É hipotetizado que polimorfismos de nucleotídeo único podem ser usados ​​para rastrear genes responsáveis ​​por distúrbios complexos. Para tanto, SNPs que apresentam co-segregação com determinada doença podem ser usados ​​como marcadores para identificar (mapear) os loci responsáveis ​​pela doença.

Os SNPs identificados em genes candidatos para uma doença complexa poderiam ser usados ​​para determinar a suscetibilidade de um indivíduo em relação à doença e, quando afetado, seu perfil de SNP para genes relacionados ao alvo da droga e ao metabolismo da droga poderia ser usado para determinar a eficácia das drogas disponíveis para fins terapêuticos.

O Projeto Internacional HapMap: Compreendendo as Variações Genéticas Humanas Comuns:

Conforme descrito anteriormente, a interação complexa de múltiplos genes, fatores ambientais e estilo de vida resultam em doenças comuns, como diabetes, câncer, derrame, doenças cardíacas, distúrbios psiquiátricos, asma etc. Embora quaisquer dois indivíduos não relacionados sejam iguais em cerca de 99,9% de seu DNA sequências, o 0,1% restante é importante porque contém as variantes genéticas que fornecem sua identidade única e também influenciam a variabilidade em seu risco de doença e na resposta aos medicamentos. Descobrir as variantes da sequência de DNA que contribuem para o risco de doenças comuns oferece uma das melhores oportunidades para compreender as causas complexas das doenças em humanos.

Um esforço centralizado e também multinacional foi necessário para mapear, descobrir e validar as variações comuns no genoma humano. O primeiro passo para apreender esse conhecimento foi dado em 2001, com a finalização da sequência do genoma humano. Consequentemente, o Projeto HapMap Internacional foi iniciado

O objetivo do projeto é desenvolver um mapa de haplótipos do genoma humano, o HapMap, que irá descrever os padrões comuns de variação da sequência de DNA humano. O Projeto é uma ferramenta poderosa e um banco de dados, que visa facilitar a descoberta de contribuições genéticas para doenças comuns, e pode ser usado em estudos que comparem os padrões de variação genética (haplótipos) em pessoas com uma doença específica a padrões em pessoas sem a doença.

Ao identificar regiões do genoma humano que mostram diferenças nos padrões de haplótipos, variantes genéticas específicas que contribuem para a doença podem ser facilmente identificadas. Para produzir o HapMap, os pesquisadores analisaram amostras de sangue de um total de 269 pessoas de quatro grandes populações.

Essas populações são: iorubá em Ibadan, Nigéria, japoneses em Tóquio, chineses Han em Pequim e residentes em Utah com ancestrais do norte e oeste da Europa. Essas quatro populações foram selecionadas para incluir pessoas com ascendência de regiões geográficas amplamente distintas - caucasianos (europeus e norte-americanos), iorubanos (negróides) e chineses e japoneses (mongolóides). Curiosamente, a população indiana ou do sul da Ásia não está representada no HapMap.

Na Índia, várias iniciativas foram tomadas para estudar as variações genéticas na população indiana, a principal delas sendo & # 8216O banco de dados de variação do genoma indiano (IGVdb) & # 8217. Os projetos HapMap e IGVdb têm o potencial de desvendar a base genética de doenças complexas, levando a descobertas para prevenção e tratamento dessas doenças.

Uma iniciativa indiana:

O subcontinente indiano sendo um caldeirão de diferentes populações e culturas desde o início das civilizações, a população pode servir como um modelo ideal para estudar o perfil de Nucleotídeo Único e sua variedade devido à sua diversidade e linhagem ancestral. A população indiana compreende mais de um bilhões de pessoas, compreendendo 4.693 comunidades com milhares de grupos endógamos, 325 idiomas funcionais e 25 scripts.

Para entender a origem, evolução, diversidade e os padrões de migração da população, SNP serve como uma ferramenta genética ideal. Além disso, a predisposição para distúrbios complexos, sensibilidade variável e reação a diferentes drogas são de importância primordial. Para este propósito, seis laboratórios constituintes do Conselho de Pesquisa Científica e Industrial (CSIR) em colaboração com outros institutos de pesquisa de primeira linha da Índia iniciaram um programa de rede.

Consórcio Indian Genome Variation (IGV) para identificar e validar SNPs e sequências de repetição polimórfica em milhares de genes do genoma humano. Esses genes foram selecionados com base em sua relevância como candidatos funcionais e posicionais em muitas doenças comuns, incluindo genes relevantes para a farmacogenômica.

Uma revisão do estudo planejado foi publicada em Human Genetics (The Indian Genome Variation database IGVdb, 2005). Este é o primeiro esforço abrangente em grande escala da Índia para compreender e utilizar as variações do genoma já presentes para sua implantação na indústria farmacêutica.

As amostras de sangue nas quais a análise de DNA será feita estão sendo coletadas de várias tribos indígenas e populações da Índia. Espera-se que os dados forneçam uma visão da estrutura da população indiana, sua evolução com uma implicação de longo alcance no estudo de doenças complexas comuns e farmacogenômica.


Polimorfismo de nucleotídeo único

A importância dos SNPs vem de sua capacidade de influenciar o risco de doenças, a eficácia dos medicamentos e os efeitos colaterais, falar sobre sua ancestralidade e prever aspectos de sua aparência e até mesmo de seus atos. SNPs são provavelmente a categoria mais importante de alterações genéticas que influenciam doenças comuns. E em termos de doenças comuns, 9 das 10 principais causas de morte têm um componente genético e, portanto, é mais provável que um ou mais SNPs influenciem seu risco.

Esses videoclipes do youtube explicam

Todos os humanos têm quase a mesma sequência de 3 bilhões de bases de DNA (A, C, G ou T) distribuídas entre seus 23 pares de cromossomos. Mas em certos locais há diferenças - essas variações são chamadas de polimorfismos. Polimorfismos são o que torna os indivíduos diferentes uns dos outros. As estimativas atuais indicam que até 0,1% de nosso DNA pode variar um pouco, o que significa que dois indivíduos não relacionados podem diferir em menos de 3 milhões de posições de DNA. Embora muitas variações (SNPs) sejam conhecidas, a maioria não tem efeito conhecido e pode ser de pouca ou nenhuma importância.

SNPedia é uma coleção do subconjunto de SNPs que foram relatados como significativos, seja do ponto de vista médico ou por outros motivos (como genealogia). A ênfase no SNPedia está nos SNPs que têm consequências médicas significativas, são comuns, são reproduzíveis (ou encontrados em metanálises ou estudos de pelo menos 500 pacientes) e / ou têm outro significado histórico ou médico.

Este exemplo de SNP rs1234 apresentará o formato de relatório usado no SNPedia.

As diferenças mais óbvias baseadas no DNA são externas, como rs1805009 que afeta a cor do cabelo vermelho. A maioria dos polimorfismos tem efeitos muito menos óbvios e muitos deles podem ter consequências médicas. Estamos apenas começando a aprender quais dos 30 milhões ou mais polimorfismos possíveis influenciam a saúde, individualmente ou em grupos. É provável que muitos polimorfismos não tenham nenhum efeito ou tenham efeitos tão sutis que levarão muitos anos até que suas consequências sejam compreendidas.

Thomas Mailund explica como cientistas e estatísticos determinam quais SNPs estão relacionados a quais doenças.

Esses sites fornecem introduções úteis:

Uma descoberta mais recente são as duplicações maiores chamadas variações de número de cópia. Essas CNVs ainda não estão tão sistematizadas ou estudadas quanto os SNPs. O banco de dados dbVar é para variações estruturais.


Doença arterial coronariana e polimorfismos de nucleotídeo único da trombospondina

GeneQuest foi uma análise em grande escala de alto rendimento de polimorfismos de nucleotídeo único (SNPs) para identificar genes associados a doença arterial coronariana prematura familiar e infarto do miocárdio. Os três SNPs que mostraram as associações mais altas e significativas com a doença foram todos membros da família do gene da trombospondina, trombospondina-1, trombospondina-2 e trombospondina-4. Essas associações imprevistas estimularam esforços para compreender como os três SNPs influenciam as estruturas e funções das trombospondinas. O SNP na trombospondina-1 e na trombospondina-4 residem em suas regiões de codificação e resultam em alterações de aminoácidos únicos: na trombospondina-1, a asparagina predominante na posição 700 é alterada para uma serina, enquanto, na trombospondina-4, é uma mudança de uma alanina para uma prolina na posição 387. O SNP na trombospondina-2 é uma alteração de base na região 3 'não traduzida do mRNA. Neste estágio inicial da investigação, as análises preditivas sugerem que as substituições na trombospondina-2 e trombospondina-4 devem alterar a estrutura, e há evidências diretas para indicar que o SNP da trombospondina-1 altera a estabilidade conformacional. Além disso, diferenças profundas na função das variantes do SNP da trombospondina-4 foram identificadas com relação à sua capacidade de suportar a adesão e proliferação de células endoteliais. Embora informações adicionais substanciais sejam necessárias para entender se e como as formas polimórficas das trombospondinas afetam a doença arterial coronariana, os dados reunidos até o momento sugerem efeitos marcantes desses SNPs nas estruturas e funções das trombospondinas, que são consistentes com a indução de uma doença pró-aterogênica e fenótipo pró-trombótico.


Materiais e métodos

Conjuntos de dados. O conjunto de cSNPs associados a doenças Mendelianas foi retirado do Human Gene Mutation Database (HGMD), data de lançamento 11 de março de 2003 (11). O conjunto de cSNPs amostrados de indivíduos saudáveis ​​foi construído a partir do banco de dados dbSNP do National Center for Biotechnology Information (12), data de lançamento em 20 de maio de 2003, que fornece um mapeamento para sequências de proteínas RefSeq (13) com curadoria. Para garantir que usamos dados da mais alta qualidade, apenas cSNPs ocorrendo em sequências “revisadas” (número de acesso começando com “NP”) foram consideradas. Para construir a lista de SNPs missense associados a doenças complexas humanas (Tabela 1), pegamos todos os cSNPs humanos de refs. 1, 4 e 6. Da ref. 10, consideramos apenas associações que também foram replicadas com significância estatística.

Pontuação de Conservação Evolutiva Específica para Posição de Substituição (subPSEC). As pontuações de SubPSEC foram calculadas a partir de alinhamentos a modelos de Markov ocultos (HMMs) no banco de dados PANTHER versão 4.1 (14), usando os métodos descritos na ref. 9, que foram ligeiramente modificados da seguinte forma. As proteínas foram pontuadas contra as subfamílias PANTHER, e se a subfamília teve uma pontuação HMM melhor do que qualquer HMM da família, as probabilidades de HMM da subfamília foram usadas em seu lugar. Além disso, se uma posição foi perfeitamente conservada na subfamília, sequências de subfamílias vizinhas da árvore da família PANTHER foram adicionadas à subfamília se também conservassem o mesmo aminoácido (este procedimento permite que a conservação por tempos evolutivos mais longos seja refletida nas pontuações ) Um total de 33 dos 37 cSNPs no conjunto de doenças complexas (Tabela 1), 12.519 dos 14.792 cSNPs em HGMD e 10.586 de 15.684 em dbSNP estavam localizados em posições alinhadas a um PANTHER HMM e podiam receber pontuações.

Distribuições de modelo aleatórias (neutras). Para gerar dados simulados para cSNPs aleatórios (Fig. 1 abaixo), alinhamentos proteína-HMM foram gerados para a sequência de proteína RefSeq humana curada mais longa de cada gene LocusLink (13). Para cada sequência de proteína, a região alinhada foi convertida em sua sequência de mRNA correspondente e, em seguida, todas as substituições de um único nucleotídeo possíveis na sequência de mRNA foram feitas. Cada códon de mRNA substituído com um único nucleotídeo que resultou em uma mudança de aminoácido foi usado para calcular uma pontuação de subPSEC. Esse procedimento resultou em um total de 47.085.084 pontos (377.100 dos quais foram amostrados aleatoriamente). A distribuição das pontuações do subPSEC foi então ponderada de acordo com o a priori probabilidades de transição / transversão do SNP, estimadas a partir de dados da base de dados JSNP (15).

Distribuições cumulativas de pontuações de substituição de aminoácidos específicas da posição para diferentes conjuntos de cSNPs. As distribuições são mostradas para doença de Mendel (vermelho), variação neutra (amarelo) e variação humana “normal” (verde). A distribuição da pontuação para doenças complexas está em quadrados pretos. Deslocamentos para a esquerda do gráfico (pontuações menores) indicam substituições cada vez mais radicais.

As distribuições de pontuação do modelo aleatório (neutro) para genes associados a doenças de Mendel e para genes associados a doenças complexas (Fig. 2 abaixo) foram calculadas de forma semelhante aos dados de variação aleatória acima. No entanto, para servir como um controle adequado para a Fig. 1, as distribuições precisam refletir o fato de que diferentes genes têm diferentes números de cSNPs associados a doenças. Portanto, criamos distribuições aleatórias para cada gene separadamente (ponderação de acordo com as probabilidades de transição / transversão como acima). A distribuição aleatória geral para o conjunto (Mendeliana ou associada a doenças complexas) é simplesmente a soma das distribuições aleatórias para cada gene no conjunto, ponderada pelo número de cSNPs naquele gene. Por exemplo, a distribuição aleatória para CARD15 deve ser contado duas vezes na distribuição aleatória geral para doenças complexas porque há dois cSNPs neste gene que estão associados a doenças complexas (Tabela 1).

Distribuições cumulativas aleatórias (neutras) de pontuações de subPSEC sobre os genes associados a doenças Mendelianas vs. doenças complexas são quase idênticas. Este é um controle para a comparação mostrada na Fig. 1, demonstrando que não há viés nesses conjuntos de genes em relação às pontuações de subPSEC e que as diferenças entre esses conjuntos na Fig. 1 são devidas à conservação específica da posição.

Razões Ka / Ks. As razões Ka / Ks entre humanos e camundongos foram obtidas no Build 36 do banco de dados HomoloGene, data de lançamento em 23 de julho de 2004 (16). Para genes HGMD, realizamos uma pesquisa blastp para encontrar as proteínas correspondentes no banco de dados de proteínas RefSeq humana (entradas revisadas apenas, número de acesso começando com “NP”). Definimos uma porcentagem de corte de identidade de 95% e exigimos que o comprimento do alinhamento fosse de pelo menos 95% da consulta e da sequência de acertos. Se houvesse várias sequências de acertos que atendessem aos critérios, o acerto superior com uma proporção Ka / Ks foi escolhido. Para todos os conjuntos, as razões HomoloGene Ka / Ks foram usadas apenas se as sequências humanas e de camundongo foram revisadas como entradas RefSeq. A fração dos diferentes conjuntos de genes que atenderam a esses critérios foram 10.536 / 21.494 para RefSeq (todos os genes), 4.139 / 6.902 RefSeqs com pelo menos um cSNP em dbSNP (codificação de genes polimórficos), 730/950 para HGMD (Mendelian), 26 / 32 para genes de doenças complexas (Tabela 1) e 10/12 para genes de doenças complexas conservadoras (Tabela 1, asteriscos).


Materiais e métodos

Coleta de dados nsSNP e dados do site PTM

Coletamos um total de 517.466 nsSNPs humanos do banco de dados NCBI dbSNP Build 135 [15]. De 517.466 nsSNPs, 509.183 SNPs eram SNPs missense e 14.878 SNPs eram SNPs stop-gain (nonsense). Ligamos a localização de nsSNPs em sequências de proteínas de Ref-Seq Build 37.3. O peptídeo flanqueador de locais nsSNP de -7 a +7 recuperado usando a tabela SNP-MapLinkProtein em dbSNP e definido como a sequência SNP.

Dados de sites PTM humanos foram recuperados de dbPTM3 [16], que inclui 194.886 PTMs verificados experimentalmente de artigos de pesquisa baseados em análises de MS / MS e 10 recursos externos relacionados a PTM. O dbPTM também fornece 404.501 PTMs previstos computacionalmente pelo método KinasePhos-like com base em modelos de Markov ocultos (HMMs). Inclui 20 tipos de sites PTM previstos com o limite de especificidade de 100% para minimizar falsos positivos. Os peptídeos de sítios PTM flanqueadores de -7 a +7, chamados de sequência de sítio PTM, foram recuperados combinando o sítio PTM com a sequência de proteína de UniProt [17].

Detecção de PTM-SNP

PTM-SNPs foram detectados alinhando a sequência SNP com a sequência do local PTM porque nem todas as sequências em UniProt e RefSeq são perfeitamente idênticas (idênticas de ponta a ponta). Cada resíduo na sequência SNP é combinado com a sequência do local PTM deslizando um por um (Figura 1). O PTM-SNP é definido como a posição do nsSNP da sequência SNP mais bem alinhada com a sequência do local PTM. Como a Figura 1 ilustra, uma sequência SNP de nsSNP, rs1803573, está bem alinhada com o resíduo +3 da sequência do local PTM. Em alguns casos, vários acessos com diversos locais foram detectados devido a repetições de sequência. A European Molecular Biology Open Software Suite (EMBOSS) [18] Needle, uma ferramenta global de alinhamento de sequências em pares, foi aplicada para lidar com esses casos excepcionais.

Detecção de um PTM-SNP por alinhamento de uma sequência de local PTM e uma sequência de local SNP. Comece com -7 a 7 resíduos de sequências de locais PTM, cada resíduo é combinado com o local nsSNP da sequência SNP deslizando um a um. A partir da posição mais alinhada da sequência SNP, a localização do PTM-SNP é identificada como a localização da sequência do site PTM que está alinhada com o nsSNP.

Também extraímos e integramos PTM-SNPs do recurso público, PhosSNP 1.0. PhosSNP inclui nsSNP associado à fosforilação a partir de sequências de mRNA que traduzem computacionalmente. No entanto, cerca de 18% dos SNPs no PhosSNP ainda não foram definidos como nsSNP pelo dbSNP Build 135, portanto, foram removidos no processo de integração.

PTM-SNPs associados a doenças

A partir de GWASs usando matrizes SNP e técnicas NGS, um grande número de SNPs associados a doenças estatisticamente significativo foi identificado recentemente. O catálogo GWAS do Instituto Nacional de Pesquisa do Genoma Humano (NHGRI) recebeu 8.771 SNPs associados a características com valores p & lt 1,0 × 10 -5 (02 de abril de 2013) [19]. O banco de dados de associação genética (GAD) [20] contém 29.578 SNPs associados a doenças e 23.671 SNPs associados a doenças também estão disponíveis em Genotypes and Phenotypes (dbGaP) [21]. Para encontrar uma correlação entre PTM-SNPs e doenças, coletamos um total de 52.731 SNPs associados a doenças distintas do catálogo NHGRI GWAS, GAD e dbGaP depois de combinar esses SNPs com nossos PTM-SNPs.

Além disso, analisamos SNPs associados ao diabetes tipo 2 (T2D) que foram identificados em nosso estudo anterior [22] usando conjuntos de dados do Wellcome Trust Case Control Consortium (WTCCC) [23]. SNPs associados a T2D com valores p & lt 1,0 × 10 -5 foram identificados a partir de SNPs de qualidade controlada (QC) 409.656, com base nas estatísticas de teste de tendência Cochran-Armitage usando PLINK 1.07 [24]. O QC é aplicado como uma taxa de genótipo ausente de amostra de & gt 3%, uma taxa de genótipo ausente SNP de & gt 1%, valor de p de Hardy-Weinberg Equilibrium (HWE) ≤ 10 -4 e frequência de alelo menor (MAF) & lt 1%. A poda de desequilíbrio de ligação foi deixada de lado para preservar os candidatos PTM-SNP. T2D PTM-SNPs foram detectados mapeando SNPs e PTM-SNPs associados a T2D. Significativamente associados T2D PTM-SNPs foram estudados para interpretar os mecanismos da doença com vários recursos de informação biológica. Genes de doenças conhecidas são coletados principalmente de OMIM [25], GAD e KEGG [26]. Os alvos de drogas são coletados do DrugBank [27], PharmGKB Drug [28] e KEGG Drug.


Polimorfismos de nucleotídeo único e osteoartrite: uma visão geral e uma meta-análise

A osteoartrite (OA) é uma doença complexa caracterizada por cartilagem articular degenerativa e é amplamente atribuída a fatores de risco genéticos. Polimorfismos de nucleotídeo único (SNPs) são variantes comuns de DNA que se mostraram promissoras e eficientes, em comparação com a clonagem posicional, para mapear genes candidatos de doenças complexas, incluindo OA. Neste estudo, pretendemos fornecer uma visão geral de vários SNPs de uma série de genes que foram recentemente associados à suscetibilidade OA. Também realizamos uma meta-análise abrangente para avaliar a associação do SNP rs7639618 do gene dos domínios do fator A de von Willebrand duplo (DVWA) com a suscetibilidade OA. Uma busca sistemática de estudos sobre a associação de SNPs com suscetibilidade a OA foi realizada no PubMed e no Google scholar. Os estudos submetidos à meta-análise incluem estudos humanos e de caso-controle que atenderam ao modelo de equilíbrio de Hardy-Weinberg e fornecem dados suficientes para calcular uma razão de chances (OR). Um total de 9.500 casos de OA e 9.365 controles em 7 estudos de caso-controle relacionados ao SNP rs7639618 foram incluídos neste estudo e os ORs com intervalos de confiança de 95% (ICs) foram calculados. Foi demonstrado que mais de 50 SNPs de diferentes genes estão associados com OA de quadril (23), joelho (20) ou ambos (13). Os ORs desses SNPs para OA e os subtipos não são consistentes. Em relação ao SNP rs7639618 de DVWA, foi observado risco aumentado de OA de joelho em todos os modelos genéticos analisados. Especificamente, pessoas asiáticas com alelo G apresentaram risco significativamente aumentado de OA do joelho (A versus G: OR = 1,28, IC 95% 1,13-1,46 AA versus GG: OR = 1,60, IC 95% 1,25-2,05 GA versus GG: OR = 1,31, IC 95% 1,18-1,44 AA versus GA + GG: OR = 1,34, IC 95% 1,12-1,61 AA + GA versus GG: OR = 1,40, IC 95% 1,19-1,64), mas não em caucasianos ou com quadril OA. Nossos resultados sugerem que vários SNPs desempenham papéis diferentes na patogênese da OA e seus subtipos SNP rs7639618 do gene DVWA está associado a um risco significativamente aumentado de OA do joelho em asiáticos. Dado o tamanho limitado da amostra, mais estudos são necessários para avaliar essa observação.

Declaração de conflito de interesse

Os autores não têm conflitos de interesse a divulgar.

Figuras

Vários polimorfismos estão associados a ...

Polimorfismos múltiplos estão associados ao risco de OA. São ilustrados 56 SNPs ...

As razões ímpares (OR) dos SNPs associados aos subtipos OA ou OA.…

Fluxograma de seleção de estudo. ...

Fluxograma da seleção do estudo. Os estudos selecionados para a meta-análise atual são ilustrados.…

Parcela florestal de comparação de alelos ...

Gráfico de floresta da comparação de alelos de DVWA rs7639618 para comparação geral (A versus ...

Meta-análise da associação rs7639618 ...

Meta-análise da associação rs7639618 e OA de joelho. A, Gráfico de floresta de homozigoto ...

Meta-análise da associação rs7639618 ...

Meta-análise da associação rs7639618 e OA de joelho. A, Forest plot de recessivo…

Parcela florestal de comparação de alelos ...

Gráfico de floresta da comparação de alelos de DVWA rs7639618 para comparação geral (A versus ...

O resultado da sensibilidade e ...

O resultado da análise de sensibilidade e gráfico de funil. A, a análise de sensibilidade mostrou que não ...


Seleção assistida por marcador no melhoramento de plantas

Polimorfismo de nucleotídeo único

O polimorfismo de nucleotídeo único (SNP) é uma mutação pontual (uma mudança em um nucleotídeo) para a qual uma curta sequência de flanqueamento é conhecida. O sistema é usado em humanos, criação de animais e, em menor medida, em plantas.

Tecnologia de genotipagem: Existem várias tecnologias para genotipar SNP, incluindo o uso de sequenciadores de DNA, espectrometria de massa e muito mais. As tecnologias modernas são automatizadas, exigindo maquinários caros, mas também são oferecidas por empresas comerciais como um serviço (consulte a seção Tecnologias modernas de genotipagem).

Genotipagem: Cada alelo é definido pelo nucleotídeo real na sequência.

Fonte de polimorfismo: SNPs são gerados por mutações pontuais, ou seja, qualquer alteração de um único nucleotídeo em qualquer lugar do genoma. As alterações podem ser a substituição de um nucleotídeo por outro e / ou deleção ou adição (Indels) de um único nucleotídeo.

Características: SNPs são marcadores de locus único e, principalmente, têm dois alelos em cada locus (baixo nível de polimorfismo).