Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
Capítulo 3
Epidemiologia Molecular da Infecção HIV-1 em STP
Epidemiologia Molecular do HIV-1 em STP
Capítulo 3 – Epidemiologia Molecular da Infecção HIV-1 em STP
3.1. Objectivos
3.1.1. Objectivos GeraisAnálise das variantes de HIV-1 presentes e da relação filogenética entre as
variantes virais identificadas em São Tomé e Príncipe (STP) e em alguns países
limítrofes da Costa Ocidental Africana.
3.1.2. Objectivos Específicos
1. Identificar as sequências parciais do gene pol de HIV-1: toda a região
codificadora da protease (1 a 99) e parte da transcriptase reversa (1 a 335)
por sequenciação directa de um grupo de amostras de plasma de pessoas
portadoras de HIV-1;
2. Determinar as prevalências dos subtipos, formas circulantes recombinantes
(CRFs, Circulant Recombinant Forms) ou únicas (URFs, Unique
Recombinant Forms) de HIV-1 presentes em São Tomé e Príncipe;
3. Analisar as relações filogenéticas entre as sequências dos vírus subtipados e
as dos países limítrofes com ligação a São Tomé e Príncipe: Angola,
Camarões, Gabão, Guiné Equatorial e Nigéria.
100
Epidemiologia Molecular do HIV-1 em STP
3.2. IntroduçãoLocalizado na Costa Ocidental Africana, região considerada epicentro da
epidemia da infecção a HIV, no arquipélago São Tomé e Príncipe coexistem não só os
dois tipos de vírus (HIV-1 e HIV-2), com predominância para o HIV-1, grupo M,
(Robertson et al, 2000), mas também infecções duplas, com os dois vírus no mesmo
hospedeiro (Van der Sande et al, 2004). Este facto tem vindo a interferir no
diagnóstico laboratorial, nomeadamente nos testes de detecção dos anticorpos
específicos, e nos de amplificação do RNA viral.
A epidemiologia molecular do HIV-1 permite estudar os factores genéticos
virais que influenciam a infecção e sua propagação, acedendo as informações
moleculares acumuladas nos genomas dos microrganismos, que são utilizadas na
reconstrução e previsão do trajecto da infecção (Hue et al, 2005). Esta ferramenta
molecular permite estudar tanto a origem dos HIVs em diversos grupos populacionais,
como monitorizar a introdução de novas variantes num determinado país ou região.
Constitui um potencial marcador para determinar o trajecto da epidemia de HIV-1,
através de estudos das variantes genotípicas, definidas principalmente em função da
variação das sequências no gene env que codifica a glicoproteína gp120 do invólucro da
partícula viral (Robertson, et al, 2000).
3.2.1. TécnicasExistem inúmeras técnicas para subtipar e comparar os vírus a nível molecular.
A sequenciação do genoma viral completo revelou-se a mais adequada, eficaz e
definitiva para determinar o genótipo de uma nova variante viral, mas tem os
inconvenientes de ser onerosa, laboriosa, requerendo pessoal altamente qualificado e
não aplicável a estudos alargados. Contudo, dado que o genoma viral é susceptível de
ocorrência de recombinação, para minimizar esta insuficiência são utilizados com
frequência os métodos de subtipagem baseados em análise filogenética do genoma
viral, também caracterizado por custos elevados. Entretanto, métodos menos onerosos,
alternativos à subtipagem do genoma completo do HIV-1, são baseados na
sequenciação directa de pequenos fragmentos do genoma viral associada à análise
filogenética (Shafer, 2002; Eshleman et al, 2004).
101
Epidemiologia Molecular do HIV-1 em STP
Embora relativamente menos oneroso do que os primeiros métodos acima
mencionados, o método de sequenciação directa de pequenos fragmentos do genoma
viral associado à análise filogenética também requer capacidade técnica qualificada e
não está ao alcance dos países de baixos recursos financeiros (Shafer, 2002).
Considerado um método alternativo de análise do genoma viral, tem sido amplamente
utilizado dado que apresenta elevada eficácia e capacidade na determinação dos
subtipos do HIV-1 (Peeters et al, 2003).
Com efeito, o desenvolvimento de técnicas de PCR tem facilitado a execução
de genotipagem dos genes dos HIVs, nomeadamente através dos sistemas comerciais
de genotipagem como, por exemplo, “ViroSeqTM HIV-1 Genotyping System, version
2.0” (Abbott Laboratories, Abbott Park, Illinois, USA), que têm mostrado eficiência e
reprodutibilidade mesmo em subtipos não B, embora optimizados para os vírus do
subtipo B (Grant et al, 2003; Jagodzinski et al, 2003).
O gene pol representa uma região muito conservada do HIV-1, e codifica para
as enzimas protease (PR), transcriptase reversa (TR) e integrase (IN), sendo que a sua
amplificação por PCR (polymerase chain reaction) e sequenciação do DNA proviral
pelo kit comercial atrás referido, permite aceder à informação contida na PR e parte da
RT, o que permite não só a subtipagem mas também a identificação de mutações
associadas a resistência aos fármacos antirretrovirais (Shafer, 2002).
Neste caso, a determinação dos genótipos de HIV-1 num grupo de amostras de
plasma dos portadores da infecção por HIV-1 é realizada através da amplificação de
parte do gene pol por RT-PCR (transcrição reversa seguida de PCR), seguindo-se a
sequenciação directa de pequenos fragmentos do genoma viral. As sequências parciais
do gene pol do HIV-1 englobam as regiões codificadoras da protease (1 a 99) e de
parte da transcriptase reversa (1 a 335) (Shafer, 2002).
Assim, visando caracterizar a prevalência das variantes virais circulantes em
São Tomé e Príncipe, bem como analisar a relação filogenética entre estas e as de
alguns países limítrofes da Costa Ocidental Africana, para avaliação do perfil
epidemiológico da infecção por HIV-1, recorreu-se ao estudo de gene pol, utilizando o
kit comercial “ViroSeq HIV-1 Genotyping System, version 2.0” (Abbott Laboratories,
Abbott Park, Illinois, USA).
O processo decorre por etapas, iniciando-se com a extracção do RNA do HIV-
1 a partir de uma amostra de plasma. Posteriormente, através da reacção RT-PCR
(transcrição reversa seguida de PCR), o RNA viral é convertido em DNA
102
Epidemiologia Molecular do HIV-1 em STP
complementar (cDNA), reacção que é catalisada pela acção da enzima transcriptase
reversa (RT). O cDNA viral obtido liga-se a uma sonda de ácido nucleíco específica
para uma determinada sequência genómica do HIV (Iweala, 2004). A cadeia híbrida
RNA-cDNA engloba parte da polimerase do HIV-1 (pol) que representa a região mais
conservada do genoma, na ORF (Open Reading Frame) na qual se localizam os genes
da protease e o da transcriptase reversa. O cDNA é amplificado por PCR em dsDNA
(DNA de cadeia dupla) seguido de sequenciação directa do DNA proviral (Eshleman
et al, 2004).
Os subtipos são obtidos através de análise das sequências nucleotídicas por
submissão destas sequências aos algorítmos bioinformáticos de subtipagem,
disponíveis na Internet, tais como HIVSeq, REGA Subtyping Tool, NCBI e jpHMM-
HIV-1 (Rhee et al, 2003, de Oliveira et al, 2005; Rozanov et al, 2004; Zhang et al,
2006). Para a comparação das sequências obtidas a partir de infectados de STP e de
outras obtidas a partir de doentes de países limítrofes disponíveis na base de dados de
Los Alamos, procedeu-se ao seu alinhamento utilizando-se o software Clustal W
(Thompson et al, 1994); para a edição das sequências foi usado o software BioEdit
(Hall, 1999) e MEGA 3.2 para a construção das árvores filogenéticas (Kumar et al,
2004).
Os vários subtipos do HIV-1 poderão influenciar a sua transmissibilidade e
imunogenecidade e este processo pode revestir-se de grande significado e impacto
biológico e epidemiológico (Robertson, et al, 2000). Contudo, até a data, não foi
demonstrado convenientemente a correlação directa da vasta diversidade viral
existente e estes processos biológicos.
Alguns estudos sugerem diferenças na transmissibilidade vertical mãe filho entre vários subtipos de HIV-1 grupo M. Assim, num estudo efectuado no Quénia, o subtipo D seria mais facilmente transmissível por esta via, enquanto o subtipo A o seria menos (Yang et al, 2003). Igualmente, um outro estudo, efectuado no Senegal, sugere que a velocidade de progressão para a SIDA seria mais elevada nos subtipos C, D e G do que no subtipo A (Kanki et al, 1999).
103
Epidemiologia Molecular do HIV-1 em STP
3.2.2. Epidemiologia molecular do HIV-1 em São Tomé e
PríncipeApós a detecção do primeiro caso de HIV no país não foram realizados estudos
de epidemiologia molecular, desconhecendo-se quer a origem dos vírus circulantes,
quer o momento exacto da sua introdução. O primeiro estudo de epidemiologia
molecular de HIV-1 envolvendo amostras de São Tomé e Príncipe foi realizado entre
2004 e 2007 (Bonfim et al, 2007).
Localizado perto do epicentro da epidemia da infecção por HIV-1 na costa
ocidental Africana, em São Tomé e Príncipe coexistem ambos os vírus, com
predominância para o HIV-1, do grupo M (Robertson et al, 2000). Comum aos países
de África Central e Ocidental a vasta diversidade genética do HIV-1 foi reportada por
vários investigadores que utilizam amostras destes países Africanos (Laurent et al,
2001; Peeters et al, 2003).
Não existem estudos sobre a introdução dos HIVs no arquipélago de São Tomé
e Príncipe, mas especula-se que terá sido no período pós independência, quando da
entrada dos militares de vários países com os quais o STP mantém intercâmbios. A
partir de então, assistiu-se à intensificação das relações entre as populações do
arquipélago e as de alguns países limítrofes da costa ocidental Africana, tais como
Angola, Camarões, Gabão, Guiné Equatorial e Nigéria (vide localização geográfica de
STP – Figura 1.20). Neste período foram observados movimentos populacionais dos
são-tomenses de e para os países supracitados. Também correspondeu a um aumento
considerável das ISTs (infecções sexualmente transmissíveis) como por exemplo, o
encontrado no inquérito populacional às grávidas (PNLS, 2003).
Presentemente verificam-se movimentos migratórios no sentido inverso: o
regresso a São Tomé e Príncipe dos emigrantes são-tomenses residentes nos países da
Costa Ocidental Africana, nomeadamente do Gabão, alguns dos quais em estado
terminal de SIDA (fonte de informação: Centro Hospitalar de São Tomé). O retorno
prende-se, possivelmente, com o acesso ao programa de tratamento com os
antirretrovirais (TARV), implementado no arquipélago, sob a tutela do Programa de
Luta contra a SIDA (PNLS).
A análise filogenética das sequências virais de doentes de São Tomé e Príncipe
e a sua comparação com sequências de doentes dos países atrás referidos pode
104
Epidemiologia Molecular do HIV-1 em STP
fornecer dados complementares aos da epidemiologia, ajudando a uma melhor
compreensão da história da infecção HIV-1 em STP.
Os países da costa ocidental Africana exibem tanto características
demográficas como políticas semelhantes, com fraco empenho na implementação de
estudos epidemiológicos dos HIVs. Assim sendo, as prevalências de subtipos dos
HIVs relativamente a estes países, constantes na base de dados de Los Alamos, são
baseados em amostras de conveniência, podendo sofrer de grave viés. Porém, apesar
destas limitações, a grande variabilidade do HIV-1 identificada nestes países da costa
ocidental Africana é uma realidade inegável (McCutchan et al, 1999; Ortiz et al, 2001;
Laurent et al, 2002; Pandreia et al, 2002; Abecasis et al, 2005; Bártolo et al, 2005;
Njai et al, 2006; Garrido et al, 2008).
105
Epidemiologia Molecular do HIV-1 em STP
3.3. Material e MétodosO estudo consistiu de 3 etapas de colheita de amostras de sangue (plasma) nas
instituições de saúde de São Tomé e Príncipe, e realização de um inquérito
epidemiológico nas populações dos dois distritos do arquipélago anteriormente
descritos no capítulo 2. Em cada etapa do estudo foram obtidos pareceres favoráveis
do Ministério da Saúde de São Tomé e Príncipe, através do Comité de Ética (estrutura
equiparada) desta instituição governamental.
3.3.1. Tipo de estudoAtendendo à baixa prevalência da infecção HIV-1 registada em São Tomé e
Príncipe em 2001 (1%), a execução deste estudo de epidemiologia molecular só foi
possível com a utilização de amostras consideradas de conveniência. A baixa
frequência de casos de infecção por HIVs registada nas instituições de saúde
justificaram as 3 estadias no país para recolha de amostras, em número suficiente para
a implementação do presente estudo. O rastreio das amostras de plasma dos infectados
com HIV-1, incluídos no presente estudo, obedeceu a critérios de anonimato, pelo que
as amostras foram recodificadas.
Primou-se pela utilização de amostras de plasma sanguíneo em vez de soro ou
células dos infectados com HIV-1. Não só porque a estabilidade destas amostras à
temperatura ambiente é superior a 6 horas, mas também porque os vírus existentes no
plasma sanguíneo são fruto de actividade replicativa recente, e como tal mais
facilmente representando populações virais seleccionadas mais recentemente, por
exemplo por terapia com os antirretrovirais.
3.3.2. População e AmostrasO estudo envolveu amostras de plasma dos seropositivos para o HIV-1,
colhidas entre Abril de 2004 e Janeiro de 2007. A amostra englobou plasma dos
utentes das instituições de saúde de São Tomé (República Democrática de São Tomé e
Príncipe): Centro Hospitalar de São Tomé (CHST), integrando as enfermarias, o
serviço do Banco de Sangue e a Consulta Externa; Centro Policlínico de Água Grande
(CPAG); Posto Clínico de Mé Zóchi (PCMZ); Projecto ARV sob a tutela do Programa
Nacional de Luta contra a SIDA (através de um grupo de amostras dos doentes
submetidos a tratamentos com antirretrovirais – ARVs); Inquérito Epidemiológico
106
Epidemiologia Molecular do HIV-1 em STP
Nacional sobre HIV e Hepatites, realizado em 2001 (cujas amostras se encontravam
em stock) e inquérito epidemiológico de 2007 (abordado no Capítulo 2). O critério de
anonimato foi preservado. Saliente-se que a baixa prevalência registada em São Tomé
e Príncipe constituiu um sério desafio, dificultando a obtenção de um número de
amostras suficientes que permitissem conclusões estatisticamente significativas.
Apesar das dificuldades, foi possível obter-se, e foram utilizadas, 93 amostras.
3.3.3. Definição das Variáveis de EstudoForam definidas algumas variáveis epidemiológicas operacionais para o
estudo, tais como “idade”, “sexo”, “data de colheita” e “código do utente”.
Consistiram variáveis facultativas “residência” e “viagem”, dada a natureza
oportunista das amostras colhidas.
3.3.4. Colheita e Processamento de AmostrasA metodologia de colheita e processamento das amostras foram as
anteriormente descritas no Capítulo 2 (2.3). O rastreio populacional decorreu na ilha
de São Tomé. Foi utilizado o teste rápido de rastreio “DetermineÔ HIV ½” (Abbott
Diagnostics, Il. USA) para todas as amostras pesquisadas, e em caso de ambiguidades
foi aplicado um segundo teste de rastreio, baseado em imunoensaio de fluorescência
“VIDAS® HIV DUO” (Bio-Mérieurx SA) executado no Laboratório de Virologia do
Hospital Egas Moniz, onde se realizou o estudo molecular das amostras.
3.3.5. GenotipagemCom o recurso ao sistema comercial “ViroSeqTM HIV-1 Genotyping System”,
version 2.0 (Abbott Laboratories, Abbott Park, Illinois, USA) foi realizada a
genotipagem do HIV-1. Este sistema foi inicialmente produzido pela Celera
Diagnostic, CA, US, e optimizado para o subtipo B. Apesar disso, o sistema provou
ser eficaz também na genotipagem de outros subtipos que não o subtipo B (Heshleman
et al, 2004). O sistema proporciona eficiência e relativa rapidez na realização da
análise, e integra reagentes para a purificação dos ácidos nucleícos e sua sequenciação.
Os resultados foram obtidos através da utilização de um sequenciador ABI PRISMTM
3100 Genetic Analyzer e analisados pelo software “ViroSeq HIV-1 Genotyping
System”, version 2.0, que permite o alinhamento dos 7 segmentos utilizados neste
107
Epidemiologia Molecular do HIV-1 em STP
teste (Figura 3.1), numa única sequência de consenso, englobando as regiões
codificadoras do gene protease dos codões 1 a 99, e da transcriptase reversa de 1 a 335
(Heshleman et al, 2004).
3.3.5.1. Extracção do RNA viral A extracção do RNA viral foi realizada partindo de 500 a 1000 µl de amostra
de plasma, utilizando-se o kit “ViroSeq™ HIV-1 Genotyping” version 2.0 (Abbott
Laboratories, Abbott Park, Illinois, USA). O primeiro passo consiste na
ultracentrifugação das amostras de plasma a 23.500 g (centrífuga - MR 23i Jouan),
durante 60 minutos, a 4ºC, para precipitar os viriões nos pellets do RNA viral
(precipitação das partículas virais). Após aspiração do sobrenadante, são adicionados
600 µl da solução de lise. Ao RNA do lisado são adicionados 600 µl de isopropanol
para sua recuperação e limpeza das impurezas nele contidas. De seguida, são
adicionados 1000 µl de etanol frio a 70% para precipitar o RNA viral (fase
considerada crítica, dado que o etanol pode precipitar as proteínas). Os excessos do
etanol são removidos e RNA libertado é diluído, segundo as cargas virais de cada
amostra. Às amostras com uma carga viral desconhecida, ou entre 2000 e 15.000
cópias/ml, adicionaram-se 50 µl do tampão de diluente. São adicionados 100 µl às que
possuíam valores iguais ou superiores a 30.000 cópias/ml. O RNA viral extraído é
conservado a -70º C em tampão de diluição.
3.3.5.2. Amplificação do gene pol de HIV-1Após a extracção, o RNA viral é convertido em cadeia híbrida RNA-cDNA
(DNA complementar) por transcrição reversa, catalisada pela acção da enzima
transcriptase reversa (RT). O cDNA é amplificado: parte do gene pol, correspondente
à região completa da protease e cerca de dois terços da transcriptase reversa. A
abertura é na ORF (Open Reading Frame) deste gene, seguindo-se aproximadamente
1,8 kilobases (kb). Uma vez obtido o cDNA viral (DNA complementar), este liga-se a
uma sonda de ácido nucleíco específica para uma determinada sequência genética do
HIV, que por sua vez interage com o seu substrato específico e cromogénico, dando
origem a um produto cuja intensidade quantifica indirectamente o RNA viral presente
na amostra (Iweala, 2004). O amplicon resultante é usado como sequência modelo
para gerar aproximadamente 1,3 kb de dados sequenciais, representando as sequências
108
Epidemiologia Molecular do HIV-1 em STP
completas e que correspondem às seguintes posições genómicas dentro dos
nucleótidos das estirpes de referência HXB2: 2253 a 2549 para a protease e 2550 a
3554 para transcriptase reversa (Eshleman et al, 2004).
As sequências obtidas são submetidas aos algoritmos de subtipagem
disponíveis na base de dados, nos sítios da Internet, que fornecem relatórios
interpretativos com as informações, tanto sobre as variantes virais, como sobre as
mutações associadas a resistências referentes aos inibidores da protease e transcriptase
reversa do HIV-1.
3.3.5.3. RT-PCR (reacção de transcrição reversa seguida por PCR)Inicia-se com a preparação da “Master Mix RT” usando os componentes e as
respectivas proporções, considerando o volume residual para 2 amostras extras:
mistura RT (240µl), inibidor de RNAase (30µl), MuLV RT (Moloney murine
leukemia vírus) RT - 30µl e de DTT (ditiotreitol), perfazendo um volume total de 312
µl (Anexo III - Quadro 3.1). Em seguida, a “Master Mix RT” é homogeneizada por
breve agitação durante 3-5 segundos (é usada centrífuga de rotor de placa), mantendo-
se à temperatura ambiente (não ultrapassando os 30 minutos). São distribuídos 10µl de
cada amostra do RNA viral extraído, num tubo MicroAmp 0,2 ml, que é pré-aquecido
para desnaturação da estrutura secundária a 65º C durante 30 segundos no
termociclador “Perkin-Elmer 9600, USA”, seguindo-se arrefecimento a 42º C durante
5 minutos, estabelecendo a temperatura de actividade enzimática óptima. Depois disso,
o termociclador é pausado, as amostras de RNA são retiradas, adicionando-se 10µl da
“Master Mix RT” a cada tubo. Os tubos são agitados durante 3-5 segundos para
homogeneizar do seu conteúdo, e são novamente colocados no termociclador,
prosseguindo a segunda etapa da reacção RT, a 42º C por 60 minutos (transcrição
reversa), a 99º C por 5 minutos para a inactivação da enzima MuLV RT, fase em que
são produzidas as cadeias duplas do RNA-cDNA híbridos representando o gene pol do
HIV-1. Todas as amostras são mantidas a 4º C, pelo menos durante 10 minutos. No
final, as amostras de cDNA produzidas são armazenadas a -20º C até a realização do
PCR (não excedendo as 2 semanas).
109
Epidemiologia Molecular do HIV-1 em STP
3.3.5.4. PCR (amplificação do cDNA)Após o descongelamento dos reagentes é preparada a “Master mix PCR”, cujo
volume total é de 930µl: PCR mix - 885 µl, “AmpliTaq Gold DNA polymerase”
(Applied Biosystems, Foster City, Calif.) - 15 µl e “AmpErase UNG” (dUTP/uracil-N-
glicosilase) - 30µl (Anexo III – Quadro 3.2). A mistura de PCR é preparada, de acordo
com as proporções para as 28 amostras mais 2 relativas ao volume residual. “Master
mix PCR” é suavemente agitada durante 3-5 segundos por 5-10 segundos. A cada tubo
de reacção do passo RT são adicionados 30 µl da “Master mix PCR”, este é agitado, e
colocado no termociclador. O primeiro ciclo da reacção de PCR (ciclo 1) é destinado a
activação de “AmpErase UNG” (dUTP/uracil-N-glicosilase) e decorre a 50º C por 10
minutos (para minimizar o risco de contaminação cruzada com produtos de
amplificações anteriores) e o segundo ciclo (ciclo 2) para activação da enzima
“AmpliTaq Gold DNA polymerase” a 93º C durante 12 minutos. A desnaturação do
DNA dá-se aos 40 ciclos, a 93º C por 20 segundos, hibridação (annealing) dos primers
aos 64º C durante 45 segundos e a extensão destes aos 66º C por 3 minutos. Através do
último ciclo (1 ciclo) a 72º C em 10 minutos dá-se a extensão final dos primers. As
amostras são mantidas a 4º C, não mais de 24 horas, evitando a actividade residual do
UNG, que pode destruir o DNA amplificado (Anexo III – Quadro 3.3) (Cunningham
et al, 2001; Eshleman et al, 2004). No final, o DNA obtido é conservado a -15/-20º C
para posterior quantificação, por electroforese em gel de agarose.
3.3.5.4.1. Quantificação do DNA por ElectroforeseA determinação semi-quantitativa da concentração dos produtos de DNA
amplificados e purificados é feita em gel de 1% “SeaKem Gold” agarose (Reliant Gel
System, Cambrex, USA), frente a um marcador estandardizado. O gel de agarose é
preparado em 100 ml de TBE 1 (1x), (Tampão Tris Borato EDTA), com 1 grama de
agarose dissolvido, e incorporando 1 µl de brometo de etídio (BrEt). É utilizado um
marcador com as concentrações conhecidas das dimensões dos fragmentos de DNA,
permitindo comparação com o brilho das bandas das amostras de DNA em estudo, de
forma a se estimar o factor de diluição a ser utilizado na sequenciação. Às amostras de
DNA são adicionadas 5 µl de loading buffer (tampão), e 5 µl de azul de bromofenol.
Em seguida, são inoculados 10 µl da mistura, por poço, colocando-se em paralelo duas
concentrações relativas ao marcador de peso molecular 100 bp (DNA Mass Ladder): 3
110
Epidemiologia Molecular do HIV-1 em STP
µl e 6 µl. Após a aplicação das amostras e do marcador no gel, este é submetido a uma
corrente constante de 10 V/cm e 51 amperes. A electroforese decorre durante 60
minutos, tempo suficiente para a migração do azul de bromofenol no gel em 5 cm.
Depois da corrida, o gel é visualizado com o recurso a luz UV de um transiluminador.
As bandas são comparadas consoante o peso molecular do marcador e determinada a
diluição correspondente para cada amostra de DNA, que deve conter, no mínimo, a
massa de DNA equivalente a 20 ng (nanogramas) (Figura 3.1).
Figura 3.1. Peso Molecular dos DNAs por Migração em Gel de Agarose Os 3 níveis de nitidez das amostras de DNA, correspondentes às diluições 1:10, 1:4 e 1:2.
3.3.5.4.2. Purificação do DNA em Membrana “Microcon Spin
Column”Inicialmente, procede-se a filtração do dsDNA, utilizando-se as colunas
“Microcon Spin Column”. Em cada microtubo de 1,5 ml é adaptada uma coluna
“Microcon” ou “Microconcentrator” que é composta por uma membrana interna
localizada no interior das duas extremidades; translúcida e azul. A extremidade
translúcida do “Microconcentrator” é encaixada no microtubo (sem tocar na
extremidade), adicionando-se 300µl de água isenta de RNase a cada
“Microconcentrator” no topo da extremidade azul. Procedendo-se do mesmo modo,
juntam-se 50µl da amostra de DNA viral em estudo. A medida que se vai juntando a
amostra de DNA viral, esta é filtrada e as cápsulas dos microtubos são fechadas. Os
filtrados são levemente agitados e postos a centrifugar a 2700g, durante 15 minutos.
Após a primeira centrifugação, os filtros são removidos, adicionando-se 35 µl de água
sem RNase aos filtrados. Inverte-se a posição do “Microconcentrator”, adaptando a
parte azul aos novos microtubos com os filtrados de DNA que são agitados e levados a
centrifugar a 2700 g, durante 5 minutos e transferidas para novos microtubos
previamente rotulados. Procedem-se as respectivas diluições das amostras de DNA, de
111
Epidemiologia Molecular do HIV-1 em STP
acordo com o peso molecular. Assim, as amostras cuja massa de DNA ≥ 100 ng
correspondem à diluição 1:10 (315 µl de H2O sem RNase), entre 60-100 ng à 1:4 (105
µl) e 40-60 a 1:2 (70 µl de H2O sem RNase). No fim, apenas as amostras de DNA
purificados com massa ≥ 20 ng são diluídas para posterior sequenciação.
3.3.5.5. Sequenciação do DNASão utilizadas para a sequenciação apenas as amostras de DNA com massa ≥
20 ng. Em microplacas de sequenciação são distribuídos 8 µl de amostras de DNA
amplificadas e purificadas, por poço. Utilizam-se 7 primers diferentes: A, B, C, D, F,
G e H; 4 forward e 3, reverse (Figura 3.2). Os primers foram desenhados pelo
fabricante, e incluídos no kit com os reagentes do “Terminador Big-Dye”. É utilizado
o sequenciador “ABI Prism 3100 Genetic Analyzer” (Applied Biosystems, US)
equipado com o software de análise. As condições das reacções de sequenciação são
de 25 ciclos para a desnaturação a 96º C durante 10 segundos, a hibridação a 50º C
durante 5 segundos e a polimerização a 60º C durante 4 minutos. A reacção de
sequenciação decorre em 4-5 horas.
O sequenciador permite juntar os sete segmentos obtidos numa única
sequência, englobando as regiões codificadas do gene protease (1-99) e da
transcriptase reversa (1-335), correspondendo aproximadamente a 1,3 Kb.
Figura 3.2. Os Primers de PCR e Sequenciação usados no Sistema ViroSeqOs primers de PCR e sequenciação usados no sistema ViroSeq com relação às regiões codificadoras da protease e transcriptase reversa. As direcções dos primers de PCR representam PCR-F ou Forward e PCR-R, Reverse). Utilizaram-se os primers de sequenciação (A, B, C, D, F, G, and H). Esta sequência de consenso é comparada com a estirpe de referência do HXB2 (Kuiken et al, 2002). Para a subtipagem, recorreu-se à REGA Subtyping Tool (de Oliveira et al, 2005), disponível na internet (http://jose.med.kuleuven.be/genotypetool/html/citeHIVtool.html). A ferramenta incorpora os softwares Clustal W, PAUP, Treepuzzle e SimPlot, bem como um conjunto de sequências de referência de todos os subtipos e de 16 CRFs; a sua análise é suportada pelos valores de bootstrap gerados pelo PAUP (Neighbour-Joinning Tree) e de bootscan (SimPlot).
112
Epidemiologia Molecular do HIV-1 em STP
3.3.6. Determinação do Subtipo de HIV-1
3.3.6.1. Análise Filogenética das Sequências NucleotídicasApós a correcção manual dos respectivos electroferogramas, as sequências
nucleotídicas do HIV-1 obtidas, em formato FASTA (Figura 3.3), com
aproximadamente 1302 bp, são submetidas a dois algorítmos bioinformáticos de
subtipagem, disponíveis no sítio da Universidade de Stanford: “HIV Sequence
Database” (http://www.hiv.lanl.gov/content/index) (Rhee et al, 2003) que faz apenas
um blast da sequência a estudar com as sequências disponíveis na base de dados e
“REGA HIV-1 SubtypingTool. REGA subtyping tool também está disponível nos sites
(http://jose.med.kuleuven.be/genotypetool/html/citeHIVtool.html) (de Oliveira et al,
2005) e (http://bioafrica.net/subtype.tool/). Através de um sistema automático, as
sequências são alinhadas com as de referência dos subtipos puros do HIV-1, grupo M,
e, quando necessário, das Formas Circulantes Recombinantes, conforme já referido.
Com base na semelhança do traçado similarity plotting e bootscanning (Lole et
al, 1999), usando a janela de formato 400 e nível dos 40 nucleótidos, os subtipos são
processados para cada um dos 9 subtipos puros de referência da base de dados de Los
Alamos (Rhee et al, 2006), e dos primeiros 16 CRFs na Rega Subtyping tool (de
Oliveira et al, 2005).
O REGA Subtyping tool incorpora os softwares SimPlot v3.2, PHYLIP v3.5,
PAUP ver. 4.0b10, e (Lole et al, 1999), (Paraskevis et al, 2003), (Huelsenbeck et al,
2001). Em caso de resultados discrepantes entre os dois algoritmos, ou quando não foi
possível a subtipagem por REGA Subtyping Tool, as sequências são analisadas
separadamente utilizando-se o programa de jpHMM-HIV da University of Göttingen
(Zhang et al, 2006 e Schultz et al, 2006) (http://jpmm.gobics.de/submission) para
análise de recombinação.
O programa “Jumping Profile Hidden Markov Model” (jpHMM) baseia-se no
modelo probabilístico destinado a análise de recombinação inter-subtipos de HIV-1.
De um modo geral estes softwares são baseados em modelos de comparação das
sequências dos ácidos nucleícos por alinhamentos múltiplos com base na similaridade.
Estes sistemas bioinformáticos incorporam diversos programas de software para a
realização de análise filogenética. Permitem a análise automatizada das sequências
nucleotídicas por comparação em análise filogenética com as sequências puras, de
113
Epidemiologia Molecular do HIV-1 em STP
referência, existentes nas bases de dados de “Los Alamos” ou noutros sítios da Internet
como o da National Center for Biotechnology Information (NCBI) (Rozanov et al,
2004) (http://www.ncbi.ncbi.nih.gov/projects/genotyping/formpage.cgi). Os sistemas
executam análises filogenéticas combinadas com métodos de bootscanning para a
subtipagem genética de fragmentos ou genoma completo de HIV-1 e emitem os
respectivos relatórios interpretativos.
Figura 3.3. Sequência Nucleotídica (FASTA)
O controlo de qualidade das sequências obtidas faz-se por comparação com as
de referência dos 9 subtipos do HIV-1, grupo M, publicadas na base de dados e
pesquisas de Los Alamos BLAST (Basic Local Alignment Search Tool). São emitidos
relatórios com os respectivos subtipos, inter-subtipos e CRFs.
3.3.6.2. Análise dos alinhamentos múltiplos Para a construção de árvore filogenética, todas as sequências nucleótidas foram
alinhadas entre si, e com as de referência dos subtipos puros do HIV-1, grupo M e,
quando necessário, das Formas Circulantes Recombinantes
(http://www.hiv.lanl.gov/content/index), utilizando o software BioEdit, que tem
incorporado Clustal W (http://www.mbio.ncsu.edu/BioEdit/bioedit.html).
Através de Clustal W incorporado no BioEdit, são realizados os alinhamentos
múltiplos das sequências nucleotídicas, excluem-se por completo os gaps e reduz-se o
114
Epidemiologia Molecular do HIV-1 em STP
tamanho das sequências (± 1200 bp) para elaboração da árvore. A árvore filogenética é
construída no programa MEGA, versão 3.1 (Kumar et al, 2004), utilizando o método
de Neighbor-Joining e o modelo de Kimura 2-parameter com 1000 réplicas de
bootstrap. Foram incluídas sequências do gene pol das estirpes de alguns países da
Costa Ocidental Africana (listagem das sequências do gene pol, obtidas do GenBank
encontra-se em anexo - Anexo III - Quadro 3.4.
3.3.7. As Variantes CRF02_AGs IdentificadasAs 38 estirpes classificadas por “REGA Subtyping Tool” como CRF02_AG no
presente estudo foram submetidas a análise filogenética. Todas as sequências foram
alinhadas com a sequência pura do subtipo B (Fr. 83.HXB2-K03455) e com a
sequência da recombinante CRF02_AG (IbNG-17756), existentes nas bases de dados
de Los Alamos (http://hiv-web.lanl.gov/) recorrendo-se ao software BioEdit.
Procedeu-se a análise das mutações associadas a resistência aos antirretrovirais, dos
polimorfismos nos sítios da PR e RT nas sequências de aminoácidos do gene pol das
variantes em estudo. Procurou-se detectar as possíveis alterações nas sequências
CRF02_AG identificadas, comparando-as com as do mesmo ancestral que foram
seleccionadas no GenBank, em relação a alguns países da Costa Ocidental Africana:
Angola, Camarões, Gabão, Guiné Equatorial, Nigéria, e outros (Lista em anexo – pág.
218), de forma a se detectar a relação de semelhança filogenética existente entre elas,
assim como possíveis alterações evolutivas do gene pol do HIV-1 nesta região
geográfica.
Constituem indicadores de transmissão da infecção no arquipélago a detecção
dos mesmos ancestrais. Relativamente às possíveis alterações nas sequências de
aminoácidos do gene pol das regiões analisadas poderão fornecer informações sobre os
aspectos associados a possível evolução do HIV-1 específica no país, ou comum a
regiões próximas a esta parte do Continente Africano. Nesta ordem de ideia foi
construída a correspondente árvore filogenética com inclusão das sequências dos
países acima mencionados. A árvore teve por base o princípio das semelhanças e
diferenças dos nucleótidos e da distribuição destes, utilizando-se o método de Kimura
2-parameter para o cálculo das distâncias. Foi averiguada a formação ou não de
clusters monofiléticos com os recombinantes dos países da Costa Ocidental Africana
acima mencionados.
115
Epidemiologia Molecular do HIV-1 em STP
3.3.8. Análise estatística O programa estatístico SPSS (Statistical Package for Social Science), versão
15.0, é utilizado para avaliar o significado dos resultados.
Com base nas proporções das frequências das variantes virais observadas são
calculadas as prevalências e os respectivos intervalos de confiança (IC), utilizando-se
o teste de χ2 com correcção de Yates e o nível de significância de 95%. O mesmo
critério de análise estatística serve para comparar as frequências dos subtipos, sub-
subtipos, CRFs e URFs com as variantes de referências.
116
Distribuição por Grupos Etários na amostra
3,25,4
22,6
11,8 9,7
3,2
05
10152025
7 - 12 13 - 24 25 - 34 35 - 44 45 - 54 55 - 63
Classes Etárias
Perc
enta
gem
(%)
Epidemiologia Molecular do HIV-1 em STP
3.4. Resultados
3.4.1. Característica da AmostraDado a prevalência da infecção em São Tomé e Príncipe ser ainda
relativamente baixa, a implementação do presente estudo só foi exequível com a
utilização de amostras consideradas de conveniência, que constituíram grande
percentagem do total de amostras.
Das 93 amostras de plasma dos portadores de HIV-1 residentes em São Tomé e
Príncipe analisadas, 31 (33%) eram do sexo masculino, 50 (54%) do feminino e 12
(13%) não possuíam informação sobre o género, facto que não é de estranhar quando
são usadas amostras de conveniência. Observou-se o predomínio do sexo feminino
(50-54%) sobre o masculino (31-33%).
Cinquenta e dois (56%) das amostras possuíam informação completa sobre as
idades e 41 (44%) não, o que constitui um viés de selecção, também frequente neste
tipo de pesquisa epidemiológica.
A idade média dos infectados era de 34,5 anos, com um mínimo de 7 e máximo
de 63 anos, e o desvio padrão (SD) foi dos 12,14 anos. A variável “Idade” foi
recodificada em 6 classes etárias: dos 7 aos 13, 14 aos 24 anos, 25 aos 34, 35 aos 44,
dos 45 aos 54 e dos 55 aos 63 constituindo respectivamente, 3 (3,2%), 4 (5,4%), 21
(22,6%), 11 (11,8%), 9 (9,7%) e 3 (3,2%) (Figura 3.4).
Figura 3.4. Distribuição por Grupos Etários na Amostra Representação gráfica dos 6 escalões etários.
117
Epidemiologia Molecular do HIV-1 em STP
3.4.2. Variantes do HIV-1 Circulantes em STP: prevalênciaClassificadas pelos dois algoritmos de subtipagem HIVSeq e REGA Subtyping
Tool, as 93 sequências nucleotídicas de amostras de HIV-1 colhidas em STP (Figuras
3.5a e 3.5b) da região do gene pol, apresentaram elevada diversidade genética viral.
Contudo, não foram registados vírus do subtipo B, o mais prevalente na Europa e
Estados Unidos, verificando-se serem todos os vírus dos subtipos não-B (Quadro 3.6).
Figura 3.5a. Alinhamentos Múltiplos (Sequências Nucleotídicas – região da PR) Alinhamentos Múltiplos das Sequências Nucleotídicas de STP com a de referência BHX2, mostrando a região completa da protease (1-99).
Figura 3.5b. Alinhamentos Múltiplos (Sequências Nucleotídicas – região da TR)Alinhamento Múltiplo das Sequências Nucleotídicas de STP com a de referência BHX2, mostrando parte da região da Transcriptase Reversa (1 -100).
118
Epidemiologia Molecular do HIV-1 em STP
Quadro 3.6. Variantes genéticas virais identificadas em amostras de STPOs algorítmos utilizados na subtipagem das 93 sequências estudadas.
Sequências Idades Género "HIV Seq" "REGA" "jpHMM"ST1 33 F CRF02_AG CRF02_AG A1ST2 37 M F1 FIST3 48 M A1 A (A1) A1ST4 38 M CRF02_AG CRF02_AGST5 39 F CRF02_AG/G CRF06_cpx (U_CRF06_cpx)ST6 62 F CRF02_AG CRF02_AGST7 41 M CRF02_AG CRF02_AGST8 46 M D DST9 CRF02_AG CRF02_AGST10 CRF02_AG CRF02_AGST11 44 CRF02_AG CRF02_AG*ST12 50 F C CST13 M CRF02_AG CRF02_AGST14 33 F CRF02_AG CRF02_AGST15 27 F CRF01_AE/CRF02_AG CRF02_AG* A1ST16 25 F CRF02_AG CRF02_AGST17 24 F D/F FIST18 25 F CRF02_AG CRF02_AGST19 30 F D/F FIST20 33 F D/F FIST21 36 F CRF02_AG CRF02_AG*ST22 32 F CRF02_AG CRF02_AGST23 12 M CRF01_AE/A A (A1)ST24 48 F A A (A1)ST25 23 F CRF02_AG/U* CRF02_AG (U_CRF02_AG)ST26 30 M CRF02_AG/U* CRF02_AG ( U_CRF02_AG)ST27 26 F CRF02_AG/U* CRF02_AG( U_CRF02_AG) A1GST28 M CRF02_AG* CRF02_AG (U_CRF02_AG) A1ST29 48 F A A (A1)ST30 M CRF02_AG/U* CRF02_AG*ST31 49 M CRF02_AG CRF02_AGST32 29 F C CST33 30 F A A (A1)ST34 21 F CRF02_AG CRF02_AGST35 24 F CRF02_AG CRF02_AGST36 F A A (A1)ST37 35 M CRF01_AE/A A (A1)ST38 M CRF01_AE/A A (A1)ST39 29 M CRF02_AG GST40 C CST41 F G GST42 35 F J JST43 27 G (G_U) G A1GST44 35 M CRF02_AG CRF02_AGST45 K/CRF02_AG CRF06_cpxST46 25 F CRF02_AG CRF02_AGST47 50 M D DST48 34 M A A (A1)ST49 28 M CRF02_AG CRF02_AGST50 48 M CRF02_AG CRF02_AG*ST51 34 F CRF02_AG CRF02_AGST52 36 M D NA (U_CRF05_DF?)ST53 22 F CRF02_AG CRF02_AGST54 50 F J JST55 59 M D/F F(F1)ST56 28 F CRF02_AG CRF02_AGST57 F K/CRF02_AG CRF06_cpx (U_CRF06_cpx)ST58 CRF02_AG/H HST59 M D/F F (F1)ST60 M CRF02_AG CRF02_AG* A1ST61 M CRF02_AG CRF02_AGST62 F H HST63 63 M A A (A1)ST64 F G G GST65 M CRF02_AG CRF02_AGST66 F K/CRF02_AG CRF06_cpx (U_CRF06_cpx)ST67 28 CRF02_AG CRF02_AGST68 F CRF02_AG/G CRF06_cpxST69 M CRF01_AE/A A (A1)ST70 G GST71 F G GST72 H HST73 M CRF02_AG CRF02_AGST74 F CRF02_AG CRF02_AGST75 F G GST76 7 F CRF02_AG CRF02_AGST77 F CRF02_AG CRF02_AGST78 F CRF02_AG CRF02_AGST79 F CRF01_AE/A A (A1)ST80 F D NA (D?) DST81 37 F D/F F (F1)ST82 33 F A A (A1)ST83 8 F CRF01_AE/A A (A1)ST84 CRF02_AG A/CRF02_AG A1GST85 F J JST86 M A A (A1)ST87 F D/F F (F1)ST88 F CRF02_AG/G CRF06_cpxST89 50 F CRF02_AG/G CRF06_cpx (U_CRF06_cpx) A1GST90 CRF02_AG/G CRF06_cpxST91 M J/G U_J A1CST92 M A A (A1)ST93 F J J
119
A111%
C3%
D4%
F11%
G7%
H2%
J4%CRF02_AG
38%K/CRF02_AG
3%
CRF02_AG/H1%
CRF02_AG/G5%
CRF02_AG/U4%
CRF01_AE/A6%
01AE/02AG1%
J/G1%
D/F8%
Epidemiologia Molecular do HIV-1 em STP
3.4.2.1. Determinação por “HIVSeq Subtyping Tool” (Stanford Database)
O HIVSeq Subtyping Tool categorizou as sequências nucleotídicas analisadas
nas seguintes variantes genéticas virais e as respectivas frequências: 35 (38%)
representam formas recombinantes CRF02_AG (Figura 3.6). Verifica-se assim que
estas são predominantes em São Tomé e Príncipe, tal como nos países limítrofes da
Costa Ocidental Africana. O subtipo A (sub-subtipo A1) representa a segunda variante
viral mais prevalente, constituindo 10 (11%) da amostra, seguindo-se a URF_D/F que
representou 7 (8%).
120
Epidemiologia Molecular do HIV-1 em STP
Figura 3.6. Distribuição das variantes virais de STP (HIVSeq Subtyping Tool) Os subtipos, sub-subtipos, CRFs e URFs do HIV-1, identificados em STP por HIVseq
Subtyping Tool (CRF02_AG/U foi determinada por SimPlot).
Os subtipos G e D constituíram respectivamente, 6 (7%) e 4 (4%) do estudo.
Quanto às restantes formas virais, 3 (3%) são do subtipo C, 1 (1%) do sub-subtipo F
(F1), 2 (2%) são do subtipo H, 3 (3%) pertencem ao raro subtipo J, 1 (1%) classificou-
se como uma forma recombinante J/G, 4 (4%) são CRF02_AG/U e 1 (1%)
CRF01_AE/CRF02_AG (Figura 3.6). Através deste algoritmo foi possível identificar
a grande variabilidade de HIV-1 em circulação no arquipélago de São Tomé e
Príncipe. Foram identificadas 16 variantes genéticas: 9 (56%) são estirpes
recombinantes (CRF02_AG, CRF02_AG/G, CRF02_AG/H, K/CRF02_AG,
CRF01_AE/CRF02_AG ou A1/G/A1, CRF02_AG/U, CRF01_AE/A, D/F, e J/G); 2
(13%) são sub-subtipos A (A1) e F (F1), e 5 (31%) representaram os subtipos puros
(C, D, G, H e J).
3.4.2.2. Determinação por “REGA Subtyping Tool”Quanto à subtipagem por REGA Subtyping Tool, as sequências nucleotídicas
deduzidas foram categorizadas nas seguintes variantes genéticas virais e as respectivas
prevalências: 38 (41%) CRF02_AG, 16 (17%) A (A1), 1 (1%) A/CRF02_AG, 3 (3%)
C, 2 (2%) D, 8 (9%) F (sub-subtipo F1), 7 (8%) G, 3 (3%) H, 8 (9%) CRF06_cpx, 4
(4%) J, 1 (1%) U/J e 2 (2%) não foram subtipáveis, designando-se NA (Figura 3.7).
121
Epidemiologia Molecular do HIV-1 em STP
Figura 3.7. Prevalência das variantes virais de São Tomé e Príncipe (REGA Subtyping Tool 2.0)
A utilização do algoritmo REGA permitiu determinar 11 variantes genéticas
virais, e 2 das sequências não foram subtipáveis (U ou NA). Das variantes genéticas
subtipadas, 4 (36%) eram estirpes recombinantes (CRF02_AG, A/CRF02_AG,
CRF06_cpx e U/J), 2 (18%) eram sub-subtipos (A1 e F1), 5 (46%) constituíram os
subtipos puros (C, D, G, H e J). O subtipo K não foi identificado nesta ferramenta de
subtipagem informática, tal como o B (Figura 3.7).
3.4.2.3. Discrepâncias Entre os Algoritmos UtilizadosA determinação dos subtipos pelos dois algorítmos acima referidos mostrou
resultados semelhantes apenas na classificação de alguns subtipos puros, como o C, D
e J (Figuras 3.6 e 3.7). Tanto os sub-subtipos A (A1) e F (F1) como os subtipos H não
foram consensuais entre ambos algorítmos. Verificou-se que o subtipo K foi detectado
por HIVSeq, apenas em recombinação com as estirpes CRF02_AGs, não tendo sido
detectado por REGA subtyping Tool (Figuras 3.6-3.7). Constatou-se existirem 37
(40%) sequências discrepantes (Quadro 3.7). No entanto, é necessário não esquecer
que o HIVSeq utiliza apenas uma BLAST search e não valida os seus resultados com
(A1)17%
C3% D
2%
(F1)9%
G8%
H3%J
4%CRF06_cpx
9%
CRF02_AG41%
A/CRF02_AG
1%
U/J1%
U2%
122
Epidemiologia Molecular do HIV-1 em STP
valores de boostrap, enquanto a REGA Subtyping Tool é muito mais complexa, sendo
os seus resultados suportados por valores de bootstrap e bootsacan superiores a 70%,
não podendo em rigor as duas ferramentas ser comparadas.
Entre ambos algorítmos apenas se registaram resultados totalmente
concordantes na classificação dos subtipos puros, C e J. Como esperado o subtipo G,
considerado ambíguo por representar por si só uma estirpe recombinante, apresentou
divergência, tanto como o subtipo D. Acentuadas discrepâncias são verificadas
nomeadamente nas sequências das estirpes que contêm fragmentos recombinantes. São
conhecidas as discrepâncias observadas ao nível do gene pol de HIV-1, apresentando
dissemelhanças entre (10-20% em relação a outros genes principais deste retrovírus).
Classificadas por HIVSeq como CRF01_AE/A todas as estirpes recombinantes neste
grupo foram avaliadas por REGA como A (A1), atendendo a que as CRF01_AE do
gene pol não contêm breakpoints, e as sequências puras do subtipo A são divergentes
(Quadro 3.7).
123
Epidemiologia Molecular do HIV-1 em STP
Quadro 3.7. Variantes discrepantes entre os algorítmos HIVSeq e REGA Variantes discrepantes entre os algorítmos HIVSeq e REGA. * - Determinação manual com o recurso ao SimPlot, versão 2.5. U – Fragmento não subtipável; NA – Não classificável.
Constatou-se que 2 (2%) das sequências no REGA subtyping Tool não foram
subtipáveis (ST52 e ST80). Contudo, as mesmas sequências foram reavaliadas pelo
mesmo algoritmo em 2008. Dadas as progressivas actualizações verificadas ao nível
do REGA subtyping Tool, as referidas sequências nucleotídicas não foram subtipáveis,
com a versão mais recente, exibindo uma região não subtipável (U), associada a um
fragmento classificado como U, e valores de bootscaning inferiores a 0,99 (Figura
3.8). ST15, ST50 e ST60 também foram difíceis de subtipar.
Sequências REGA S. Tool HIVSeqSTP23 A (A1) CRF01_AE/ASTP37 A (A1) CRF01_AE/ASTP38 A (A1) CRF01_AE/ASTP69 A (A1) CRF01_AE/ASTP79 A (A1) CRF01_AE/ASTP83 A (A1) CRF01_AE/A
ST3 A (A1) A/U*STP48 A (A1) A/U*
STP17 F1 D/FSTP19 F1 D/FSTP20 F1 D/FSTP55 F( F1) D/FSTP59 F(F1) D/FSTP81 F(F1) D/FSTP87 F1 D/F
STP11 G CRF02_AGSTP39 G CRF02_AGSTP43 G G/U*
STP5 CRF06_cpx CRF02_AG/GST45 CRF06_cpx K/CRF02_AG
STP57 CRF06_cpx K/CRF02_AGSTP66 CRF06_cpx K/CRF02_AGSTP68 CRF06_cpx CRF02_AG/GSTP88 CRF06_cpx CRF02_AG/GSTP89 CRF06_cpx CRF02_AG/GSTP90 CRF06_cpx CRF02_AG/G
STP15 CRF02_AG/* CRF01_AE/02_AGSTP50 CRF02_AG/* CRF02_AGSTP52 NA DSTP60 CRF02_AG/* CRF02_AGSTP80 NA D
STP58 H CRF02_AG/H
STP91 U*/J J/G
STP25 CRF02_AG CRF02_AG/U*STP26 CRF02_AG CRF02_AG/U*STP27 CRF02_AG CRF02_AG/U*STP30 CRF02_AG CRF02_AG/U*
124
Sequências HIVSeq REGA ST5 CRF02_AG/G CRF06_cpx
ST15 CRF01/02_AG CRF02_AG (U_CRF02_AG)ST25 CRF02_AG CRF02_AGST26 CRF02_AG CRF02_AGST27 CRF02_AG CRF02_AGST30 CRF02_AG CRF02_AGST43 G GST45 K/CRF02_AG CRF06_cpx (U_CRF06_cpx)ST50 CRF02_AG CRF02_AG (U_CRF02_AG)ST52 D NA (U_CRF05_DF)ST57 K/CRF02_AG CRF06_cpx (U_CRF06_cpx)ST58 CRF02_AG/H HST60 CRF02_AG CRF02_AG (U_CRF02_AG)ST66 K/CRF02_AG CRF06_cpx (U_CRF06_cpx)ST68 CRF02_AG/G CRF06_cpx (U_CRF06_cpx)ST80 D NA ST84 CRF02_AG A/CRF02_AGST88 CRF02_AG/G CRF06_cpxST89 CRF02_AG/G CRF06_cpxST90 CRF02_AG/G CRF06_cpx
Epidemiologia Molecular do HIV-1 em STP
Figura 3.8. Estirpes
ambíguas, recombinantes e não recombinantesDesempenho dos algorítmos usados na subtipagem
A ST52 apresentou uma estrutura genómica correspondente a U_CRF05_DF
em análise de recombinação, com um valor de bootscan cluster support igual a 0.793
que não foi possível subtipar (Figuras 3.8 e 3.9).
Figura 3.9. Análise de recombinação de ST52 (REGA Subtyping Tool) Sequência ST52 não foi subtipável (U_05_DF), tendo apresentado o valor de
125
Epidemiologia Molecular do HIV-1 em STP
bootscan cluster support igual a 0.793.Em análise parcial de pequenos segmentos dos genomas virais, utilizando-se a
janela do formato 400, e a nível dos 40 nucleótidos por SimPlot, ST80 não foi
classificável como subtipo D, apresentando um valor de bootscan cluster support igual
a 0,542 (Figura 3.10). Exibindo estruturas genómicas atípicas, as sequências ST50 e
ST60 também foram classificadas como URF_AG/U. Quanto à ST15 foi classificada
como a forma única URF, A1/G/A1 (Figura 3.11a e 3.11b).
Ao ser analisada em mais pormenor a estrutura genómica de ST15, verificou-se
que de 1 a 300bp é constituída por CRF01_AE, de 300 a 600bp exibe um ancestral A1,
dos 600 a 950 compõe-se de um segmento CRF02_AG, e, finalmente, de um segmento
do sub-subtipo A1 dos 952 a 1300bp, tendo sido classificada finalmente como
A1/G/A1. Assim, esta sequência que não tinha sido possível subtipar pelo algoritmo
REGA (Figuras 3.11a e 3.11b), apresenta uma estrutura integrando duas CRFs, à
semelhança das estirpes CRF36_cpx e CRF37_cpx, constantes na base de dados de
Los Alamos. Parece possuir mosaico semelhante à estirpe dos Camarões (AY444295)
que fora classificada como uma CRF02_AG PR/CRF02_AGRT. Este facto sugere
disseminação pelos países da Costa Ocidental Africana, na qual se localiza São Tomé
e Príncipe. Atendendo a estas dúvidas na subtipagem, a mesma sequência foi
reavaliada em 2008, em análise de bootscaning por REGA Subtyping Tool version 2:
apresentou um fragmento não definido na região da protease e o da transcriptase
reversa correspondendo a CRF02_AG (Figuras 3.10; 3.11a e 3.11b).
126
Epidemiologia Molecular do HIV-1 em STP
Figura 3.10. ST80 em análise de recombinação (REGA Subtyping Tool) ST80
não foi subtipável (NA), apresentando bootscan cluster support = 0,542.
127
Epidemiologia Molecular do HIV-1 em STP
Figura 3.11a. Análise de recombinação dos fragmentos de ST15 (REGA Tool) Determinação parcial da estirpe ST15 por REGA S. Tool
128
Sequências REGA ST11 U_CRF02_AGST15 U_CRF02_AGST25 U_CRF02_AGST26 U_CRF02_AGST27 U_CRF02_AGST28 U_CRF02_AGST30 U_CRF02_AGST50 U_CRF02_AGST60 U_CRF02_AGST84 U_CRF02_AG
Epidemiologia Molecular do HIV-1 em STP
Figura 3.11b. ST15 em análise de bootscaning (REGA Subtyping Tool)O genoma ST15 exibe uma estrutura recombinante, U_CRF02_AG (200 a 1100nt→G), sendo composta pelo sub-subtipo A1 (720 a > 1200 nt→A1). O valor de bootscan: 0.69.
Dadas estas discrepâncias, 10 (11%) das sequências foram assim reavaliadas
por REGA Subtyping Tool Version 2 em 2008: ST11, ST15, ST25, ST26, ST27, ST28,
ST30, ST50, ST60 e ST84. Todas apresentaram estruturas genómicas idênticas
constituídas por recombinantes com regiões não subtipáveis, associadas a um
fragmento U, U/CRF02_AG, e com valores de bootscaning inferiores a 0,99 (Figura
3.12). A mesma estrutura também foi constatada para as restantes estirpes classificadas
como CRF02_AG.
Figura 3.12. Reavaliação por REGA Subtyping Tool A reavaliação de algumas sequências difíceis de subtipar
Quatro destas, ST25, ST26 (Figuras 3.13a e 3.13b), ST27 e ST30 foram ainda
reavaliadas com o recurso ao programa SimPlot, tendo sido classificadas neste como
CRF02_AG/U. A sequência ST84 foi classificada como APR/CRF2_AGRT, com um
valor de Bootstrap igual a 100% e bootscan de 0,99 (Figuras 3.8; 3.12). Relativamente
às 4 (4%) das estirpes classificadas como CRF02_AG/G por REGA Subtyping Tool, 3
129
Epidemiologia Molecular do HIV-1 em STP
(3%) das quais tinham sido classificadas como KPR/CRF02_AGRT, passaram
posteriormente a CRF06_cpx; os seus genomas são constituídos por um mosaico dos
subtipos A, G, J, K. Em análise de recombinação estas estirpes foram reclassificadas
em U_CRF6_cpx, à semelhança do que se tem vindo a verificar com as estirpes
CRF02_AGs (Figura 3.14).
Figura 3.13a. ST26 em análise de bootscaning (REGA Subtyping Tool)
Figura 3.13b. ST26 em análise de bootscaning (REGA Subtyping Tool)
130
Epidemiologia Molecular do HIV-1 em STP
Sete (8%) das sequências (ST17, ST19, ST20, ST55, ST59, ST81 e ST87)
foram classificadas inicialmente pelo algoritmo HIVSeq como D/F, pelo REGA
Subtyping Tool como sub-subtipo F (F1). Também as estirpes CRF01_AE/A pela
classificação por HIVSeq, são re-classificadas como pertencendo ao sub-subtipo A
(A1), atendendo à ausência de breakpoints na região estudada e levando-as a
divergirem com as estirpes puras do subtipo A.
No que concerne às CRF02_AGs identificadas neste estudo, espelham o perfil
epidemiológico da infecção em São Tomé e Príncipe. Constituíram 38 (41%) da
amostra estudada, sendo também frequentes nos países limítrofes da Costa Ocidental
Africana. Observa-se que 16 (17%) das estirpes CRF02_AG integram um dos
subtipos, G, J, H, K ou U (fragmento não subtipável). O fragmento classificado como
de origem do subtipo G é problemático apresentando incongruências na sua
determinação. Alguns autores como Abecasis et al, 2007 sugerem que o subtipo G
constituinte das CRF02_AGs é, por si só, uma estirpe recombinante, o que certamente
explicaria o elevado grau de divergência que apresenta. Sugerem ainda que as estirpes
recombinantes CRF02_AG incluem outros fragmentos, e não unicamente G.
O sinal da evolução das estirpes CRF02_AGs é o facto de integrarem vários
subtipos, sub-subtipos e CRFs e URFs, o que provavelmente tem interferido com os
testes de diagnóstico do HIV-1 em São Tomé e Príncipe, e com as capacidades de
respostas dos algorítmos de subtipagem existentes nas bases de dados conhecidas.
Com efeito, de acordo com as informações incluídas na base de dados de Los Alamos,
a prevalência destas variantes ronda os 50 a 70% das estirpes circulantes nos países
situados nesta região Central Ocidental Africana. Na base de dados de Los Alamos
constatam-se que nos países limítrofes a São Tomé e Príncipe registam-se as seguintes
distribuições das CRF02_AG, com base em amostras não aleatorizadas, por isso não
necessariamente representativas das respectivas populações: 168 de 420 (40%) na
Nigéria, 43 de 109 (39%) na Guiné Equatorial, 1359 de 3602 (38%) nos Camarões, 74
de 260 (29%) no Gabão e 8 de 215 (4%) em Angola (Figuras 3.22 – 3.26).
3.4.2.4. Análise das discrepâncias com o algoritmo jpHMM-HIV-1Doze 12 (13%) das estirpes ambíguas foram reanalisadas pelo algoritmo
jpHMM-HIV (web server to detect genomic recombinations in HIV-1) da Universidade
de Göttingen, Alemanha, na tentativa de esclarecimento dos resultados das análises
genómicas dos dois algorítmos utilizados previamente no estudo. Verificaram-se
131
Sequências HIVSeq REGA jpMM-HIV-1ST1 CRF02_AG CRF02_AG A1ST15 CRF01/02_AG CRF02_AG (U_CRF02_AG) A1ST27 CRF02_AG CRF02_AG (U_CRF02_AG) A1GST28 CRF02_AG CRF02_AG (U_CRF02_AG) A1ST43 G (G_U) G A1GST60 CRF02_AG CRF02_AG (U_CRF02_AG) A1ST64 G G GST80 D NA (D) DST82 A A(A1) A1ST84 CRF02_AG A/CRF02_AG A1GST89 CRF02_AG/G CRF06_cpx A1GST91 J/G U/J A1C
Epidemiologia Molecular do HIV-1 em STP
novamente alguns resultados discrepantes, mas alguns foram concordantes (Figura
3.14).
Figura 3.14. Análise de
Recombinação Genómica (jpHMM-HIV-1)Embora não seja possível a comparação destas 3 ferramentas bioinformáticas de subtipagem, apenas uma sequência - ST 91 foi classificada por jpHMM-HIV-1, de forma totalmente discordante, como A1C, enquanto nos outros dois algorítmos foi classificada como recombinante J_G e U_J.
O mapeamento genómico apresentado nas Figuras 3.15 e 3.16 evidencia
diversas ambiguidades na determinação das variantes genéticas virais. Por exemplo, a
sequência ST15, que havia sido classificada como CRF01_AE/CRF02_AG (A1/G/A),
e (U_CRF02_AG), respectivamente por HIVSeq, e por REGA Subtyping Tool,
classificou-se como A1 neste último algorítmo.
132
Epidemiologia Molecular do HIV-1 em STP
Figura 3.15. Estrutura genómica de ST15 (REGA)Esquema de assinatura do subtipo viral, baseando-se na sequência ST15> 800bp, agrupada a um subtipo puro, CRF, ou sub-subtipo, com o valor de “bootstrap” >70%, com detecção de recombinação nos subtipos puros por análise “bootscan”, e falha na classificação como CRF ou subtipo em análise de recombinação. A cor vermelha representa parte do gene pol correspondente ao subtipo A, verde ao G, e branco à região não subtipável e/ou <70%. Retirado da base de dados de Los Alamos (de Oliveira et al, 2005).
133
Epidemiologia Molecular do HIV-1 em STP
Figura 3.16. Estrutura genómica da amostra ST15 (jpHMM-HIV-1)Genoma viral da estirpe ST15 determinada por jpHMM-HIV, algorítmo da Universidade de Göttingen. Adaptado de Zhang et al, 2006 e Schultz et al, 2006 (http://jpmm.gobics.de/submission).
3.4.3. Análise das Relações Filogenéticas entre os Vírus Subtipados
A árvore filogenética das estirpes identificadas construída com inclusão das
estirpes de referência do HIV-1 existentes no Genbank (Anexo III – Quadro 3.3),
mostra a formação de cluster entre as sequências identificadas neste estudo e as de
referências, e um perfil heterogéneo da infecção por HIV-1 em São Tomé Príncipe. A
infecção por HIV-1 neste país caracteriza-se por grande diversidade genética,
incluindo diversos subtipos, CRFs e URFs, sugerindo múltiplas introduções e
sugerindo a disseminação da epidemia a partir de populações dos países da Costa
Ocidental Africana (Figura 3.17).
134
Epidemiologia Molecular do HIV-1 em STP
Figura 3.17. Relações filogenéticas entre as sequências pol do HIV-1 dos vírus subtipados e algumas estirpes representativas das variantes seleccionadas na base de dados de Los Alamos, recombinantes ou não, do grupo M. Árvore construída com o recurso ao programa “Mega ver.3.1”, com base no Neighbor-Joinning e F84 Model, partindo de matrizes de distâncias de nucleótidos da região do genoma pesquisado. Foram incluídas 100 sequências e 823 caracteres, e inserções sem gaps. (Página 133).
135
Epidemiologia Molecular do HIV-1 em STP
ST76 CRF02 AG ST77 CRF02 AG
ST14 CRF02 AG ST21 CRF02 AG
ST35 CRF02 AG 132554Angola
ST26 CRF02 AG Ref.02 AG.NG.x.IBNG.L39106
AM113750.1 GAB ST18 CRF02 AG ST28 CRF02 AG ST7 CRF02 AG ST13 CRF02 AG
ST49 CRF02 AG ST56 CRF02 AG
ST6 CRF02 AG ST84 A/CRF02 AG
68209Angola ST51 CRF02 AG
ST15 CRF02 AG Ref.02 AG.CM.AY444295
ST34 CRF02 AG 02 AGCM9797CMP807
ST9 CRF02 AG ST73 CRF02 AG
ST61 CRF02 AG Ref.02 AG.CM.99.pBD6 15.AY271690
FJ481706.1 EG ST30 CRF02 AG ST74 CRF02 AG
ST4 CRF02 AG FJ481701.1 EG
ST45 CRF02 AG ST22 CRF02 AG
ST46 CRF02 AG 165056Angola
ST44 CRF02 AG ST31 CRF02 AG Ref.G.KE.93.HH8793 12 1.AF061641 Ref.G.PT.x.PT2695.AY612637 ST41 G ST71 G
ST75 G ST70 G
Ref.G.NG.92.92NG083.U88826 ST82 A1
ST86 A1 ST24 A1 ST38 A1
ST69 A1 ST79 A1
ST37 A1 Ref.A1.KE.94.Q23 17.AF004885 Ref.A1.UG.92.92UG037.AB253429 A1.SE.94.SE7253 Ref.F1.BR.93.93BR020 1.AF005494
ST55 F1 ST20 FI
ST2 F1 ST17 F1 ST19 F1
ST81 F1 ST59 F1
ST87 F1 ST5 CRF06 cpx
ST66 CRF06 cpx ST8 D
ST47 D Ref.D.CM.01.01CM 4412HAL.AY371157
Ref.D.CD.83.ELI.K03454 05 DF.BE.x.VI1310
Ref.D.TZ.01.A280.AY253311 Ref.D.UG.94.94UG114.U88824
Ref.K.CD.97.EQTB11C.AJ249235 Ref.K.CM.96.MP535.AJ249239 Ref.B.FR.83.HXB2 LAI IIIB BRU.K03455
Ref.B.US.98.1058 11.AY331295 Ref.F2.CM.02.02CM 0016BBY.AY371158
Ref.F2.CM.95.MP257.AJ249237 ST12 C
Ref.C.ZA.04.SK164B1.AY772699 ST32 C Ref.C.IN.95.95IN21068.AF067155
Ref.C.BR.92.BR025 d.U52953 ST58 H
ST62 H ST72 H
Ref.H.BE.93.VI991.AF190127 Ref.H.CF.90.056.AF005496
ST91 U J 11 cpx.GR.x.GR17
Ref.J.SE.94.SE7022.AF082395 Ref.J.CD.97.J 97DC KTB147.EF614151
ST54 J ST42 J ST85 J
N.CM.97.YBF106 N.CM.02.DJO0131
O.CM.98.98CMU2901 O.SN.99.SEMP130099
99
7978
98
76
85
90
98
91
86
71
75
94
86
95
96
81
93
90
7093
99
83
85
93
93
86
72
74
71
91
0.02136
ST7
6 C
RF0
2 A
GS
T77
CR
F02
AG
ST1
4 C
RF0
2 A
GS
T21
CR
F02
AG
ST35
CR
F02
AG13
2554
Ango
la
ST34 CRF02 AG
02 AGCM9797CMP807
ST9 CRF02 AG
ST73 CRF02 AG
ST61 CRF02 AGRef.02 AG.CM.99.pBD6 15.AY271690
FJ481706.1 EGST30 CRF02 AGST74 CRF02 AGST4 CRF02 AGFJ481701.1 EGST45 CRF02 AG
ST24 A1
ST38 A1
ST69 A
1S
T79 A1
ST37 A
1R
ef. A1.K
E.94. Q
23 17. AF004885
Ref.A
1.UG
.92.92UG
037.AB
253429A
1.SE
.94.SE
7253
Ref
.F1.
BR
.93.
93B
R02
0 1.
AF0
0549
4
ST55
F1
ST20
FI
ST2
F1
Ref.K.CD.97.EQTB11C.AJ249235
Ref.K.CM.96.MP535.AJ249239
Ref.B.FR.83.HXB2 LAI IIIB BRU.K03455Ref.B.US.98.1058 11.AY331295
Ref.F2.CM.02.02CM 0016BBY.AY371158Ref.F2.CM.95.MP257.AJ249237ST12 C
Ref.C.ZA.04.SK164B1.AY772699ST32 C
Ref.C.IN.95.95IN21068.AF067155
Ref.C.BR.92.BR025 d.U52953
ST58 H
O.SN
.99.SEMP1300
0.02
vv
Epidemiologia Molecular do HIV-1 em STP
Figura 3.18. Árvore circular das sequências do gene pol do HIV-1 identificados em STP e estirpes de referência. Tendência da infecção por HIV-1 em São Tomé e Príncipe (sequências do gene pol). Relações filogenéticas entre as sequências pol do HIV-1 dos vírus subtipados e os seleccionados na base de dados de Los Alamos, usando os grupos N e O como outgroup.
137
Epidemiologia Molecular do HIV-1 em STP
3.4.3. Análise das relações filogenéticas entre as CRF02_AGs identificadas em STP e as de alguns países da Costa Ocidental Africana: Angola, Camarões, Gabão, Guiné Equatorial, e Nigéria
A listagem das sequências do gene pol dos países com ligação ao arquipélago
de São Tomé e Príncipe, extraídas do GenBank, está representada no Anexo III -
Quadro 3.4. As 38 sequências nucleotídicas dos fragmentos de gene pol determinados
por PCR e sequenciação directa do DNA foram classificadas com base no algoritmo
REGA Subtyping Tool.
Construída com utilização do programa de software MEGA 3.1 utilizando-se o
de modelo Neighbor-Joinning, pelo método de Kimura 2-parameter, a árvore
filogenética proporcionou indicações sobre as relações entre as 38 CRF02_AG
identificadas no estudo por “REGA Subtyping Tool” e as dos países limítrofes da Costa
Ocidental Africana, tais como Angola, Gabão, Guiné Equatorial, Camarões, Nigéria e
outros países (Figuras 3.18, 3.19 - 3.21a,b). Verificou-se que grande parte das
recombinantes CRF02_AG em estudo, colhidas entre 2001 e 2007, apresentaram
discrepância dos breakpoints, formando cluster monofilético com as demais estirpes
CRF02_AG dos países da Costa Ocidental Africana, sugerindo efeito fundador e
evolução viral no país. São localizadas na árvore como outgroup relativamente às dos
países vizinhos. Este grupo de estirpes não apresenta ancestral comum com as demais
estirpes assim classificadas. Contudo, algumas estirpes em estudo, que tinham sido
difíceis de classificar, agruparam-se com as restantes estirpes de fora de São Tomé e
Príncipe, sugerindo transmissão a partir daqueles países. Além disto, a análise dos
aminoácidos destas estirpes apontam divergências na região da protease, nas posições
PR 3 e 37, podendo também expressar evolução deste gene e transmissão regional.
A amostra ST15 apresenta um ancestral evolutivo comum com o da estirpe de
referência dos Camarões, AY444295. Este facto sugere disseminação regional, ou seja
entre os países da África Ocidental e Central. Pelo contrário, foi verificada a não
formação de grupos entre o conjunto maioritário das estirpes CRF02_AG são-
tomenses e as CRF02_AG dos países da Costa Ocidental Africana, nos breakpoints.
138
Epidemiologia Molecular do HIV-1 em STP
Figura 3.19. Relações filogenéticas entre as sequências do gene pol do HIV-1 das estirpes CRF02_AG de origem são-tomense, e estirpes representativas de recombinantes CRF02_AG do grupo M, nomeadamente as de referência - 02AGNGL39106 (Nigéria) e subtipo B (BHXB2- França) como outgroup. É baseada no modelo Neighbor-Joinning partindo de matrizes de distâncias de nucleótidos da região do genoma pesquisado (MEGA 3.1). O dendograma representa 0.5% de variabilidade, e os números nos nós assinalam valores de bootstrap superiores a 70%.
ST61 CRF02 AG
ST73 CRF02 AG
ST9 CRF02 AG
ST34 CRF02 AG
ST10 CRF02 AG
ST7 CRF02 AG
ST13 CRF02 AG
ST74 CRF02 AG
ST28 CRF02 AG
ST78 CRF02 AG
ST49 CRF02 AG
ST56 CRF02 AG
ST51 CRF02 AG
ST53 CRF02 AG
ST44 CRF02 AG
ST15 CRF02 AG
STF18 CRF02 AG
ST26 CRF02 AG
ST1 CRF02-AG
ST6 CRF02 AG
ST21 CRF02 AG
ST25 CRF02 AG
ST14 CRF02 AG
ST76 CRF02 AG
ST77 CRF02 AG
Ref.02 AG.NG.x.IBNG.L39106
ST22 CRF02 AG
ST46 CRF02 AG
ST65 CRF02 AG
ST4 CRF02 AG
Ref.B.FR.83.HXB2 LAI IIIB BRU.K03455
93
76
99
98
95
78
97
0.005
139
Epidemiologia Molecular do HIV-1 em STP
Figura 3.20a. Relações filogenéticas das sequências do gene pol do HIV-1 provenientes de residentes em STP e várias estirpes de subtipos e sub-subtipos do grupo M, seleccionados aleatoriamente da base de dados de Los Alamos, mostram formação de cluster monofilético da maioria das estirpes CRF02_AG de STP, com possível efeito fundador e transmissão de âmbito local. Algumas das CRF02_AG de STP formam cluster com sequências de países limítrofes, sugerindo possível introdução a partir da costa Ocidental Africana (Angola, Camarões e Nigeria).
ST76 02AG ST77 02AG
ST14 02AG ST6 02AG
132554Angola Ref.02 AG.NG.x.IBNG.L39106
ST16 02AG ST35 02AG
ST22 02AG ST46 02AG
ST30 02AG ST74 02AG
ST7 02AG ST13 02AG
ST10 02AG ST34 02AG
ST51 02AG ST53 02AG
ST18 02AG ST28 02AG
68209Angola ST78 02AG
ST49 02AG ST56 02AG
ST4 02AG 165056Angola
ST9 02AG Ref.02 AG.CM.99.pBD6 15.AY271690
ST61 02AG ST73 02AG
ST44 02AG ST67 02AG
ST60 02AG ST15 02AG
Ref. 02 AG.CM. AY444295 Ref.G.BE.96.DRCBL.AF084936
Ref.G.PT.x.PT2695.AY612637 Ref.G.KE.93.HH8793 12 1.AF061641
Ref.G.NG.92.92NG083.U88826 Ref.A2.CD.97.97CDKTB48.AF286238
Ref.A2.CY.94.94CY017 41.AF286237 Ref.A1.AU.03.PS1044 Day0.DQ676872
Ref.A1.RW.92.92RW008.AB253421 Ref.A1.KE.94.Q23 17.AF004885
Ref.A1.UG.92.92UG037.AB253429 Ref.C.BR.92.BR025 d.U52953
Ref.C.IN.95.95IN21068.AF067155 Ref.C.ZA.04.SK164B1.AY772699
Ref.C.ET.86.ETH2220.U46016 Ref.H.BE.93.VI991.AF190127
Ref.H.BE.93.VI997.AF190128 Ref.H.CF.90.056.AF005496
Ref.J.CD.97.J 97DC KTB147.EF614151 Ref.J.SE.93.SE7887.AF082394
Ref.J.SE.94.SE7022.AF082395 Ref.B.FR.83.HXB2 LAI IIIB BRU.K03455
Ref.B.TH.90.BK132.AY173951 Ref.B.NL.00.671 00T36.AY423387
Ref.B.US.98.1058 11.AY331295 Ref.D.CM.01.01CM 4412HAL.AY371157
Ref.D.CD.83.ELI.K03454 Ref.D.TZ.01.A280.AY253311
Ref.D.UG.94.94UG114.U88824 Ref.K.CD.97.EQTB11C.AJ249235
Ref.K.CM.96.MP535.AJ249239 Ref.F1.BE.93.VI850.AF077336
Ref.F1.BR.93.93BR020 1.AF005494 Ref.F1.FI.93.FIN9363.AF075703
Ref.F1.FR.96.MP411.AJ249238 Ref.F2.CM.02.02CM 0016BBY.AY371158
Ref.F2.CM.97.CM53657.AF377956 Ref.F2.CM.95.MP255.AJ249236
Ref.F2.CM.95.MP257.AJ249237
99 99
99
70
98
70
99
99
98
99
99
93
95
82
82
72
99
88
98
71
99
71
98
90
99
97
98
74
91
0.005
140
Epidemiologia Molecular do HIV-1 em STP
Figura 3.20.b. Relações filogenéticas entre as sequências do gene pol de HIV-1 das estirpes CRF02_AG de origem são-tomense e outras seleccionadas aleatoriamente da base de dados de Los Alamos (subtipos, sub-subtipos e recombinantes do grupo M), mostrando o efeito fundador, particularmente evidente na árvore radial, e formação de cluster. A árvore foi construída com o recurso ao Mega 3.1, com base no modelo Neighbor-Joinning e Kimura 2-parameter, partindo de matrizes de distâncias de nucleótidos da região do genoma pesquisado. Foram incluídas 62 sequências e 901 caracteres incluindo inserções, e sem gaps.
A árvore da Figura 3.17 evidencia múltiplas introduções virais no arquipélago,
com a formação de clusters entre as estirpes recombinantes ou não, de STP, e várias
outras isoladas em diversas partes do Mundo. Verifica-se a disseminação entre os
países da Costa Ocidental Africana, tais como Angola, Gabão, Camarões, Nigéria,
Senegal, Burquina-Faso, evidenciando a ocorrência de transmissão regional da
infecção por HIV-1 nesta zona Africana (Figura 3.17-3.21).
Classificadas como CRF02_AG por REGA Subtyping Tool, as estirpes de São
Tomé e Príncipe (azul na Fig. 3.21a) e um grupo de sequências de diversas variantes
virais seleccionadas do GenBank/NCBI, e da base de dados de Los Alamos,
evidenciam formação de cluster monofilético, constituindo clones específicos do país
e efeito fundador, associado a transmissão de âmbito local (U_CRF0_AG e
A_CRF02_AG) (Figura 3.21a). Estas estirpes não foram antes descritas.
Ref.02 AG.CM.99.pBD6 15.AY271690 ST59 F1
0.02
141
ST61 02AG ST73 02AG ST9 02AG
ST34 02AG ST7 02AG
ST13 02 AG ST78 02AG
ST1 02-AG ST49 02 AG ST56 02AG
ST28 02AG ST25 02AG
ST35 02AG ST6 02AG
ST21 02 AG ST14 02AG
ST76 02AG ST77 02AG
ST74 02AG ST4 02AG
ST22 02AG ST46 02AG ST51 02AG
ST53 02AG ST18 02AG ST26 02AG
ST15 02AG 14 BG.ES.99.X397
G.KE.93.HH8793 12 1 G.NG.92.92NG083
G.SE.93.SE6165 A2.CY.94.94CY017 41 A2.CD.97.97CDKTB48
16A2D.KR.97.97KR004 01 AE.TH.90.CM240
15 01B.TH.99.99TH MU2079 A1.UG.98.98UG57136
A1.KE.94.Q23 17 A1.SE.94.SE7253
A1.UG.92.92UG037 18 cpx.CM.97.CM53379
06 cpx.AU.96.BFP90 04 cpx.CY.94.CY032
D.TZ.01.A280 D.UG.94.94UG114
19 cpx.CU.99.CU38 D.CM.01.01CM 4412HAL
D.CD.83.ELI 10 CD.TZ.96.96TZ BF061
B.FR.83.HXB2 LAI IIIB BRU B.TH.90.BK132
B.NL.00.671 00T36 B.US.98.1058 11
03 AB.RU.97.KAL153 2 F2.CM.95.MP255
F2.CM.95.MP257 F2.CM.02.02CM 0016BBY
F2.CM.97.CM53657 05 DF.BE.x.VI1310
F1.FR.96.MP411 12 BF.AR.99.ARMA159
F1.BR.93.93BR020 1 F1.FI.93.FIN9363
F1.BE.93.VI850 09 cpx.GH.96.96GH2911
K.CD.97.EQTB11C K.CM.96.MP535
C.ET.86.ETH2220 C.BR.92.BR025 d
07 BC.CN.97.CN54 C.ZA.04.SK164B1 C.IN.95.95IN21068 08 BC.CN.97.97CNGX 6F
H.BE.93.VI991 H.CF.90.056
H.BE.93.VI997 J.SE.94.SE7022
11 cpx.GR.x.GR17 13 cpx.CM.96.1849
N.CM.97.YBF106 N.CM.02.DJO0131
O.BE.87.ANT70 O.CM.98.98CMU2901
O.SN.99.SEMP1300
99
99
99
99
99
99
99
99
99
98
98
82 96
95
95
84
94
85 93
74
92
91
86
84
81
99
71
76
99 78
0.02
Epidemiologia Molecular do HIV-1 em STP
142
Epidemiologia Molecular do HIV-1 em STP
Figura 3.21a. Árvore com os recombinantes CRF02_AG de São Tomé e Príncipe (azul) e outras variantes seleccionadas de base de dados de Los Alamos. Relações filogenéticas entre as sequências CRF02_AG de STP, e estirpes dos subtipos puros, e recombinantes do grupo M, utilizando-se sequências de referência dos grupos O e N dos Camarões como outgroup. A árvore foi construída no MEGA 3.1 com base no modelo Neighbor-Joinning partindo de matrizes de distâncias de nucleótidos da região do genoma pesquisado. Os 2% representam a variabilidade, e os números nos nós assinalam valores de bootstrap> a 70%.
143
Epidemiologia Molecular do HIV-1 em STP
Figura 3.21b. Relações filogenéticas entre as sequências CRF02_AG de STP e as de alguns países da costa ocidental Africana. A árvore mostra claramente interligação entre as estirpes CRF02_AG de STP (ST_02AG) e as do continente (Angola, Gabão, Camarões, Nigéria, e Guiné Equatorial).
3.5. Discussão
ST76 02AG ST77 02AG
ST14 02AG ST6 02AG
132554.Ang ST16 02AG
ST35 02AG ST18 02AG
ST28 02AG ST49 02AG
ST56 02AG ST51 02AG
ST53 02AG AM113750.1GAB
ST30 02AG ST74 02AG
ST65 02AG ST67 02AG
Ref.02 AG.NG.x.IBNG.L39106 ST4 02AG
ST22 02AG ST46 02AG
ST7 02AG ST13 02AG
ST10 02AG FJ481701.1 EG
ST34 02AG 02AGCM9797CMP807
ST15 02AG Ref. 02AG.CMAY444295
ST44 02AG ST60 02AG
68209.Ang ST78 02AG
FJ481706.1 EG 165056.Ang
ST9 02AG Ref.02AG.CM.99.pBD6 15.AY271690
ST61 02AG ST73 02AG
99
99
99
72 96
86
98
96
97
77
88
0.002
144
Epidemiologia Molecular do HIV-1 em STP
São Tomé e Príncipe, embora localizado perto do epicentro da infecção por
HIV-1, tem registado baixos valores de prevalência (vide capítulo 2). Porém, teme-se
um incremento marcado da infecção nas próximas décadas, dada a situação económica
degradada do país, sobretudo a pobreza feminina, e certa poligamia, aliados a
carências de programas de prevenção e vigilância epidemiológica das infecções a
HIVs e de outras ISTs.
Através da epidemiologia molecular do HIV-1 são estudados factores genéticos
virais que poderão influenciar a infecção e a sua epidemiologia. Assim, utilizando os
préstimos desta ferramenta pode-se tentar deduzir a origem dos HIVs em diversos
grupos populacionais, detectar e monitorizar a introdução de novas variantes num país
ou numa determinada região, contribuindo para melhor compreensão da biologia do
HIV-1, sua transmissão, história natural e classificação genética (Robertson et al,
2000).
Este é o primeiro estudo de epidemiologia molecular de HIV-1 oficialmente
realizado com amostras de São Tomé e Príncipe. O estudo envolveu amostras dos
seropositivos para os anticorpos específicos do HIV-1, que utilizaram diversas
instituições de saúde do país, dos 7 aos 63 anos e de ambos os sexos. Teve como
propósito identificar e conhecer a prevalência das variantes virais circulantes em São
Tomé e Príncipe (e também avaliar as resistências aos antirretrovirais – capítulo 4).
O gene pol constituiu o alvo deste estudo uma vez que constitui uma região
muito conservada do vírus, e codifica as enzimas protease (PR), transcriptase reversa
(RT) e integrase (IN). A RT tem constituído o alvo principal da terapêutica
antirretroviral. A amplificação do gene pol permite aceder as informações contidas nos
genes e relativas tanto aos subtipos como às mutações associadas a resistência aos
fármacos antirretrovirais. Assim, permite ser melhor caracterizada a extensão da
epidemia no país, e serem esclarecidas as fontes comuns de infecção. Este é um dado
relevante para o estabelecimento das estratégias de prevenção e controlo da infecção,
mais apropriadas às características epidemiológicas do país.
Partindo de amostras de plasma colhidas aos seropositivos são-tomenses que
ocorrem às diversas instituições de saúde do país, foi amplificado o gene pol do HIV-
1. O processo de genotipagem consistiu de extracção do RNA, que é convertido em
cDNA pela reacção transcriptase reversa, seguida de PCR (RT-PCR). O cDNA obtido
é amplificado em DNA de cadeia dupla, seguindo-se a sequenciação directa (Marlowe
et al, 2000). As sequências nucleotídicas obtidas são submetidas a análise filogenética:
145
Epidemiologia Molecular do HIV-1 em STP
por submissão destas em formato FASTA a algoritmos bioinformáticos existentes nas
bases de dados, e análise dos alinhamentos múltiplos, de forma a serem detectadas as
semelhanças e dissemelhanças, para a determinação dos ancestrais comuns entre as
sequências das estirpes identificadas.
Este tipo de teste é relativamente moroso e considerado um teste complexo,
devido a dificuldades de interpretação dos dados. Não obstante as reavaliações
frequentes, o processo de genotipagem de subtipos não-B apresenta ainda
incongruências entre os vários algoritmos na interpretação dos resultados,
possivelmente por sua optimização ter sido originalmente efectuada para os vírus do
subtipo B. Por outro lado tem-se vindo a verificar melhoria destes algoritmos. Uma
limitação considerada relevante refere-se ao facto do teste só ser exequível para os
infectados com carga viral superior a 500-1000 cópias por mililitro.
Foram utilizados os algoritmos de subtipagem dos sítios de Internet: HIVSeq
database (Rhee et al, 2003) e REGA subtyping tool (de Oliveira et al, 2005). Em casos
de ambiguidades, as sequências nucleotídicas foram analisadas com um software
adicional SimPlot (Ray, 1999), com o algoritmo jpHMM-HIV, do sítio da
Universidade de Göttingen (Zhang et al, 2006; Schultz et al, 2006). Todos estes
algoritmos apresentaram discrepâncias, quer em si próprios, quer uns com os outros.
Este facto, que pode comprometer o processo de subtipagem, é sobretudo devido à
crescente prevalência de cada vez mais variantes genéticas virais novas.
O algoritmo HIVSeq (Rhee et al, 2003) registou grande variabilidade viral em
São Tomé e Príncipe, com diversas variantes genéticas, nomeadamente subtipos e
recombinantes (CRF02_AG, CRF02_AG/A, CRF02_AG/G, CRF02_AG/H,
K/CRF02_AG, CRF01_AE/CRF02_AG (ou A1/G ou A1/G/A1), A/U, G/U e J/G).
Apenas registou presença do subtipo K em recombinação com CRF02_AG (Figuras
3.6-3.7), enquanto tanto REGA subtyping Tool (de Oliveira et al, 2005) como jpHMM-
HIV (Zhang et al, 2006 e Schultz et al, 2006) não o puderam detectar.
O resultado de submissão das sequências ao algoritmo REGA subtyping Tool
(de Oliveira et al, 2005) classificou 4 variantes recombinantes (CRF02_AG,
A/CRF02_AG, CRF06_cpx e J_U) (Figura 3.7). Os resultados de ambos algoritmos
foram sobreponíveis apenas em relação aos subtipos puros C, D e J. Verificaram-se
resultados discrepantes entre os algoritmos ao nível da análise de recombinantes. Em
análise de recombinantes, todas as estirpes CRF01_AE/A do gene pol identificadas
146
Epidemiologia Molecular do HIV-1 em STP
por HIVSeq (Rhee et al, 2003) foram classificadas como sub-subtipo A (A1) pelo
REGA subtyping Tool (de Oliveira et al, 2005).
Um dos pontos de concordância entre os algoritmos foi a existência de elevada
diversidade genética viral no país. Também concordaram na completa ausência de
vírus do subtipo B, que é predominante nos países da Europa, Américas e Austrália. O
subtipo B representa 10-12% dos casos de infecção por HIV no mundo (Hemelaar et
al, 2006). De acordo com alguns estudos tem-se verificado relativa diminuição da
prevalência dos subtipos B, em detrimento dos subtipos não-B (Spira et al, 2003).
Estes factos poderão dificultar o Sistema Nacional de Saúde de São Tomé e Príncipe,
quer ao nível de diagnóstico, quer para o estabelecimento de protocolos relacionados
com a terapêutica aos antirretrovirais, dado tanto os testes diagnósticos como os ARVs
terem sido optimizados para o subtipo B. Saliente-se ainda que as discrepâncias entre
os algorítmos de subtipagem são a nível de pormenor, particularmente na constituição
de recombinantes. Não se verificou qualquer amostra ser classificada como subtipo
puro num algorítmo e como outro subtipo puro diferente no outro. Assim, pode-se
interpretar este facto como dificuldades destes algorítmos (que são apenas ferramentas
automáticas, é bom não esquecer) em classificar fragmentos de genoma, ou
combinações de fragmentos de genoma, que são novos.
As inferências filogenéticas das sequências nucleotídicas do gene pol,
relativamente à análise de subtipos e recombinantes apontam para um perfil de
infecção heterogénea em São Tomé e Príncipe, com predominância de estirpes
recombinantes CRF02_AG, 35 (38%) no “HIVSeq” e 38 (41%) no REGA subtyping
Tool, tal como nos países limítrofes da costa Ocidental Africana, nomeadamente
Nigéria (Howard et al, 1994; McCutchan et al, 1999; Peeters et al, 2000b), Camarões
(Carr et al, 1998; 2001; Mboudjeka et al, 1999; Burda et al, 2004), Gabão (Pandreia et
al, 2002) e Guiné Equatorial (Ortiz et al, 2001), com excepção de Angola, que
apresenta baixa prevalência deste recombinante (Abecasis et al, 2005; Bártolo et al,
2005; Garrido et al, 2008) (Figuras 3.22-3.26). No total, das 93 sequências do gene pol
do HIV-1 analisadas, 64 (70%) no “HIVSeq” e 67 (73%) no REGA subtyping Tool,
foram classificadas como subtipos A, G ou um dos seus recombinantes. Com efeito, os
estudos conduzidos com amostras de determinados países de África, confirmam a
predominância destas formas virais e seus recombinantes nas regiões Central e
Ocidental do Continente Africano (Laurent & Delaporte, 2001; Laurent et al, 2002;
Peeters, 2003; Toni et al 2005; Pandrea et al, 2005; Njai et al, 2006). Note-se que as
147
Epidemiologia Molecular do HIV-1 em STP
variantes virais CRFs têm os segmentos do genoma derivados de dois ou mais
subtipos. Os subtipos C, A e CRF02_AG representam aproximadamente 75% das
estimadas 14.000 novas infecções por dia no mundo (Heeney et al, 2006).
148
Epidemiologia Molecular do HIV-1 em STP
Figura 3.22 Variantes genéticas do HIV-1 em Angola.O gráfico mostra as variantes genéticas do HIV-1 em Angola, quer das formas recombinantes como não recombinantes (Adaptado da Base de Dados de Los Alamos, 2008 - http://www.hiv.lanl.gov/).
149
Epidemiologia Molecular do HIV-1 em STP
Figura 3.23. Variantes genéticas do HIV nos Camarões.O gráfico mostra as percentagens das variantes genéticas do HIV-1 nos Camarões, quer das formas recombinantes como não recombinantes. As variantes pertencem ao grupo M, e O pertence ao grupo O, também presente nos Camarões (Adaptado da Base de Dados de Los Alamos, 2008 - http://www.hiv.lanl.gov/ ).
150
Epidemiologia Molecular do HIV-1 em STP
Figura 3.24. Variantes genéticas do HIV-1 do Gabão.O gráfico mostra as percentagens das variantes genéticas do HIV-1 no Gabão, quer das formas recombinantes como não recombinantes. As variantes pertencem ao grupo M, e O pertence ao grupo O, que também co-circula neste país (Adaptado da Base de Dados de Los Alamos, 2008 - http://www.hiv.lanl.gov/ ).
151
Epidemiologia Molecular do HIV-1 em STP
Figura 3.25. Variantes genéticas do HIV-1 da Guiné Equatorial. O gráfico mostra as variantes genéticas do HIV-1 na Guiné Equatorial, quer recombinantes quer não recombinantes. As variantes pertencem ao grupo M, e o O representa o grupo O, que co-circula neste país (Adaptado da Base de Dados de Los Alamos, 2008 - http://www.hiv.lanl.gov/ ).
Figura 3.26. Variantes genéticas do HIV-1 da Nigéria.O gráfico mostra as variantes genéticas do HIV-1 na Nigéria, quer recombinantes quer não recombinantes (Adaptado da Base de Dados de Los Alamos, 2008 - http://www.hiv.lanl.gov/ ).
152
Epidemiologia Molecular do HIV-1 em STP
Saliente-se que a variante CRF02_AG, cuja estirpe de referência é a IbNg, da
Nigéria, é a forma recombinante dos subtipos A e G mais prevalente na África Central
e Ocidental (Figura 1.13). Esta variante viral representa 50-70% das estirpes em
circulação nesta região (Peeters, 2000; Carr et al, 2001). O primeiro exão do rev, e os
genes gag e vpr são do subtipo A, enquanto os outros genes são quimeras A/G.
Encontraram-se novos tipos de recombinantes A/G, exibindo diferentes pontos de
recombinação em relação à estirpe padrão IbNg, tendo sido nomeadamente
identificados nos Camarões (Carr et al, 2001) e em emigrantes africanos residentes na
Holanda (Cornelissen et al, 2000). Num estudo recente, os autores tentaram
demonstrar que o subtipo G é ele próprio um recombinante, e não um subtipo puro
(Abecasis et al, 2007). No presente estudo, foi detectada recombinação da estirpe
CRF02_AG, com vários subtipos, sub-subtipos, CRFs e URFs, produzindo
recombinantes considerados de 2ª geração, tal como se verifica com CRF09_cpx
(McCutchan et al, 2004; Brodine et al, 2003), CRF36_cpx (Powell et al, 2007b) e
CRF37_cpx (Powell et al, 2007a). Verifica-se que uma pequena percentagem de
CRF02_AG integra subtipos, sub-subtipos e mesmo CRFs pertencentes a uma nova
geração, revelando por si só um processo evolutivo baseado em recombinações, tal
como A/CRF02_AG, K/CRF02_AG, CRF02_AG/G, CRF02_AG/H, CRF02_AG/U,
CRF01_AE/CRF02_AG e CRF01_AE/A. À excepção da CRF01_AE/CRF02_AG e
CRF01_AE/A, estas foram inicialmente classificadas pelo REGA Subtyping Tool
como CRF06_cpx, e após reavaliação por uma versão actualizada deste algoritmo em
Junho de 2008, mostraram diferenças na constituição genómicas, integrando na sua
constituição um fragmento U_CRF06_cpx (Figura 3.8).
A estirpe recombinante CRF09_cpx, de origem Senegalesa, integra para além
da CRF02_AG, o subtipo A e um fragmento não subtipável, U (McCutchan, 2000;
McCutchan et al , 2004 ; Brodine et al, 2003). Um cenário semelhante se constata com
a estirpe recombinante CRF30_0206, que inclui tanto o CRF02_AG como CRF06_cpx
(Montavon et al, 2002). As duas estirpes recentemente identificadas, anteriormente
referidas, constituem evidência do processo de integração e evolução das estirpes
CRF02_AG: CRF36_cpx (A, G, CRF01_AE, CRF02_AG) e CRF37_cpx (A, G,
CRF01_AE, CRF02_AG, U) (Powell et al, 2007a,b). Assim, nas últimas décadas tem-
se vindo a registar um processo de diversificação de vírus recombinantes, incluindo
subtipos, inter-subtipos e as CRFs, exibindo complexos genomas em mosaicos, facto
que evidência acentuado incremento das infecções por formas recombinantes ou
153
Epidemiologia Molecular do HIV-1 em STP
superinfecções com vírus de subtipo/formas recombinantes diferentes na pandemia da
SIDA, também se detectando este facto em São Tomé e Príncipe.
Nos Camarões, país em que são frequentes não só os vírus do grupo M, mas
também, do grupo O, uma equipa de investigadores avaliou os desempenhos dos testes
de diagnóstico de HIVs licenciados pela FDA através de rastreio das 240 amostras de
plasma dos dadores, utilizando tanto os testes rápidos de rastreio como os de
amplificação dos ácidos nucleícos para determinação dos subtipos. Concluíram que
nas amostras de plasma o HIV-1 é detectado na grande maioria, mas não em todos, dos
testes licenciados por FDA, mas o antigénio p24 não foi detectado em nenhuma das
amostras. Verificaram ainda que alguns testes baseados na amplificação de ácido
nucleíco não detectaram uma parte de amostras com serologia reactiva, ainda que
pequena (Lee et al, 2006). Situações semelhantes têm sido suspeitas em São Tomé e
Príncipe, dada a grande predominância de estirpes recombinantes. Caracterizadas pela
associação no seu genoma de fragmentos de dois subtipos, A e G, as estirpes
recombinantes CRF02_AG identificadas em São Tomé e Príncipe exibem uma
recombinação específica, integrando genomas virais de quase todas variantes
detectadas até a presente data, constituindo evidência de um processo de evolução
rápida, como se tem vindo a constatar com outras estirpes do HIV-1, grupo M.
Também a estirpe CRF02_AG (ST15) apresentou estrutura genómica de difícil
classificação, desde CRF02_AG e U_CRF02_AG pelo REGA Subtyping Tool,
CRF02_AG/CRF01_AE pelo HIVSeq, com o recurso ao software SimPlot foi
classificada como URF_A1/G/A, e finalmente pelo jpHMM-HIV-1 da Universidade de
Göttingen como A1 (Figuras 3.11a-b; 3.15 e 3.16).
Em análise de recombinantes, as estirpes CRF02_AGs identificadas formam
cluster monofilético com baixa percentagem de variação das posições polimórficas.
Uma estirpe CRF02_AG, nomeadamente a ST15 exibe características semelhantes às
da variante viral de referência, AY444295, identificada nos Camarões e classificada
como uma CRF02_AG, sugerindo múltiplas introduções de infecção no país, podendo
ter originado um cluster de transmissão local. Saliente-se que a sequência ST15
pertence a uma pessoa do sexo feminino, com cerca dos 34 anos, cuja profissão é
“Caixeiro-viajante”, tendo frequentado os países da Costa Ocidental Africana,
nomeadamente Gabão e Camarões.
154
Epidemiologia Molecular do HIV-1 em STP
A análise dos aminoácidos das formas genéticas CRF02_AG mostrou
divergências em alguns aminoácidos (PR 3 e 37) em relação a outras formas genéticas
virais semelhantes estudadas no Continente, sugerindo a possibilidade de evolução
específica do vírus em São Tomé e Príncipe, e sendo necessária a implementação de
estudos adicionais neste âmbito com um número significativo de sequências destas
formas genéticas virais. Estudos adicionais poderão confirmar ou infirmar esta
hipótese. Por outro lado, ao serem comparadas as variantes de HIV-1 detectadas neste
estudo de investigação, com as dos países com ligação a São Tomé e Príncipe, tais
como Angola, Gabão, Guiné Equatorial, Camarões e Nigéria, verificou-se grande
proximidade e mesmo a formação dos clusters monofiléticos entre elas. Estas relações
filogenéticas sugerem que as variantes virais do HIV-1 são disseminadas dos países da
Costa Ocidental Africana para o arquipélago, e talvez vice-versa, constatando-se nelas
os mesmos ancestrais evolutivos.
O conhecimento das variantes do HIV-1 circulantes permite contextualizar a
monitorização das mutações de resistências, em função da introdução da terapêutica
com os ARVs. E ao serem conhecidas as variantes genéticas do HIV-1 em circulação
no país, abre-se uma janela de oportunidade para a selecção das estirpes genéticas a
integrarem as hipotéticas vacinas para a população são-tomense.
155
Epidemiologia Molecular do HIV-1 em STP
3.6. ConclusõesFoi constatada uma grande diversidade genética do HIV-1, grupo M, num
pequeno país, cuja população rondava os 140.000 habitantes em 2001. Este facto
sugere várias introduções independentes.
Tal como nos países limítrofes, verificou-se existir predominância da variante
recombinante CRF02_AG em STP, sugerindo disseminação regional. A presença de
uma estirpe são-tomenses semelhantes à de origem Camaronesa (AY444295) concorda
com esta interpretação. A estirpe AY444295 apresenta semelhanças com as ST15, não
obstante as discrepâncias apresentadas pelos algorítmos de subtipagem utilizados no
presente estudo de investigação.
Foi elevada a diversidade genética do HIV-1 em circulação, em STP, o que
também constituirá um obstáculo à adopção de vacinas eficazes de uso global, quando,
e se, forem produzidas. Do mesmo modo levanta a questão da fiabilidade dos testes de
HIV-1 em uso no país. Questão que se prende com a optimização dos testes para os
subtipos não-B, é prioritária para os países, como STP, onde a maioria dos isolados de
HIV-1 são de grupo M não-B, não se excluindo a hipótese – apesar de extremamente
baixa - de existirem em circulação vírus dos grupos N e O. Estes subtipos e formas
genéticas virais emergentes poderão causar cross linked antigenic reaction,
apresentando resultados inconclusivos dos testes de screening para HIV-1, quase todos
optimizados para estirpes do subtipo B.
As inferências filogenéticas sugerem que as variantes virais do HIV-1 são
disseminadas dos países da Costa Ocidental Africana para o arquipélago e vice-versa,
constatando-se nelas os mesmos ancestrais evolutivos. As formas recombinantes
CRF02_AG apresentaram divergências nalguns aminoácidos (PRO 3 e 37) em relação
a outras formas semelhantes estudadas no continente, o que pode apontar para a
possibilidade de evolução específica do vírus no próprio arquipélago. Outros estudos
serão necessários para confirmar ou infirmar esta hipótese.
156
Epidemiologia Molecular do HIV-1 em STP
157