22
Revista Chilena de Historia Natural 82: 277-297, 2009 ARTÍCULO DE REVISIÓN Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica en análisis evolutivos y de distribución Methodological advances for the combined study of genetic, genealogical and geographical information in evolutionary and distributional analyses ELLA VÁZQUEZ-DOMÍNGUEZ * , SUSETTE CASTAÑEDA-RICO, TANIA GARRIDO-GARDUÑO & TANIA A. GUTIÉRREZ-GARCÍA Departamento de Ecología de la Biodiversidad, Instituto de Ecología, Universidad Nacional Autónoma de México, Apartado Postal 70-275, Ciudad Universitaria, México DF, 04510, México * Autor correspondiente: [email protected] RESUMEN El análisis de la distribución de linajes de genes a lo largo de su distribución geográfica, para elucidar patrones y procesos históricos, evolutivos y ecológicos que determinan la distribución de la biota en el planeta, conforma la disciplina de estudio conocida como filogeografía. En esta revisión presentamos un resumen de la historia, definición y progresos de la filogeografía, profundizando sobre las herramientas, métodos y técnicas utilizadas para desarrollar estudios filogeográficos. Sintetizamos los fundamentos y avances analíticos y teóricos, con explicaciones mediante ejemplos relevantes que permitirán a los lectores obtener el sentido y alcances de esta área de investigación. Finalmente, indicamos las nuevas líneas de análisis y estudio de la filogeografía. Palabras clave: ADN, coalescencia, estadísticos de resumen, filogeografía, genealogías de genes. ABSTRACT Phylogeography is a discipline that involves the analysis of the distribution of gene lineages throughout their geographical range, with the objective of evaluating and elucidating the historic, evolutionary and ecological patterns and processes that determine the global distribution of the biota. In the present review we present a summary of the history, definition and progresses of phylogeography, deepening about the tools, methods and techniques used to perform phylogeographical studies. We synthesize the fundamentals and theoretical and analytical advances, with explanations based on relevant examples that will allow readers to acquire the sense and scope of this research field. Finally, we point out the novel routes of phylogeographic analysis and study. Key words: DNA, coalescence, gene genealogies, phylogeography, summary statistics. INTRODUCCIÓN La filogeografía, a 20 años de su nacimiento como disciplina de estudio (Avise et al. 1987), ha acuñado diversas definiciones, de las cuales la más ampliamente utilizada es la que formuló John Avise, en el 2000, en su libro Phylogeography, the history and formation of species: “es el campo de estudio relacionado con los principios y procesos que gobiernan la distribución geográfica de linajes de genes, sobre todo aquellos entre y dentro de especies cercanamente relacionadas” (Avise 2000). Sin embargo, la filogeografía, como la entendemos hoy, se enmarca en un área más amplia denominada ecología molecular, la cual se define, de manera general, como el conocimiento y aplicación de marcadores genéticos moleculares para explorar preguntas y problemas en ecología y evolución. La naturaleza y la escala de los estudios de ecología molecular están definidas por el hecho de que se estudian las relaciones genéticas entre individuos, poblaciones y especies, que se

Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

277AVANCES METODOLÓGICOS EN FILOGEOGRAFÍARevista Chilena de Historia Natural82: 277-297, 2009

ARTÍCULO DE REVISIÓN

Avances metodológicos para el estudio conjunto de la informacióngenética, genealógica y geográfica en análisis evolutivos

y de distribución

Methodological advances for the combined study of genetic, genealogical and geographicalinformation in evolutionary and distributional analyses

ELLA VÁZQUEZ-DOMÍNGUEZ*, SUSETTE CASTAÑEDA-RICO, TANIA GARRIDO-GARDUÑO& TANIA A. GUTIÉRREZ-GARCÍA

Departamento de Ecología de la Biodiversidad, Instituto de Ecología, Universidad Nacional Autónoma de México,Apartado Postal 70-275, Ciudad Universitaria, México DF, 04510, México

* Autor correspondiente: [email protected]

RESUMEN

El análisis de la distribución de linajes de genes a lo largo de su distribución geográfica, para elucidarpatrones y procesos históricos, evolutivos y ecológicos que determinan la distribución de la biota en elplaneta, conforma la disciplina de estudio conocida como filogeografía. En esta revisión presentamos unresumen de la historia, definición y progresos de la filogeografía, profundizando sobre las herramientas,métodos y técnicas utilizadas para desarrollar estudios filogeográficos. Sintetizamos los fundamentos yavances analíticos y teóricos, con explicaciones mediante ejemplos relevantes que permitirán a los lectoresobtener el sentido y alcances de esta área de investigación. Finalmente, indicamos las nuevas líneas deanálisis y estudio de la filogeografía.

Palabras clave: ADN, coalescencia, estadísticos de resumen, filogeografía, genealogías de genes.

ABSTRACT

Phylogeography is a discipline that involves the analysis of the distribution of gene lineages throughout theirgeographical range, with the objective of evaluating and elucidating the historic, evolutionary and ecologicalpatterns and processes that determine the global distribution of the biota. In the present review we present asummary of the history, definition and progresses of phylogeography, deepening about the tools, methods andtechniques used to perform phylogeographical studies. We synthesize the fundamentals and theoretical andanalytical advances, with explanations based on relevant examples that will allow readers to acquire the senseand scope of this research field. Finally, we point out the novel routes of phylogeographic analysis and study.

Key words: DNA, coalescence, gene genealogies, phylogeography, summary statistics.

INTRODUCCIÓN

La filogeografía, a 20 años de su nacimientocomo disciplina de estudio (Avise et al. 1987),ha acuñado diversas definiciones, de las cualesla más ampliamente utilizada es la que formulóJohn Avise, en el 2000, en su libroPhylogeography, the history and formation ofspecies: “es el campo de estudio relacionadocon los principios y procesos que gobiernan ladistribución geográfica de linajes de genes,sobre todo aquellos entre y dentro de especies

cercanamente relacionadas” (Avise 2000). Sinembargo, la filogeografía, como la entendemoshoy, se enmarca en un área más ampliadenominada ecología molecular, la cual sedefine, de manera general, como elconocimiento y aplicación de marcadoresgenéticos moleculares para explorar preguntasy problemas en ecología y evolución. Lanaturaleza y la escala de los estudios deecología molecular están definidas por el hechode que se estudian las relaciones genéticasentre individuos, poblaciones y especies, que se

Page 2: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

278 VÁZQUEZ-DOMÍNGUEZ ET AL.

emplean marcadores genéticos moleculares, yque es necesario contar con informacióncualitativa y cuantitativa de cambios en laestructura o composición genética (Carvalho1998, Freeland 2005, Vázquez-Domínguez2007a).

La filogeografía trabaja con los componenteshistóricos, filogenéticos, de la distribuciónespacial de linajes de genes, y considera comoejes el tiempo y el espacio, en los cuales(idealmente) se mapean las genealogías deestudio. Al comparar las relaciones evolutivas delos linajes con su distribución geográfica, esposible tener un mejor entendimiento de cuálesfactores han influido más en la distribución de lavariación genética. Así, la filogeografía englobaaspectos tanto temporales (relaciones evolutivas)como espaciales (distribución geográfica).Asimismo, enfatiza aspectos históricos de ladistribución espacial actual de linajes de genes,utilizando información temporal (histórica) queha sido posible obtener a partir del uso y análisisde la información contenida en las moléculas deácido desoxirribunocleico (ADN); en otra escala(ecológica), enfatiza el papel de las presiones ofactores ecológicos contemporáneos en laconformación de la distribución espacial decaracteres. Por lo tanto, la filogeografía trata deinterpretar el modo y la extensión en que losprocesos históricos en la demografía pudierondejar marcas evolutivas en la distribucióngeográfica actual de caracteres genéticamentebasados (Avise 2000, Vázquez-Domínguez2002, Freeland 2005).

Marcadores moleculares en filogeografía

El acelerado desarrollo de técnicas molecularesen general, así como sobre el conocimiento dela molécula de ADN mitocondrial (ADNmt) enparticular (mediados-finales de los 70),contribuyó significativamente para laconsolidación de los análisis filogeográficos.Entre las características moleculares que hacenespecial al ADNmt están que es una moléculacircular covalentemente cerrada, de tamañopequeño (ca. 16-20 kilobases), conformada porun total de 37 genes (13 RNA mensajeros, 2RNA ribosomales y 22 RNA de transferencia),además de una región conocida, en vertebradosy equinodermos, como región control (ca. 1 kb)o d-loop (fragmento más pequeño dentro de laregión control misma), que controla la

replicación y transcripción en la molécula ytiene una tasa excepcionalmente alta desustitución y de polimorfismos en muchostaxones (para una descripción detallada delADNmt ver Brown 1985, Wainscoat 1987, Luntet al. 1998). Las propiedades más interesantesen términos filogeográficos y particularmentedel ADNmt en animales son su alta tasa deevolución (sustitución) a nivel de secuencias denucleótidos, su prácticamente nularecombinación, gran variación intraespecífica,y más importante, su herencia estrictamentematerna (con muy escasas excepciones), quepermite describir la historia matrilineal deorganismos coespecíficos y con ello el poderaplicar estimaciones de reloj molecular y haceranálisis coalescentes (ver más adelante). ElADNmt de plantas, aunque habita también en elcitoplasma y codifica grupos similares degenes, no está regido por las mismas reglas queel animal; evoluciona de manera rápidarespecto al orden de los genes, pero despacio ensecuencias nucleotídicas (Palmer 1990). ElADN de cloroplasto (ADNcp), aunque conciertos problemas como la posibilidad de tenerherencia biparental en algunos taxones y tasasde evolución de moderadas a bajas, ha sido laopción más exitosa para desarrollar estudiosfilogeográficos con plantas (Soltis et al. 1992).Estas razones, además de que existe un grannúmero de oligonucleótidos (‘primers’)mitocondriales universales para animales, hatenido como consecuencia que los estudiosfilogeográficos de animales hayanhistóricamente quintuplicado aquellos deplantas.

Sin embargo, el uso de ADNmt representaproblemas que hay que tomar en cuenta: dadoque implica un único locus, tiene limitacionesen cuanto a la reconstrucción de historiaspoblacionales, sobre todo si ese locus ha estadosujeto a selección o algún otro proceso, o si elADNmt pasó recientemente de una especie aotra por hibridización. También son deconsiderarse su alta sensibilidad a cuellos debotella y la posibilidad de que su herenciamaterna resulte en una reconstrucciónincompleta de la historia poblacional sihembras y machos tienen patrones dedispersión diferentes (Avise 2000, Freeland2005). La forma más adecuada de probar si unagenealogía de ADNmt refleja correctamente lahistoria es evaluando su concordancia con

Page 3: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

279AVANCES METODOLÓGICOS EN FILOGEOGRAFÍA

genealogías inferidas con regiones de ADN enotros genomas: en plantas normalmente secomparan con plástidos (orgánulos limitadospor membrana que se encuentran solamente enlas células de plantas y algas) y regionesnucleares, mientras que en animales solo esposible con loci nucleares. Ello conllevaproblemas inherentes, sobre todo por laposibilidad de recombinación que implica quediferentes partes de un mismo locus puedentener diferente historia evolutiva; sin embargo,también se ha encontrado, en un buen númerode estudios fi logeográficos con genesnucleares, que la recombinación no esnecesariamente un problema insalvable (Hare2001, Husmeier & Wright 2001).

Por otro lado, dados los cientos o miles demoléculas de ADNmt que tiene un individuo, laheteroplasmia –que es la presencia de dos omás haplotipos mitocondriales dentro de unamisma célula– parecía un problema potencialen estudios filogeográficos. Contrario a loesperado, se conoce que los casos deheteroplasmia son mínimos y no representan unproblema en estudios rutinarios con ADNmt enanimales. Por el contrario, se reconoce queexiste la posibilidad de efectos de cambioshomoplásicos (caracteres similares pero noderivados de un ancestro común) en estudioscon ADNmt, por ejemplo cambios paralelos oconvergentes en sitios de restricción, sobretodo en términos de ambigüedad en laconstrucción de los árboles o redes dehaplotipos. Cabe mencionar que no solo existenya formas de evaluar y lidiar con la homoplasia(ver Templeton 1983), sino que los problemasaquí señalados cuando se usa ADNmt sonactualmente fáciles de identificar por la granexperiencia acumulada a través de los múltiplesestudios filogeográficos publicados (para unalista de ejemplos en animales ver Avise 2000,Vázquez-Domínguez 2007b y en plantasFreeland 2005, Eguiarte et al. 2007), así comoel impresionante desarrollo que han tenido losmétodos de análisis (extensa revisión enEmerson et al. 2001, Hare 2001, Posada &Crandall 2001, Knowles & Maddison 2002,Hey & Machado 2003, Templeton 2004, Posadaet al. 2006, Eguiarte et al. 2007). Finalmente, lamayoría de los estudios filogeográficos que hanutilizado genes nucleares se han basado en lasecuenciación de genes específicos (e.g.microsatélites). Asimismo, en filogeografía

existe un interés creciente por usarpolimorfismos de nucleótidos únicos (singlenucleotide polymorphisms, SNPs) de múltiplesloci para reconstruir historias poblacionales,dado que los SNPs representan la forma másprevaleciente de variación genética (Brumfieldet al. 2003).

Un ejemplo con ADNmt donde se muestrauna clara estructura filogeográfica es el trabajode Grazziotin et al. (2006), donde empleancitocromo b para analizar un complejo deserpientes (Familia Viperidae) que sedistribuye en el bosque brasileño del Atlánticoy que incluye a una especie continentalBothrops jararaca (Wied-Neuwied, 1824), ydos especies insulares B. insularis (Amaral,1922) y B. alcatraz (Marques, Martins &Sazima, 2002). Los resultados indican que estasdos últimas especies se originaronrecientemente a partir de la primera, pero pordistintos eventos durante el Pleistoceno (origenparafilético). Por otro lado, se identificaron dosfilogrupos continentales (norte y sur) con untiempo de divergencia de aproximadamente 3.8millones de años (MA) (Plioceno). El grupo delsur muestra una mayor fluctuación del tamañopoblacional y menor diversidad genética que elnorte, lo que se atribuye a que el sur de Brasiltuvo un mayor impacto de las oscilacionesclimáticas durante el Pleistoceno (e.g. Behling& Lichte 1997, Behling & Negrelle 2001). Enotro ejemplo con citocromo b, se ha podidoconfirmar que la ruta migratoria del roedorOtotylomys phillotis (Merriam, 1901) fue de sura norte (Centroamérica hacia sur de México),durante el gran intercambio biótico que se dioal formarse el istmo de Panamá haceaproximadamente 3 MA (Gutiérrez-García &Vázquez-Domínguez resultados no publicados).

No solo el ADNmt ha mostrado óptimosresultados en estudios filogeográficos, porejemplo en un estudio con Arabis alpina (L.)donde se empleó ADN de cloroplasto (regióntrnL-F) y nuclear (ITS), ambos marcadoresmostraron, con ligeros cambios, una claradiferenciación genética y estructurafilogeográfica a lo largo de la distribución de laespecie, reconociéndose básicamente tresgrupos: este de África, Asia y el Mediterráneo-Europa (Koch et al. 2006). Se pudo determinarque hubo tres procesos de dispersión a partir delas poblaciones de Asia (Medio Este),poblaciones además con altas tasas de

Page 4: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

280 VÁZQUEZ-DOMÍNGUEZ ET AL.

diversidad genética: i) hacia África vía lapenínsula Arábica, ii) por el oeste hacia Europay el norte de África y más tarde hacia el norte,iii) una nueva migración hacia el este de África(Koch et al. 2006). Algunos de estos patronesse han encontrado para otras especies deplantas (e.g. Mummenhoff et al. 2001, Bleekeret al. 2002).

Reloj molecular

Una forma sencilla de evaluar las relacionesevolutivas entre diferentes alelos es estimarcuánto difieren dos secuencias homólogas. Estoes, se puede estimar hace cuánto tiempodivergieron dos secuencias con base en qué tandiferentes son una de otra, pues secuenciassimilares en general habrán divergidorecientemente y secuencias muy diferenteshabrán sido evolutivamente independientes porun tiempo relativamente largo. Dichaestimación se hace normalmente con base en elnúmero de diferencias en las bases y se expresacomo el porcentaje de sitios variables entrepares de secuencias, aunque modelos máscomplejos toman en cuenta procesosmutacionales, por ejemplo dando diferente pesoa las transiciones y transversiones o a lassubstituciones sinónimas respecto a las no-sinónimas.

En los años 1960 se tenía la idea de que lassecuencias de ADN evolucionaban a tasas casiconstantes y por lo tanto que la diferencia entredos secuencias podía utilizarse para estimardirectamente el tiempo de divergencia entreestas, a lo que se le conoce como relojmolecular (Zuckerkandl & Pauling 1965). Lacalibración del reloj molecular se basa en lafecha aproximada cuando dos linajes genéticosdivergieron, fecha que idealmente deberíaobtenerse de información independiente de lamolecular, por ejemplo del registro fósil o deun evento geológico conocido (e.g. surgimientode una isla). Posteriormente se calcula el valorde divergencia (de las secuencias) que hahabido desde esa fecha, ello al dividir lacantidad de divergencia que ha ocurridodurante ese tiempo entre el tiempo estimadodesde que divergieron, con lo que se obtieneuna estimación de la tasa a la que ha ocurrido laevolución molecular (o lo que es lo mismo, latasa a la que el reloj molecular ha idocaminando).

Por ejemplo, si se tienen dos secuencias de500 pares de bases (pb), las cuales difieren en20 pb y se conoce un evento geológico quesucedió hace 1 millón de años, se tiene que:

Fechado = 1.000.000 añosCantidad de divergencia = 20/500 = 0,04 (= 4 %)

Calibración: dado que normalmente seexpresa en términos de porcentaje dedivergencia por millón de años, en este ejemplola calibración del reloj molecular sería de 4 %de divergencia por cada millón de años.

Tomando en cuenta que los diferenteshaplotipos dentro de una población registran lahistoria matrilineal de eventos mutacionales, lafilogeografía ha podido emplear estimacionesdel reloj molecular, ya sea de ADNmt o demarcadores nucleares. El ADNmt tiene una tasade diferenciación alta, pero muy variable entregrupos taxonómicos; el reloj molecular másampliamente utilizado es el de vertebrados –ymás específicamente mamíferos– deaproximadamente 2 % de divergencia desecuencias por cada millón de años (Brown etal. 1979). Sin embargo, este reloj constante esatribuible solo a cambios en ciertas posicionesde nucleótidos específicas, además de quediferentes regiones y genes del ADNmt mismopresentan variadas tasas de evolución dentro deun linaje. Por ejemplo, la región control ha sidoparticularmente útil para análisisfilogeográficos en escalas muy pequeñas detiempo microevolutivo (e.g. miles o cientos demiles de años), ya que tiene una tasaexcepcionalmente rápida de sustitución denucleótidos y altos niveles de polimorfismointraespecífico (Lunt et al. 1998). Aunque noexisten reglas específicas, la tasa de mutacióndel ADNmt parece variar de acuerdo conciertas variables taxonómicas, como hábitotermal, tiempo generacional y tasa metabólica(Martin & Palumbi 1993), por lo que es mejorusar un reloj molecular que haya sido calibradodentro del grupo taxonómico y región génica deestudio. Se ha observado que existe variacióntemporal en cuanto a la tasa de sustitución, yque esta tasa es además específica a cada gen,lo cual debe considerarse al hacer estimacionesde tasas evolutivas (Bedfor & Hartl 2008).

García-Moreno et al. (2004) utilizan relojmolecular con la tasa de diferenciación del 2 %para estimar tiempos de divergencia de

Page 5: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

281AVANCES METODOLÓGICOS EN FILOGEOGRAFÍA

Chlorospingus ophthalmicus (Du Bus deGisignes, 1847), especie de ave restringida abosques mesófilos en México, entre diferenteslocalidades que corresponden a complejosmontañosos. Así, sus resultados muestran quelas poblaciones del norte y sur de la SierraMadre Occidental se diferenciaron hace 450.000años. Por otro lado, Devitt (2006) realizó unanálisis filogeográfico para evaluar la historiaevolutiva y biogeográfica de Trimorphodonbiscutatus (Duméril Bibron & Duméril, 1854)(serpiente) a lo largo de su distribución entre lazona de transición neártica y neotropical deMéxico. Para ello, utilizó un reloj molecularcalculado con un método Bayesiano para obtenertiempos de divergencia. El método requiere dediferentes puntos de calibración (superior einferior) en ausencia de registro fósil, para locual se consideró la edad (11 MA) y la velocidadde evolución (0,07 substituciones/sitio/millonesde años) del nodo del grupo externo y el rangode edad de dos nodos internos (14-7 MA y 8-4MA), basados en datos geológicos del EjeNeovolcánico Transversal y de la península deBaja California. Con ello pudieron datar concerteza los cinco clados obtenidos, cuyadiferenciación es consistente con un modelo devicarianza durante el Neógeno.

Demografía y coalescencia

Bajo neutralidad, en una población de tamañoconstante y a lo largo de las generaciones,surgen de forma permanente nuevos alelos pormutación y se pierden otros por deriva génica,de tal forma que todos los alelos de un gen enuna generación derivan de –o coalescen hacia–un único alelo ancestral. Dado que la mayoríade las mutaciones ocurren en un único punto enel tiempo y el espacio, es posible hacerinferencias de eventos pasados así, lapropagación de cada nueva mutación (alelo) esafectada por patrones de dispersión, tamañopoblacional, selección natural y otros procesosque pueden deducirse a partir de la distribuciónactual de dichas mutaciones (Freeland 2005).De esta forma, al ver hacia atrás en el tiempo,los haplotipos de ADNmt o de cualquier gennuclear, eventualmente coalescen hacia elancestro común más reciente (ACMR). Sepuede identificar el ACMR utilizando lacoalescencia (teoría de coalescencia), la cual sebasa en una teoría matemática desarrollada por

Kingman (1982) para describir la genealogía degenes neutrales hacia atrás en el tiempo (parauna revisión amplia ver Hudson 1990, 1998).Esto es, si aplicamos la coalescencia a lassecuencias de múltiples alelos de un locusparticular, se pueden describir las historiasevolutivas de esos alelos al rastrear hacia atrásel punto en el cual coalescen (se unen). Así, losprocesos de coalescencia en poblacionesnaturales “garantizan” las conexionesfilogenéticas entre genotipos dentro de unaespecie, vía sendas verticales de descendencia.La teoría de coalescencia moderna es la formade evaluar los procesos de ramificación deárboles genealógicos (Hudson 1990, 1998,Nordborg 2000).

Aunque la teoría es complicada, el conceptogeneral de coalescencia es relativamentesencillo: líneas matrilineales semejantes a un‘pedigree’ (ver Fig. 1) muestran cómo,partiendo de información del presente(haplotipos diferentes), es posible trabajarhacia atrás en el t iempo (n número degeneraciones) para reconstruir la historia delinajes genéticos (n número de individuos),dentro de una población en particular. De lostres linajes que se muestran en oscuro en laFigura 1, los haplotipos A y B coalescenprimero, mientras que el ACMR de los treslinajes está ubicado más atrás en el tiempo.Eventualmente, todos los alelos dentro decualquier población (sin considerar migrantesrecientes) deberán coalescer a un único aleloancestral, sin embargo, cuánto tiempo hayatenido que transcurrir dependerá de múltiplesfactores, pero principalmente del tamañoefectivo de la población (Ne): la relación entreel t iempo de coalescencia y el tamañopoblacional es directa, porque la probabilidadde que un par de secuencias coalescan en unpunto –histórico– está en función del tamaño dela población, y mientras más pequeño sea éste,más rápidamente coalescerán.

Si una población tiene un tamaño constante deNe y los individuos dentro de la población tienenreproducción aleatoria durante cada generación,la probabilidad de que dos haplotipos diferentes‘elijan’ al mismo ‘padre’ (haplotipo ancestral) enla generación inmediata anterior y coalescan es 1/2Ne para un locus nuclear diploide y, en lamayoría de los casos, 1/Nef para ADNmt (Nef esel tamaño efectivo de hembras de la población).Asimismo, la probabilidad de que elijan padres

Page 6: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

282 VÁZQUEZ-DOMÍNGUEZ ET AL.

diferentes (i.e. no coalescan) es de 1 - 1/2Ne y 1 -1/Nef. El tiempo de coalescencia promedio detodos los haplotipos en una población es 4Ne y Ne

generaciones, para genes diploides ymitocondriales, respectivamente. Si consideramosque en las poblaciones naturales los factoresdemográficos (e.g. tasa de fecundidad, tasa demortandad, etc.) determinan los tamañospoblacionales, se entiende que existe unaintrincada relación entre demografía y la filogeniade genes, de manera que las variablesdemográficas son factores decisivos quegobiernan la profundidad, la forma y los patronesdemográficos de los árboles de genes. Al mismotiempo, demografía, filogenia y coalescencia serelacionan íntimamente, de manera que lademografía determina la dinámica de los procesosde ramificación y coalescencia de linajes, comopuede apreciarse en la Figura 2: se pueden inferircambios históricos del tamaño poblacional apartir de secuencias de poblaciones actuales, y

combinando la información de árbolesfilogenéticos y genealogías es posible determinarsi la población se ha mantenido relativamenteconstante (Fig. 2A), o si, por el contrario, hahabido un crecimiento (Fig. 2B) o decremento(Fig. 2C) exponencial. Una excelente revisiónsobre demografía y filogeografía se puedeconsultar en Avise (2000). Se conoce que eltiempo de coalescencia se ve afectado no solo porNe, sino por factores como fluctuaciones deltamaño poblacional, selección natural einmigración, entre otros. Por ello, modelosmatemáticos y estadísticos basados en la teoría decoalescencia deben considerar diversosparámetros demográficos, evolutivos y ecológicos(Nordborg 2000).

La coalescencia, junto con análisisdemográficos históricos, puede ayudar adeterminar la existencia de periodos de expansióno reducción poblacional. Ejemplo de ello son losestudios en los que se determina el tiempo al

Fig. 1: Relación evolutiva (genealógica) de cuatro haplotipos (individuos) dentro de una población.Los linajes de los haplotipos pueden rastrearse hacia atrás en el tiempo y así identificar los eventoscoalescentes. Por ejemplo, los haplotipos A y B tienen su ancestro común más reciente (ACMR)dos generaciones atrás (primer evento coalescente; ancestro señalado con un asterisco), mientrasque el ACMR de los haplotipos A, B y C (doble asterisco) se da cuatro generaciones atrás (segundoevento coalescente). Características como tamaño poblacional, selección natural y flujo génicodeterminan en gran medida los patrones de coalescencia.Genealogical relationship of four haplotypes (individuals) within a population. Haplotype lineages can be traced back on timeto identify coalescent events. For example, haplotypes A and B have their most recent common ancestor (MRCA) twogenerations back (first coalescent event; ancestor indicated by an *). While the MCRA of haplotypes A, B and C (double **)is four generations back (second coalescent event). Coalescent patterns greatly depend on factors such as population size,natural selection and gene flow.

Page 7: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

283AVANCES METODOLÓGICOS EN FILOGEOGRAFÍA

ancestro común más reciente y además seidentifica el comportamiento del tamaño de lapoblación a través del tiempo, como el trabajocon modelos de evolución humana de Templeton(2002). En este caso el autor comparó lospatrones de distribución histórica de laspoblaciones humanas de acuerdo con varios genesnucleares y mitocondriales (recordemos que cadagen tendrá diferente tiempo de coalescenciaesperado según su forma de herencia). Realizóajustes en los cálculos de tiempo de divergenciapara cada gen a partir de nueva evidencia, y pudo

así identificar la existencia de varios eventos deexpansión poblacional a partir de África y sudirección (ya sea hacia Asia o el Pacífico). Pudoademás describir los procesos asociados condichos eventos, como aislamiento por distancia,patrones de flujo génico y expansión a través deáreas continuas o discontinuas, y determinar elmomento en que posiblemente ocurrieron.También es posible determinar los efectos deprocesos vicariantes en la distribución de laestructura genética de poblaciones y especies(Smit et al. 2007).

Fig. 2: Se muestran genealogías hipotéticas de tres poblaciones, con sus árboles filogenéticoscorrespondientes, de (A) población de tamaño constante, (B) población con crecimiento exponen-cial y (C) población con decremento exponencial. En los tres casos, las poblaciones actuales sontodas del mismo tamaño (n = 10), de las cuales se denotan cinco haplotipos (a, b, c, d, y e). Lasdiferencias en la topología de los árboles son resultado de la selección (‘muestreo’) de haplotiposde poblaciones con dinámicas diferentes (ver Emerson et al. 2001).Hypothetical genealogies are shown for three populations, with their corresponding phylogenetic tree, for (A) a populationwith constant size, (B) with exponential growth, and (C) with exponential decrement. Populations from all three cases havethe same size (n = 10), from which five haplotypes are shown (a, b, c, d, and e). Differences in tree topology are the resultof the selection (‘sampling’) of haplotypes from populations with different dynamics (see Emerson et al. 2001).

Page 8: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

284 VÁZQUEZ-DOMÍNGUEZ ET AL.

Peters et al. (2005) utilizaron un método decoalescencia (aislamiento con migración) paradeterminar, en el pato de bosque Aix sponsa(Linnaeus, 1758), si existía diferenciación entrelas poblaciones del este y las del oeste deNorteamérica. Para ello calcularon el tamañopoblacional, el tiempo de divergencia y el flujogenético materno. Los resultados mostraron unaclara diferenciación entre las poblaciones (Φst =0.31), así como un tiempo de divergencia de almenos 10.000 años, resultado principalmente delescaso flujo génico entre ellas y por los distintoseventos de glaciación, en los que al parecer laspoblaciones han ocupado al menos dos refugiosdurante la última glaciación del Pleistocenotardío. Finalmente, encontraron que el tamañopoblacional es mayor en el este –además de quepresenta una expansión reciente–, contrario a loque sucede en la población del oeste quemantiene un tamaño pequeño semejante a lapoblación ancestral y no muestra expansiónreciente.

MÉTODOS DE ANÁLISIS

Los métodos moleculares actuales permiten nosolo la estimación de las frecuencias alélicas,sino también de las relaciones genealógicasentre alelos, con lo cual es posible considerar elflujo génico histórico y la fragmentación depoblaciones en un marco conceptual másevolutivo y geográfico, ya que se puedencomparar las relaciones evolutivas de loslinajes genéticos con su ubicación geográfica(Freeland 2005). Sin embargo, dado que losmétodos tradicionales de la genética depoblaciones no consideran los factoreshistóricos, dichos métodos deben adecuarsepara poder hacer uso de la informaciónhistórica contenida en los estimadoresmoleculares. Wright (1931, 1943) introdujo losestadísticos de F, que han permitido cuantificarla subdivisión –estructura– de las poblaciones,así como el flujo génico, a partir de lasfrecuencias alélicas obtenidas en diferenteslocalidades geográficas. Actualmente, al poderutil izar datos de secuencias de ADN yrepresentarlos en un árbol de alelos ohaplotipos, se t iene no sólo la escalageográfica, sino una dimensión más: el tiempoevolutivo. Así, mientras que los estadísticos deF no hacen uso de la información temporal,

nuevos procedimientos estadísticos basados enla información de ADN pueden separar loseventos históricos de aquellos a nivel de laestructura poblacional (Hudson et al. 1992,Templeton et al. 1995, Templeton 2004).

Como veremos más adelante, se handesarrollado métodos para examinar el efectode los patrones históricos de migración ydispersión sobre la distribución de genes, loscuales integran la información genealógica y dedistribución para hacer inferencias sobre lospatrones históricos de flujo génico (e.g. Hudson1990, Templeton et al. 1995, Avise 2000,Cruzan & Templeton 2000, Templeton 2004).En particular, modelos de genética depoblaciones basados en la teoría decoalescencia proveen un marco conceptualestadístico para el análisis de, entre otros, lainformación filogeográfica (e.g. Modelo deNiegel; Avise 2000), lo que ha llevado acompilar dicha información metodológica bajoel concepto de ‘estadística filogeográfica’(Knowles & Maddison 2002).

El análisis filogeográfico parte, en su nivelmás fino tal vez, de qué tan estructuradas(diferenciadas) están las poblaciones; sinembargo, y como ya hemos mencionado antes,el enfoque filogeográfico tiene que analizarinformación tanto espacial como temporal, enescalas históricas (evolutivas) y ecológicas. Porlo tanto, en filogeografía es necesario primeroestablecer las relaciones genealógicas entrehaplotipos, y posteriormente identificar quéfactores históricos y geográficos pudieronhaber influido o determinado la distribuciónactual de los haplotipos. Para ello, se utilizanbásicamente dos métodos de análisis, unofundamentalmente gráfico, basado en árbolesde genes o en coalescencia, y otro queconsidera estadísticos de resumen y parámetrosdemográficos (Emerson et al. 2001, Posada &Crandall 2001, Knowles & Maddison 2002,Hey & Machado 2003; Tabla 1).

Métodos gráficos (basados en árboles de genes)

Métodos filogenéticos tradicionales

En filogeografía se aplican los mismosalgoritmos que se emplean para reconstruirárboles de especies o taxones superiores; sinembargo, como en el caso particular de lafilogeografía, las OTUs del árbol filogenético

Page 9: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

285AVANCES METODOLÓGICOS EN FILOGEOGRAFÍA

Método

1. Métodos filogenéticos tradi-cionales

2. Redes de haplotipos

3. Análisis de clados anidados

1. Gráficas de linajes a travésdel tiempo

2. Gráficas de líneas de cielo

Estadísticos de resumen

1. Distribución de diferenciaspareadas

2. Parámetros demográficosbasados en coalescencia

Ventajas

Se requiere conocer tiempos de diver-gencia. Describe relaciones interespecí-ficas, jerárquicas. Es posible utilizar in-formación de genes nucleares.

Describe las relaciones intraespecíficasen una red, lo que permite describir rela-ciones reticuladas entre haplotipos (y nojerárquicas). Incluye la frecuencia gráfi-ca de los haplotipos e infiere haplotiposfaltantes.

Permite tener análisis estadísticos de larelación geográfica y genealógica. Per-mite evaluar si el muestreo es adecuado.

Permite inferir cambios históricos de ta-maño poblacional. Incluye análisis esta-dístico.

Permite utilizar el tamaño efectivo de lapoblación (Ne). Mayor poder discrimi-nante entre grupos.

Se desarrollaron a partir de modelosneutrales. Utilizan la tasa de mutaciónpoblacional (θ). Permite estimar cam-bios en el tamaño poblacional histórico(e.g. distribución mismatch, D de Taji-ma).

Incluyen estimadores de máxima verosi-militud (e.g. Monte Carlo, Cadenas deMarkov). Se puede obtener una medidade incertidumbre. Permite estimar tasade migración, crecimiento poblacional,identificar al ancestro común más re-ciente, determinar la edad y ubicaciónde subpoblaciones ancestrales.

Desventajas

Evalúan relaciones jerárquicas y no ge-nealógicas (haplotipos). No permite vi-sualizar frecuencias ni pasos mutaciona-les

No permite visualizar distancias genéti-cas en forma gráfica. No describe rela-ciones evolutivas. Límite de confianzasensible al número y la distribución geo-gráfica de las muestras.

Muy sensible a la resolución genética.Interpretaciones limitadas por el tamañode muestra.No considera límites de confianza.

Sensible a delimitaciones genéticas ytaxonómicas en la definición de las es-pecies. Error al identificar especies her-manas por falta de muestreo. Problemaspor baja variabilidad genética, persisten-cia de haplotipos ancestrales y multibi-furcaciones debido a descendientes devarios linajes.

Es necesaria una alta variabilidad, yaque se requiere conocer el tiempo de di-vergencia e inferir un árbol de genes.Asume reloj molecular y muestreo alazar.

No considera la estructura genealógicade los datos. Se ajustan a un modelo de-mográfico (e.g. modelos de islas, de ais-lamiento por distancia) y no todos pue-den evaluarse estadísticamente.

Requieren de un trabajo computacionalintensivo.

Referencias

Avise 2000, Freeland 2005,Hawkins 2006, Kelchnes &Thomas 2006, Eguiarte et al.2007, Spellman & Klicka 2007

Templeton 1992, Clement 2000,Posada & Crandall 2001,Muwakina et al. 2003, Excoffieret al. 2005

Crandall & Templeton 1993,Templeton & Sing 1993, Tem-pleton et al. 1995, Templeton1998, Cruzan & Templeton2000, Posada et al. 2000, Frutos& Van Den Bussche 2002,Knowles & Maddison 2002,Templeton 2004, Hasbún et al.2005, Posada et al. 2006

Emerson et al. 2001, Hawkins2006

Emerson et al. 2001, Strimmer& Pybus 2001, Holmes et al.1995, 1999, Burbrink et al. 2008

Tajima 1983, Fu 1994

Bahlo & Griffiths 2000, Emer-son et al. 2001

Métodos gráficos (basados en árboles de genes)

Métodos gráficos (basados en coalescencia)

TABLA 1

Resumen de los métodos de análisis filogeográfico incluidos en la presente revisión, dondese señalan las ventajas y desventajas principales, así como las referencias más importantes.

Para una explicación más extensa de cada método, ver el texto.

Summary of the phylogeographical methods of analyses included in the present review, where main advantagesand disadvantages are indicated, with their corresponding references. For a more extensive explanation of each

method refer to the main text.

Page 10: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

286 VÁZQUEZ-DOMÍNGUEZ ET AL.

son los haplotipos, se obtiene un árbol degenes, que se define como un diagramaramificante que describe el patrón de ancestríaentre secuencias homólogas de ADN dediferentes individuos de una población o unaespecie (Hey & Machado 2003), y donde lasramas de diferentes longitudes expresan lacantidad de cambio evolutivo (en términos, porejemplo, de número de pasos mutacionales,número de sustituciones). Las variantes ohaplotipos del ADNmt registran la historiamatrilineal de eventos mutacionales (Fig. 3A),y pueden conectarse filogenéticamente en unfilograma (Fig. 3B), el cual puede a su vez

sobreponerse a la distribución geográfica delgrupo de estudio (Fig. 3C), a fin de tener unaprimera –y meramente gráfica– aproximación alos procesos evolutivos responsables de ladistribución actual de la especie o grupo deespecies (Avise 2000).

Aunque los árboles de genes, que describenel patrón de ancestría del ADN de unapoblación, son diferentes de los árbolesfilogenéticos, que se refieren al patrón deancestría de un taxón, los primeros puedenanalizarse con lo métodos f i logenéticostradicionales, como parsimonia, o aquellosque involucran distancias genéticas o la

Fig. 3: (A) haplotipos individuales (secuencias de ADN mitocondrial) de una especie, (B) que seconectan filogenéticamente en un filograma; grupos de haplotipos diferenciados (monofiléticos) sedenominan filogrupos, (C) el filograma puede sobreponerse a la distribución geográfica del grupode estudio.(A) individual haplotypes (mitochondrial DNA sequences) from a species, (B) that can be connected phylogenetically in aphylogram; differentiated haplotype groups (monophyletic) are called phylogroups, (C) the phylogram can be overlaid ontothe geographical distribution of the group of study.

Page 11: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

287AVANCES METODOLÓGICOS EN FILOGEOGRAFÍA

posibi l idad de apl icación de modelosevolut ivos específ icos, como neighbor-joining, mínima evolución, máximaverosimilitud y métodos bayesianos. A travésde estos análisis filogenéticos es posibledeterminar filogrupos diferentes (Fig. 3); siexiste concordancia entre la distribucióngeográfica de los haplotipos y los haplogruposreflejados en la filogenia, dicha informaciónsirve de apoyo (o como base) de otros análisisque evalúen directamente concordancia (e.g.clados anidados; ver más adelante). Losanál is is f i logenét icos permiten est imartiempos de divergencia, información que es devital importancia en filogeografía (Tabla 1).Spellman & Klicka (2007) utilizaron doscriterios filogenéticos (parsimonia y máximaverosimilitud) para evaluar hipótesis históricassobre la evolución de Sitta carolinensis, aveque se dis tr ibuye ampliamente enNorteamérica. Obtuvieron un filograma concuatro f i logrupos monofi lét icos (Este ,Pacífico, este de la sierra Nevada y lasmontañas Rocallosas, la Gran Cuenca yMéxico) , f i logrupos sorprendentementeconcordantes con la distr ibución de losbosques de encino-pino. Los resul tadosapoyan la hipótesis de que esta especieevolucionó dentro de este tipo de hábitat,contrario a otra hipótesis propuesta sobre unaexpansión reciente, y que el aislamientoposterior de sus poblaciones ha resultado enuna diferenciación signif icat iva entrepoblaciones y variación genética críptica.

Existe variada literatura que puede revisarsepara profundizar sobre métodos filogenéticos;en particular sobre su aplicación enfilogeografía ver Freeland (2005), Hawkins(2006), Kelchner & Thomas (2006), Eguiarte etal. (2007).

Redes de haplotipos

En estudios filogeográficos se utilizan conmayor frecuencia métodos de reconstrucciónfilogenética que consideran la coalescencia, loscuales se emplean ya sea en combinación con losfilogenéticos tradicionales o, por el contrario,como el único análisis de estudio (Tabla 1). Así,a diferencia de los árboles bifurcadostradicionales, estos métodos permiten describirlas relaciones evolutivas en forma de árbolesmultibifurcantes, en los cuales un único

haplotipo puede dar origen a muchos haplotipos,creando lo que se conoce como ‘redes’,particularmente como redes mínimas dehaplotipos (conexiones entre haplotipos dadaspor el mínimo número posible de mutacionesentre ellos). Dado que se trabaja con filogeniasde haplotipos a nivel intraespecífico (y no anivel interespecífico), las cuales casi nopresentan recombinación, pueden tener muypoca variación e implican un tiempo evolutivomucho menor, Templeton et al. (1992)propusieron un método que toma en cuenta estasparticularidades, conocido como parsimoniaestadística. Clement et al. (2000) desarrollaronel programa de cómputo TCS (“Phylogeneticnetwork estimation using statistical parsimony”)que permite estimar redes filogenéticas a partirde secuencias de ADN o de matrices dedistancias nucleotídicas utilizando el algoritmode Templeton et al. (1992). Este algoritmoestima el número máximo de diferencias depares de bases entre secuencias que puedenatribuirse a una serie de mutaciones únicas encada sitio de la secuencia; número al que seconoce como límite de parsimonia (con unaconfianza del 95 %). El programa no conecta ala red los haplotipos que difieren por un númerode pares de bases que exceda dicho límite, por elsupuesto de posible homoplasia. Sin embargo, ellímite puede excederse por otras razones, comoun tamaño pequeño de muestra (e.g. número dehaplotipos), o un muestreo sesgadogeográficamente (i.e. falta de haplotipos ohuecos en la distribución del taxón de estudio).Una vez que se estima el límite de parsimonia, elalgoritmo conecta los haplotipos que difierenpor una sola mutación, seguido de los quedifieren por dos mutaciones, luego tres y asísucesivamente, hasta que se alcance el límite ohasta que se unan todos los haplotipos.

El resultado final es una red que muestra lasrelaciones entre todos los haplotipos con base enel número mínimo de mutaciones (los pasos aseguir para el uso del programa se pueden ver enClement et al. 2000). Las conexiones entre loshaplotipos representan eventos coalescentes porlo que pueden hacerse, a partir de la red deparsimonia y con base en los principios decoalescencia, las siguientes predicciones (verClement et al. 2000) (Fig. 4): i) los haplotiposcon mayor frecuencia tienen alta probabilidad deser alelos ancestrales, ii) los haplotipos quetienen múltiples conexiones muy probablemente

Page 12: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

288 VÁZQUEZ-DOMÍNGUEZ ET AL.

son ancestrales, iii) dentro de la red, loshaplotipos ancestrales son de interior y loshaplotipos nuevos tienen mayor probabilidad deser periféricos (‘de punta’), iv) se espera que loshaplotipos ancestrales tengan una ampliadistribución geográfica (básicamente porque los

individuos que tienen esos haplotipos han tenidomucho tiempo para dispersarse), y v) loshaplotipos con una única conexión se prevéestén unidos a haplotipos de la misma población(dado que han evolucionado recientemente y porlo tanto sin tiempo para dispersarse).

Fig. 4: Red mínima de haplotipos en las que se muestran las conexiones entre haplotipos, unidospor un paso mutacional. El tamaño de los rectángulos es proporcional a la frecuencia de loshaplotipos en la población. Se muestran las diferentes predicciones que pueden hacerse a partir dela red: (A) los haplotipos con mayor frecuencia tienen alta probabilidad de ser alelos ancestrales(rectángulo sombreado), (B) los haplotipos que tienen múltiples conexiones muy probablementeson ancestrales (rectángulo sombreado), (C) dentro de la red, los haplotipos ancestrales son deinterior (sombreados) y los haplotipos nuevos tienen mayor probabilidad de ser periféricos (‘depunta’), (D) se espera que los haplotipos ancestrales tengan una amplia distribución geográfica(haplotipo central, con alta frecuencia en cuatro diferentes localidades), y (E) los haplotipos conuna única conexión se prevé estén unidos a haplotipos de la misma población (círculos oscuros).Haplotype minimum network where connections among haplotypes, joined by one mutational step, are shown. Rectanglesize is proportional to haplotype frequency in the population. The different predictions that can be asserted from thenetwork are shown: (A) haplotypes with the highest frequency have more probability of being ancestral alleles (grayrectangle), (B) haplotypes with multiple connections are most probably ancestral (gray rectangle), (C) within the network,ancestral haplotypes are interior (shadowed) and new haplotypes have higher probability of being peripheral (‘pointhaplotypes’), (D) ancestral haplotypes are expected to have ample geographical distribution (central haplotype with highfrequency in four different locations), and (E) haplotypes with only one connection are expected to be connected withhaplotypes from the same population (dark circles).

Page 13: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

289AVANCES METODOLÓGICOS EN FILOGEOGRAFÍA

Un ejemplo donde se utilizó una red mínimade haplotipos es un estudio con el jabalíverrugoso Pacochoerus africanus (Paillas,1766) en África (Muwakina et al. 2003). Losresultados mostraron tres clados altamentediferenciados entre sí: un clado Oeste, separadode un clado Sur por 17 pasos mutacionales y unclado Este separado del clado Sur por 10 pasos,además de estructuración a escala más fina conhaplotipos que divergen dentro de los cladosmismos. Los autores concluyen que dichaestructura es resultado de las fluctuacionesambientales del Plioceno-Pleistoceno, queocasionaron que las poblaciones de jabalí seaislaran en tres refugios diferentes.

Pueden utilizarse otros algoritmos aparte deTCS, siempre y cuando sea posible construirredes de haplotipos. Por ejemplo, Cassens et al.(2003) en un estudio con el delfínLagenorhynchus obscurus (Gray, 1828) delhemisferio Sur, utilizaron diferentes formas deestimar redes, e.g. ‘minimum spanningnetwork’ (con el software Arlequin), y losmétodos de ‘split decomposition’ (conSplitsTree) y ‘median-joining networks’ (conNetwork) (Huson 1998, Excoffier et al. 2005).Con esta combinación de análisis encontraronun diferenciación significativa entre loshaplotipos del Atlántico (Perú) de los delPacífico (Argentina y Sudáfrica).

Análisis de clados anidados

Para poder estimar los factores históricos ygeográficos que han determinado ladistribución actual de haplotipos, enfilogeografía se utiliza con considerablefrecuencia el análisis de clados anidados (NCA,por sus siglas en inglés; Templeton et al. 1995).Su popularidad descansa en tres razonesprincipales: i) permite hacer un análisisestadístico objetivo con el que se puede evaluarla hipótesis nula de que los haplotipos de losclados se distribuyen geográficamente al azar(i .e. no asociación entre la variaciónhaplotípica y la geografía), ii) permite detectary probar estadísticamente los mecanismosevolutivos responsables de la distribuciónespacial de los patrones de variación genéticaobservada, y i i i) permite interpretar lospatrones significativos utilizando criteriosexplícitos, con los que es posible evaluar si elmuestreo es adecuado para detectar una

asociación significativa entre los clados y lageografía, y si es adecuado además parainterpretar biológicamente dicha asociación(Tabla 1).

El primer paso para hacer un NCA es elcontar con un red de haplotipos como lasexplicadas arriba; posteriormente se utilizanreglas específicas para definir una serie declados anidados jerárquicamente dentro de lared (Reglas de anidación; Templeton & Sing1993, Templeton 2004) (Fig. 5). En el primernivel se definen los ‘clados de un paso’, queagrupan a los haplotipos más exteriores(haplotipos de punta) con el haplotipoinmediato anterior separado por una solamutación (haplotipos de interior); estos cladosde un paso se anidan en ‘clados de dos pasos’,que contienen al clado de nivel uno unido alhaplotipo inmediato anterior separado por unasola mutación, y así sucesivamente. Secontinúa el anidamiento hasta que el siguientenivel de anidamiento más alto resulta en unúnico clado que contiene a toda la red (Fig. 5).Como resultado, se tiene que los niveles másaltos del anidamiento corresponden a loseventos coalescentes más antiguos y viceversa.

Posteriormente en el NCA se analizan enforma conjunta el cladograma anidado y sudistribución geográfica, considerando lasfrecuencias de cada uno de los haplotipos asícomo dos medidas de distancia: distancia delclado (Dc) que representa la distancia promediode los miembros del clado al centro geográficode ese clado (es decir, la dispersión geográficade los haplotipos de un clado); y distancia delclado anidado (Dn) que mide la distanciapromedio de los miembros del clado anidado alcentro geográfico del clado anidado (es decir,cómo se distribuye un clado en relación conotros clados en el mismo nivel de anidamiento);se estima también una medida de interior-puntadentro de cada categoría anidada, como ladiferencia entre la distancia interior promediomenos la distancia de punta promedio (clado deinterior y clado de punta en cada niveljerárquico; ver Crandall & Templeton 1993,Cruzan & Templeton 2000 y Posada et al. 2006para detalles de los cálculos). La evaluaciónestadística de estas medidas de distancia serealiza por medio de un procedimiento deMonte Carlo, que son algoritmos usados enmétodos estocásticos de simulacióncomputacionalmente intensivos, que se basan

Page 14: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

290 VÁZQUEZ-DOMÍNGUEZ ET AL.

en un muestreo repetido y aleatorio de datossimulados obtenidos a partir de los datosempíricos (Luikart & England 1999). En elcaso específico del NCA esto se hace a travésde la construcción de distribuciones nulas: seconstruye una tabla de datos de contingenciapara cada clado y nivel de anidamiento, lascuales se aleatorizan y de las cuales se vuelvena calcular las medidas de distancia, con las quese comparan iterativamente los datosempíricos. Existe una forma de hacer estoscálculos de manera automatizada, con elprograma GeoDis escrito por Posada ycolaboradores (Posada et al. 2000, 2006). Losresultados que da el programa incluyen lascomparaciones (Dc y Dn) que sonsignificativamente diferentes de lo esperado porel azar (junto con los valores de significanciaobtenidos con pruebas de chi-cuadrado)

El objet ivo de est imar aquel lasasociaciones significativas entre haplotipos ysu distribución geográfica es poder aceptar orechazar –estadísticamente– la hipótesis de noasociación entre la variación haplotípica y lageografía . El lo se hace anal izando los

resultados obtenidos con GeoDis por medio deuna clave de inferencia (‘clave de Templeton’;Templeton 2004) para determinar cuál ocuáles escenarios explican más acertadamentelos patrones observados en la distribución delos haplotipos; se parte de tres procesosposibles: i) aislamiento por distancia, debido aflujo génico restringido, ii) fragmentaciónhistórica, y i i i ) expansión del área dedistribución de las poblaciones, incluyendoeventos de colonización a distancia. Ladescripción detallada del análisis de cladosanidados, así como las herramientas parallevarlo a cabo, se incluyen en Templeton etal. (1995), Templeton (1998) y Templeton(2004). Existe ya un programa con el quepuede hacerse todo este procedimiento demanera automatizada (ANeCA; Panchal 2007).

El NCA tiene ciertas limitaciones que debenconsiderarse, como que es sensible a laresolución genética para poder detectar losprocesos históricos, además de que lasinterpretaciones biológicas que pueden hacerseestán significativamente limitadas por eltamaño de muestra (individuos por población) y

Fig. 5: Diferentes niveles de anidación de (A) una red mínima de haplotipos. (B) clados de un paso:en el primer nivel, se anidan (‘unen’) haplotipos de punta a su haplotipo inmediato anterior separa-do por un solo paso mutacional, seguidos de los clados de segundo (C) y tercer nivel (D), hasta queel nivel final incluye a toda la red en un único clado de cuarto nivel (D).Different nesting levels of (A) a minimum haplotype network. (B) one-step clades: on the first level, point haplotypes arenested (‘joined’) to their immediate anterior haplotype, separated by one mutational step, followed by second (C) and thirdlevel clades (D), until the last level includes the whole network in a unique fourth level clade (D).

Page 15: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

291AVANCES METODOLÓGICOS EN FILOGEOGRAFÍA

por la amplitud del muestreo (sit iosmuestreados que deben cubrir adecuadamentela distribución geográfica de la especie deestudio), así como por el hecho de que la clavede inferencia solo provee respuestas de ‘sí’ y‘no’, sin considerar límites de confianza(Knowles & Maddison 2002, Templeton 2004).Existe una fuerte controversia alrededor de estemétodo, lo que ha generado una serie decomunicaciones entre autores y opositores (verPetit 2008 y referencias incluidas),particularmente por quienes señalan que elNCA no es confiable porque resulta en un altoporcentaje de falsos positivos y de falsosnegativos. Sin embargo, Templeton (2008) hademostrado que dichos porcentajes son muchomenores cuando se evalúan casos reales,habiendo validado el método con una enormebase de datos de controles positivos, encomparación a cuando se prueban a través dedatos no reales, sino obtenidos con modelosmatemáticos.

Un ejemplo de análisis que integra una redmínima de haplotipos y el posterior NCA es elestudio de Frutos & Van Den Bussche (2002)con poblaciones de armadillos de Paraguay ysecuencias de citocromo b. En este caso,obtuvieron la frecuencia de los haplotipos,hicieron la red mínima y el análisis de clados yposteriormente util izaron la clave deTempleton. El análisis permitió determinar queel muestreo es inadecuado para ciertos clados(localidades geográficas), que uno de los cladosse encuentra en expansión y otro tiene flujogénico restringido. Las conclusiones delestudio incluyen la identificación demovimiento por parte de las hembras y elefecto de un río como barrera a la dispersión.Con la misma metodología, Hasbún et al.(2005) analizan la filogeografía de una lagartijade América Central y muestran la secuencia decolonización de las poblaciones del géneroCtenosaura a lo largo de su rango dedistribución, atribuible a la historia geológicade la región. A partir de la clave de Templetonsugieren procesos de fragmentación en elpasado para el cladograma completo (i.e. todoel rango de distribución), además de eventos defragmentación y expansión para los clados quelo integran (i.e. algunas subpoblaciones).

Después de esta explicación de los métodosgráficos basados en árboles, es importantemencionar que una de las limitantes más

importantes de dichos métodos es que lamayoría de las historias demográficas dancomo resultado árboles de genes que varíangrandemente en cuanto a topología y longitudde ramas, varianza conocida como varianzaestocástica. Dicha varianza está asociada a lavariación inherente observada en las historiasgenealógicas obtenidas con diferentes genes(e.g. nucleares versus mitocondriales), quepuede dar como resultado historias diferentespara una misma población. Otro problema delos métodos basados en árboles es que estánlimitados por la forma de estimación del árbolde genes y no se puede siempre asegurar querepresente la verdadera historia de la población,por ejemplo debido a mutación recurrente en elADNmt o por recombinación en genesnucleares (Hey & Machado 2003). Para lidiarcon estas limitantes se ha hecho cotidiano, porun lado, el uso de diferentes análisis en unmismo estudio (por ejemplo, métodosfilogenéticos junto con clados anidados yestimadores de genética de poblaciones yestructuración genética), y por otro, hamotivado el desarrollo de otros métodosdirectamente enfocados a descifrar las historiasdemográficas de las poblaciones, ya seagráficos basados en coalescencia y matemáticosbasados en estadísticos de resumendemográfico, como veremos a continuación.

Métodos gráficos (basados en coalescencia)

Gráficas de linajes a través del tiempo

Con análisis de coalescencia se ha demostradoque secuencias homólogas de una poblacióncontienen información sobre la historiademográfica de esa población. Cuando dichassecuencias se analizan a través de un árbolgenealógico, cada nodo interno corresponde,por definición, a un evento de coalescencia, ypor ello se pueden inferir cambios históricos enel tamaño poblacional a partir de la distribucióntemporal de los nodos en la genealogía. Así, sepuede graficar la distribución acumulada de loseventos coalescentes contra el tiempo (Fig. 6A)y la forma de la curva resultante –o gráfica delinajes a través del tiempo (LTT por sus siglasen inglés)– se puede usar para probar hipótesisespecíficas de la historia de la población, lascuales se derivan de las curvas esperadas bajocoalescencia (simulaciones); posteriormente se

Page 16: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

292 VÁZQUEZ-DOMÍNGUEZ ET AL.

evalúa el ajuste entre las curvas teóricasobtenidas con LTT y la curva observada con losdatos empíricos, para poder elegir entre lashipótesis alternativas (ver Emerson et al. 2001y Hawkins 2006 para una revisión de estemétodo; Tabla 1).

Gráficas de líneas de cielo (‘skylines’)

En las gráficas skyline, generalizadas o no, seutiliza el tamaño efectivo de la población (Ne) enlugar de los eventos coalescentes, por lo que sonmás fáciles de interpretar que los LTT. Para ello,se estima la media armónica del tamaño efectivopara cada intervalo internodos, medidos eneventos mutacionales que corresponden aperiodos de tiempo (Mi), la cual se grafica contrael tiempo (Fig. 6B) para tener una representaciónno paramétrica de tamaño efectivo de la

población a lo largo del tiempo. Finalmente seajustan modelos demográficos específicos y seestiman los parámetros correspondientesutilizando máxima verosimilitud (Emerson et al.2001, Strimmer & Pybus 2001). La ventaja de losskylines generalizados es que pueden aplicarse encasos en los que el árbol genealógico no estátotalmente resuelto y/o los datos no sean muyvariables (Tabla 1).

Estos métodos han sido utilizados, porejemplo, en estudios de HIV-1: las gráficasskyline han mostrado que en la poblaciónhumana el subtipo A ha tenido un aumentoexponencial a tasa constante, y que elcrecimiento ha sido logístico para el subtipo B,mientras que los LTT indican crecimientoexponencial para ambos subtipos. Estosresultados sugieren que para el HIV-1 losskylines tienen mayor poder discriminante

Fig. 6: (A) gráfica de linajes a través del tiempo (LTT) y (B) gráfica ‘skyline’, ambas en escalalogarítmica, donde la línea punteada muestra una población en crecimiento y la línea continua unapoblación de tamaño relativamente constante a lo largo del tiempo. (C) en la gráfica ‘mistmatch’ semuestra la distribución de frecuencias del número de diferencias pareadas entre secuencias (barras)y la curva teórica esperada de una población con expansión poblacional.(A) lineage-through-time plot (LTT) and (B) skyline plot, both in logarithmic scale, where the dotted line indicates agrowing population and the continuous line shows a population with constant size through time. (C) mismatch graphshowing the frequency distribution of the number of pairwise differences between sequences (bars) and the expectedtheoretical curve from a population with exponential growth.

Page 17: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

293AVANCES METODOLÓGICOS EN FILOGEOGRAFÍA

(Holmes et al. 1995, 1999). En otro ejemplo,Burbrink et al. (2008) pudieron determinar coneste método cuáles poblaciones de la serpienteColuber constrictor (Linnaeus, 1758)ampliamente distribuida en Norteamérica,tuvieron un crecimiento poblacional hacealrededor de 200.000 años, y que no se vieronafectadas por los ciclos glaciales posteriores.

Estadísticos de resumen (distribución de dife-rencias pareadas)

Los métodos que consideran un esquemaestadístico para analizar secuencias de ADN sedesarrollaron a partir de modelos neutrales (sinselección natural), desarrollados previo aladvenimiento de las secuencias y lacoalescencia, pero que son directamenteintercambiables. Los estadísticos de resumenmás comúnmente utilizados se enfocan en latasa de mutación poblacional, denotadatípicamente como θ, que es igual a:

θ = 4Nu

y donde N es el tamaño poblacional y u es latasa de mutación neutral del gen en cuestión.Así, el número de mutaciones neutrales quesepara a dos secuencias es 4N x u, en unorganismo diploide. Dicho parámetro puedeestimarse usando el número de sit iospolimórficos en la muestra (S), el númeropromedio de diferencias pareadas entre lassecuencias (k) o el número de mutacionessingletones (η) (Fu 1994). Con base en esteestadístico es posible estimar cambios en eltamaño poblacional histórico, evaluando si losdatos empíricos se ajustan a un modelo detamaño poblacional constante. Para ello seutilizan comúnmente pruebas de neutralidad,entre las cuales tenemos los estimadores de Fu& Li, D* y F*, que consideran S y k comoestimadores no sesgados de θ (Fu & Li 1993), yla D de Tajima (Tajima 1983), que se basa en ladiferencia entre S y k. Otra forma comúnmenteutilizada para estas estimaciones es la conocidacomo ‘distribución mismatch’, unprocedimiento basado en distancias genéticas(Rogers & Harpending 1992) que evalúa si ladistribución observada de S o k en la poblaciónde estudio es estadísticamente diferente de laesperada bajo la hipótesis de crecimientopoblacional (Fig. 6C).

La principal limitante de estos estadísticosde resumen es que hacen uso solo de una partede la información posible, ya que no consideranla estructura genealógica de los datos; ademásdependen del modelo demográfico que se eligecomo al que mejor se ajustan los datosempíricos (e.g. modelo de islas, de aislamientopor distancia), y sólo existe un númerodeterminado de modelos que pueden evaluarseestadísticamente (Tabla 1).

Estadísticos de resumen (parámetros demográ-ficos basados en coalescencia)

Para lidiar con las limitantes de los estadísticosde resumen mencionadas arriba, recientementese ha desarrollado el uso de estimadores demáxima verosimilitud (Emerson et al. 2001)que incorporan, entre otros:

a) un muestreo ‘Metropolis-Hastings’(MMH) junto con la integración de diferentesfilogenias. El MMH es un método de MonteCarlo ampliamente utilizado que se basa en unamodificación del esquema original de MonteCarlo, pues usa cadenas de Markov paramuestrear, de entre los diferentes estados delproceso estocástico bajo estudio, sólo losestados más probables y hacerlo además conuna probabilidad mayor. Con ello evita tenerque muestrear todos los estados (cuyo númeropuede ser extremadamente alto y hacer elanálisis irrealizable). Así, es posible analizartanto el árbol genealógico que mejor describelas secuencias como otros menos probables, ytener entonces una medida de incertidumbre,para evaluar los resultados respecto a una tasade crecimiento (o decremento) exponencial dela población.

b) uso de ecuaciones recursivas paracalcular curvas de verosimilitud para elparámetro q. Las ecuaciones se usan paraconstruir una cadena de Markov; se estima lafunción de verosimilitud para un valor dado deq, al simular de manera independiente yrepetida la cadena de Markov y al tomar lamedia de los valores simulados. Posteriormentese construyen curvas de verosimilitud para elrango de valores de q. Este método ha sido muyútil para analizar poblaciones subdivididas yestimar tasa de migración, crecimientopoblacional, identificación de dónde ocurrió enla población el ancestro común más reciente,así como determinar la edad y ubicación de

Page 18: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

294 VÁZQUEZ-DOMÍNGUEZ ET AL.

subpoblaciones ancestrales (Bahlo & Griffiths2000). Como puede deducirse entonces, es unaaplicación de gran util idad en estudiosfilogeográficos.

Existen otras propuestas para el análisis depoblaciones subdivididas que incorporanparámetros demográficos sin embargo; para lospropósitos de estudios filogeográficos, losdescritos en esta última parte de la presenterevisión son hasta ahora las mejoresherramientas disponibles. Nuevamente, existevariada literatura que puede consultarse paraahondar tanto como sea necesario en estosmétodos y sus aplicaciones. Para una revisióngeneral de la cual partir, y muy importantetambién, para una descripción de los programasestadísticos y de cómputo disponibles paraaplicar los métodos descritos y que suman yauna extraordinariamente larga lista, verGaggiotti et al. (1999), Luikart & England(1999), Emerson et al. (2001), Hare (2001),Posada & Crandall (2001), Knowles &Maddison (2002), Hey & Machado (2003),Knowles (2003), Crisp & Cook (2005), Kelchner& Thomas (2006), Posada (2006), Allendorf &Luikart (2007), Eguiarte et al. (2007).

Es importante enfatizar que las preguntasque pueden analizarse bajo un enfoquefilogeográfico son increíblemente variadas,desde la evaluación básica de si las poblacionesde una especie tienen un patrón filogeográficodefinido, es decir, poblaciones diferenciadas alo largo de su distribución geográfica y cuyaestructuración responde a procesos históricos ydemográficos reconocibles, como por ejemplovicarianza y aislamiento por distancia (Riddleet al. 2000), lo mismo que estudios queinvolucran evaluaciones taxonómicas (Harris etal. 2000), hibridización (Godinho et al. 2006),poblaciones de origen (Grazziotin et al. 2006,Vázquez-Domínguez et al. 2009), aplicacionesen conservación (Smith et al. 2000), refugiospleistocénicos (Avise & Walker 1998),procesos de colonización (Richardson et al.2002) y expansión (Lessa et al. 2003), hastaevolución humana (Templeton 2002); y no sólohay estudios en vertebrados y plantas, pues sehan descrito patrones filogeográficos enparásitos (Mejía-Madrid et al. 2007), bacterias(Carbone & Kohn 2001) y hongos (Reeb et al.2007). Y esta no es una lista exhaustiva.

Las herramientas y métodos de análisisfilogeográfico están en pleno auge, y es seguro

que su desarrollo, perfeccionamiento y alcancese verá maximizado en el corto plazo.Indudablemente se enfatizará el desarrollo deanálisis que incorporan la coalescencia, enparticular se está trabajando en integrar elmodelaje de nicho ecológico y de sistemas deinformación geográfica a los métodos decoalescencia, para poder evaluar conjuntamentela distribución geográfica y la genealogía (verCarstens & Richards 2008). Se estándesarrollando también métodos bayesianos queincorporan coalescencia y permiten estimardemografía histórica (Drummond et al. 2005).Asimismo, los estudios de filogeografíacomparada son cada vez más frecuentes; noexiste una metodología específica para evaluarla congruencia filogeográfica de diferentestaxa, por lo que esta es un área que tambiénestá en pleno auge (Hickerson et al. 2006).Aunque la filogoegrafía tiene ya más de 20años, las enormes posibilidades de estudiopresentados en esta revisión, se veránmaximizadas con los avances metodológicos enpuerta para el estudio conjunto de lainformación genética, genealógica y geográficaen análisis evolutivos y de distribución.

LITERATURA CITADA

ALLENDORF F & G LUIKART (2007) Conservation andthe genetics of populations. Blackwell Publishing,Oxford, United Kingdom. 642 pp.

AVISE JC, J ARNOLD, RM BALL, E BERMINGHAM, TLAMB, JE NIEGEL, CA REEB & NC SAUNDERS(1987) Intraspecific phylogeography: themitochondrial DNA bridge between populationgenetics and systematics. Annual Review ofEcology and Systematics 18: 489-522.

AVISE JC & D WALKER (1998) Pleistocenephylogeographic effects on avian populations andthe speciation process. Proceedings of the RoyalSociety of London B 265: 457-463.

AVISE JC (2000) Phylogeography. The history andformation of species. Harvard University Press,Cambridge, United Kingdom. 447 pp.

BAHLO M & RC GRIFFITHS (2000) Inference from genetrees in a subdivided population. TheoreticalPopulation Biology 57: 79-95.

BEDFORD T & DL HARTL (2008) Overdispersion of themolecular clock: temporal variation of gene-specific substitution rate in Drosophila. MolecularBiology and Evolution 25: 1631-1638.

BEHLING H & M LICHTE (1997) Evidence of dry andcold climatic conditions at glacial times in tropicalsoutheastern Brazil. Quaternary Research 48: 348-358.

BEHLING H & RRB NEGRELLE (2001) Tropical rainforest and climate dynamics of the Atlanticlowland, Southern Brazil , during the LateQuaternary. Quaternary Research 56: 383-389.

Page 19: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

295AVANCES METODOLÓGICOS EN FILOGEOGRAFÍA

BLEEKER W, C WEBER-SPARENBERG & H HURKA(2002) Chloroplast DNA variat ion andbiogeography in the genus Rorippa Scop.(Brassicaceae). Plant Biology 4: 104-111.

BROWN WM (1985) The mitochondrial genome ofanimals. En: MacIntyre RJ (ed) Molecularevolutionary genetics: 95-130. Plenum, New York,USA.

BROWN WM, M GEORGE & AC WILSON (1979) Rapidevolution of animal mitochondrial DNA.Proceedings of the National Academy of SciencesUSA 76: 1967-1971.

BRUMFIELD RT, P BEERLI, DA NICKERSON & SVEDWARDS (2003) The utility of single nucleotidepolymorphisms in inferences of population history.Trends in Ecology and Evolution 18: 249-256.

BURBRINK FT, F FONTANELLA, R PYRON, TQGUIHER & C JIMÉNEZ (2008) Phylogeographyacross a continent: the evolutionary and demographichistory of the North American racer (Serpentes:Colubridae: Coluber constrictor). MolecularPhylogenetics and Evolution 47: 274-288.

CARBONE I & LM KOHN (2001) A microbialpopulation-species interface: nested cladistics andcoalescent inference with multi locus data.Molecular Ecology 10: 947-964.

CARSTENS BC & CL RICHARDS (2008) Integratingcoalescent and ecological niche modeling incomparative phylogeography. Evolution 61: 1439-1454.

CARVALHO GR (ed) (1998) Advances in molecularecology. IOS Press, Amsterdam, Netherlands. 314pp.

CASSENS I, K VAN WAEREBEEK, B BEST, EACRESPO, J REYES & MC MILINKOVITCH(2003) The phylogeography of dusky dolphins(Lagenorhynchus obscurus): a critical examinationof network methods and rooting procedures.Molecular Ecology 12: 1781-1792.

CLEMENT M, D POSADA & KA CRANDALL (2000)TCS: a computer program to est imate genegenealogies. Molecular Ecology 9: 1657-1660.

CRANDALL KA & AR TEMPLETON (1993) Empiricaltests of some predictions from coalescent theorywith applications to intraspecific phylogenyreconstruction. Genetics 134: 959-969.

CRISP MD & LG COOK (2005) Do early branchinglineages signify ancestral traits? Trends in Ecology& Evolution 20: 122-128.

CRUZAN MB & AR TEMPLETON (2000) Paleoecologyand coalescence: phylogeographic analysis ofhypotheses from the fossil record. Trends inEcology & Evolution 15: 491-496.

DEVITT TJ (2006) Pylogeography of the WesternLyresnake (Trimophodom biscutatus): testingaridland biogeographical hypotheses across theNeartic-Neotropical transition. Molecular Ecology15: 4387-4407.

DRUMMOND AJ, A RAMBAUT, B SHAPIRO & OGPYBUS (2005) Bayesian coalescent inference ofpast population dynamics from molecularsequences. Molecuar Biology and Evolution 22:1185-1192.

EGUIARTE L, V SOUZA & X AGUIRRE (2007) Laecología molecular de plantas y animales. INE/Conabio, México. 592 pp.

EMERSON BC, E PARADIS & C THÉBAUD (2001)Revealing the demographic histories of speciesusing DNA sequences. Trends in Ecology &Evolution 16: 707-716.

EXCOFFIER L, G LAVAL & S SCHNEIDER (2005)Arlequin ver. 3.0: An integrated software packagefor population genetics data analysis. EvolutionaryBioinformatics Online 1: 47-50.

FREELAND JR (2005) Molecular ecology. John Wiley &Sons, Ltd., London, United Kingdom. 388 pp.

FRUTOS SD & RA VAN DEN BUSSCHE (2002) Geneticdiversity and gene flow in nine-banded armadillosin Paraguay. Journal of Mammalogy 83: 815-823.

FU YX (1994) Estimating effective population size ormutation rate using the frequencies of mutations ofvarious classes in a sample of DNA sequences.Genetics 138: 1375-1386.

FU YX & WH LI (1993) Statistical tests of neutrality ofmutations. Genetics 133: 693-709.

GAGGIOTTI OE, O LANGE, K RASSMANN & CGLIDDONS (1999) A comparison of two indirectmethods for estimating average levels of gene flowusing microsatellite data. Molecular Ecology 8:1513-1520.

GARCÍA-MORENO J, AG NAVARRO-SIGÜENZA, ATPETERSON & LA SÁNCHEZ-GONZÁLEZ (2004)Genetic variation coincides with geographicstructure in the common bush-tanager(Chlorospingus ophthalmicus) complex fromMexico. Molecular Phylogenetics and Evolution 33:186-196.

GODINHO R, B MENDONÇA, EG CRESPO & NFERRAND (2006) Genealogy of the nuclear b-fibrinogen locus in a highly structured lizardspecies: comparison with mtDNA and evidence forintragenic recombination in the hybrid zone.Heredity 96: 454-463.

GRAZZIOTIN FG, M MONZEL, S ECHEVERRIGARAY& SL BONIATO (2006) Phylogeography of theBothrops jararaca complex (Serpentes: Viperidae):past fragmentation and island colonization in theBrazilian Atlantic Forest. Molecular Ecology 15:3969-3982.

HARE MP (2001) Prospects for nuclear genephylogeography. Trends in Ecology & Evolution16: 700-706.

HARRIS D, DS ROGERS & J SULLIVAN (2000)Phylogeography of Peromyscus furvus (Rodentia;Muridae) based on cytochrome b sequence data.Molecular Ecology 9: 2129-2135.

HASBÚN CR, A GÓMEZ, G KHÖLER & DH LUNA(2005) Mitochondrial DNA phylogeography of theMesoamerican spiny-yailed lizards (Ctenosauraquinquecarinata complex): historical biogeography,species status and conservation. Molecular Ecology14: 3095-3107.

HAWKINS JA (2006) Using phylogeny to investigate theorigins of the Cape flora: the importance oftaxonomic, gene and genome sampling strategies.Diversity and Distributions 12: 27-33.

HEY J & CA MACHADO (2003) The study of structuredpopulations – new hope for a difficult and dividedscience. Genetics 4: 535-543.

HICKERSON MJ, G DOLMAN & C MORITZ (2006)Comparative phylogeographic summary statisticsfor testing simultaneous vicariance. MolecularEcology 15: 209-223.

HOLMES EC, S NEE, A RAMBAUT, GP GARNETT &PH HARVEY (1995) Revealing the history ofinfectious disease epidemics through phylogenetictrees. Philosophical Transactions of the RoyalSociety of London B 349: 33-40.

HOLMES EC, OG PYBUS & PH HARVEY (1999) Themolecular population genetics of HIV-1. En:

Page 20: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

296 VÁZQUEZ-DOMÍNGUEZ ET AL.

Crandall KA (ed) The evolution of HIV: 177-207.Johns Hopkins University Press, Baltimore, USA.

HUDSON RR (1990) Gene genealogies and the coalescentprocess. En: Futuyma D & J Antonovics (eds)Oxford surveys in evolutionary biology: 1-44.Oxford University Press, Oxford, United Kingdom.

HUDSON RR (1998) Island models and the coalescentprocess. Molecular Ecology 7: 413-418.

HUDSON RR, M SLATKIN & WP MADDISON (1992)Estimation of levels of gene flow from DNAsequence data. Genetics 132: 583-589.

HUSMEIER D & F WRIGHT (2001) Probabilisticdivergence measures for detecting interspeciesrecombination. Bioinformatics 17: S123-S131.

HUSON DH (1998) SplitsTree: analyzing and visualizingevolutionary data. Bioinformatics 14: 68-73.

KELCHNER SA & MA THOMAS (2006). Model use inphylogenetics: nine key questions. Trends inEcology & Evolution 22: 87-94.

KINGMAN JFC (1982) The coalescent. StochasticProcesses and their Applications 13: 235-248.

KNOWLES LL & WP MADDISON (2002) Statisticalphylogeography. Molecular Ecology 11: 2623-2635.

KNOWLES LL (2003) The burgeoning field of statisticalphylogeography. Journal of Evolutionary Biology17: 1-10.

KOCH MA, C KIEFER, D EHRICH, J VOGEL, CBROCHMANN & K MUMMENHOFF (2006)Three times out of Asia Minor: the phylogeographyof Arabis alpine L. (Brassicaceae). MolecularEcology 15: 825-839.

LESSA EP, JA COOK & JL PATTON (2003) Geneticfootprints of demographic expansion in NorthAmerica, but not Amazonia, during the LateQuaternary. Proceedings of the National Academyof Sciences 100: 10331-10334.

LUIKART G & PR ENGLAND (1999) Statistical analysisof microsatellite DNA data. Trends in Ecology &Evolution 14: 253-256.

LUNT DH, LE WHIPPLE & BC HYMAN (1998)Mitochondrial DNA variable number tandemrepeats (VNTRs): utility and problems in molecularecology. Molecular Ecology 7: 1441-1455.

MARTIN AP & SR PALUMBI (1993) Body size,metabolic rate, generation time, and the molecularclock. Proceedings of the National Academy ofSciences USA 90: 4087-4091.

MEJÍA-MADRID H, E VÁZQUEZ-DOMÍNGUEZ & GPÉREZ-PONCE DE LEÓN (2007) Phylogeographyand freshwater basins in Central Mexico: recenthistory as revealed by the f ish parasiteRhabdochona lichtenfelsi (Nematoda). Journal ofBiogeography 34: 787-801.

MUWANIKA VB, S NYAKAANA, HR SIEGISMUND &P ARCTANDER (2003) Pylogeography andpopulation structure of the common warthog(Phacochoerus africanus) inferred from variation inmitochondrial DNA sequences and microsatelliteloci. Heredity 91: 361-372.

MUMMENHOFF K, H BRÜGGEMANN & JL BOWMAN(2001) Chloroplast DNA phylogeny andbiogeography of Lepidium (Brassicaceae).American Journal of Botany 88: 2051-2063.

NORDBORG M (2000) Coalescent theory. En: BaldingDJ, MJ Bishop & C Cannings (eds) Handbook ofstatistical genetics: 1-37. John Wiley & Sons,London, United Kingdom.

PALMER JD (1990) Contrasting modes and tempos ofgenome evolution in plants and algae. Trends inGenetics 6: 115-120.

PANCHAL M (2007) The automation of nested cladephylogeographic analysis. Bioinformatics 23: 509-510.

PETERS JL, W GRETES & KE OMLAND (2005) LatePleistocene divergence between eastern and westernpopulations of wood ducks (Aix sponsa) inferred bythe “isolation with migration” coalescent method.Molecular Ecology 14: 3407-3418.

PETIT RJ (2008) The coup de grâce for the nested cladephylogeographic analysis? Molecular Ecology 17:516-518.

POSADA D (2006) ModelTestServer: a web-based tool forthe statistical selection of models of nucleotidesubstitution online. Nucleic Acids Research 34:W700-W703.

POSADA D & KA CRANDALL (2001) Intraspecific genegenealogies: tress grafting into networks. Trends inEcology & Evolution 16: 37-45.

POSADA D, KA CRANDALL & AR TEMPLETON(2000) GeoDis: a program for the cladistic nestedanalysis of the geographical distribution of genetichaplotypes. Molecular Ecology 9: 487-488.

POSADA D, KA CRANDALL & AR TEMPLETON(2006) Nested clade analysis statistics. MolecularEcology Notes 6: 590-593.

REEB V, P HAUGEN, D BHATTACHARYA & FLUTZONI (2007) Evolution of Pleopsidium(Lichenized Ascomycota) S943 group I introns andthe phylogeography of an intron-encoded putativehoming endonuclease. Journal of MolecularEvolution 64: 1432-1432.

RICHARDSON BA, J BRUSFELD & B KLOPFENSTEIN(2002) DNA from bird-dispersed seed and wind-disseminated pollen provides insights intopostglacial colonization and population geneticstructure of whitebark pine (Pinus albicaulis).Molecular Ecology 11: 215-227.

RIDDLE BR, DJ HAFNER, LF ALEXANDER & JRJAEGER (2000) Cryptic vicariance in the historicalassembly of a Baja California peninsular desertbiota. Proceedings of the National Academy ofSciences USA 97: 14438-14443.

ROGERS AR & H HARPENDING (1992) Populationgrowth makes waves in the distribution of pairwisegenetic differences. Molecular Biology andEvolution 9: 552-569.

SMITH TB, K HOLDER, D GIRMAN, K O’KEEFE, BLARISON & T CHAN (2000) Comparative avianphylogeography of Cameroon and EquatorialGuinea mountains: implications for conservation.Molecular Ecology 9: 1505-1516.

SMIT HA, TJ ROBINSON & BJ VAN VUUREN (2007)Coalescence methods reveal the impact ofvicariance on the spatial genetic structure ofElephantulus edwardii (Afrotheria, Macroscelidea).Molecular Ecology 16:2680-2692.

SOLTIS DE, PS SOLTIS & BJ MILLIGAN (1992)Intraspecific chloroplast DNA variation: systematicand phylogenetic implications. En: Soltis PS & JJDoyle (eds) Molecular systematics of plants: 117-150. Chapman & Hall, New York, USA.

SPELLMAN G & J KLICKA (2007) Pylogeography of theWhite-breasted Nuthatch (Sitta carolinensis):diversification in North American pine and oakwoodlands. Molecular Ecology 16: 1729-1740.

STRIMMER K & OG PYBUS (2001) Exploring thedemographic history of DNA sequences using thegeneralized skyline plot. Molecular Biology andEvolution 18: 2298-2305.

TAJIMA F (1983) Evolutionary relationships of DNA

Page 21: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

297AVANCES METODOLÓGICOS EN FILOGEOGRAFÍA

sequences in finite populations. Genetics 105: 437-460.

TEMPLETON AR (1983) Phylogenetic inference fromrestriction endonuclease cleavage site maps withparticular reference to the evolution of man and theapes. Evolution 37: 221-244.

TEMPLETON AR (1998) Nested clade analyses ofphylogeographic data: testing hypotheses aboutgene flow and population history. MolecularEcology 7: 381-397.

TEMPLETON AR (2002) Out of Africa again and again.Nature 416: 45-51.

TEMPLETON AR (2004) Statistical phylogeography:methods of evaluating and minimizing inferenceerrors. Molecular Ecology 13: 789-809.

TEMPLETON AR (2008) Nested clade analysis: anextensively validated method for strongphylogeographic inference. Molecular Ecology 17:1877-1880.

TEMPLETON AR & CF SING (1993) A cladistic analysisof phenotypic associations with haplotypes inferredfrom restriction endonuclease mapping. IV. Nestedanalyses with cladogram uncertainty andrecombination. Genetics 134: 659-669.

TEMPLETON AR, KA CRANDALL & CF SING (1992)A cladistic analysis of phenotypic associations withhaplotypes inferred from restriction endonucleasemapping and DNA sequence data. III. Cladogramestimation. Genetics 132: 619-633.

TEMPLETON AR, E ROUTMAN & C PHILLIPS (1995)Separating population structure from populationhistory: a cladistic analysis of the geographicaldistribution of mitochondrial DNA haplotypes inthe tiger salamander, Ambystoma tigrinum. Genetics140: 767-782.

VÁZQUEZ-DOMÍNGUEZ E (2002) Phylogeography,

historical patterns and conservation of natural areas.En: Nelson G, JC Day, LM Sportza, J Loucky & CVásquez (eds) Protected areas and the regionalplanning imperative in North America: 369-378.University of Calgary Press, Calgary, Canada.

VÁZQUEZ-DOMÍNGUEZ E (2007a) ¿Cuál es el enfoquede la ecología molecular? Ejemplos con un ratónespinoso. En: Sánchez-Rojas G & AE Rojas-Martínez (eds) Tópicos en sistemática, biogeografía,ecología y conservación de mamíferos: 59-70.Universidad Autónoma del Estado de Hidalgo, SerieCiencia al día 1, México.

VÁZQUEZ-DOMÍNGUEZ E (2007b) Filogeografía yvertebrados. En: Eguiarte L, V Souza & X Aguirre(eds) La ecología molecular de plantas y animales:441-466. INE/Conabio, México.

VÁZQUEZ-DOMÍNGUEZ E, A MEJÍA-MADRID & RVEGA (2009) Oryzomys couesi en el sureste deMéxico: estimaciones genéticas y filogeográficas.En: Cervantes FA, J Vargas-Cuenca & Y Hortelano-Moncada (eds) 60 años de la Colección Nacional deMamíferos del Instituto de Biología, UNAM.Aportaciones al conocimiento y conservación de losmamíferos mexicanos. Instituto de Biología, UNAM,México.

WAINSCOAT J (1987) Out of the garden of Eden. Science234: 194-196.

WRIGHT S (1931) Evolution in Mendelian populations.Genetics 16: 97-159.

WRIGHT S (1943) Isolation by distance. Genetics 28:114-138.

ZUCKERKANDL E & L PAULING (1965) Evolutionarydivergence and convergence in proteins. En: BrysonV & HJ Voegel (eds) Evolving genes and proteins:97-166. Academic Press, New York, USA.

Editor Asociado: Elie PoulinRecibido el 29 de febrero de 2008; aceptado el 25 de marzo de 2009

Page 22: Avances metodológicos para el estudio conjunto de la … · 2009. 9. 11. · Avances metodológicos para el estudio conjunto de la información genética, genealógica y geográfica

298 VÁZQUEZ-DOMÍNGUEZ ET AL.