Aplicación de métodos para la inferencia filogenética en el estudio
Transcripción
Aplicación de métodos para la inferencia filogenética en el estudio
Aplicación de métodos para la inferencia filogenética en el estudio de las relaciones entre Cetartiodáctilos: un acercamiento basado en morfología y ADN Javier Enrique Colmenares Pinzón (2071178) Silvia Ximena Vásquez (2071661) Edgar Pedraza Leguizamo (2071157) Olmer Julian Toloza Moreno (2071405) RESUMEN La inconclusa posición filogenética asignada a los Cetáceos por distintos autores ilustra el conflicto entre la información potencial que puede extraerse a partir de datos moleculares y morfológicos, más aún cuando se trata de grupos con un amplio registro fósil. Usando un set de datos de 635 caracteres morfológicos y 7981 moleculares registrados para 78 taxa exploramos las relaciones filogenéticas del grupo en conjunto referenciado como Cetartiodactyla, mediante técnicas de Maxima Parsimonia, Maximum Likelihood e inferencia Bayesiana. Aunque las topologías basadas en caracteres moleculares obtenidas mediante ML sostienen la relación de Cetaceamorpha con Hippopotamidae, su poder de resolución se limita a la parte histórica reciente del grupo mientras que los análisis de evidencia total con MP e IB, aunque soportan la monofilia de Artiodactylamorpha, no contradicen ni aclaran con certeza la relación entre Cetaceamorpha e Hippopotamidae . INTRODUCCIÓN Los Cetáceos son un grupo de mamíferos acuáticos cosmopolitas típicos de ecosistemas marinos y dulceacuícolas [17]. Numerosos análisis filogenéticos basados en moléculas, morfología y una combinación de los dos, sugieren una inestabilidad en las relaciones de las ballenas con otros grupos que ha ido creciendo con el incremento del registro fósil de su paso de la vida en la tierra a la vida acuática. Mediante el presente trabajo buscamos abordar la problemática y con el uso de diferentes métodos de inferencia filogenética resolver dos cuestiones de interés particular: es Cetartiodactyla un grupo monofilético? ¿Cuál es el grupo hermano de los cetá ceos? MATERIALES Y MÉTODOS Se utilizó como punto de referencia para el presente trabajo la matriz compilada y recodificada por [1] para un total de 71 taxa y 635 caracteres morfológicos. Se seleccionaron como caracteres moleculares 3 genes nucleares (RAG1, PRM1, LALBA) y 3 mitocondriales (NADH, CYTB, 12S) con base en [1,2] y se recopilaron secuencias de ADN de al menos uno de estos 6 caracteres para 26 de los taxa existentes de [1] y para 7 taxa complementarios usando GenBank y BLASTN. Asumiendo en algunos casos monofilia de especies y de géneros, de los 78 taxa utilizados, 76 fueron registrados a nivel de género y los dos restantes a nivel de familia. Oryceteropus, Tapirus, Equus y Rhinocerotidae se usaron como outgroups. Se realizó un análisis de sensibilidad en el programa POY [3] aplicando la misma estrategia de búsqueda a cada partición y a la combinación de las mismas y variando las tasas de transición, transversión y gap mediante 3 sets de costos diferentes (1:1:1; 1:2:2 y 1:2:4). Se calculó el Índice de Incongruencia de Longitudes [4] y el costo con mínima incongruencia se seleccionó como el “mejor” para realizar un análisis de máxima parsimonia más profundo para la evidencia total con una búsqueda de Wagner (Build=125), un swap mediante alternancia de TBR y SPR y un bootstrap paramétrico de 100. Después del alineamiento de las secuencias de ADN de cada partición en el programa SeaView versión 4.3.3 [5] se utilizó el programa JModelTest versión 0.1.1 [6] para hallar el modelo de sustitución de cada una implementando el criterio de información de Akaike (AIC). Posteriormente se ejecutó un análisis de Maximum Likelihood en el programa PhyML versión 3.0 [7] para cada partición y finalmente, para la evidencia total, se corrió un análisis de inferencia filogenética Bayesiana durante 10 millones de generaciones con el programa MrBayes versión 3.2 [8] utilizando 4 cadenas de Markov) y una frecuencia de muestreo de 10 mil. Para este último análisis 13 taxa fósiles fueron omitidos para obtener una mejora en el tiempo computacional. RESULTADOS El análisis de diferentes esquemas de costos en las búsquedas con POY indicó mínima incongruencia entre particiones cuando se asignó el mismo costo a sustituciones y gaps (1:1:1) y un peso de 1 a la morfología según lo indicado por el valor del Índice de Incongruencia de Longitudes (ILD=0,1106). En cuanto al análisis de evidencia total, el consenso estricto de los árboles más parsimoniosos, con una longitud mínima de 16.213 pasos, evidenció la monofilia de Artiodactylamorpha con un valor de soporte de bootstrap no paramétrico de 0,71 corroborando así la primera hipótesis del presente trabajo (Figura 1). Sin embargo, como lo muestra la topología, dentro de este gran grupo fueron incluidos taxa tradicionalmente usados como outgroups (†Phenacodus, †Hyracotherium, †Hyopsodus y Orycteropus), lo cual surge como resultado irregular en contraposición a las topologías consenso de trabajos como el de [1,9,10]. Pese a esto, los valores de soporte de los nodos indican que las posiciones de dichos taxa no se recupera ron en más del 12% de las pseudoreplicas. Pese a que claramente se distingue a Cetaceamorpha como el grupo más anidado dentro de Artiodactylamorpha, la obtención de una respuesta clara respecto a su monofilia fue difícil debido a la posición inusual de Physeter y Megaptera, que fue inestable según algunas politomias recuperadas en uno de los árboles más parsimoniosos. Sin embargo, la agrupación de los cetáceos restantes está soportada por un valor de Bootstrap de 0,16 siendo †Ambulocetus el miembro más basal. Los mayores valores de soporte, recuperados en lo nodos que agrupan los cetáceos más anidados, pueden ser el reflejo de la buena disponibilidad de información para los taxa en todas las particiones (Tabla 2). Los valores de Bootstrap no soportan la monofilia del clado extinto Mesonychia, sin embargo, según los resultados de máxima parsimonia se trata del grupo basal de Cetaceamorpha y por lo tanto el más cercanamente relacionado en acuerdo con [1,11,12]. La posición de †Mesonychia ha sido ampliamente cuestionada sobre todo después del reporte de la aparición de esqueletos fosilizados de ballenas arcaicas con características diagnós ticas de los Artiodáctilos [14,15]. Este último autor, al igual que [9,10,13], presenta una topología en la cual †Mesonychia es excluido totalmente de Artiodactylamorpha, hecho atribuido a la inclusión de dicho material fósil en los análisis. Sin embargo, en [1] la misma inclusión no altera la posición de †Mesonychia como grupo hermano de Cetaceamorpha y su anidamiento dentro d e Artiodactylamorpha al igual que en nuestros análisis. Las relaciones de Cetaceomorpha con algún taxón viviente no están claramente definidas en la topología. El grupo más cercano ((Potamochoerus+Sus)Lama) resulta de una asociación no común entre un mie mbro de la familia Camelidae y dos miembros de la familia Suidae, lo cual posiblemente explique el valor de soporte para el nodo (BS=0,03), mientras que si se ignoran estos nodos poco soportados se podría hablar de una relación cercana entre Hippopotamidae+Merycopotamus (cuyo clado está soportado con un valor de Bootstrap de 0,46) y Cetaceamorpha, constituyendo de esta forma el grupo Cetancodonta, comúnmente reportado en otros análisis [1,9,10,12,15]. Aunque es apresurado hablar de resultados contundentes, a grandes rasgos la segunda hipótesis del presente trabajo es corroborada mediante el análisis de máxima parsimonia efectuado en POY para la evidencia total. Por otra parte, en cuanto al análisis de inferencia bayesiana , la topología consenso resultante muestra la carencia de resolución en un gran número de nodos y por lo tanto la inestabilidad en la posición de muchos taxa (Figura 2). Atribuimos lo anterior principalmente a que el análisis corrido durante 10 millones de generaciones no alcanzó una desviación estándar de las frecuencias de divergencia cercana a 0,01, valor sugerido por [8] como referencia de convergencia. Al igual que en el análisis de máxima parsimonia de manera general se evidencia la monofilia de Artiodactylamorpha con un valor de probabilidad posterior de 0,99, sin embargo, la inclusión inestable de taxa utilizados como outgroups surge como resultado irregular tal y como sucede con el consenso de MP. Aunque es clara la inclusión de Cetaceamorpha dentro de Artiodactylamorpha, la monofilia del clado no está clara debido a las posiciones inestables de Megaptera , Physeter, †Pakicetidae, †Ambulocetus y †Rodhocetus, sin embargo si se ignoraran estos taxa, el grupo de las ballenas está soportado por un valor de PP de 1. Contrario a los resultados obtenidos con MP, la relación de Cetaceamorpha con otros grupos no está bien definida debido a la polaridad de la topología en cuyo caso a un lado de este clado se ubican los Ruminantios (PP=0,94) y al otro lado Hippopotamidae+Merycopotamus (PP=0,84). En el análisis ML se obtuvieron seis topologías diferentes (Figura 3) construidas a partir de los modelos evolutivos seleccionados según el criterio Akaike para cada gen (12S y RAG1=GTR +Γ), (CYTOB Y NADH=GTR +I +Γ), (LACT =HKY +Γ) y (PROT1 =TPM1uf +Γ). Se evidencia en la mayoría de ellas la monofilia de Cetartiodactyla con soporte >80%, en acuerdo con lo reportado por [1,18,19,20], siendo las obtenidas a partir de CYTOB y NADH las que resuelven más claramente el anidamiento de Cetacea dentro de Artiodactyla al igual que su relación cercana con Hippopotamidae con valores de soporte de 73% y 67% respectivamente. CONCLUSIONES Aunque en parte los resultados obtenidos en el presente estudio concuerdan con los de otros autores, existen notables incongruencias entre las técnicas de análisis filogenéticos cuando se usan o bien datos moleculares o datos morfológicos independientemente. Si bien las relaciones entre taxa existentes pueden resolverse mediante la inclusión de caracteres moleculares, la reconstrucción de los nodos más basales depende de la inclusión de caracteres morfológicos de taxa fósiles lo cual en el caso de Cetartiodactyla también permite la reconstrucción de la historia ligada al paso de una vida terrestre a una vida acuática. Por lo anterior, análisis filogenéticos usando matrices de evidencia total pueden conjugar las bondades de los datos moleculares y morfológicos siempre y cuando el muestreo de caracteres sea completo y la aplicación de los métodos lo más rigurosa posible . En el presente estudio se dio un paso a la comprensión de la problemática de la reconstrucción de relaciones filogenéticas y aunque se muestra la monofilia de Artiodactylamorpha y las relaciones de Cetaceomorpha con otros clados, aún existen problemas limitando una mejor resolución de la topología que deben ser mejorados a futuro. REFERENCIAS [1] O’Leary, M.A., Gatesy, J. , 2008. Impact of Increased character sampling on the phylogeny of Cetartiodactyla (Mammalia): combined analysis including fossils. Cladistics 24: 397 -442. [2] McGowen, M. R., Spaulding, M., Gatesy, J., 2009. Divergence date estimation and a comprehensive molecular tree of extant cetaceans. Molecular Phylogenetics and Evolution 53: 891 906 [3] Varón, A., Vinh, L.S. Wheeler, W.C. 2010. POY version 4: phylogenetic analysis using dynamic homologies. Cladistics 26: 72-85 [4] Farris, J.S., Källersjo, M., Kluge, A. G., Bult, C., 1995. Testing significance of incongruence. Cladistics 10: 315-319 [5] Gouy, M., Guindon, S., Gascuel, O., 2010. SeaView version 4: a multiplataform graphical user interface for sequence alignment and phylogenetic tree building. Molecul ar Biology and Evolution 27(2): 221-224 [6] Posada, D., 2008. JModelTest: Phylogenetic Model Averaging. Molecular Biology and Evolution 25: 1253-1256 [7] Guindon, S., Gascuel, O., 2003. PhyML:” A simple, fast and accurate algorithm to estimate large phylogenies by maximum likelihood”. Systematic Biology 52 (5): 696-704 [8] Ronquist, F., Huelsenbeck, J.P., 2010. MrBAYES 3.2: Bayesian phylogenetic inference under mixed models. Bioinformatics 19: 1572-1574 [9] Spaulding, M., O’Leary, M.A., Gatesy, J., 2009. Relationships of Cetacea (Artiodactyla) Among Mammals: Increased Taxon Sampling Alters Interpretations of Key Fossils and Character Evolution. PLoS ONE 4 (5) [10] Geisler, J.H., Uhen, M.D., 2005. Phylogenetic Relationships of Extinct Cetartiodactyls: Results of Simultaneous Analyses of Molecular, Morphological, and Stratigraphic Data. Journal of Mammalian Evolution 12: 145-159. [11] O’Leary, M.A., Geisler, J.H., 1999. The Position of Cetacea Within Mammalia: Phylogenetic Analysis of Morphological Data from Extinct and Extant Taxa. Systematic Biology 48 (3): 455-490 [12] Geisler, J.H., 2001. New Morphological Evidence for the Phylogeny of Artiodactyla, Cetacea and Mesonychidae. American Museum of Natural History. [13] Geisler, J. H., Uhen, M.D., 2003. MORPHOLOGICAL SUPPORT FOR A CLOSE RELATIONSHIP BETWEEN HIPPOS AND WHALES. RAPID COMMUNICATION. Journal of Vertebrate Paleontology 23 (4): 991-996 [14] Gingerich, P.D., Haq, M., Zalmout, L.S., Khan, I.H., 2001. Origin of Whales from Early Artiodactyls: Hands and Feet of Eocene Protocetidae from Pakistan. SCIENCE 293: 2239-2242 [15] Thewissen, J.G.M., Williams, E.M., Roe, L.J., Hussain, S.T., 2001. Skeletons of terrestrial cetaceans and the relationships of whales to artiodactyls. NATURE 413 277 -281 [16] Perrin, W.F., Würsig, B., Thewissen, J.G.M., 2002. Encyclopedia of Marine Mammals. Academic Press, San Diego, California. [17] Matthee, C.A., Burzlaff, J.D., Taylor, J.F., Davis, S.K., 2001. Mining the Mammalian Genome for Artiodactyl Systematics. Systematic Biology 50(3): 367-390. [18] Hassanin, A., Delsuc, F., Ropiquet, A., Hammer, C., Van Vuuren, B, J., Matthee, C., Garcia, M., Catzeflis, F., Areskoug , Veronika ., Nguyen, T, T., Couloux, Ar naud ., 2012. Pattern and timing of diversification of Cetartiodactyla (Mammalia, Laurasiatheria), as revealed by a comprehensive analysis of mitochondrial genomes. Comptes Rendus Biologies 335: 32–50. [19] Zhou, X., Xu, S., Yang, Y., Zhou, k., Y, Guang. , 2011. Phylogenomic analyses and improved resolution of Cetartiodactyla. Molecular Phylogenetics and Evolution 61: 255 –264. FIGURAS Y TABLAS Figura 1. Consenso estricto (Longitud=16.213) del análisis de MP en POY. Se muestran los valores de soporte de Bootstrap en los nodos. Se cree que la monofilia de Artiodactylamorpha está reportada (BS=0,71) pese a la inclusión irregular de los outgroups. † Mesonychia es el grupo más relacionado con Cetaceamorpha mientras que Hippopotamidae sea posiblemente el taxón viviente más emparentado con las ballenas. Figura 2. Consenso de la mayoría obtenido mediante IB en MrBayes. Los valores de probabilidad posterior aparecen para cada nodo. Se aprecia claramente la inestabilidad de numerosos taxa, especialmente fósiles. Se soporta la monofilia de Artiodactylamorpha (PP=0,99). Las relaciones de Cetaceomorpha con algún otro grupo son difusas. Figura 3. Comparación de las topologías obtenidas en el análisis de ML para cada gen. Se aprecian discrepancias entre genes nucleares y mitocondriales en la resolución de las relaciones de Cetáceos con otros grupos. Tablas 1 y 2. RAG1 TAXA Orycteropus Odobenus Equus Tapirus Rhinocerotidae Lama Camelus Pecari Sus Potamochoerus Babyrousa Tragulus Moschus Antilocapra Giraffa Cervus Odocoileus Ovis Bos Hippopotamus Balaenoptera Megaptera Eubalaena Kogia Physeter Ziphius Pontoporia Inia Sotalia Grampus Delphinapterus Monodon Tursiops RAG1 JN414911 PRTM 1 ----- AY239184 AY726547 AY239186 AY059705 ------------- --- EU189425 EU189410 EU189404 ----- ------------- JN414895 EU189419 AY122033 JN414861 EU189418 EU189401 ------- AY239177 FJ900270 AF447520 GU394038 AY011909 AY011878 AY239185 AY011910 AY239183 EU189411 LALBA --- NADH --- CYTB --- 12s NC_002078.1 EF465501 NC_004029.2 GU174611.1 AJ428576.2 ------- NC_001788 NC_001788.1 AJ428947.1 AF145734 X97336.1 JF718877.1 ------- AJ007814 AP003426 AP003426.1 AY012144.1 AP003423.1 AP003423.1 GU598215.1 AP003427 AP003427.1 AY546515.1 DQ518915 NC_014692.1 GQ338938.1 AY534300.1 GQ338939.1 Z50106 GQ338943.1 AY121994 AY121991 AY121995 AY121988 AY122014 ----------- AF091629 AF091706 AY122015 AP003424 AY121992 AY121986 AY122017 NC_007704 AJ000021 AF091707 AY122022. AP003423.1 AF091630 AF091708.1 AY122026 DQ320087 AF034730 AF091699 AY122023 NC_006853 V00654 V00654 GQ368528 AY122012 NC_000889 Y08813 Y08810 EU445017 EU444931 AY398656 NC_001601 X61145 X61145 AF447522 EU444929 AY398651 AY398624 X75584a AP006467.1 GQ368545 GQ368526 AY398660 NC_006930.1 X75587a AP006473 JN414901 GQ368525 AF304096 AJ554055.1 AJ554055.1 AJ554055.1 JN414858 EU444927 AF304098 AJ277029 AJ277029.2 NC_002503.2 EU445014 EU444928 AF228412 AY398623 AF304075.1 U13101.1 EU189407 GQ368530 AF304093 --- AJ554060.1 AJ554060.1 EU189406 GQ368529 AF304092 NC_005276.1 AJ554059.1 NC_005276.1 JF505023 JF505012 AF304091 --- AF304067.1 AF304055.1 GQ368537 GQ368513 EU121196 EU557095.1 AF084059.1 EU557095.1 GQ368540 GQ368517 AF228409 AY398628.1 X92531a --- EU189405 GQ368516 AJ007812 NC_005279.1 U72038.1 AJ554062.1 GQ368532 GQ368508 EU121185 EU557093 X92526.1 EU557093.1 JN414893 EU189399 Tabla 1 (Izquierda). Terminales, particiones y números de acceso a GenBank Tabla 2 (Derecha). Particiones de los datos. Los cuadros negros indican que se obtuvo información (secuencias y morfología) Orycteropus Odobenus Hyopsodus † Phenacodus † Hyracotherium † Equus Tapirus Rhinocerotidae Protoceras † Poebrotherium † Lama Camelus Perchoerus † Pecari Xenohyus † Sus Potamochoerus Hylochoerus † Babyrousa Protungulatum † Diacodexis a † Diacodexis b † Cainotherium † Leptomeryx † Tragulus Moschus Antilocapra Giraffa Cervus Odocoileus Ovis Bos Merycoidodon † Agriochoerus † Libycosaurus † Anthracokeryx † Microbunodon † Bothriogenys † Elomeryx † Merycopotamus † Choeropsis Hippopotamus Siamotherium † Achaenodon † Andrewsarchus † Indohyus † Brachyhyops † Archaeotherium † Gobiohyus † Helohyus † Eoconodon † Sinonyx † Harpagolestes a † Harpagolestes b † Mesonyx† Dissacus a † Dissacus b † Pachyaena † Hapalodectes † Pakicetidae † Artiocetus † Ambulocetus † Rodhocetus † Dorudon † Basilosaurus † Balaenoptera Megaptera Eubalaena Kogia Physeter Ziphius Pontoporia Inia Sotalia Grampus Delphinapterus Monodon Tursiops PRTM 1 LALBA NADH CYTB 12s Morfo