Enigmas en el origen de las lenguas andinas: aplicando
Transcripción
Enigmas en el origen de las lenguas andinas: aplicando
Enigmas en el origen de las lenguas andinas: aplicando nuevas técnicas a las incógnitas por resolver Paul Heggarty A Alfredo Torero, in memoriam. l. Introducción El presente artículo 1 es el resultado de un estudio comparativo de veinte variedades de lenguas andinas de las familias quechua, aimara2 y uru-chipaya; basado en la recolección de nuevos datos en un reciente trabajo de campo, al igual que en la aplicación de nuevas técnicas para la interpretación de los mismos. La Figura 1 muestra la ubicación geográfica de las veinte variedades consideradas en nuestro estudio, además de los principales grupos geográficos dentro de la familia quechua. 2 Agradecemos al Dr. Rodolfo Cerrón-Palomino por sus valiosos y generosos consejos a lo largo de los últimos tres años, tanto en lo vinculado con nuestros datos como en lo concerniente a nuestras dudas en diferentes aspectos de la lingüística andina. De igual manera, no hubiera sido posible esta presentación de nuestro estudio sin el empei10 de Dante Oliva León, quien nos ayudó a lo largo del proceso de su adaptación al castellano, y las agudas observaciones finales de Marco Ferrell, así como también una mas del Dr. Rodolfo Cerrón-Palomino. Sin pretender pronunciamos en el tema, para los fines puramente prácticos seguimos en el presente artículo la nomenclatura propuesta por Cerrón-Palomino (1993). Así, el aru de Torero y el jaqi de Hardman serán simplemente nuestro aimara (en tanto familia, y no en tanto lengua); mientras que la lengua que para estos dos últimos autores es el aimara corresponde a lo que aquí siempre calificamos de aimara sureño. Nº 40, primer semestre del 2005 9 m Figura 1. Familias lingüísticas de los Andes centrales o !!l. e a. 6' (/1 '< COLOMBIA Lu~:ir,·, 1k r,·ali,.adún S ub-g rup os de la famili.1 quechua ,fo l r:.1haju ( 'lih:t1á1m ,k lo., 10 /11gm ·, .~ ,h· 1-ca li:ad,in d, 1n1b,~jo ,k· t1llllf'" de 1,11' 1Hricdt1dn u111s1dcn,da., ,r.- r an1p11 ('/ ld/11\:.H: IJ/t.'c.l flltfio oCD CT O,) ;(/1 1 Ecuador 1 Q llh s..,n.n:.1 Qllh Truj,· .\'n, f:'.11c 1110¡41 .ff li11 ,:0111hi11t1dt1 10111a11do , ·0111" Ji1e111,·.1 ¡'J C:llcit1flllt'J1/{· . /u .11//II/H. l,•l(IIC St 0 /("l/ ('l/ ll'tllll ' /I fr¡ ( ·n.,.,',11./'afo111111u COOJ). In,· c11aln ,1 _,11 n := .l"l' h11,\ lll"011 1.:11 los J' .; • l .,·1·iwnl111 ( f9i6) '."':\,; ··""' '"' ' -~.'"' 111a¡,a.,· ,le /kll'd l:i.:11<1dor • 7i,rau(l 1r./J¡,w·,1/•,.,.,¡ • l'l,1:(1 y ( 'ama mi ( I fJ85) PERI' 1 N. del Perú J / { ··, F Sureño . . . _\ ···</ QI Yii nac QI C haq1ar ... "·•·. 1 Ql Hu:i. nu1,:11 Qllr A t:al\:i E .·11/ Lu;:arl·~ de n::.li t:11:itl n lle 1ro1h:1jn,k ,·:1mr11 - · --- ~ ---J A~C C:ll"hU.\ AyC Tupe Cuzco-Collao /folhia BRASIL Qll;i ln nhua~i Qll:i C h... till:.i ptHll ,.......,. .1,,,. Sub-grupos de la familia aimara 1 Central Qlh: Culn• Qlh: Cu rn, S. de Bolivia ;;o Qlh: T :u¡uik A~·S Hu:.inn né Qlk Puno A~'S Sii ll n l ltl .\"17"! AyS Pu1¡ui l',111 Qlh: MU;l\\ll ~ No111,·: 1-:.n .1·fl•n mú.~ 1uril·tla<Íl'.1 dl'l,¡m•dma ,·11 d 11111k ,k· Arg1:111ina ¡¡; /.ax ahrL·via111ra.1· ,ft· los nombrt·.1· y ,·laxific:a,·u,11,·s ti,· las 1'(1ricdacln· ('orrelpond,·11 )> ,·11 /m gr,¡tit·ol· ,·n rn_fi,rma orixmal ,·n in¿;h:.,. (por ,·r,·mp/11 .H' do :\yC ~ a. 5· O,) F Qllc Pucuna CD < ¡¡;· 1/nr n111 /(f.1 q11t· K wky no AiC c:iuquil . apw·,•,·,·n ·--\r··,~-\ ARGEÑTI NA Famitta Uru-Chipaya j Pau/ Heggarty: Enigmas en el origen de las lenguas andinas Nuestro propósito fundamental consiste en cuantificar el grado de semejanza existente entre las variedades en cuestión, tanto en el nivel fonético 3 como en el semánticoléxico. Dichas cuantificaciones no se obtienen por medio de las técnicas tradicionales de cuantificación - tales como la lexicoestadística- ampliamente criticadas, sino por métodos más recientes desarrollados , en ambos casos (la fonética y la semántica léxica) , por nosotros mismos . Estos métodos nos vienen resultando más adecuados que los tradicionales . En una segunda etapa, analizamos el conjunto de resultados del proceso inici al de cuantificación, a través de programas (software) para el análisis filogenético , también de reciente aparición. Dichos programas posibilitan nuevas y reveladoras maneras de representar e interpretar las relaciones entre las familias idiomáticas implicadas, como también acerca de su desarrollo histórico y, por extensión, el de sus pueblos hablantes. Resulta importante aclarar desde el inicio que nuestros cotejos fonéticos se presentarán en un artículo posterior y que el presente se limita únicamente a los resultados concernientes a nuestro estudio léxico, los cuales desde ya arrojan un cariz novedoso e interesante acerca de las preguntas clásicas sobre los orígenes y las relaciones entre las familias quechua y aimara, entre ellas el añejo debate "quechumara" de si existe o no un tronco común en su desarrollo. Aunque dicha cuestión resulta para Torero (2002: 154) un asunto zanjado , para otros lingüistas ello todavía no tiene una respuesta definitiva. Según Cerrón-P alomino (2000: 337) : " En suma, la .cuestión del origen común de ambas lenguas no es un caso cerrado"; para Campbell (1995 : 157): "La cuestión( ... ) tiene que dej arse abierta, y requiere mayor investigación 4 ". Así, pues, luego de transcurridas cuatro décadas de haberse empezado a abordar la cuestión de manera científico-lingüística, el asunto continúa siendo un caso irresuelto. Pareciera, pues, que estamos topándonos con los límites inherentes a lo que con confianza pueden decirnos las técnicas actualmente a disposición de la lingüística histórico-comparativa y que una respuesta definitiva a la cuestión quechumara escapara a su alcance . Se han intentado novedosos enfoques metodológicos, por ejemplo en Campbell ( 1995), y el perspicaz trabajo de Adelaar ( 1986). Sin embargo, a pesar de los frutos obtenidos, el propio Campbell (1995 : 194) reconoce que siempre quedamos frente a "pistas sugestivas, pero nada que sea concluyente". Como bien lo resume Cerrón-Palomino (2000: 337): "pese a [tales] intentos ( .. .) nos quedamos con la sensación de no haber adelantado mucho en la dilucidación del problema". Tal es el contexto dentro del cual se inscribe la presente investigación. Para lograr cualquier progreso en el problema considerado, la lingüística comparativa parece necesitar de nuevas técnicas que permitan abordar los datos comparativos con mayor sensibilidad que las técnicas tradicionales, en particular, cualquier método que pueda ayudar a distinguir los rasgos de origen común de aquellos que son producto de la convergencia. Es tarea del presente artículo proponer y presentar algunas técnicas que pueden ayudarnos en este sentido. 3 4 Como bien consideramos más adel ante , el estudio relativo al aspecto fonético queda pendiente para una posterior publicación. Toda traducción de citas en el presente a11ículo es nuestra. Nº 40 , primer semestre del 2005 11 Estudios y Debates 2. Avance de resultados Con el riesgo de invertir el orden convencional de presentación de un trabajo científico, pero con la ventaja de dar a nuestros lectores una idea general de lo que nu~stro método busca proporcionar, comenzamos ofreciendo algunos de los principales resultados de nuestra investigación. La Figura 2 presenta las cuantificaciones de semejanza de la semántica léxica (representada por una muestra de 150 significados) entre todas las variedades de las lenguas andinas estudiadas por nosotros hasta la fecha, más el castellano como una referencia externa. A su vez, estas cuantificaciones servirán luego como datos de entrada para los programas de representación gráfica. Inherentes a este conjunto de cuantificaciones de semejanza, están por descifrarse unos datos "indicadores" sobre las relaciones -genealógicas 5 u otras- entre las variedades en cuestión: la llamada se1ialfilogenética. En ciertas circunstancias históricas, esta señal puede responder a una estructura de simples ramificaciones; aunque en otras, más bien, a configuraciones superpuestas mucho más complejas. Sin embargo, debido a la complejidad de las relaciones multidimensionales que se dan entre un gran número de variedades a la vez, esta señal no es siempre comprensible a simple vista, a partir de las cuantificaciones de semejanza. Así que para diferenciar y dilucidar la señal que pueden esconder tales cifras de semejanza, las introducimos en los programas de análisis filogenético que las convierten en distintos tipos de representación gráfica. Tales programas han sido elaborados en tanto herramientas capaces de sintetizar las relaciones multidimensionales, inherentes a las cifras, en aquella representación gráfica bidimensional que con mayor fidelidad les corresponde, y que resulta mucho más fácil de visualizar. Específicamente, estos programas sirven para el análisisfilogenético. Es decir. que buscan graficar la filogenia de las variedades en cuestión, lo cual equivale, esencialmente, al "árbol genealógico" tradicional. Para ser más precisos, los programas sirven para representar o "reconstruir" aquel proceso de desarrollo histórico que resulte más coherente con las cuantificaciones de semejanza, que ya observamos entre las variedades, y que mejor las explica. Los programas a los que hacemos mención, fueron elaborados fuera de la lingüística, en los campos de la genética y la biología evolutiva, donde se utilizaron, primero, para comparar e investigar los niveles de parentesco entre especies biológicas, sobre la base de cuantificaciones de semejanza derivadas de comparaciones del ADN de dichas especies. El presente estudio, inserto en el contexto de la lingüística andina, está inscrito dentro de un proyecto pluridisciplinario más amplio -Métodos Cuantitativos en la Clasificación de Lenguas"- dirigido por la lingüista April McMahon en la Universidad de Sheffield (Gran Breta- 5 6 12 En el presente artículo seguimos la propuesta de no referirnos a las relaciones de parentesco entre las lenguas con el térn1ino genético sino, más bien, con el término g<'nea/ógico. Este último nos parece más adecuado y evita posibles confusiones con las relaciones genéticas, propiamente dichas, en tre las poblaciones hablantes de tales lenguas. Nuestro proyecto de investigación fue financiado mediante la beca número AN6720/APN 12536 (2001-04) de The Arts and Huma11ities Research Board en el Reino Unido; a ellos nuestro agrade- Revista Andina z Figura 2. Cuantificaciones de semejanza en semántica léxica para 20 variedades de lenguas andinas o .¡:,. -º ~ ~r J .O= ~ diferencia tota l; 100 = identidad total. Las cifras en negrita denotan comparaciones entre variedades de una misma familia lingüistica reconocida como tal. Las ciúas en c:ursiva denotan comparaciones con el castellano. las que tienen un estatus (/) et) particular. y se presentan aquí únicamente para fines ilustr:itivos. 3 et) !:!?. ro a. ~ N o o u, 'J § :¡¡ ~ Sph e > o ~ -~ .,,o e ~ '§ o ó :,: .J o o 6 .Eo u e o u -'= u o "· ·e .... ~ <I) o -;;; <¡; e u 8;.,;' ,oe o. " 1 .... ~ u ~ "e 8o c.. i:_; .e .e o• o• o o o o o o o 3 o ü ;_; ;..; •C., e ,,-. 'J -'= íi. 6 ~ ü ü < < e 1 vi < ] ·; ,-. " <I) c.. 6 -; ;; < g- r.r. < o c. 6 5.6 5.5 3.8 5./ 9.7 8. / 4.0 2.5 3.7 n.n ! .O n.5 n.n /.9 1.3 5./ 3.4 1.5 1.3 .!.9 n.n castellano Ync 91.6 88.1 83.2 79.6 82.2 73.5 71.3 77.9 74.4 72.8 74.8 73.6 70.6 72.0 27.6 27.7 16.8 16.8 18.5 7.3 QI : Y:i.nac Che 91.1 81.3 76.7 79.4 72.2 71 .5 76.7 72.6 69.6 72.6 71.9 68.9 71.0 25.3 26.2 16.8 17.2 18.5 6.6 Q I: Chacpar Hnc 79.8 75.0 78.1 70.5 69.5 73.6 71 .0 68.3 70.0 70.1 66.5 67.9 24.9 26.0 17.2 17.3 19.0 6.6 Ql: Huánuco Lrs 77.0 83.1 78.8 77.6 84.0 79.2 79.9 80.5 80.2 77. 0 79.1 29.0 29.4 16.5 16.0 18. 1 6.0 Q?: Laraos lnk 87.3 67.5 66.9 70.3 64.2 65.1 65.8 65.8 63.0 64.4 24.0 23.8 14_. 7 14.8 14.8 3.8 Qlla: lncahuasi Ch1 79.6 76.8 75.7 71.4 73.1 72.9 72.4 70.7 72.0 27.9 29.3 17.7 16.4 16.5 7.8 Qlla: Chelilla Trj 87.5 79.5 79.5 79.8 80.2 79.5 80.4 80.0 22.5 24.0 16.5 16.5 18.7 7.5 Q ll b: Troje Sm 77.4 77.6 78.1 79.4 77.3 77.8 78.2 21.0 22.7 16.0 15.8 17.6 7.5 Q llb: Serena Atl 87.3 86.7 86.5 87.3 83.3 84.1 26.6 27.7 19.3 18.8 20.6 7.4 Qllc: Atalla Cuz 89.9 90.9 90.0 86.4 87.9 25.3 26.2 20.3 20.5 22.4 7.2 Qilc: Cuzco Pun 91.8 93.9 87.7 88.5 26.3 27.5 23.5 22. 1 24.6 7 .7 Qllc: Puno Tql 93.1 87.4 88. 1 25. 1 :!5.9 2 1.4 20.4 22.7 7.3 Qlh::: Taquilc Cr. 88.2 89.4 26.4 27.5 23.2 21.3 24.~ 7.2 Qll c: Curva Pcn 96.2 23 .9 25.0 19.3 19.4 22.0 7.2 Qlk: Pocona Mr w 24.5 25.9 19.8 19.7 22.6 7.3 Qllc: Marawa -o QJ s. if <Q <Q QJ ?m :::, <e' 3Q) (/) Kwk et) :::, ~ Q <e' et) :::, a. et) 93.8 56.0 55.5 56.2 7 .2 AC: Cae huy (Kawki) Jqr 54.8 53.5 53.7 7.6 AC : Tupe (Jaqaru) Hcn 9 1.6 87.1 14.4 AS: Huancané StT 91.0 15.9 AS : Sullcatiti Puk 15.9 AS : Puqui (/) C hi Ch: Chipaya :::, ¡¡;(/) ro :::, ce e Q) Q) a. s· (;) __J Q) (/) Estudios y Debates ña). Este proyecto busca aplicar tales programas a datos lingüísticos en diferentes familias de lenguas del mundo. Muchos lingüistas reaccionan con comprensibles reservas frente a la aplicación de técnicas de esta naturaleza, a pesar de que ya a nivel mundial se observa un intel\éS creciente acerca de cómo tales métodos se pueden aplicar valiosamente al estudio histórico-comparativo de las lenguas. Sin disponer del espacio suficiente para tratar a profundidad lo relacionado con ei funcionamiento de los programas, remitimos a nuestros lectores a la nueva guía de McMahon y McMahon (en prensa), la cual expone en detalle, a un público lingüista, cómo funcionan y por qué ellos pueden revelarse como he1ramientas muy útiles para la investigación de la historia de las lenguas, una vez configurados de manera apropiada para usos lingüísticos. Tanto la recolección de datos como los análisis de los mismos para producir las presentes cuantificaciones de semejanza, son trabajo realizado enteramente por el autor del presente artículo. Las representaciones gráficas, por otro lado, son trabajo de Robert McMahon, genetista colaborador en el mencionado proyecto, quien aplicó a nuestras cuantificaciones de semejanza dichos programas filogenéticos. Debemos subrayar que estos últimos fueron elaborados por otros investigadores fuera de nuestro proyecto. Utilizamos el programa FITCH, el cual forma parte del paquete PHYLIP de Felsenstein (2001 ), y sobre todo NeighborNet (parte del paquete SplitsTree 4) de Bryant & Moulton (2002), ambos especialistas en bioinformática. Estamos en deuda con todos ellos por haber puesto a disposición general dichos programas en la internet. Nosotros, pues, simplemente los hemos descargado y configurado adecuadamente para interpretar datos lingüísticos y, posteriormente, hemos introducido nuestras propias cuantificaciones de semejanza para obtener los gráficos. La figura 3, por ejemplo, ilustra cómo nuestras cifras de semejanza se pueden convertir en una representación bastante simple del tipo "estrella", por medio del programa FITCH. Este programa insiste en que toda relación entre las lenguas sea representada con el esquema del clásico árbol genealógico, es decir, de ramificaciones únicamente binarias. Para las abreviaturas presentes en todos los gráficos, consultar la leyenda del mapa de la Figura 1. Nótese que las líneas y su longitud representan grados de diferencia, y no de conexión, entre las variedades. Además, el hecho de que ciertas variedades parezcan de alguna u otra forma "vinculadas" a estas representaciones, no implica, de ninguna manera, que dicha relación sea necesariamente una relación genealógica más que de contacto. Como se explicará más adelante, nuestra postura metodológica está libre de considerar que cualquier correspondencia léxica particular entre dos variedades, sea un caso o de verdadera cognación o de préstamo. Dejaremos dichas interpretaciones para la sección 6. Así, nos resulta perfectamente factible incluir en estos gráficos al chipaya y al castellano, pues aunque bien sepamos que no están emparentados ni con el quechua ni con el aimara, resulta muy ilustrativo ver exactamente el lugar que ocupan en los gráficos respecto de estas dos familias. cimiento por su apoyo. Para más detalles sobre este proyecto, consulte nuestra página web: www.shef.ac.uk/english/language/quantling. Nuestras investigaciones sobre el cauqui fueron apoyadas por The Foundationfor Endangered Languages, www.ogmios.org. 14 Revista Andina Paul Heggarty: Enigmas en el origen de las lenguas andinas Figura 3. Representación tipo "estrella" de las relaciones entre 20 variedades de lenguas andinas (más el castellano como referencia externa), producida por medio del programa FITCH (ver texto) en base a las cifras de la Figura 2 SUREtilO A2-StT CENTRAL A2-Hcn Al MARA A1 -Jqr A1 -Kwk CHIPYA CASTELLANO Ch-Chl 01-Chc CENTRAL ' 01-Hnc · Q2c-AH QUECHUA 01 -Ync Q2e-Cuz ·. Q2a-lnk CAJAMARCA - ·. CAÑARIS Q2c-Tql Q2c-Crv Q2b-Trj Q2c-Pun 02b-Sm SUREtilO ECUADOR La Figura 4 se vale de un procesamiento diferente y más flexible de los mismos datos para producir- en contraste con la representación tipo estrella- una representación tipo red. Esta tiene la ventaja particular de no obligar a que el output visual tenga la forma de un árbol de ramificaciones binarias nítidas y distintas, si la señal filogenética en los datos no es compatible con tal realidad histórica. Así, este tipo de representación ofrece una manera mucho más fiel y útil de identificar y representar casos en los que las variedades han tejido redes de relaciones mucho más complejas y superpuestas; por ejemplo, los continuos dialectales y los escenarios de contacto intenso. Además de los indicadores que puedan contener estos gráficos para la cuestión quechumara, los demás aspectos salientes para nuestros fines son: la relativa homogeneidad de la familia quechua frente a la aimara y la posición en el árbol genealógico de las variedades dtl Quechua II. Pero volveremos a estas cuestiones, entre otras, en la sección 6, pues explicaremos primero cómo producimos nuestras cuantificaciones de semejanza entre las lenguas sobre las cuales están basadas todas estas representaciones. Nº 40, primer semestre del 2005 15 Estudios y Debates Figura 4. Representación tipo "red" de las relaciones entre 20 variedades de lenguas andinas (más el castellano como referencia externa), producida por medio del programa NEIGHBORNET (ver texto) en base a las cifras de la Figura 2 CAJAMARCA· CA~RIS ECUADOR CENTRAL 02-cPa, QUECHUA 02-cMrw SUREÑO Al MARA A2-Puk A2-StT SUREÑO A 1-Jqr A1 -Kwk CENTRAL 3. ¿Cognados o préstamos? Una nueva postura metodológica Es sabido que hay precedentes en el estudio de las relaciones entre las lenguas andinas, a partir de su semántica léxica, basados en el tradicional método de la lexicoestadística. Así, el estudio de Torero ( 1972 [ 1970]) se limitó a la familia quechua y, por otra parte, el de Hardman (1975 [1966]) a la familia aimara. Comparamos en la sección 6 algunos aspectos de nuestros resultados con los de ellos. El único intento significativo de tratar ambas familias dentro de un mismo estudio fue el trabajo lexicoestadístico de Büttner ( 1983), pero este fue llevado a cabo con tan poco éxito que resultó ampliamente desacreditado, y sus conclusiones descalificadas, debido a dos fallas metodológicas fundamentales . La primera de ellas reside en una representación deformada de los datos lingüísticos, consecuencia a su vez del inflexible esquema de análisis, propio de la lexicoestadística. Más adelante volveremos a este punto. 16 Revista Andina Pau/ Heggarty: Enigmas en el origen de las lenguas andinas La segunda falla metodológica consiste en que las conclusiones que Büttner se pennitió, en base a sus datos, resultan de una argumentación circular, tal como lo señalaron la mayoría de críticos, entre ellos Torero (2002: 149) y Cerrón-Palomino (2003 [ 1987] : 372-3 73). Ésta consiste en valerse de sus datos lexicoestadísticos como supuesta prueba de que las familias quechua y aimara están emparentadas, e incluso, especifica a nivel de tronco. En esto Büttner seguía a algunos otros practicantes de la lexicoestadística, quienes durante su auge buscaron emplearla no sólo como técnica para medir cuán estrechamente ciertas lenguas estaban emparentadas entre sí (una vez que este hecho fuera establecido de manera convincente por medio del método comparativo), sino también como un simplista " método de diagnóstico" para tratar de probar el parentesco en casos donde éste quedaba aún en duda : El defecto de tal lógica consiste en la suposición de que la lista de significados de Swadesh es de alguna manera inmune al préstamo, de tal modo que cualquier correspondencia que se encontrase en la lista, necesariamente, se deba considerar como producto de un origen común, sin haber contemplado seriamente la explicación alternativa de que se pueda tratar de préstamos entre familias no emparentadas. Evitamos a toda costa tal equivocado supuesto. Más adelante volveremos a tratar este punto. Siguiendo nuestra postura metodológica, a priori queda del todo por establecer si el quechua y el aimara están o no emparentados; pero, siendo así , ¿cómo podría intentarse cualquier fonna de lexicoestadística, dado que este método se basa fundamentalmente en la noción de la cognación y, por lo tanto, sólo tiene sentido aplicarlo a lenguas entre las cuales ya sabemos que existe una relación genealógica comprobada? Se requiere, pues, de una postura totalmente diferente sobre cómo abordar las correspondencias aparentes, en forma y significado, en la semántica léxica y la cuestión de su potencial cognación. Dado el actual estado de nuestros conocimientos -o la falta de ellos- nos quedamos sólo con unos paralelismos en forma y significado -por ejemplo, *yaca- - *yaci- (saber) o *warmi - *marmi (mujer)- que bien podemos identificar; pero sin que podamos tener la seguridad en todos los casos de porqué ni cómo hayan aparecido, si por origen común o por contacto. Tal como lo expresa Cerrón-Palomino (2000: 309): "( ... ) la objeción central de la indistinción entre elementos cognados y préstamos [es] una de las más fuertes , aunque, como se verá, el asunto no es fácil de sortear". A pesar de ello, la situación tal vez no sea, como puede parecer, un callejón sin ~alida. El solo hecho de que no podamos estar seguros del origen de una correspondencia determinada no quiere decir que por lo tanto no nos quede más que echar a perder el conocimiento lingüístico que tenemos, a propósito de la misma, como si careciera de toda utilidad . En lo que sí podemos confiar, en muchos casos, es que a una correspondencia en forma y signifi cado como *yaca- - *yací- se le puede imputar, de manera más convincente, a algún tipo de conexión histórica entre estas palabras (ya sea ésta el préstamo o el emparentamiento ), más que al puro azar. Proponemos, a continuación, una manera de aprovechar hechos de este tipo, los cuales sí conbcemos con confianza, para investigar acerca de la naturaleza de las relaciones entre las familias lingüísticas involucradas, pero sin caer en ninguna suposición sobre aquellos asuntos de los cuales no nos encontremos en condiciones adecuadas para estar seguros. Es decir, en ningún momento, nos aventuramos a especificar en nuestros datos ninguna opinión respecto de si una determinada correspondencia en forma y significado entre las Nº 40, primer semestre del 2005 17 Estudios y Debates familias quechua y aimara implica, necesariamente, o bien un préstamo o bien un origen común. Todo lo contrario, a priori evitamos adrede tomar posición sobre este asunto. Para ello necesitamos recurrir a un término que no conlleve ninguna implicancia con una u otra explicación, tal como sí conllevan los términos cognado, préstamo e, incluso, correspondencia. Proponemos, entonces, en este sentido, el término correlato (y sus derivados correlación y correlacionados). Nuestro correlato se debe entender como un término general y neutro para cualquier correspondencia llamativa en forma y significado, que se deba al origen común o bien al préstamo, y libre de cualquier supuesto, a priori, sobre dicha naturaleza. Un correlato será, entonces, cualquier correspondencia que nos llama la atención en cuanto se le puede atribuir de manera más convincente a alguna forma de conexión histórica (no especificada) que al puro azar. Muy bien sabemos, por supuesto, que un gran número de los correlatos conocidos se consideran entre la mayoría de los especialistas en lenguas andinas como préstamos evidentes (entre ellos, varios numerales, por ejemplo). El problema consiste en que hay también abundantes palabras sobre las cuales los análisis no están de acuerdo, pues se prejuzgan de acuerdo con las diferentes posiciones sobre si el quechua y el aimara están o no emparentados. Los que creen que hay emparentamiento identificarán ciertos correlatos como verdaderos cognados (aunque siempre puedan discutir sobre exactamente cuáles); para quienes no crean en tal emparentamiento, todos los correlatos necesariamente serán o bien préstamos o bien puras coincidencias fortuitas. No queda sino la solución metodológica señalada por Adelaar (1986: 380), a quien secunda Torero (2002: 155) así:"( ... ) cualquier progreso en la cuestión de las relaciones quechua-aru 'presupone metodológicamente un abandono total de ideas preconcebidas acerca del parentesco genético'". Sin embargo, esto último es una espada de doble filo, ya que tampoco debemos partir del presupuesto de que tal relación no exista. De igual manera, mientras para Adelaar ( 1986: 380) "la comparación debería hacerse en base a dos entidades lingüísticas 'depuradas' de préstamos", tal como para Campbell ( 1995: 182) "las formas que son bastante similares a nivel fonético se deben descartar en cuanto sean posibles préstamos", nosotros adoptamos una postura metodológica diametralmente opuesta. El hecho de que ciertos correlatos sean préstamos conocidos, o posibles, no supone de ninguna manera que no resulten informativos, ni mucho menos que sean aptos sólo para ser descartados de los datos comparativos. Intentamos una nueva postura que, por el contrario, pueda aprovecharse de lo que sabemos del conjunto de correlatos que se dan entre el quechua y el aimara, pero sólo si todos ellos, incluso aquellos de los que tengamos fuertes sospechas de que sean préstamos, se retengan en los datos, asignándoseles a todos ellos un mismo estatus no prejuzgado: en cuanto correlatos, nada más. Por último, debemos clarificar que a los préstamos del castellano -ellos sí muy fáciles de identificar en la gran mayoría de los casos- se les asigna en nuestros datos un estatus especial, lo cual nos permite tratarlos de distintas maneras de acuerdo con diferentes fines . Puesto que no pueden sino ocultar y confundir los orígenes e interrelaciones entre las lenguas andinas, que es lo que aquí nos interesa dilucidar, en el presente estudio los préstamos del castellano tienen un estatus de "ausencia de datos" en función de aquellas relaciones. 18 Revista Andina Paul Heggarty: Enigmas en el origen de las lenguas andinas 4. Cuantificaciones detalladas de semejanza en semántica léxica Volvemos ahora a la primera fall a metodológica fundamental que socava el estudio de Büttner: su tratamiento de los datos. En una época en la cual las condiciones para el trabajo de campo eran más dificiles que hoy en día, y la documentación sobre las lenguas andinas mucho más escasa, Büttner se valió de datos secundarios , los cuales trató de fom1a algo incoherente. Sus entradas para el significado caliente ( warm en la lista original de Swadesh) ilustran bien el problema: Büttner da cognados de rup(h)a- para muchas variedades del quechua, incluso el cuzqueño, pero q 'uiii para el quechua boliviano (Büttner 1983: 137). En realidad, la mayoría de las variedades del quechua, y por cierto tanto el boliviano como el cuzqueño, tienen ambas raíces en significados estrechamente relacionados en el campo semántico de caliente; se trata de un solo ejemplo entre muchos . Como lo han demostrado varios especialistas, los datos publicados de Büttner son simplistas. Así, Cerrón-Palomino (2003: 3 72), por ejemplo, habla de "escogitaciones asombrosamente ingenuas" y de ''arbitrariedad selectiva". Sin embargo, es importante reconocer que el problema no consiste únicamente en el hecho de que algunos de los datos de Büttner sean "equivocados" ; más bien, esto no es sino síntoma de un problema inherente al mismo método de la lexicoestadística. Como en el ejemplo de caliente, la lexicoestadística obliga de todas maneras a falsear relaciones conocidas entre las lenguas, por la inflexibilidad simplista del método, y por cuanto resultan in-ealistas y no aptos para las lenguas andinas un gran porcentaje de los significados en las listas de Swadesh. La camisa de fuerza propia de la lexicoestadística, aquella visión de "o todo o nada", no nos permite introducir los datos en una configuración que bien sabemos es una aproximación mucho más acertada de lo "correcto", para que podamos incluir de manera flexible y adecuada toda la información que consideramos pertinente. En este caso, por ejemplo, sabemos que ambas raíces rup(h)a- y q 'uñi están presentes en casi la totalidad de las variedades quechuas, incluso la de Cuzco y la(s) de Bolivia. Sabemos, además, que hay ciertas diferencias en los significados exactos de estas dos raíces, y en su empleo con respecto a otros sinónimos: en algunas variedades rup(h)a- se refiere específicamente a la luz o a calor del sol y/o a quemar, mientras q 'uñi a menudo quiere decir más bien abrigado y/o simplemente caliente (en el sentido de la palabra warm de Swadesh, más bien que hot) . Así , no es únicamente la representación de Büttner, sino cualquier representación lexicoestadística, la que no alcanza a representar de manera apropiada ninguno de estos conocimientos. Críticas de este tipo no son nada nuevo para los especialistas en lingüística históricocomparativa, quienes han respondido duramente al método lexicoestadístico. Así, se requiere un enfoque metodológico radicalmente nuevo, de tal modo que lo que aquí proponemos de ninguna manera resulta alguna suerte de "lexicoestadística refinada" y nada más , sino una escisión respecto de aquella filosofia. Nuestro propósito es muy específico: representar, en cifras que tengan un sentido coherente, el grado de semejanza entre las lenguas, en este caso, en lo concerniente a la semántica léxica. Por cie1io, nuestro método se basa fundamentalmente en la cuestión de si, para expresar cada significado en una lista representativa, las lenguas diferentes se valen de Nº 40, primer semestre del 2005 19 Estudios y Debates lexemas que son o no correlatos, y ahí acaba cualquier semejanza con la lexicoestadística. Sobre todo, nuestro método rechaza la falla más ampliamente criticada al método lexicoestadístico: su insistencia simplista en selecciones absolutas del tipo "o todo o nada" ("sólo un lexema por significado", "o cognado o no", etc.). Así, expresa sus resultados valiéndose únicamente de una clasificación binaria de O ó 1 para cada significado - dicho de otra forma o bien 0% o bien l 00%-, dejando de lado todo tipo de valoración intermedia. Hemos hecho, pues, todo lo posible a fin de concebir una estructura adecuada para nuestra base de datos, que sea capaz de representar, de la manera más detallada, flexible y equilibrada posible, la naturaleza exacta de las superposiciones y diferencias entre las lenguas en su semántica léxica. De tal estructura se derivan directamente nuestras cuantificaciones mucho más adecuadas que las que propondría la lexicoestadística tradicional. 4.1. ¿Cuantificar Lenguas? No sorprende, pues, que el método y los cálculos que utilizamos sean mucho más complejos que los de la lexicoestadística. Ello a tal punto que , sin disponer del espacio aquí para explicar y justificar detalladamente todas nuestras asignaciones numéricas, en algunos momentos nos veremos obligados a apelar a cierta "indulgencia" por parte de nuestros lectores más escépticos. Así, apelamos a considerar cómo las cifras que proponemos efectivamente coinciden bastante bien con aquellos análisis y juicios no cuantificados a los cuales estamos más acostumbrados los lingüistas. En efecto, como bien sabemos, el intento de cuantificar cualquier aspecto del lenguaje es una tarea particularmente expuesta al escepticismo, lo que bien se puede comprender dada la poco feliz historia en este campo hasta la fecha. Es justamente por eso que nuestros métodos se han ido desarrollando dentro del contexto de una postura radicalmente nueva a la cuestión de cómo se deben cuantificar y comparar las lenguas. Remitimos a los lectores interesados a Heggarty (en preparación) 7 , donde se retoma esta tarea de cuantificación del lenguaje, a partir de sus principios fundamentales, seguidos por una exposición completa de nuestros métodos, tanto para la semántica léxica como para otros subsistemas del lenguaje, tales como la fonética y la morfosintaxis. Nuestra postura no es tan ingenua como para imaginar que cualquiera de nuestras cifras constituya de alguna forma una cuantificación definitiva y absoluta, la única expresión numérica correcta de los hechos lingüísticos. Una postura razonada frente a la cuantificación, debe reconocer que no siendo el lenguaje una estructura inherente matemática, cualquier intento para cuantificarlo inevitablemente no será más que una "interpretación" matemática de conceptos lingüísticos. No podemos sino aspirar a una aproximación numérica que se justifique por los hechos lingüísticos; en este caso las relaciones entre las lenguas en su semántica léxica. Sin embargo, si la alcanzamos y podemos tener confianza en ella, entonces ésta posee un gran valor potencial en tanto que nos permite abrir una extensa gama de aplicaciones para el procesamiento numérico, tal como lo demostramos en la sección 6. 7 20 Cualquier investigador interesado puede solicitamos desde ya un a versión previa de los capítulos relevantes a la semántica léxica. Revista Andina Pau/ Heggarty: Enigmas en el origen de las lenguas andinas Aquí nos limitamos a dar una perspectiva general del método, lo cual se ilustrará mejor por medio de ejemplos específicos de cómo evitamos las selecciones binarias e inflexibles de la lexicoestadística para cada uno de los principales tipos de problemas que se encuentran cuando se intenta representar y cuantificar el grado de semejanza en la semántica léxica. 4.2. Grados de coincidencia entre sinónimos El concepto más básico en nuestro esquema de comparación es el de la coincidencia de correlatos entre los lexemas que se emplean en cualquier par de variedades para expresar un significado particular. Tal coincidencia puede ser total: por ejemplo, para el significado de comer, entre el francés manger y el italiano mangiare. Contrariamente, puede ser nula: por ejemplo, entre el francés manger y el castellano comer. Ambos casos son fáciles de representar numéricamente como una coincidencia de correlatos de I ó O. Pero una coincidencia también puede ser sólo parcial, y esto en varios sentidos. Un primer tipo de coincidencia parcial puede darse en los lexemas de los cuales disponen las variedades diferentes para un determinado significado. Ateniéndonos al significado cabeza, por ejemplo, nuestro infonnante para el quechua de Chacpar emplea a la vez urna y piqa, mientras que los hablantes del quechua cuzqueño disponen sólo de uma. En primer lugar, nuestro método tiene que acomodar múltiples sinónimos en una misma lengua. La fonna en la cual se calcula el grado de coincidencia entre los lexemas de lenguas diferentes se puede ilustrar de forma más útil en términos de INTELIGIBILIDAD . Un hablante del quechua de Chacpar siempre entendería el significado cabeza en una conversación entre hablantes del quechua cuzqueño, ya que éstos emplearían consistentemente la palabra urna, forma que aquél reconoce. Sin embargo, lo contrario no es verdad: un hablante cuzqueño sólo entendería a los hablantes de Chacpar en aquellos contextos en los cuales empleasen éstos la forma urna, y no en el resto de los casos cuando utilicen más bien la alternativapiqa. La inteligibilidad siempre se debe analizar en cuanto una relación de doble sentido, ya que no necesariamente hay simetría en los dos sentidos. Teniendo en cuenta esta relación asimétrica, y suponiendo una frecuencia de uso igual para las raíces urna y piqa en Chacpar, la coincidencia global de los dos sistemas se calcula como sigue: Figura 5: Cuantificaciones de coincidencia pasiva entre sinónimos: escenario AB -A Dirección de inteligibilidad Lengua' 2 -+ Len2ua Cuzco -+ Chacpar Chacpar -+ Cuzco Sinónimo A Forma en 1 len2ua urna ¿Reconocida 2 en len2ua ? sí = 1 Sinónimo B Forma en 1 len2ua - Evaluación combinada para ¿Reconocida todos los sinónimos 2 en len2ua ? 1/ 1 = 1 urna sí = 1 piqa no = O Evaluación global de coincidencia en inteligibilidad: Nº 40, primer semestre del 2005 1 /2 + 0 1 -- lz (1 + 112) ~ 2 = ·¡, /2 = 21 Estudios y Debates Sin embargo, la inteligibilidad mide sólo la coincidencia pasiva entre los sistemas, lo cual no alcanza a registrar diferencias entre lenguas que tienen los mismos sinónimos, pero que son empleados con diferente frecuencia en cada una de ellas. Se necesita, entonces, ulteriores mecanismos para representar coincidencias entre los sinónimos, también en su empleo activo en lenguas diferentes, lo que incluye la posibilidad de "ponderar" los sinónimos por su frecuencia e importancia relativas. Estos mecanismos efectúan ajustes correspondientes a las cifras de coincidencia (nom1almente unas pequeñas reducciones). Resulta, así, una escala de diferentes grados de coincidencia entre sinónimos, tal como se observa en la Figura 6. Figura 6: Cuantificaciones de coincidencia en sinónimos: varios escenarios Lengua 1 lengua ? lengua 2? lenguaj? lengua4 ? lengua5? Correlatos presentes (en cuanto sinónimos) A A A A B B - - - - - - Evaluación de semejanza entre 1 lengua ? y lengua'? L l /3 l ¡2 - e e o Nótese que mientras se han hecho algunos intentos por ajustar la lexicoestadística tradicional para permitir que se reconozca sinónimos múltiples -por ejemplo en el trabajo de Oyen et al. (1992: IE-DATAI .txt)- éstos todavía no alcanzan a diferenciar los tres primeros casos en la figura anterior, pues todos se representarían indistintamente con cifras de semejanza de 100%. Para enfocar nuestra cuantificación de semejanza únicamente en el nivel de la semántica léxica, tal como Jo requiere el concepto de cognados, también para nuestros correlatos hacemos abstracción de cualquier cambio fonético que pueda haber llegado a diferenciar las formas fonéticas. (Para cuantificar la semejanza en el muy distinto campo de la fonética, emplearemos un método completamente diferente en nuestro artículo posterior). Es decir, empleamos aquí el término inteligibilidad en un sentido "lingüísticamente informado", por el cual se considera a los correlatos siempre "inteligibles", aún entre variedades que los han venido cambiando en "reflejos" fonéticos diferentes y propios. 4.3. Grados de coincidencia en el significado También puede haber casos de coincidencia parcial entre la semántica léxica de lenguas diferentes, cuando los lexemas correlacionados se distribuyen diferentemente entre los diversos sentidos más específicos de un determinado significado en la lista 8 , y/o también en 8 22 Como se puede observar, empleamos los términos sentido y significado con un claro propósito que los diferencia. Así, un sentido .es una manera semántica más específica de utilizar uno de los significados en nuestra lista comparativa. Revista Andina Paul Heggarty: Enigmas en el origen de las lenguas andinas otros significados relacionados con éste pero de forma más indirecta. El significado sol ofrece una valiosa ilustración de algunos de los muchos tipos diferentes de configuración que puede haber, en este caso entre cinco de nuestras variedades andinas: quechua de Atalla: posee inti en el sentido de cue,po celeste, pero rupay en el sentido de luz/calor del sol; aimara de Puqui : posee inti en el sentido de cuerpo celeste, pero tupi (correlato con rupay) en el sentido de luz/calor del sol; quechua de Laraos: posee inti en ambos sentidos; rupa- se conoce solamente en cuanto a raíz verbal hacer calor (sol), quemar; quechua de Chetilla: posee solamente rupay; no se conoce inti (salvo indirectamente por medio del castellano); el chipaya: tiene thuñi en el sentido de cuerpo celeste, pero siy en el sentido de luz/calor del sol; no se conoce inti; en cuanto a la raíz lupi, ver más abajo. Desde estas formas se desprende una amplia gama de configuraciones complejas y grados de coincidencia entre los varios pares de variedades. En seguida se presenta una selección de tales configuraciones, las cuales podemos ordenar en una escala decreciente de inteligibilidad, de la siguiente manera: Atalla- Puqui Correlatos de inti y de rupay en todos los sentidos del signifi(a) cado de sol. Correlatos en el sentido principal de cuerpo celeste; mientras (b) Atalla - Laraos que en el sentido secundario de luz/calor del sol el hablante del quechua de Atalla entendería un subsentido algo diferente, y el hablante de Laraos sólo entendería un sentido algo más indirectamente relacionado ( quemar o hacer calor) . Correlatos en el sentido secundario de luz/calor del sol, pero (c) Atalla- Chetilla en el sentido principal de cuerpo celeste el hablante del quechua de Atalla entendería un subsentido algo diferente (luz/calor del sol), mientras que el hablante de Chetilla no reconocería la palabra que se emplea en Atalla. A la vez, en el sentido principal de cuerpo celeste y el secundaChetilla - Laraos (d) rio de luz/calor del sol, el hablante de Laraos sólo entendería un sentido algo más indirectamente relacionado ( quemar o hacer calor), mientras que el hablante de Chetilla no reconocería la palabra que se emplea en Laraos. Ninguna coincidencia entre los correlatos, ni en el sentido prinAtalla - Chipaya (e) cipal ni en el secundario. En estbs cinco casos, el sistema de representación y cuantificación de nuestro modelo arroja debidamente una escala decreciente de cuantificaciones de inteligibilidad, la cual corresponde con la escala que acabamos de exponer, en base a criterios lingüísticos (aunque no cuantificados), como sigue: (a) = 1; (b)= 0,83; (c) = 0,56; (d) = O, 17; (e)= O. Nº 40, primer semestre del 2005 23 Estudios y Debates Hay que recordar que la Jexicoestadística tradicional, o la versión de Dyen et al. (1992), sólo hubiera podido proveer cifras absolutas de O o 1 para cada una de estas relaciones . En la Figura 7 se expone una perspectiva general de cómo nuestro modelo llega a la obtención de estas cifras. Simplificando en algo el procedimiento, se puede 1decir que el método reconoce Jo que constituye efectivamente una escala de diferentes grados de coincidencia en los significados entre los correlatos, como sigue: inteligibilidad entera y exacta; inteligibilidad próxima en subsentidos del mismo significado global (aquí, sol), que asegura un alto grado de inteligibilidad; inteligibilidad indirecta en un significado bastante diferente, pero siempre relacionado de forma suficientemente próxima dentro del mismo campo semántico como para contribuir, por lo menos, a un cierto grado de inteligibilidad; ausencia de cualquier inteligibilidad. Nuestro principio fundamental para expresar en cifras las relaciones entre las lenguas es que, a falta de un argumento lingüístico indiscutible para proceder a cifras aún más precisas, las relaciones se deben representar en términos de los escalones iguales que numéricamente resulten más simples: a saber, para un caso como éste donde los escalones son cuatro, las evaluaciones son de 1, \ , 1/ 3 y O respectivamente. La Figura 7 ilustra igualmente cómo nuestro método incorpora en sus cálculos el hecho de que uno de los dos subsentidos que reconozcamos es algo más básico que el otro. En este caso, el sentido de cuerpo celeste se considera más básico que el enfoque más estrecho, sólo en la luz o el calor que proviene del mismo. Siguiendo de nuevo el principio de ponderación que aplicamos por defecto, esta relación se representa por la proporción desigual más simple que haya, o sea 2: 1. Un ejemplo en el plano diacrónico puede ayudar a ilustrar la flexibilidad y adecuación de nuestro modelo. Cerrón-Palomino (comunicación personal, 2004) nos informa que en el sentido de luz/calor del sol, la lengua chipaya tiene una raíz nativa siy, pero que además la forma aimara lupi es ya conocida por algunos hablantes del chipa ya. En tal contexto, bien se puede imaginar que lupi podría acabar por entrar en el chipaya, tal como ya ha ocurrido con varios préstamos del aimara. Nuestro sistema podría representar, por medio de una evaluación progresivamente más alta de coincidencia con el aimara, varias fases en un proceso por el cual tupi paulatinamente podría pasar a ser siempre más preeminente en el chipaya. Se puede imaginar cómo podría pasar de un rol de sinónimo menor conjuntamente con la raíz nativa siy (situación que se evaluaría en una comunidad con el aimara de O, 11 ), hasta la paridad con siy (0,22), o hasta desplazar completamente la palabra nativa (0,33). En los mismos términos de la escala que presentamos más arriba, este último escenario es de correlatos exactos en el sentido secundario de luz/calor del sol, pero sin ningún correlato en el sentido principal de cuerpo celeste . Así, esta evaluación de 0,33 cabe debidamente en su posición correcta en la escala. Si lupi debiera extenderse más allá del sentido secundario de luz/calor del sol al sentido principal de cuerpo celeste, el cual tiene una mayor ponderación, el cálculo de la coincidencia léxica con el aimara aumentaría aún más. 24 Revista Andina z o .¡:. ? Figura 7. Cálculos de los grados de coincidencia de correlatos entre cinco variedades de lenguas andinas en su semántica léxica para el significado sol. O= diferencia total; 1 = identidad total ~ ~:r .., CD VI Lenguas CD 3 CD ic. ~ N o oo, - En ambas direcciones de inteligibilidad: Lengua 1 _. Subsentido A: cuerpo celeste 1 1 la que en la lengua2 tiene un correlato: o Entrada en 1 lengua o C'· E<o "O ·¡; o e: o u e_-o E·;:: e: -",,..o" ~-º ~ o ~]~ ::; ·"' ;53] ~ UJ ';;' ~ -~ "O e: Lengua' B "O e: e:" -~~o ::, " "O e:~ ""' E "' § ~ § u ·e: " u e: 1;l 1 .::, I ~~--.~~-,-~~~-.~~,e"',, {l ·-g "' "' " "O ..o E -o "' < Entrada e: ..o en :§ "'O lengua' ~ .::E """ "' IU "O "' "O GJ :-: -~·3 o= o "'O·et inti 1 rup_ay inti 1 Atalla -. Laraos Laraos-. Atalla Atalla -. Chetilla inti inti inti 1 1 Iup_i rupay (inti) Chetilla -. Atalla rupay Chetilla -. Laraos rupay Laraos -. Chetilla inti Atalla--+ Chipaya inti thuñi Chipaya-. Atalla '¡, 1 ';, o o o os· E-o ,, "O o ::! i::" ~ 'E ::: t E~ ::, " -""' " ==~ "O e: -g o u u.J,, '1, rupay (rupay) '1. (rup_ay) (inti) o rupay sir o ] !! e: e: o ~E] ; ~ -~ § ~] O·- 1U -- t- o o ::; "' "' :¡; Atalla-. Puki 1 Grado de coincidencia global la que en la lengua es correlato en cuanto: Puki -. Atalla o Componentes ponderados Subsentido B: luz/calor del sol -g ';;' "O ·¡; o e: o u ~ o .::, iJ 1 cu r.n ~ CU "'O IU :": g~ o X o "O ·;; "'O -= ""' ":r. ~ -~ ºü "'O u= """ g~ .S et '1, "/, .¿ . -;. aJ ' "O ..o::: ::, o "' o. <.c0 X ] .g " "'~ ::: = " ::, o ..o' "O ::: = suma de los dos componentes ponderados para los dos subsentidos "' o. ~ s. if ~ 2/3 1/3 4/6 1/6 5/6 = 0,83 ~ 2/9 3/9 5/9 ce· m ::::, = 0,56 3 11) ';, o o o VI '1, 2/18 1/18 3/ 18 = 0,17 o o o o CD ::::, ~ Q ce· CD ::::, c. CD ¡¡;VI ro ::::, (C e 11) VI 11) ::::, c. N o, 5· 11) VI Estudios y Debates 4.4. Grados de coincidencia de formas: lexemas compuestos de morfemas múltiples Puede haber una coincidencia léxica parcial no sólo en el significado sino también en la forma, allí donde hay lexemas compuestos por más de un morfema, de los cuales sólo uno es correlato entre lenguas diferentes. El ejemplo habitual es el de los lexemas del castellano y francés, corazón y coeur. En este caso, las raíces son correlatos entre sí, pero el primer lexema lleva además un morfema adicionado diacrónicamente (lat. -atio, -ationis > -azón) que no se encuentra en la forma francesa. Nuevamente la Jexicoestadística no alcanza a representar coincidencias léxicas parciales de este tipo. La cognación es un atributo de los morfemas y no necesariamente de los lexemas enteros, y lo mismo se aplica, por supuesto, a nuestro concepto de correlación . Así, nuestro análisis segmenta los lexemas complejos (siempre que ello se requiera) y pregunta si los morfemas individuales que componen dicho lexema son correlatos o no . Los cálculos incluyen ponderaciones apropiadas que reflejan la importancia relativa de los morfemas, con las cuales se evalúa la coincidencia global entre un par como corazón-coeur en 0,67 (\ ), dado que los morfemas principales -las raíces- son correlatos, mientras que es sólo en el sufijo menos significativo para la inteligibilidad- donde no hay correlación. En las lenguas andinas muchas de las formas constituidas por morfemas múltiples son nombres compuestos. Por ejemplo, el jacaru sim(i) ts 'aaka para diente (literalmente "boca hueso"), o el quechua ecuatoriano simi kara para labio ("boca piel "). Estas formas crean coincidencias complejas, de inteligibilidad parcial, con otras variedades del quechua que guardan los mismos correlatos en sus significados originales u otros (en este caso simi para boca). Para representar y cuantificar tales relaciones, es indispensable un análisis por morfema. 4.5. Calificación de plausibilidad de correlaciones Gran parte del debate quechumara se reduce a discusiones sobre cuáles de las aparentes correspondencias, en forma y significado, constituyen o no correlatos llamativos que reclamen otra explicación que el simple azar; y así, de si una reconstrucción propuesta resulta "convincente" o más bien "muy especulativa". Por ejemplo, en el significado de cerro se encuentran dos formas reconstruidas como *queu para el protoaimara y *urqu para el protoquechua (siguiendo a Cerrón-Palomino 2000: 311 ). Éstas demuestran un cierto grado de coincidencia fonética sugestiva de alguna fonna de conexión histórica, pero no completamente convincente como para que todos los lingüistas estén de acuerdo en que el caso no es más que una mera coincidencia producto más bien del azar. Para cualquier caso discutible de este tipo, se especifica en nuestra base de datos un nivel de cuán plausible sea que haya una relación histórica entre las dos (o más) formas fonéticas candidatas. Reconocemos que tales evaluaciones de plausibilidad son todavía algo impresionistas; sin embargo, en la medida de lo posible las mismas se han obtenido a partir de la aplicación de diferentes principios, y toman en cuenta los cambios de sonido que se saben típicos de las lenguas andinas. Así, para luz/calor del sol, la idea de que lupi del aimara y nup 'i deljacaru sean correlatos con el rupay del quechua se evalúa como plausibilidad muy elevada. 26 Revista Andina Pau/ Heggarty: Enigmas en el origen de las lenguas andinas Dicho sistema permite que se produzca un conjunto independiente de resultados para cada nivel de plausibilidad, en un degradé que va desde una visión más especulativa hasta una mucho más cauta de lo que se considera una correlación convincente entre morfemas. Esta serie resultante tiene diferentes utilidades; aunque para una discusión más amplia sobre este punto remitimos a los lectores a Heggarty (en preparación). Aquí nos limitamos apresentar esencialmente los resultados que corresponden a nuestra posición relativamente cauta, según la cual se toma por ejemplo p 'iqi -piqa (cabeza) como correlatos, pero *queu- *urqu (cerro) y *huma - *qam (tú) como no muy convincentes y algo especulativos. 4.6. Objetividad Probablemente, aquello que más esté poniendo a prueba la buena voluntad de nuestros lectores en el curso de esta exposición, es que nuestro método esté expuesto a juicios potencialmente subjetivos. Ello, sobre todo, en lo que respecta a qué ponderación, o cuál de los grados en nuestras escalas, corresponde a una configuración determinada en los datos lingüísticos. Buscamos minimizar este problema, en primer lugar, definiendo nuestras categorías, objetivamente, en función de principios de análisis lingüístico, tales como los conceptos de hiponimia e hiperonimia, los cuales, en este sentido, se nos revelan como pautas particularmente útiles. En muchos casos, estas pautas permiten que nuestras evaluaciones sean objetivas, basadas en principios coherentes. Sin embargo, queda en la naturaleza misma del lenguaje -particularmente en el borroso ámbito de la semántica léxica- el hecho de que en varias situaciones limítrofes sea más probable que nunca podamos eliminar por completo la subjetividad. Esto, no obstante, no quiere decir que no haya maneras de reducir el efecto de desequilibrio que tal subjetividad pueda ejercer en nuestras cuantificaciones. Es importante reconocer que las diferencias de opinión subjetiva tienden a limitarse a un nivel de diferencias relativamente menor en casos limítrofes. Resulta dificil entrever, por ejemplo, que sea subjetiva la cuestión de si un lexema dado fuera el representante principal de un significado en una lengua determinada, o si simplemente no existiese en dicha lengua. Sin embargo, donde sí puede haber una pregunta subjetiva es al tener que escoger cuál de dos sinónimos próximos es en verdad el más importante. Es sólo la postura de la lexicoestadística la que termina haciendo de esto un problema grave, por no ser capaz de representar los posibles niveles intermedios y forzarnos a la ejecución de un análisis en términos de "todo o nada", amplificando así, en sus cálculos, el impacto de cualquier subjetividad. Gracias a estas escalas, se puede limitar el impacto de la subjetividad sólo a las cuestiones de menor trascendencia, que en suma son las únicas a las que afecta. Confiadamente, podemos saber si un lexema determinado es a todas luces altamente pertinente, aun si puede haber un elemento de subjetividad para evaluar la ponderación exacta que le debemos otorgar frente a otros. En otros casos, para un lexema que se sabe muy poco significativo, puede quedar algo "subjetiva" la decisión de si lo descartamos por completo, o si más bien lo preferimos incluir con una ponderación particularmente baja, o sólo como un subsentido muy limitado. Pero cualquiera que sea el que prefiramos entre estos análisis alternativos, el impacto en nuestros resultados no será sino del orden de O, 1 a 0,2, en vez del drástico viraje de Oa 1, que es todo lo que puede ofrecernos la lexicoestadística. Así que mientras nuestros Nº 40, primer semestre del 2005 27 Estudios y Debates principios no alcanzan a eliminar por completo la subjetividad, consiguen por lo menos limitar estrechamente su impacto en los resultados globales. Recuérdese la ilustración que hemos dado líneas arriba de cómo nuestro sistema permite que se representen las diferentes fases por las cuales el préstamo tupi podría paulatinamente entrar en la lengua chipaya. De las cifras que allí se aprecian, queda claro cómo dos evaluaciones subjetivas -cada una de las cuales le atribuye a la forma tupi un grado diferente de preeminencia en la lengua- no tendrían sino un impacto muy limitado en las cuantificaciones globales de semejanza. En cualquiera de los casos la diferencia numérica sería mínima: de Oa O, 11 ; de O, 11 a 0,22; o de 0,22 a 0,33 (o incluso diferencias más pequeñas). Se puede prever, aún, un mayor refinamiento de nuestro modelo en algunos aspectos, pero tal como ya está configurado nos sentimos lo suficientemente confiados como para presentarlo en tanto técnica que ofrece representaciones numéricas, que corresponden fielmente a los grados de diferencia que podemos establecer en base a nuestro juicio lingüístico. Si finalmente disponemos de una técnica para medir el grado de semejanza en la semántica léxica, que resulte mucho más adecuada, equilibrada y detallada que la lexicoestadística, ya es hora de poner atención en lo que podrían ser los nuevos aportes que ésta nos pueda ofrecer. 4.7. Ajustes a la lista de significados para las lenguas andinas Existe un aspecto más en el cual nuestro método debe ser cuidadoso: en lo que respecta a la naturaleza de las lenguas a las que se les aplica el método aquí. Tal como lo han venido señalando muchos lingüistas que han intentado aplicar la lexicoestadística a regiones fuera de Europa, listas de significados como las de Swadesh requieren de ajustes considerables para adecuarlas al uso con lenguas estructuralmente muy diferentes, que tienen sus orígenes en culturas también muy distintas . Tal vez la li sta CALMS EA (~ulturally ªnd Linguistically Meaningful for S.outh-.E.ast Asia) de Matisoff (2001 ), escogida para tener sentido cultural y lingüístico en el sureste asiático, sea el ejemplo más conocido. Para el presente estudio, hemos adaptado nuestra propi a lista " CALMA" de significados apropiados para los Andes, para garantizar, en primer lugar, que la lista de significados utilizados para la comparación de las variedades andinas les sea pertinente, significativa y adecuada. Nuestra lista resulta, pues, una versión extensamente modificada de las listas originales de Swadesh, ya que nos vimos obligados a aplicar distintos tipos de cambios en función de las realidades lingüística y cultural de los Andes. En algunos casos, bastó con ajustar en algo los significados de Swadesh, allí donde el campo semántico era inadecuadamente amplio o estrecho para las lenguas andinas, pero buen número de los significados de Swadesh han requerido de una "cirugía" más radical. En primer lugar, algunos de sus significados únicos, como old (viejo/vieja), se han tenido que separar en los dos conceptos distintos que les corresponden en muchas lenguas andinas . Ilustrando con las formas del quechua cuzqueño, la calidad de old no se considera igual al aplicársele al varón o a la mujer, en tanto que estos dos conceptos requieren de raíces distintas, machu y paya, respectivamente. A la inversa, en muchos casos fusionamos los que para Swadesh son dos significados independientes en su lista; por ejemplo, la distinción de wife (esposa) vs. woman (mujer). La fusión de tales significados evita el problema de "raíces compartidas", identificado por Kessler (2001 ). 28 Revista Andina Pau/ Heggarty: Enigmas en el origen de las lenguas andinas Muchos problemas de este tipo se deben al hecho de que las estructuras gramaticales típicas de las lenguas andinas se diferencian de las de las lenguas europeas. Es por estas diferenci as que descalificamos varios de los significados en las listas de Swadesh, ya que, a diferencia del inglés y/o del castellano, en las lenguas andinas las oposiciones entre significados como morir-matar, él-ellos (he-they), y o- nosotros, son puramente gramaticales, antes que lexicales. Ello quiere decir que en las lenguas andinas tales oposiciones no pertenecen a la semántica léxica, el campo que es el objeto de nuestro estudio, sino a la gramática. En suma, hemos recortado y rehecho radicalmente las listas de Swadesh. De los 150 significados en nuestra lista global , 85 de ellos se hallan también en la lista de 100 significados de Swadesh, y 30 en la lista de 200. Los 35 restantes se completaron con significados que a menudo se han empleado en otros estudios lexicoestadísticos, los cuales hemos introducido a propósito para garantizar un equilibrio {;ntre algunos significados que se saben particularmente estables a través del tiempo , así como otros que se saben mucho menos estables (ver más abajo). Nuestra lista completa de significados aparece en el Apéndice. Embleton (1986: 92-3) ha argumentado que, por debajo de un número total de 200 significados, una lista empieza a perder poder discriminatorio para la dilucidación filogenética. La autora, sin embargo, se refería al método lexicoestadístico tradicional, donde la valoración que corresponde a cada uno de los 200 significados se limita a un fonnato binario, es decir, 1 ó O. Ya que la precisión de nuestro método va mucho más allá, para cualquier significado individual se puede obtener una amplia gama de valoraciones intermedias que van desde O hasta 1, atravesando distintos escalones fraccionales . De esta manera, podemos alcanzar un nivel mucho más alto de "resolución" para cada uno de los significados en la lista, lo cual hace más que compensar el hecho de limitarnos a algo menos de 200 significados en total. 5. Los Datos 5.1. Selección de las variedades consideradas hasta la fecha Los datos que utilizamos fueron recolectados por nosotros mismos en diferentes trabajos de campo, salvo los correspondientes a dos de las veinte variedades que muestra la Figura 1, para cuya obtención nos valimos de las siguientes fuentes : Para el chipaya, datos recolectados y analizados por Cerrón-Palomino & Bailón Aguirre (en preparación). A ellos nuestro agradecimiento por la generosa voluntad de hacérnoslos disponibles antes de publicados. Para el quechua de Huánuco, datos obtenidos de Weber et al. ( 1998). Por supuesto, recae sobre nosotros la responsabilidad de cualquier interpretación errónea de los datos que de estas fuentes obtuvimos. Nuestro estudio debe verse como una primera etapa de lo que idealmente deberá ampliarse, a !'argo plazo, a una cobertura más extensa de las variedades lingüísticas andinas. Nos proponemos abarcar progresivamente muchas variedades más, con lo cual podremos cubrir algunas lagunas patentes en nuestra actual cobertura, tales como el quechua de Santiago del Estero, de Lamas y de Junín, así como un mayor número de variedades de QI. Las . variedades que con más urgencia tendremos que incluir son aquellas que se ven enfrentadas Nº 40, primer semestre del 2005 29 Estudios y Debates a su inminente extinción y que se cuentan además entre las más informativas para cuestiones de clasificación, como lo son para el quechua las variedades de Pacaraos, Yauyos y Chachapoyas. Hasta que podamos recolectar nuestros propios datos para estas variedades, y con el fin de proveer por lo menos algunas nuevas luces sobre ellas -aunque basadas en datos ya existentes- incluimos aquí abajo un análisis a partir de los resultados de Torero ( 1972), estudio que abarca un número más grande de variedades del quechua peruano que el nuestro . Por limitaciones de espacio en el presente artículo, no entraremos en mayores detalles sobre las razones que justifican nuestra selección de variedades, así como tampoco sobre los detalles concernientes a ubicaciones geográficas ni informantes. Sin embargo, exponemos una información completa sobre estos asuntos en www.quechua.org.uk. 5.2. Estado actual de nuestros datos: calidad y fiabilidad Nuestra postura metodológica requiere que se investigue y analice los datos léxicos hasta un nivel considerablemente más detallado de lo que exigían los intentos precedentes para cuantificar la semejanza en semántica léxica, exactamente lo que se requiere para contrarrestar las muchas críticas válidas dirigidas a dichos intentos. No obstante que hayamos hecho todo lo posible para garantizar la fiabilidad de nuestros datos, dentro del limitado tiempo disponible para nuestro trabajo de campo, no sería realista pretender ser un "experto" en las relaciones precisas, en la semántica léxica, de las veinte variedades andinas que abarcamos. Y si bien siempre buscamos estandarizar nuestro proceso de trabajo de campo para que éste sea uniforme en cada caso, siempre hay algún margen para la subjetividad en los resultados obtenidos, dada la naturaleza inherentemente fluida de la semántica léxica. La tarea más compleja que requiere nuestro método, para ser aplicado coherentemente, es la de abarcar cualquier reflejo fonético de todos los lexemas pertinentes que se encuentran en todas las variedades consideradas para un significado determinado en la lista. Tuvimos que buscar un equilibrio entre la posibilidad de que a veces nuestros informantes pudieran no producir todas las formas relevantes, y la de inducir determinadas respuestas involuntariamente, con el propósito de haber querido confirmar la presencia de correlatos esperados a partir de nuestra experiencia con otras variedades. En cuanto a la tarea de identificar correlatos, ésta pudo verse dificultada, en ciertos casos, por el efecto de cambios de sonido inesperados entre las variedades comparadas. Para recolectar datos como los nuestros, lo ideal sería un proceso de etapas múltiples, aunque hasta la fecha no haya sido posible efectuar visitas de retorno para la confinnación de datos sino tan solo en siete de las veinte localidades de nuestro trabajo de campo. Así, reconocemos que hasta el momento nuestros datos siguen siendo algo provisionales y que, seguramente, ellos podrían beneficiarse de las contribuciones de especialistas en los dialectos en cuestión. En efecto, quisiéramos aprovechar de la ocasión que nos ofrece el presente artículo para invitar y agradecer cualquier tipo de contribución, comentario, sugerencia, crítica o corrección a nuestros datos (o incluso para proveernos datos de otras variedades). Para este fin, y para exponer nuestra base de datos a los juicios de nuestros colegas, ponemos a disposición nuestros datos léxicos en formato Microsoft Access, el cual se puede descargar de nuestras páginas web . (A su debido tiempo agregaremos las trascripciones fonéticas correspondientes). 30 Revista Andina Pau/ Heggarty: Enigmas en el origen de las lenguas andinas Sin embargo, confiamos en que nuestros datos, en este estado actual, poseen desde ya un nivel mucho más confiable que en estudios anteriores, como el de Büttner (1983) , particularmente porque nuestro método se ha elaborado a propósito para ser más flexible y minimizar el impacto en los resultados globales de cualquier juicio subjetivo. Así, los errores u omisiones que puede haber afectarían probablemente sólo a las palabras y sentidos menores, los cuales no contribuyen sino a una fracción de los resultados globales para un determinado significado, de tal forma que no tendrían un impacto numérico muy significativo en los resultados globales, ni por lo tanto en las representaciones que de ellos se derivasen. De ahí nuestra confianza en ofrecer nuestros datos desde ya, como un recurso que esperamos sea lo suficientemente confiable para ser de real utilidad, y que sirva como base para adecuaciones ulteriores . Se mantendrá actualizada y se ampliará nuestra página web con cualquier versión revisada de nuestros resultados. 6. Interpretaciones acerca de la historia y los orígenes 6.1. La hipótesis quechumara 6.1.1. Contrastes entre significados más estables y menos estables en el tiempo El criterio original, en base al cual Swadesh seleccionó sus listas de significados, era el de enfocarse en un "vocabulario básico", presuntamente de por sí muy estable a través del tiempo y particularmente resistente al préstamo. En efecto, varios estudiosos se han valido de esta suposición en el debate quechumara en tanto argumento en contra de cualquier origen común reciente. Adelaar ( 1986: 382) señala que "Un parentesco genético cercano entre los dos grupos debería ser visible en elementos léxicos tan básicos como los aquí citados", a saber: atar, dormir, casa,perro, agua, uno, nariz. Cerrón-Palomino (2000: 313) concuerda en que "( ...) un parentesco cercano entre ambas lenguas debería mostrar, en principio, una mayor comunidad léxica entre este sector del vocabulario, cosa que no ocurre." En efecto, Cerrón-Palomino contrasta explícitamente la baja comunidad léxica resultante en el vocabulario básico entre el aimara y el quechua, frente a la mucho más alta encontrada dentro de cada familia: "Por el contrario, el cotejo del vocabulario básico de AS [aimara sureño] y de AC [aimara central] (cf Apéndice D), así como el de QC [quechua central] y QS [quechua sureño], arroja un promedio que va entre un 60% y 70% de elementos compartidos, de manera que nadie discute la relación de membresía genética que guardan entre sí". Tal como la mayoría de los investigadores, sin embargo, estos dos autores se limitan a lo que se puede inferir de lo que se supone es el sector más estable del vocabulario que representan las listas de Swadesh. Aquí intentamos llevar mucho más adelante esta lógica, y de hecho el primer punto importante que hay que notar es que tal supuesto resulta mucho menos simple de lo que parece a primera vista. Inclusive en la lista de 200 significados de Swadesh, muchos de ellos se han revelado empíricamente bastante mestables en muchas familias lingüísticas. En efecto, algunos investigadores han querido llevar más lejos esta observación, intentando establecer para cada significado individual de la lista su propio ritmo de reemplazo léxico a través del tiempo. Por lo general, sin embargo, los estudiosos han hecho esto con . el único propósito de aislar el núcleo de significados más estables, lo cual consideraban más Nº 40, primer semestre del 2005 31 Estudios y Debates útil para sus propios fines, descartando todos los menos estables. Starostin (1991), por ejemplo, depura la lista hasta, tan sólo, 55 significados, y luego aun sólo 35 . Algunos pocos investigadores, por otro lado, han intentado aprovechar más bien las diferencias que se dan entre los significados más estables y menos estables. Esto\lo han hecho Dyen et al. (1992), pero sólo para intentar "rehabilitar" el método glotocronológico presuntamente apto para calcular fechas de separación entre las lenguas. Sin embargo, a diferencia de estos últimos, nosotros no compartimos su suposición, empíricamente inválida, de que estos ritmos de cambios léxicos sean absolutos y mantengan necesariamente una regularidad mecánica a través del tiempo en todas las lenguas y en todas las circunstancias históricas . Guardando esta distancia, nosotros no nos aventuramos a intentar dataciones absolutas. El propósito nuestro es valernos sólo del hecho de la diferencia relativa en estabilidad inherente, y esto no para establecer dataciones, sino como una herramienta adicional para investigar la cuestión del origen común versus la convergencia por medio del contacto intenso. Es decir, nos proponemos confrontar nuestras cuantificaciones de semejanza en semántica léxica para dos sectores contrastantes del vocabul ario : uno que se sabe típicamente muy estable y otro netamente menos estable. Este método se basa en una propuesta metodológica de McMahon & McMahon (en prensa: cap.4 §4.3), en base al estudio más detallado actualmente disponible sobre la estabilidad respectiva de determinados significados, el de Lohr (1999). Lohr llegó a sus evaluaciones de estabilidad en base a dos criterios. En primer lugar, para cada significado, consultó diccionarios de las protolenguas para cuatro familias diferentes (protoindoeuropeo, protoafroasiático, protoaustronesio, y protosinotibetano) para ver si hubiera perdurado rasgos fonéticos suficientemente claros como para permitir a los especialistas reconstruir un lexema para este significado. El número de las familias (entre Oy 4) en las cuales se ha revelado posible reconstruir un lexema para un significado determinado constituye para Lohr su "tasa de reconstructibilidad" para este significado. En segundo lugar, para cada significado examinó el número total de reemplazos léxicos, dentro de unos lapsos conocidos en varias ramas del indoeuropeo, lo que le dio su "ritmo de reemplazo léxico" promedio para cada significado. En el presente estudio en base a nuestra lista global de 150 significados, para que un significado determinado se incluya en la sublista más estable, hemos empleado los criterios siguientes: que este significado se pueda reconstruir en al menos tres, o todas las cuatro, de las familias de Lohr; que sufra no más de dos reemplazos léxicos a través de todos los casos fechados del estudio de Lohr, lo que corresponde a un promedio de un reemplazo no más frecuente de una vez cada 15. 700 años. A la inversa, para que sea incluido en nuestra sublista menos estable, un significado tiene que cumplir: que se le pueda reconstruir en una sola como máximo, o bien ninguna, de las cuatro familias de Lohr; que sufra por lo menos cinco reemplazos léxicos a través de todos los casos fechados del estudio de Lohr, lo que corresponde a un promedio de por lo menos un reemplazo cada 6.300 años. 32 Revista Andina Pau/ Heggarty: Enigmas en el origen de las lenguas andinas Detalles más amplios se encuentran en McMahon & McMahon (en prensa: ch.4 §4.3) y Lohr ( 1999). Otros estudios confinnan que los significados identificados por Lohr, en cuanto más estables o menos estables, parecen tener validez general para las diversas familias de lenguas. Hay una correlación estadística muy significativa entre las tasas de reemplazo de Lohr y las calculadas independientemente - en base a datos de familias lingüísticas distintas, salvo el indoeuropeo incluido en ambos estudios- por Dyen et al. ( 1992: IE-RATEI .txt). Además, nuestros propios resultados apo rtan ulterior confirmación de que efectivamente las sublistas siguen siendo válidas - en cuanto más estable y menos estable- a través de familias lingüísticas diferentes : en este caso, las andinas. En primer lugar, los significados menos estables son los que pretendemos sean más susceptibles de verse reemplazados por préstamos y, efectivamente, en la sublista menos estable encontramos tres veces más préstamos del castellano que sustituyen a los lexemas nativos que en la sublista más estable. En segundo lugar, encontramos un contraste muy marcado y revelador entre nuestros resultados para las dos sublistas diferentes, tal como no tardaremos en explicar. Es éste, pues, el segundo criterio crucial al cual obedeció la selección de nuestra lista "andina" de significados (tal como adelantamos en la sección §4.7): en la lista global tienen que figurar dos sublistas particulares de similar extensión, una de significados más estables y otra de significados mucho menos estables. Todos los demás significados deben tener un ritmo de estabilidad intermedia entre estos extremos. La última columna del cuadro en el Apéndice identifica cuáles significados figuran en cuál de las sublistas, por su nivel de estabilidad. De los 150 significados en total , 31 calificaron en cuanto menos estables y 42 como más estables. Aunque los numerales de tres a diez eran candidatos potenciales para la sublista más estable, su rol al interior de un sistema ( el numérico) implica que no son enteramente independientes los unos de los otros, tal como lo evidencian los sistemas numerales las mismas lenguas andinas (Cerrón-Palomino 1987: 366). Ello constituye un potencial desequilibrio para las comparaciones entre nuestras dos sublistas, así que preferimos excluir a propósito de nuestra lista más estable todos los numerales por encima de dos, tal como Swadesh los excluyó de su lista de 100 significados. 6.1.2. ¿Origen común o más bien convergencia por contacto:> La Figura 8 presenta las representaciones NeighborNet, correspondientes a nuestras diferentes sublistas de significados: la menos estable (a la izquierda), la más estable (a la derecha). Basta con una primera mirada para que estos gráficos muestren que indiscutiblemente hay alguna característica que aparta de manera muy nítida nuestras dos sublistas. En efecto, con respecto al gráfico que arroja la sublista de los significados intermedios restantes (que aquí no ~e reproduce por falta de espacio), las dos configuraciones en la Figura 8 se apartan en direcciones diametralmente opuestas. Un contraste tan marcado clama por una explicación en términos de algún factor de peso en condiciones de explicarla; y en efecto, el único que parece viable es precisamente · que haya diferencias en la estabilidad inherente de los significados en las dos subli stas. En Nº 40, primer semestre del 2005 33 Estudios y Debates Figura 8. Representaciones neighbomet de las relaciones entre variedades del quechua y el aimara calculadas en base a nuestras cuantificaciones de semejanza en semántica léxica, para nuestras dos diferentes sublistas de significados, ambos gráficos a la misma escala. Las cifras indican las distancias entre las 'raíces' de las dos familias . 1 Significados menos estables Significados más estables A2SIT ·· ... ... _SUREFIO SUREf.10 CENTRAL .//A1Kwt ···",'2~1T ,·' A1.Jqr CENTRAL ~-~ ~---.. CA.JAMAR.CA . ·' CARARIS ECUADOR ./ / a:z... 01Chc: ECUADOR ' QZ.chl CENTRAL º'"""' SURE!iro °'""' QUECHUA ......... ···sü"REAo """" .. QUECHUA el caso de que no hubiéramos observado ninguna diferencia importante entre las configuraciones gráficas que resultan de las dos sublistas, bien hubiéramos tenido motivos para dudar de la validez de nuestra afirmación de que éstas se diferencian netamente en sus tasas de estabilidad. Resulta que tenemos al contrario todas las razones ara confiar en su validez. Siendo así, podemos con bastante confianza proceder a algunas interpretaciones útiles de tan contrastantes configuraciones. La interpretación más económica salta a la vista: estas configuraciones son eminentemente compatibles con un escenario de convergencia por medio del contacto como explicación para la relación, y lo son mucho menos con el origen común. Nótese en particular cómo dentro de cada familia, el contraste que se da entre las sublistas resulta completamente a la inversa del que se observa entre las dos familias . Al 34 Revista Andina Paul Heggarty: Enigmas en el origen de las lenguas andinas pasar de la sublista menos estable a la más estable, la familia aimara se reduce a un agrupamiento mucho más compacto, mientras que la red enmarañada de los dialectos del quechua se contrae de fonna aun más espectacular. Ello constituye evidencia complementaria de que se debe esperar que las lenguas que han ido divergiendo, a partir de un origen común, deberían resultar más similares en los significados más estables que en los menos estables. Para el caso del quechua respecto del aimara como familias, sin embargo, observamos configuraciones precisamente contrarias. Adelaar y Cerrón-Palomino encontraron en la lista global de Swadesh indicios en contra de cualquier origen común relativamente reciente para el quechua y el aimara. Aquí hemos llevado más lejos sus observaciones, considerando las listas de Swadesh no sólo como entidad completa e indivisible, sino también considerando el contraste llamativo entre los resultados para nuestras diferentes sublistas de significados. También hemos aplicado nuevas técnicas de análisis capaces de extraer la señal filogenética que se esconde en los datos complejos. El resultado inspira algo más de confianza para aseverar que si alguna vez hubo origen común entre las dos familias, se trataría de uno extremadamente remoto. Sin embargo, resulta importante esta última concesión, pues sí existe un escenario alternativo que hubiera podido llevar a un resultado como el de los dos gráficos en la Figura 8. Si las familias tuvieran un origen común muy remoto se pudiera haber producido tantos cambios, a lo largo de los varios milenios trascurridos desde entonces, como para dejar no más que unos pocos cognados en la sublista más estable. En la sublista menos estable se hubieran perdido aún más cognados, pero ya que esta sublista es la más susceptible al préstamo estas pérdidas hubieran podido verse compensadas por un contacto intenso que reintroducía correlatos bajo la forma de préstamos . Tal proceso naturalmente afectaría mucho más a la lista menos estable, con tal de que finalmente hubiera muchos más correlatos prestados- en ella que cognados supérstites en la lista más estable. Tal escenario hubiera podido devenir en configuraciones parecidas a las que hemos observado en los Figura 8. Por lo menos uno de los elementos de tal escenario ya está dado, pues como es bien sabido, no faltan razones para suponer que ha habido un contacto intenso entre estas lenguas desde hace milenios. Más bien, ¿no sería sino lógico que la lista menos estable haya sido prácticamente inundada de préstamos, mucho más que la más estable? Algunos, por cierto, sí; pero para tener una perspectiva sobre cuántos, recuérdese que las variedades dentro de cada familia también han sido expuestas a los contactos que se han ido produciendo desde que se fragmentaron de sus protolenguas respectivas, pero notablemente sin que tales contactos se hayan mostrado suficientes como para perturbar, ni mucho menos revertir, la señal muy clara de su parentesco también respectivo. Para poder dilucidar más el balance de las probabilidades entre los dos escenarios, tal vez nos pueda aportar algo el examen detenido de los correlatos en cada sublista, para ver cuáles se pueden identificar indudablemente como préstamos en vez de posibles cognados verdaderos. Sin embargo, como hemos visto, "el asunto no es fácil de sortear" (CerrónPalomino 2000: 309). Hay una señal más en los datos que queda por explicar si imaginarnos que no hubiera un origen común quechumara: que haya un grado siquiera limitado de semejanza entre el quechua y el aimara en la sublista más estable. Esta señal atestigua la intensidad peculiar del ·contacto entre las lenguas andinas, en el sentido de que su impacto en ellas se revela de una Nº 40, primer semestre del 2005 35 Estudios y Debates intensidad insólita frente a la historia de las cuatro familias que a Lohr le sirvieron de base para obtener sus evaluaciones de estabil idad. Este hecho apoya una visión de la relación quechua-aimara en tanto caso claro de una convergencia de muy gran alcance. \ 6. 1.3. Diferentes niveles de plausibilidad En el escenario sin origen común , se deben c_o nsiderar como préstamos , o semejanzas fortuitas, inclusive a los correlatos de la sublista más estable. En tal caso, es revelador observar lo que ocurre cuando relajamos los criterios de Jo qu e constituye una correspondencia fonética plausible. Nuestra escala de evaluaciones de plausibilidad permite obtener un conjunto de resultados para cada uno de los varios niveles de plausibilidad. Todas los grá ficos que aq uí presentamos son los que corresponden a nuestro nivel de plausibilidad 5, es decir, la postura medianamente cauta del autor respecto de cuánta similitud fonética debe haber para requerir otra explicación que no sea el puro azar. En este nivel, pares como el *queu - *urqu cerro o *hac 'a - *hatu(n) grande de Cerrón-Palom ino (2000: 311) no se suponen históricamente conectados, mientras lupi - rupay sí . El mismo Cerrón-Palomino se interesarí a sin duda en ver los resultados, más bien, de nuestro nivel 2, ya que este nivel entiende como históricamente conectados todos los pares de palabras que para él "podrían inferirse mediante una simple inspección" en tanto que "cognados probables" o "cognados muy probables", incluyendo los dos ejemplos que acabamos de mencionar. Son potencialmente informativas las diferencias entre los resultados de los diversos niveles de plausibilidad. No nos sorprende que a medida que se relaja e l criterio de pl ausibilidad, los nodos que representan las supuestas raíces de las familias quechua y aimara paulatinamente se aproximan por lo menos en algo . Y aunque el efecto de acercamiento es ligeramente más importante para los significados más estables , aun en la interpretación más "especulativa" de lo que puede constituir una correlación ( es decir, nuestro nivel de plausibilidad 1), los dos gráficos siguen en la configuración contraria a lo que sería compatible de manera sencilla y directa con la hipótesis del origen común. Las raíces de las dos familias resultan mucho más cercanas para los significados menos estables (una distanci a de 24,7) que para los más estables (47,6), y los gráficos correspondientes (que aquí no se reproducen por falta de espacio) siguen en exactamente la misma configuración genera l a los de la Figura 8. 6. 1.4. Recapitulación Resulta que aunque nuestra técnica no puede ofrecer una respuesta del todo definitiva, sí provee indicios suplementarios claramente inclinados a favor de uno de los lados del debate, es decir, en contra de un origen común en todo pasado que no sea extremadamente remoto. Todavía no se pueden ofrecer comparaciones directas con otras familias lingüísticas, hasta que completemos un estudio de ellas por medio del mismo método que aquí empleamos. Sin embargo, limitándonos a una comparación somera con las lenguas de la famili a indoeuropea, señalamos cómo son únicamente las más distantes entre ellas las que comparten tan pocos correlatos entre los significados más estables como el quechua y el aimara 36 Revista Andina Paul Heggarty: Enigmas en el origen de las lenguas andinas entre sí. Así que, a menos que haya alguna razón por la cual las lenguas andinas hayan ido perdiendo su vocabulario bás ico a un ritmo considerablemente más acelerado que las lenguas indoeuropeas más inestables, cualquier presunto origen común quechumara debería remontarse por lo menos tan lejos como la profundidad en el tiempo de la familia indoeuropea, es decir, entre 6000 y 9500 años. En cualquier caso aún quedaría mucho por explicar, ya que en base a la interpretación "por defecto" de nuestros resultados, éstos son altamente consistentes con el contacto como explicación mucho más sencilla y directa que el origen común para la configuración de correlatos que se observan entre el aimara y el quechua. 6.2. Historia y clasificación de los dialectos del quechua 6.2. l. Investigación de la historia de lcts/ámilias lingüísticas: 1: innovaciones compartida.1· o grctdos de semejanza'! Aparte de la cuestión quechumara, también podemos valernos de nuestros resultados por los indicadores que puedan contener sobre la historia individual de cada familia. Empecemos con la familia quechua. Primero debemos tener en cuenta las advertencias de Landerman ( 1991: 165), para quien la verdadera filogenia de una familia lingüística sólo se puede basar en las innovaciones compartidas, y no en retenciones compartidas ni en innovaciones paralelas . Entonces, a primera vista, ya que nuestros datos no son más que cuantificaciones de semejanza en semántica léxica sin ninguna especificación de cuál de los correlatos corresponde al estado ancestral en la protolengua, para Landerman no serían válidas como rasgos "diagnósticos" informativos para investigar el árbol genealógico del quechua. Landerman sin duda optaría por la aplicación del método "cladístico" de Ringe et al. (2002) que busca una "filogeni a perfecta", es decir, una estructura arbórea compatible con tocios los rasgos diferenciadores entre las variedades o, en su defecto , con casi la totalidad de ellos. En efecto, si fuera aplicado al caso del quechua, este método tal vez podría traernos alguna iluminación. Sin embargo, éste no se ha revelado libre de problemas : la realidad lingüística rara vez es compatible con una filogenia perfecta (ver McMahon & McMahon en prensa: cap.3 *2). Más aún, la cuestión resulta mucho menos categórica de lo que admite Landerman, por lo menos en la semántica léxica. En primer lugar, pese a lo que supone la teoría según la cual son sólo las innovacion es compartidas las que nos pueden servir de indicadores confiables de una filogenia , en la práctica parece que evaluaciones de semejanza basadas únicamente en la semántica léxica nos dan resultados que están en acuerdo estrecho con filogenias basadas en rasgos diagnósticos reconocidos. El estudio reciente de la familia indoeuropea realizado por Gray & Atkinson (2003) ha obtenido un árbol genealógico que reproduce fielmente las rami fícaciones tradiciona)es establecidas por el método comparativo, no obstante que el suyo fuera basado en datos que no llevaban especificación alguna de cuáles cognados representaban retenciones compartidas de formas ancestrales, y cuáles innovaciones compartidas. De hecho, es lógico: para sus 200 significados, y entre todas las lenguas investigadas, Gray & -Atkinson se encontraron con 2449 juegos diferentes de cognados, así que la gran mayoría de Nº 40, primer semestre del 2005 37 Estudios y Debates ellos -todos menos los 200 estados ancestrales- necesariamente tenían que ser innovaciones de todas maneras. Además, en muchos casos el hecho es que simplemente no sabemos cuál de dos o más formas que se registran en una familia es la protoforma original, ni exáctamente qué sentido tenía. En el caso del numeral cuatro, para este sentido ciertas variedades del quechua utilizan la raíz ta wa, y otras cusku. El asunto es que no hay manera de saber cuál de entre ellas es la palabra "original" y cuál la innovación. Es más : en ciertos casos, no hay buenas razones para suponer que no hubiera sido posible que ambas formas no existiesen como sinónimos en el protoquechua (un poli11111r/is1110) , y que ambas ramas de la familia hayan " innovado" en lo que cada una perdió una de las dos formas. Mas todo esto no quiere decir que por lo tanto un contraste entre dos grupos de variedades como las que poseen fa wa y las que poseen cusku no nos pueda proveer el e datos valiosos para la clasificación. Este contraste sí junta correctamente todas aquellas variedades que comparten alguna innovación , y las separa correctamente con respecto de las demás, que son las que guardan la forma original. Aun si no podemos identificar en un caso particular cuál de los dos grupos es el que ha innovado, de hecho esto no importa -siempre que podamos esperar que otros rasgos nos ayuden a identificar otras ramificaciones que pueda haber entre las variedades restantes que guardan la forma original. Así. aun si para un determinado rasgo diferenciador no sabemos cuál de las dos ( o más) formas sea la original , siempre hay información útil en el simple hecho de que haya un contraste entre las variedades que tienen una de las formas o la otra. Es muy importante fijarse en que la señal tílogenética - o sea, los indicadores clasificatorios- no reside en la semejanza que puede "unir" ciertas variedades (ya sean las innovadoras entre sí, o bien las conservadoras entre sí) . Más bien, la señal filogenética reside en el contraste que diferencia unas variedades de otras: las innovadoras en oposición a las conservadoras. Landerma n hace bi en en reco rdarnos la importancia de las innovaciones compartidas, pero en ma teri a de metodolog ía filogenética su argumentación está en parte equivocada y, por ende, ta mbién lo son sus conclusiones indebidamente pesimistas acerca de las perspectivas para el progreso en la clasificación del quechua. En parte su pesimismo se basa en su postura de que para el análisis del desarrollo histórico de una familia lingüística, só lo sirve un método capaz de encontrar una filogenia perfecta, lo cual lo lleva a excluir otros métodos tales como nuestras cuantificaciones de semejanza global. Detrás de esto está una cuestión incluso más fundamental en lo que Landerman parte a priori desde un supuesto simplificador algo curioso: que como " meta" deberíamos estar buscando sólo una filogenia perfecta, como si ésta fuera la única representación válida - y/o necesariamente la más exacta- de las relaciones históricas entre las variedades de una familia. Es una postura eminentemente cuestionable, afortiori cuando se trata de una familia como la quechua, la cual hasta hoy en muchas de las regiones donde se hablan sus variedades toma la forma de muy extensos continuos dialectales. 6.2.2. la primera ramificación del quechua Apoyándonos en tales argumentos, nos sentimos lo suficientemente confiados como para presentar nuestros resultados en cuanto contribuciones pote ncialmente útiles al enten- 38 Revista Andina Paul Heggarty: Enigmas en el origen de las lenguas andinas dimiento del desarrollo histórico del quechua. Aportan, por lo menos, datos comparativos nuevos y más detallados desde el campo de la semántica léxica y, por ende, complementarios a los criterios esencialmente fonológicos y morfológicos en los cuales se ha basado la clasificación tradicional de la familia quechua y la visión correspondiente de su desarrollo histórico. 6.2.2.1. Nuestros datos y Landennan ( 1991) Para detenernos únicamente en las relaciones dentro del quechua, podemos quitar de nuestro cotejo todas las variedades ajenas a esta familia (lo que ajusta ligeramente el gráfico). Limitándonos a este conjunto de datos, por medio del programa FITCH que insiste en representar ramificaciones únicamente binarias, podemos producir una representación simple en forma de un árbol genealógico, tal como se ve en la Figura 9. (E l rol del castellano en este árbol es só lo en cuanto referencia externa para proveer la " raíz" artificial que requiere esta representación). Figura 9. Representación tipo "fenograma" de las relaciones entre 15 variedades del quechua producida por medio del programa FlTCH (ver texto) en base a las cifras de la Figura 2, y tomando al castellano como referencia externa y raíz artificial RAMAS Y ALGUNAS SUBRAMAS SEGUN LAS CLASIFICACIONES TRADICIONALES CENTRAL 02c Atl 02c Cuz CUZCO, PUNO, NORTE DE LA PAZ SUREÑO Q2c Pun CUZCOCOLLAO SUR DE BOLIVIA 02b TrJ ECUADOR ~ - - Q2bSm QP Lrs , LARAOS ~ - - - Q2alnk CAJAMARCACAÑARJS 02a Cht j CENTRAL Nº 40, primer semestre del 2005 39 Estudios y Debates Los dos gráficos siguientes, mientras tanto, son representaciones NeighborNet más sensitivas a cualquier señal en los datos que pueda contradecir una estructura de ramificaciones únicamente binarias (ver sección 2). La Figura I O se basa en la sublista de los 42 significados más estables, los cuales son considerados por ciertos lingüistas como los indicadores más fieles de la filogenia de una familia lingüística, mientras la Figura 11 muestra los resultados para la lista entera de los 150 significados, la cual provee infonnación más detallada, de mayor resolución. Figura I O. Representación tipo "red" de las relaciones entre 15 variedades del quechua producida por el programa NeighborNet (ver texto) en base a las cifras para los 31 significados más estables Q1-Hnc CENTRAL Q1-Chc Q1-Ync Q2-cCrv ·· ... 02-oCuz SUREÑO ECUA~~R ·.. Q2-aCht NORTE DE PERU En cada una de estas representaciones, lo que más llama la atención es que los dialectos quechua que tradicionalmente se han clasificado como Qlla - las variedades de Cajamarca e Incahuasi (fell"eñafe)- aparecen más cercanos a los dialectos Ql que al Qllb y al Qllc. Es decir, el Qlla termina ubicándose al "otro lado" de la ruptura principal que tradicionalmente se supone se dio en la familia. Este resultado parece respaldar la conclusión más general de Landerman ( 1991: 265): que incluso la bifurcación más fundamental, la que opone al Quechua l del Quechua Il, está en tela de juicio, y con ella muchas suposiciones tradicionales acerca de la historia y la expansión de la familia quechua. Reproducimos en la Figura 12 los tres árboles genealógicos que Lande1111an ( 1991: 268) considera consistentes con los criterios morfológicos y fonológicos tradicionales. A propósito de ellos, el investigador concluye que: "las relaciones entre los tres grupos están indeterminadas. Es posible cada una de las siguientes [relaciones)": 40 Revista Andina Paul Heggarty: Enigmas en el origen de las lenguas andinas Figura 11 . Representación tipo " red'' de las relaciones entre 15 variedades del quechua producida por medio del programa NeighborNet (ver texto) en base a las cifras de la Figura 2 ECUADOR Q2b3m 02a lnk. CAJAMARCA · CAÑARIS Figura 12. Los tres árboles genea lógicos posibles para la historia temprana del quechua, según Landem1an ( 199 1: 268) PQ = Protoqu echua C = Ct!ntral PQ M e s S = Sureño NP = Norte d el Perú PQ NP M e NP PQ s A e NP s Nuestra Figuras 9, 1O y 11 no coinciden con la clasificac ión tradicional representada por el árbol de l lado derecho, s ino un poco más con la representación del centro. El grupo que Landerman identifica como del "norte del Perú" (" North Peruvian" ), su "NP", corresponde al menos en parte al tradicional Q ll a. A nuestros resultados se ha llegado por medio de un método enteramente diferente de l de Landerman , así que éstos constituyen evidencias com- Nº 40, primer semestre del 2005 41 Estudios y Debates plementarias e independientes. Ambos ponen en entredicho la bifurcación primaria que propone la clasificación tradicional. 6.2.2.2. Los datos lexicoestadísticos de Torero (1972) para el quechua En homenaje y en memoria de uno de los fundadores de la ciencia de la lingüística comparativa quechua, Alfredo Torero, nos permitimos presentar la Figura 13, la cual se basa no en datos nuestros, sino en los del estudio lexicoestadístico del propio Torero ( 1972). Ya que esperamos que ello pueda constituir otra valiosa contribución suya a la clasificación del quechua, hemos introducido sus datos en el mismo programa NeighborNet, el cual arroja como resultado la interpretación gráfica de la Figura 13. El estudio de Torero se basó únicamente en la lista de 100 significados de Swadesh pero, respecto de nuestro estudio, tiene la ventaja de una cobertura mucho más densa de los dialectos del QI (para utilizar el término acuñado por el mismo Torero) en el Perú central. Figura 13. Representación neighbornet de las relaciones entre 37 variedades del quechua calculada en base a las cuantificaciones lexicoestadísticas de Torero ( 1972). Ver la leyenda de las abreviaturas en el cuadro adjunto CENTRAL SUREÑO Qlle:Chuq Qlb: Lam• ECUADOR, LAMAS Y CHACHAPOYAS 42 Revista Andina Paul Heggarty: Enigmas en el origen de las lenguas andinas Leyenda para las 37 variedades del quechua en el estudio de Torero (1972), li stadas siguiendo el orden en Torero ( 1972: 76-80). Lo que aquí se presenta como "clasificación tradicional" sigue la que se encuentra detallada en Cerrón-Palomino (2003: Cap.8), a su vez "siguiendo fundamentalmente a Torero" (Cerrón-Palomino 2003: 225). Los signos de interrogación denotan variedades para las cuales opinamos que existen ciertas razones para calificarlas más bien de "intermedias" Lugar Abr. Nombre i.:o mpl c!o Departamento Cl,,sificación y/o provincia trndicional Lugar Abr. Nombre i.:ornpkto Departamento Clasificación y/o provincia trae\ ic ional Coro Corongo Ancash Ql Tant Tantará Huancavelica Sihu Sihuas Ancash Ql Paca Pacaraos Lima QJO Huar Huari Ancash Ql Ferr Ferre,iafe Lambayeque Q lla Monz Monzón Huánuco Ql Caja Cajamarca Cajamarca Q ll a QlP Pana Pana o Huánuco Ql Lara Laraos Lima (Yauyos) Q fl a'' Cará Carás [sic] Ancash Ql Linc Lincha Lima (Yauyos) Q ll aº Ocro Oc ros Ancash Ql C hac Chac ha poyas Amazonas Qllb Ch iq Chiqui án Ancash Ql Pich Pichincha Pichincha Qllb La U La Unión Huánuco Ql Lama Lamas San Martín Qllb Caja Cajatambo Lima Ql Surc Surcubamba Huancavelica Qllc A nd a Andajes Lima Ql A yac Ayacucho Ayacucho Q ll c Tapu T apuc Paseo Ql Puqu Puquio Ayacuc ho Qllc Ulcu Ulcumayo Junín Ql Grau Grau Ap urímac Qllc Tarm Tarma Junín Ql C uzc Cuzco Cuzco Qllc Jauj Jauja Junín Ql Muñe Muñecas La Paz Qllc A li s Alis Lim a (Yauyos) Qf? Poto Potosi Potosí Qllc Chon C hongos Bajo Junín Ql Chuq Ch uqui saca C huqui saca Qllc Caer Ca era Lima (Yauyos) Qf? Stgo Stgo del Estero Stgo del Estero Huan Huangáscar Lima (Yauyos) Qf ? ! Q ll c Tal como ya hemos dejado en claro, tenemos reservas serias a propósito de la utilidad y la adecuación del método lexicoestadí stico tradicional del cual se valió Torero. Al mismo tiempo, Torero no publicó sus cuantificaciones del grado de semejanza entre las variedades en su semántica léxica, aunque es en base a aquellas cuantificaciones que él mismo calculó, por el método glotocronológico, las fechas de separación entre las variedades que luego propuso (Torero 1972). En tanto que dichas fechas guardan una relación estrecha con las cuantificacion~s de semejanza, las empleamos en sustitución de ellas. Desafortunadamente, Torero nunca publicó las listas exactas de las palabras que seleccionó para que se las pudiese inspeccionar al detalle. Sin embargo, tal como muchos en la andinística, tenemos una considerable confianza en el discernimiento lingüístico de Torero que respalda sus datos, por lo cual consideramos que aun como están, éstos merecen ser Nº 40, primer semestre del 2005 43 Estudios y Debates investigados por medio de las novedosas herramientas de análisis que no le fueron disponibles. En efecto, ello resulta muy revelador. La Figura 13 ilustra la utilidad y capacidad discriminatoria de la representación NeighborNet . Efectivamente, ésta puede ais lar ciertas configuraciones exiJtentes en los datos, las cuales en el gráfico se realizan como una serie de líneas paralelas, consistentes con alguna fom1a de "ruptura" entre las variedades. Aquellas líneas que hemos señalado con 1- S separan la mayoría de las variedades sureñas, a la derecha de la ruptura, de todas las demás variedades, a la izquierda. Sin embargo, que hayan tantas líneas 1- S - trece en total- refleja las muchas relaciones entrecruzadas presentes en los datos, las cuales asocian también variedades que se encuentran de lados opuestos de esta ruptura 1- S. Además, en sus detalles, el gráfico difiere en dos puntos importantes de la clasificación para el quechua que el mismo Torero fue uno de los primeros en proponer. Una vez más, son las variedades de Cajamarca y de Ferreñafe las que aparecen "fuera de su sitio" con respecto al árbol genealógico tradicional, lo que apoya de nuevo a las objeciones de Landennan respecto a la idea tradicional de una ruptura primaria 1-11. Existe también otra serie de líneas paralelas, las cuales hemos señalado con C- 1, y que sugieren otra ruptura, la que a su vez separa casi todas las variedades Ql del resto. En su conjunto, estas dos rupturas separan no dos sino tres grupos principales. Es muy importante, sin embargo, señalar que ni las líneas C-1, ni las 1- S, ni ambas en conjunto, encajan bien en ninguno de los esquemas que sugieren los tres árboles de Landerman. Ello porque de un examen más detenido de la Figura 13 se desprende que las demás variedades del "norte de Perú" - es decir, las más orientales, de Chachapoyas y Lamas- de ninguna manera aparecen agrupadas con las más occidentales de Cajamarca y Ferreñafe. Más bien, estos supuestos "subgrupos" occidental y oriental se posicionan muy apartados el uno del otro: éste se acerca más al quechua ecuatoriano, aquél al quechua central. Tal configuración está claramente en contra de la idea de un grupo unitario "norte de Perú", y apoya más bien a la visión revisada de Torero, la cual diferencia muy fuertemente las variedades occidentales de las orientales en su clasificación. Siendo justos con Landerman, debemos aclarar que al principio él presenta su "norte de Perú" esencialmente como un término únicamente geográfico. Además, trata específicamente de la cuestión de si los dos supuestos subgrupos - el occidental y el oriental- tienen o no alguna relación genealógica estrecha (Landerman 1991: §4.3 .3 ), y se ve obligado a dejar abierta tal cuestión. Sin embargo, no asocia claramente las variedades orientales con otra de sus ramas, y continúa empleando su "NP" en sus árboles para un tercer grupo genealógico distinto del C( entra!) y del S(ureño ). Si por ello entiende un grupo unitario que incluye las variedades de Chachapoyas y Lamas con las de Cajarnarca y Ferreñafe, entonces esto invalida cada uno de los tres árboles que propone, por lo menos según los datos léxicos de Torero. 6.2.2.3. Un continuo dialectal antes que una nítida ramificación ¿Cuál puede ser, entonces, el análisis correcto? Una pista la ofrecen las variedades de Yauyos y de Pacaraos: tal como las del Qlla, éstas se posicionan entre las rupturas C- 1 e 1- S. Es decir, se ven eminentemente intermedios entre los dos grupos de variedades centrales y sureñas, tal como lo hace en nuestro propio estudio la única de estas variedades que hemos 44 Revista Andina Pau/ Heggarty: Enigmas en el origen de las lenguas andinas podido incluir hasta la fecha, el quechua de Laraos. Además, las variedades de Yauyos conforman un grupo relativamente unitario, que se parecen más entre sí que a casi cualquier otra variedad. Tal homogeneidad niega la separación de estas variedades a un lado y al otro de la ruptura principal QI-QII, tal como se la presenta en Cerrón-Palomino (2003: 247), a su vez "siguiendo fundamentalmente a Torero" (p. 225). Ésta clasificación tradicional quiere juntas en el Qlla a las variedades de Laraos y Lincha (pp . 237-8), mientras coloca las de Alis (p. 234) y de Huangáscar en el Ql (pp. 235-6). Tal clasificación supondría que existe entre ellos una división fundamental y de data muy antigua. Los resultados de Torero para la semántica léxica, por lo menos, resultan enteramente contrarios a tan radical división. En efecto, no sólo la variedad de Huangáscar dista del QI, sino que es precisamente ella entre todas las variedades intermedias la más cercana al QII. Antes que todo, la configuración global en la Figura 13 dista muchísimo de ser un árbol de bifurcaciones nítidas; todo al contrario, representa una red muy compleja de relaciones. Recuérdese que NeighborNet de ninguna manera teje siempre tales redes. Más bien , el programa está configurado para producir simples árboles ramificados, siempre y cuando la señal en los datos sea consistente con tal configuración: obsérvese la ramificación binaria muy nítida entre el aimara central y sureño. Que las relaciones principales entre las variedades de la familia quechua devienen más bien en una red compleja se debe precisamente al hecho de que la señal en los datos no es inherentemente compatible con una historia de bifurcaciones nítidas. Nuestros resultados respaldan, pues, el punto de vista de Landerman - basado en una lógica independiente, en otros campos que el léxico- de que el mejor análisis del desarrollo temprano del quechua no debe ser en términos de una bifurcación primaria binaria. Sin embargo, lo que no apoyan nuestros resultados es su suposición de que la única respuesta alternativa se debe buscar en alguna otra configuración del mismo tipo de estructura de "árbol genealógico", ni siquiera una trifurcación. Lo que estos resultados reclaman es una revisión aun más profunda. ¿Por qué necesariamente se debe tratar de una ruptura? La falta de una señal filogenética nítida no se debe considerar ni un "problema", ni una "desilusión", ni una "pena", como parece considerarlo Landerman al no poderse reconstruir un árbol con bifurcaciones nítidas.Nuestro objetivo no es el de dibujar un árbol, sino simplemente entender la realidad histórica del proceso de desarrollo de la familia lingüística quechua. Nuestro éxito no se mide en términos de cuán ordenadas - ni mucho menos, cuán idealmente binarias- sean las series de ramificaciones que dibujamos en un gráfico como representación de la historia del quechua. Más bien, nuestro éxito debería evaluarse simplemente en términos de cuánto logremos acercamos a una visión de dicha historia lo más compatible con los datos lingüísticos. No nos tenemos que sentir "decepcionados", como parece sentirse Landerman (1991: 269)-"concluimos a nuestro pesar"-, al ver que no se alcance encajar los datos en una estructura arbórea. El cuadro que aquí ofrecemos bien puede ser más complejo que un simple árbol. Pero no es la simplicidad analítica, sino la fidelidad a la historia real, nuestra meta en la lingüística histórica. Todas las representaciones de nuestros datos y de los de Torero abogan de manera convincente, por lo menos en lo que concierne a los indicios léxicos, por la hipótesis de que simplemente no hubo un solo evento dominante de ruptura en la historia temprana del quechua. Al contrario, los datos son más compatibles con un escenario totalmente diferente: Nº 40, primer semestre del 2005 45 Estudios y Debates una fragmentac ión mucho más paulatina, compleja y entrecruzada, la cual de vino en un continuo dialectal, sin duda a lo largo de muchos sig los . Evidentemente, parece que luego, en una etapa muy posterior a los albores de la divergencia de la familia, finalmente se produjeron algunas rupturas más o i'nenos nítid as hacia los dos lados más apartados del continuo dialectal. Las líneas C- 1 en la Figura 13 corresponden a una ruptura que separa las variedades centrales de las que podríamos llamar las variedades "intermedias"; mientras que las líneas 1- S corresponden a una ruptura entre las variedades intermedias y las sureñas. Nótese, sin embargo, que la ruptura C- 1 se ve apenas más significativa que las que separan entre sí los cuatro mayores subgrupos al interior de las variedades sureñas. A fin de cuentas, para nuestra visión de las primeras etapas del desarrollo de la familia quechua, mejor haríamos en revisar la importancia relativa de los análisis de bifurcación y de continuo dialectal , claramente más a favor del segundo de lo que suponen las clasificaciones tradicionales. En efecto, nuestra visión del desarrollo temprano del quechua en tanto que divergencia paulatina en un continuo dialectal disipa de golpe buena parte de la controversia acerca del lugar que deberían ocupar en nuestra clasificación los varios dialectos "intermedios". Las variedades de quechua que se habla(ba)n en Pacaraos y en varios lugares de la provincia de Yauyos no toman parte consistente en los rasgos que tradicionalmente se consideran diagnósticos de una ruptura fundamental que opondría una rama QI a otra Qll (ver Adelaar 1987 y Taylor 1984a, 1984b, 1987). Estas variedades a menudo se han calificado de "problemáticas" para la clasificación. Lo que se sugiere aquí es que no son ellas el "problema" por no caber fácilmente en ningún nicho dentro en un árbol genealógico: el problema consiste más bien en insistir a priori en una estructura de árbol como necesariamente la única representac ión posible de la histori a del quechua. En un continuo dialectal, mientras tanto, el estatus intermedio no es "problemático", sino precisamente lo esperado para aquellas variedades que - también en un sentido geográfico- se encuentran en regiones intermedias entre el quechua central y el sureño. Esquivando la frontera nítida QI-Qll entre Huancayo y Huancavelica sobre la cual se ha insistido tanto, bien podemos trazar una gradiente mucho menos tajante que vaya del llamado Ql al llamado Qll: basta pasar por las regiones montañosas del interior del departamento de Lima, allí donde justamente se encuentran muchas de las variedades intermedias. 6.2. 3. Rupturas menores dentro de la familia quechua Hemos tenido cuidado en calificar siempre nuestro escenario como uno válido sólo para las etapas iniciales de la divergencia del quechua. Pues luego, una vez que los dialectos hacia el lado sureño del continuo se hubieron extendido tan lejos como para estar fuera de cualquier contacto significativo con las variedades del Perú central, el modelo del árbol genealógico vuelve a ser medianamente más apropiado para identificar ciertas ramificaciones menores, particularmente dentro de las regiones sureñas. Así, mientras nuestros resultados ponen en tela de juicio la ubicación del Qlla dentro de la familia, confirman por lo menos su identidad en tanto grupo separado, tal como respaldan el contraste tradicional entre el Qllb y el Qllc. Además, dentro del mismo Qllc, la distinción primaria que se suele destacar contempla una rama Ayacucho-Chanca frente a otra Cuzco-Collao, la cual abarca todos las varieda- 46 Revista Andina Pau/ Heggarty: Enigmas en el origen de las lenguas andinas des desde Cuzco hacia el sur, hasta el sur de Bolivia y el norte de Argentina. Esta distinción encuentra respaldo como la bifurcación primaria dentro del QIJc, aunque se deba reconocer que nuestro estudio comprende, a la fecha , sólo un representante del quechua AyacuchoChanca, y además una muy norteña (la comunidad de Atalla, cerca de la ciudad de Huancavelica). Nos proponemos cuanto antes agregar unas variedades más intermedias entre ésta y la cuzqueña, lo que bien podría darnos un cuadro más complejo y más consistente con los análi sis que a menudo se proponen para esta región en tanto continuo dialectal. Mientras hacíamos nuestra selección de las variedades por incluir, decidimos escoger una concentración más densa de variedades al interior de una de las ramas tradicionales - a saber, la de Cuzco-Callao- con el propósito de ver cuán sensitivo puede ser nuestro método para distinguir entre las variedades más estrechamente emparentadas. Efectivamente, resulta que a su vez al interior de la misma rama Cuzco-Callao, la siguiente ramificación que se da según nuestros resultados refleja directamente la ruptura geográfica entre las variedades del quechua que se hablan al norte y al sur del área aimara-hablante (entorno al Lago Titicaca, en el sur de Perú y el norte de Bolivia) . Para el tradicional Ql, por el momento nuestra cobertura abarca demasiado pocas variedades como para dar una resolución suficiente de alguna estructura interna dentro de esta rama, pero una mirada al NeighborNet que resulta de los datos de Torero en la Figura 13 da algunas indicaciones. No entraremos aquí en detalles, sino para constatar que una vez más la señal de red que se encuentra en los datos parece menos compatible con bifurcaciones nítidas al interior del quechua central que con un continuo dialectal. 6.3. La estructura interna de la familia aimara 6.3. /. Jacaru y cauqui: ¿dos lenguas distintas o variedades de una sola ? Uno de los debates animados en la lingüística de la familia aimara gira en torno al estatus de las dos variedades supérstites del aimara central: el cauqui ( de Cachuy) y eljacaru (de Tupe)9 . Hardman sostiene que son lo suficientemente diferentes una de la otra como para merecer el estatus de dos lenguas distintas, si bien estrechamente emparentadas. La visión alternativa, tal como lo presenta Cerrón-Palomino (2000: 63-5, 286), replica que tal caracterización exagera el grado mínimo de diferencia que guardan entre sí y que, más correctamente, ellas se deberían definir como dos variedades estrechamente emparentadas de lo que esencialmente es una misma lengua. Pudo haber algunos argumentos en el contexto social para recurrir al término " lengua" antes que al de "dialecto", a fin de insistir en un estatus y prestigio equitativos de cada una de las dos variedades. Aquí, sin embargo, nos limitaremos a criterios lingüísticos internos. Hardman infonna de ciertas diferencias en morfosintaxis y fonología, pero para CeITónPalomino éstas resultan mínimas. A juicio de un nuevo estudio del sistema fonológico del cauqui por Darlte Oliva (comunicación personal, tesis en preparación) , y unos cotejos preli- 9 Para má s detalles sobre la postura que seguimos en la nomencl atura de las lenguas an dinas, ver la sección espec ial en nuestras páginas web. Nº 40, primer semestre del 2005 47 Estudios y Debates minares de nuestros propios datos fonéticos para las dos variedades, las diferencias entre ellas parecen más bien no ser tantas tampoco en este campo. Además, durante nuestro trabajo de campo, nuestros informantes, hablantes nativos de estas variedades, informaron \ de una inteligibilidad mutua casi total. Finalmente, mucho de la argumentación de Hardman para identificar a las dos variedades como lenguas distintas se reduce a sus cálculos de las diferencias léxicas entre ell as, por medio de la lexicoestadística. A éstas se les alude en Hardman ( 1975), donde presenta sus cálculos globales del porcentaje de cognados, aunque no sistemáticamente sus listas de palabras. ¿Cuál de las dos posiciones se ve respaldada por nuestros propias clas ificaciones para la semejanza léxica? Un aspecto de la posición de Hardman se basa en que sus cálculos la llevan a considerar el cauqui como considerablemente más cercano al aimara sureño de cuanto lo es el jacaru. En primer lugar, nuestros resultados están de acuerdo en que, efectivamente, el cauqui ostenta con el aimara sureño una cuota de semejanza algo más alta (un promedio de 55,9%) que eljacaru (54,0%). Sin embargo, la diferencia es mucho menos significativa que en la lista de 100 palabras en el estudio de Hardman. Más pertinentes aun son nuestras cifras de semejanza entre los mismos cauqui y jacaru. Para nuestra lista de significados, los dos resultan algo menos diferentes el uno del otro (una cuota de semejanza de 93,8%) que las variedades del aimara sureño entre sí (91,6% ; 91,0%; 87,1%), tal como también muchas variedades del quechua entre sí (por ejemplo, el cuzqueño y el puneño: 89,9%). Sin embargo, todas estas últimas no se suelen considerar lenguas distintas , sino sólo variantes regionales de una " lengua" más amplia que las abarca: en estos casos, respectivamente, el aimara sureño y el quechua Cuzco-Collao. Pues, a fortiori en el caso del cauqui y el jacaru, parece ciertamente algo exagerado tildarlos de lenguas distintas. La explicación para la discrepancia entre nuestras cifras y las de Hardman bien podrí a buscarse simplemente en la calidad de los datos disponibles . De nuestros informantes pudimos conseguir datos para todos los 150 significados en nuestra lista (aunque, como siempre, en algunos casos los lexemas nativos se han visto reemplazados por préstamos del castellano). Mientras tanto, el conjunto de datos al cual tenía acceso Hardman para su estudio en 1966 era muy incompleto: para el cauqui sólo había alcanzado conseguir datos para 59 de los significados de la lista de 100 de Swadesh, y 95 de la lista de 200. En el conjunto total de nuestras cuantificaciones en la Figura 2, y en las varias representaciones gráficas expuestas, también se pueden encontrar pautas interesantes para la dilucidación de la cuestión dificil de exactamente cuántas "lenguas" distintas uno puede querer distinguir dentro de la familia quechua. Sin embargo, una vez más tenernos que advertir que nuestras cuantificaciones reflejan diferencias únicamente en la semántica léx ica, no en la fonética ni en la gramática, así que no tratan sino de parte de la cuestión. Además, más útil sería disponer de un patrón de cotejo externo, lo cual nos proponernos ofrecer a su debido tiempo una vez que hayamos apli cado nuestros métodos también a una se lección de lenguas europeas. 48 Revista Andina Paul Heggarty: Enigmas en el origen de las lenguas andinas 6.3.2. La relación entre el aimara sureiio y central Pasando a la relación entre el aimara sureño y central, consultemos nuevamente el gráfico izquierdo en la Figura 8, es decir, el que corresponde a los significados menos estables y más expuestos al préstamo. La configuración que allí se nota indica que ciertas diferencias entre el aimara sureño y central corresponden a diferencias paralelas entre el quechua sureño y quechua central, tal como las representa la serie de líneas paralelas que hemos señalado con S-C. Estas líneas corresponden a un cierto número de significados para los cuales las variedades sureñas del quechua y las sureñas del aimara comparten corre latos las unas con las otras, pero sin compartirlos con las variedades centrales de sus respectivas familias . Además, o alternativamente, las mismas líneas S-C pueden representar significados en los cuales son las variedades centrales de cada familia las que comparten correlatos entre sí, pero no con alguna variedad sureña. Sea como fuere, lo más interesante es que estas líneas S-C se desvanecen en la sublista de significados que se saben más estables, es decir, menos expuestos a cambios inducidos por el contacto. Esto sugiere, como candidato de preferencia para explicar esta configuración en los gráficos, el préstamo debido al contacto. Así , las líneas S-C que separan variedades de la misma familia corresponden a préstamos que han venido reemplazando a los lexemas originales de la protolengua en ciertas variedades descendientes de ella prestados justamente a partir de las variedades geográficamente vecinas de la otra familia. Efectivamente, pues, existe una correlación muy estrecha con la misma geografía: las variedades del aimara central se colocan del lado derecho a la par que las del quechua central; mientras que las variedades del aimara sureño se alinean al lado izquierdo, tal como lo hace el quechua sureño. Entre las variedades del quechua que se suelen calificar de "sureñas", sólo una produce una nota aparentemente di screpante, y es precisamente la más septentrional entre ellas, a saber, la de Atalla (Huancavelica). Ésta se pone más bien del lado de los grupos centrales, lo que de hecho cabe con una explicación geográfica tal que ella esté menos afectada por contactos con el aimara sureño. En cuanto a las variedades del quechua ecuatoriano, bien se puede imaginar que estén poco involucradas con cualquiera de las ramas del aimara. No obstante, por defecto se ven obligadas a ponerse del lado de aquellas variedades con las cuales estén más estrechamente emparentadas, lo que explicaría que se agrupen con el quechua sureño. Esta capacidad de la representación NeighborNet para aislar tales efectos del contacto con las variedades locales del quechua resulta iluminadora para evaluar la profundidad en el tiempo de la separación entre el aimara central y sureño. Pues si ahora podemos identificar este componente de contacto que separa las variedades centrales del aimara de las sureñas, podemos constatar que aun si lo descartáramos, quedaría algo más de profundidad en la bifurcación principal de la familia aimara que a través de toda la familia quechua. En otras palabras, la distancia entre las variedades más diferentes es mayor dentro de la familia aimara que en la quechua. Se aprecia además una bifurcación binaria mucho más nítida y profunda, aunque en esto las consideraciones hechas líneas arriba sobre el análisis del quechua nos deben servir de advertencia para no dar demasiada importancia a la bifurcación nítida que observamos en Nº 40, primer semestre del 2005 49 Estudios y Debates la familia aimara. Porque bien hubiéramos podido quedarnos con una señal indistinguible de una bifurcación simplemente en virtud de la constelación particular de variedades de esta familia que por casualidad socio-histórica haya sobrevivido hasta la fecha . Es decir, la familia aimara bien pudo haber sido en sus orígenes más bien un continuo dialectal , dentro del cual las formas ancestrales deljacaru/cauqui y del aimara altiplánico pudieron ocupar posiciones hacia los extremos. Tal escenario sería, además, perfectamente compatible con las evidencias considerables de otras variedades -¿intermedias?- del aimara, las cuales antiguamente se hablaron tan ampliamente a través del sur del Perú. Siempre que el análisis se enfoque únicamente en variedades supérstites de una familia lingüística se corre el riesgo de falsear la realidad histórica de la misma. Europa ha vivido en los últimos siglos un proceso similar de extinción de variedades intermedias, aunque en este caso principalmente por un proceso de estandardización entorno a una variedad de mayor prestigio social. Si comparamos únicamente las lenguas estándar que a este proceso sobrevivieron, nos quedamos con árboles engañosamente sencillos, compuestos de lenguas netamente distintas, para familias como la romance, la gern1ánica y la eslava. Más bien , en cada caso la verdadera historia fue una de muy lenta y duradera fragmentación en inmensos continuos dialectales desde sus inicios hasta la muy tardía aparición de los estados nacionales. De lo anterior, existe un problema potencial de interpretación también para la historia del quechua y del aimara. A saber, no hay ninguna garantía de que aquellas variedades que han logrado sobrevivir hasta hoy representen los polos más extremos de la variación que antes pudo haber habido dentro de cada familia, ni que atestigüen toda la profundidad de su desarrollo histórico . No obstante, aun a falta de esta garantía, en la práctica casi no nos queda más remedio que tratar de avanzar en base a la suposición de que así fuera , y en ta l caso nuestros resultados aportan una confirmación de que las variedades dentro de la fami lia aimara sean algo más diferentes entre sí de cuanto lo son las variedades del quechua. 6.4. ¿Tierras de origen, expansiones y fechas? Siendo así, y siempre que no hubieran intervenido otros factores para perturbar sus procesos históricos respectivos, por defecto se supondría que las primeras diferenciaciones dentro del protoaimara se produjeron algún tiempo antes de que comenzara la fragmentación del protoquechua. Así, nuestros resultados por lo menos son compatibles con las pautas más generales del escenario que actualmente, más a menudo, se propone en la andinística. Este escenario supone una expansión primero del aimara, predominantemente hacia el sur, desde el foco original en el Perú central, que generalmente se asume para esta familia. A esta primera expansión, le habría sucedido algunos siglos más tarde la del quechua, el cual se habría expandido tanto hacia el norte como hacia el sur, fragmentándose en el transcurso de este proceso. Si bien nuestras cuantificac iones no necesariamente pueden excluir otros escenarios, por lo menos sugieren que cualqu ier alternativa q ue propone una fragmentación del quechua, anterior a la del aimara, tendrá que acompañarse de alguna justificación en cuanto a factores históricos, lo sufic ientemente fuertes, para revertir el supuesto de que es la familia aimara la que desde más antigua data está divergiendo . En lo que respecta a proponer fechas absol utas para estos eventos, recuérdese que los métodos basados en los datos lingüísticos no han logrado ninguna aceptación general 50 Revista Andina Pau/ Heggarty: Enigmas en el origen de las lenguas andinas como instrumentos viables. Los intentos hasta la fecha (principalmente la glotocronología) dependen de suposiciones metodológicas muy poco sólidas y ampliamente desacreditadas. El santo grial de una versión lingüística de la datación por radiocarbono sin duda nunca será alcanzable, ya que el problema es intrínseco a la naturaleza misma del lenguaje, y de cómo cambia a través del tiempo : su susceptibilidad inherente a las fuerzas inconstantes de la historia humana. Tenemos sí algunos medios para obtener por lo menos una perspectiva relativa sobre las fechas, en particular a través del cotejo de los grados de diversidad que encontramos dentro del quechua y del aimara, frente a lo que se observa en otras familias lingüísticas para las cuales sí tenemos cronologías evidenciadas (particularmente las de Europa) . Y mientras este cotejo de ninguna manera nos pueda dar una fecha exacta, sí puede arrojar por lo menos lapsos indicativos de fechas, aunque bastante amplios, compatibles con estas cuantificaciones de diversidad . Más allá de estos limites, para más precisión necesitamos herramientas que nos proporcionen una vista mejor enfocada en las relaciones exactas dentro de cada una de las familias lingüísticas y, a la vez, entre ellas. Podemos entonces pasar a la búsqueda de las correlaciones más convincentes entre estas relaciones lingüísticas y los varios flujo s migratorios -o expansiones simplemente culturales- evidenciados independientemente en los registros arqueológicos e históricos . Definiti vamente, los desarrollos más recientes en las investigaciones en este sentido para las lenguas indoeuropeas dan que pensar a los investigadores que se proponen intentar este procedimiento para el caso andino. En los últimos años se ha venido cuestionando más y más la fecha tradicional de 6000 a 6500 años de antigüedad (a la fecha actual), la cual desde hace largos años se ha "s upuesto" para los albores de la divergencia lingüística indoeuropea. Se ha argumentado que los indicios lingüísticos que se han reunido a su favor, al fin y al cabo, no constituyen pruebas inequívocas para dataciones específicas, sino sólo para establecer lapsos más amplios. Por lo tanto, son posibles otros escenarios que llevan al protoindoeuropeo a un origen de dos a tres milenios más antiguo aun: a saber, 8000 a 9000 años de antigüedad (Renfrew 1989, Gray & Atkinson 2003). De la misma manera, existen muy pocos indicios sólidos de que las familias quechua y aimara sean tan jóvenes y, por ende, sus primeras di spersiones tan recientes, como a menudo se ha propuesto: es decir, de unos pocos siglos antes o después de hace 2000 años. Los hechos lingüísticos bien podrían mostrarse compatibles con lapsos muchos más amplios, según los cuales la historia de estas familias lingüísticas podría remontarse a una época de varios siglos más temprana de cuánto actualmente se imagina. En el contexto de la visión ahora extendida de que los orígenes del quechua se han de buscar en el Perú central, y de lo relativo al viraje reciente a favor de un foco original para el quechua más bien en el interior que en regiones litorales, se anuncia tentadora la idea de una conexión con culturas aún tan antiguas como Chavín. Que conste, sin embargo, que por lo menos, según los indicios actuales -aunque todavía impresionistas-, este escenario sigue pareciéndonos' todavía tan temprano para el quechua que queda en el ámbito especulativo. Lo mismo señala Cerrón-Palomino (2003: 22) respecto de las sugerencias tentativas sobre alguna relación del protoquechua con la cultura Cara!. Por el momento, entonces, dejamos de lado toda cuestión vinculada con la datación ·y con los vínculos posibles con determinadas culturas arqueológicas, a la espera de una Nº 40, primer semestre del 2005 51 Estudios y Debates investigación más profunda una vez que hayamos completado el análisis de nuestro segundo tipo de datos -a saber, cuantificaciones de las diferencias entre las lenguas andinas en su fonética y ya no en su semántica léxica. Antes de ello, expresamos nuestro anhelo de recibir las réplicas, críticas y contribuciones de los especialistas en lingüí sti ca andina a este primer intento de aplicación de novedosas herramientas metodológicas, reunidas de la lingüísti ca y de otras disc iplinas, a las cuestiones más espinosas de la clasi fic ación y de la prehistoria del quechua y el aimara. Paul Heggart~0 Universidad de Edimburgo 1O Este trabajo ha sido realizado en el marco de un proyecto auspiciado por la Universidad de Sheffie ld. 52 Revista Andina Pau/ Heggarty: Enigmas en el orig en de las lenguas and inas Apéndice Lista adaptada de 150 significados con relevancia cultural y lingüística en los Andes ~ Inglés Castellano ;,En li stas de Swa dcsh de ceniza back espalda be sick estar et~f<!rmo X ~] ""' int. X baja baja bell y (stomach) barriga big grande bird pájaro X bite, to morder X X int. b lack blood negro X X int . sangre X int. bone hueso X in t. X int. int. baja branch rama baja bread ')Q/1 baja breast seno baja X brother (man's) hermano (del varón) brother (woma n's) hermano (de la mujer) alta a lta clo ud nube X cold /i-ío X come, to venir cry, to llorar day día die, to morir dog perro X int. X alta X alta in t. int. drink, to tomar, beber X X int. d ry seco X X int. ear oreja X X alta ea t, to comer X X alta egg eight huevo X X alta elbow empty e ye face fa r (away) fa t (grease) fi ngemai l ti re aNum ocho codo vacío ojo cara lejos grasa wia fiifgo Nº 40, primer semestre del 2005 int . baja alta X baja X X X X X X ¡,E n listas de Swadcsh dl' five tl ower tl y, to foot forehead fou r fox fu ll give, to go, to gold grass green ha ir hand happy head cinco flor volar pie /i·ente (la) cuatro int. li ve, to alta lo use in t. man, male ]': ~ ;§ É~ IOO? 200? !l ~ aNum int. alta X alta X baja aNum zorro mt. lleno dar a l ta X X ir alta alta oro mt. hierba, nasto verde (color) cabello X muno X X 1111. baja int. X Castellano feliz, aler,re cabeza hear, to oír heart corazón heavv lnesado hide, to esconder (all'o) high up arriba, en alto hi t, to lvol,,ear horn cuerno hot caliente husba nd e.muso knee rodilla know, to saber laugh, to reir leaf hoja left (hand side) izauierda leg lnierna ti ck, to lumer lig ht (not heavv) /;viano , lií!ero lip labio int. X Inglés ~i X 100? 200? ashes -g; baja X alta X mt . int. int. X X X int. X alta X baja int. alta X int. X int. X baja int. int. X X X X int. int. int X X baja int. alta mt baja alta vivir 1,,iojo varón, hombre X X int baja 53 Estudios y Debates ----, ¡,En li slá.~ de Ing lés Castellano Sw11dcsh de 100'/ 200'/ man y meat moon mountain mouse mouth name nave \ neck new ni ght nin e nose not o \d (man) o \d (woman) one person push, to ra in red right (hand side) ri ver road root rope salt sand see, to seed se ven sew, to shadow sister (man's) sister (woman's) si t, to six skin 54 muchu(s) ca rn e /w,a cerro ratón boca nombre ombligo cuello nuevo noche nueve nariz no vieio (varón) vieja (mujer) X X X X ; durnúr int . s mall p c<¡11 e1iu int . smoke int . speak, to int. spit, to humo hablar escupir estar en pie estrella ¡piedra ch1,par, mamar sol dulce nadar cola, rabo diez lve11sar (cmzitar) este tú tres cansar(.se) lengua diente árbul dos caminar. andar agua nosotros (inclusive) stand, to int. stone X baja suck, to a lta sun a lta in t. sweet swi m, to tail ten think (over), to this thou (you sg.) three baja tire int. tongue tooth tree two aN um a lt a X X a lt a int. int. X X X a lt a baja X int. baja X alta wa lk, to water X baja we (inclusive) X alta int. X X X int. what? w hite X int. who? X int. w ind w ing with aN um X a lta int. woman worm int. ye ar int. ye ll ow young (fe ma le) a lt a X X aNum X baja ;; H 1 IOO'/ 200? sleep, to star X Swadcs h de Castellano ba¡a a lta lversona, ser humano empujar lluvia lviel Ing lés ;¡ baja X X estar sentado seis ¡,En listas de X X l/110 roiu derecha (mano) río camino, carretera raíz soga, cuerda sal arena ver semilla siete coser sombra hermana (del varón,) hermana (de la mujer) ~ _¡; young (male) que? blanco quién? viento ala \ alta X llll. int. int. a lta alt ::i X alta bap 1111. X alt a lnl. baja baja X aNum baj a int. X alta X aNum X alta X X alta X X int . '"' alta bajJ X X X a lta alta int. 1nt X '"' a lta baja int. COJT miúer g usan o mio amarillo ju ven (nn!jer) joven (varón) X X int a ha baja 1111 . int. in t. Revista Andina BIBLIOGRAFIA ADELAAR, Wi llem F.H . 1986 "La Relación quechua-aru: Perspectivas para la se paración del léxico", Revista Andina, 4:2 , 379-426. 1987 Morfología del quechua de Pacaraos. Lima BRYANT, David y V. Moulton 2002 "NeighborNet: an agglomerative method for the construction of planar phylogenetic networks", Proceedings of th e Workshop in Algorithms for Bioinformatics. BÜTTNER, Thomas Th. 1983 Las lenguas de los Andes centrales. Madrid: Ediciones Cultura Hispánica. CAMPBELL, Lyle 1995 "The Quechumaran hypothesis and lessons for distant genetic comparison", DiachronicaX/1. (Amsterdam) 2, 157-99. John Benjamins Publishing Company. CERRÓN-PALOMINO , Rodolfo 1993 "Quechuística y aimarística: una propuesta terminológica", Alma Mater . (Lima) 5, 41-55. Universidad Nacional Mayor de San Marcos. 2000 Lingüística aimara. Cuzco: Centro de Estudios Regionales Andinos Bartolomé de Las Casas. 2003 [1987] Lingüística quechua. Cuzco: Centro de Estudios Regionales Andinos Bartolomé de Las Casas. CERRÓN-PALO!r11NO, Rodolfo y Enrique Bailón Aguirre en preparación Vocabulario chipaya-caste//ano. castellano-chipaya. Lima: Fondo Editorial de la Pontificia Universidad Católica del Perú. Nº 40, primer semestre del 2005 55 Estudios y Debates OY EN, lsidore; KRUSKAL Joseph B. y BLACK, Paul 1992 "An Tndoeuropea n classifícation: a lexicostati sti ca l experiment", Transactions of th e Ameri can Philosophical Society, 82. Datos disponibles en: www.ldc .upenn.edu 1 EMBLETON, Sheila M. 1986 Statistics in Historical Linguistics. Bochum: Brockmeyer. FELSENSTEIN, J. 2001 PHYL!P: Phy loge11y !11fere11ce Pa ckage. Version 3. 6. Department of Genetics, University of Washington. GRAY, Russell D. y ATKINSON , Quentin D . "Language-tree divergence times support the Anatolian theory of lndo-Europ ean 2003 origin", Nature, 426, 435-439 . HARDMAN, Martha J. 1975 [ 1966] "Eljaqaru, el kawki y e l aymara", Actas del Simpos io de Montevideo. (México) 433-56. Editoria l Galache. HEGGARTY, Paul A. en preparac ión Measured Language: .fi"om Firsl Principies to New Techniques fo r Putting Numbers 011 Language Similarity. Oxford: Bl ackwell . KESSLER, Brett 2001 The Significance of Word Lisis: Stalistical Tests far ln vestigating Historical Connections Between Languages. Stanford: Center for the Study of Language and Tnformation (CS LI Publications). LANDERMAN , Peter N. 1991 Quechua Dialects and their Classification. Tes is doctoral , UCLA . Ann Arbor, Michigan : U.M.I. Dissertation Services. LOHR, Mari sa 1999 Methodsjor th e Genetic C/ass1jicatio11 of Languages . Tesis doctora l no publicada , Un iversidad de Ca mbridge. MATISOFF, James A. 2000 " On the uselessness of glottochronology for the subgrouping ofTibeto-Burman ", en: RENFREW, Colin, April McMahon & Larry Trask (eds.): Tim e-Depth in Historical Linguistics. (Cambridge) McDon ald lnstitute fo r Archaeological Research , 333-71. M CMAHON , April y MCMAHON , Robert en prensa Language C/assification by Numbers. Oxford : Oxford Uni vers ity Press. 56 Revista Andina Paul Heggarly: Enigmas en el origen de las lenguas andinas RENFREW, Col in 1987 Archaeology and language: The Puzzle of Indo-European Origins . London : Jonothan Cape. RTNG E, D.A. ; WARNOW, T. , y TAYLOR 2002 " lndo-European and computational cladistics", Transactions of'th e Philological Society, 100( 1), 59-129. STAROSTTN, Sergei A. 199 1 "Altaiskaia probl ema i proiskhozhdenie iaponskogo iazyka", Nauka, Glavnaia redaktsiia vostochnoi literatwy (Moscú) . SWADESH, Morris 1952 "Lexico-statistical dating of prehistoric ethnic contacts: with special reference to North American Indians and Eskimos", Proceedings of the American Philosophical Society, 96, 452-463 . TAYLOR, Gerald 1987 "A lgunos datos nuevos sobre el quechua de Yauyos (Vitis y Hu ancaya)", Revista Andina (Cuzco), 9, 253-65 . 1984a " Yauyos, un microcosmo dialectal quechua", Revista Andina (Cuzco), 3, 12146. 1984b Estudios de dialectología quechua (Chachapoyas, Ferreñafe, YauyoJ) . Chosica - Lima: Universidad Nacional de Educación. TORERO, Alfredo 1972[1970] 2002 "Lingüística e historia de la sociedad andina", en ESCOBAR, A. (ed.): El reto del multilingüismo en el Perú. (Lima) Instituto de Estudios Peruanos . Idiomas de los Andes - lingüística e Historia. Lima: Editorial Horizonte / IFEA. WEBER, David J., J. Felix CAYCO Z., Teodoro CAYCO V. y Marlene BALLENA DÁVILA (compilado res) 1998 Rimaycuna - Quechua de Huánu co. Lima: Instituto Lingüístico de Verano. Nº 40, primer semestre del 2005 57 Estudios y Debates COMENTARIOS Willem F.H. Adelaar F.B.J. Kuiper Instituut, Países Bajos. El artículo de Paul Heggarty retoma la discusión sobre la posición genealógica del quechua y del aymara, esta vez con un método moderno y refinado, con "programas elaborados fuera de la lingüística", cuya validez ya fue comprobada, según el autor, con familias lingüísticas en otras partes del mundo. Para el lector no familiarizado con las consideraciones metodológicas tratadas en este artículo, resulta dificil evaluar su plusvalía. Sin embargo, la representación de las relaciones entre variedades del quechua y del aymara incluidas en la Figura 8 del artículo muestra que el método utilizado no hace sino confirmar lo que todos ya sabíamos: la distancia genealógica entre el quechua y el aymara (emparentados o no) sigue siendo enonne, cuando al mismo tiempo el cuadro actual se ve borroso por la gran cantidad de préstamos ocurridos entre el quechua y el aymara en su totalidad, así como entre dialectos geográficamente cercanos de cada grupo. Un aspecto interesante de las conclusiones de Heggarty concierne la confirmación de una mayor separación genealógica de las lenguas aymaráicas frente a una relativa homogeneidad dentro del grupo quechua. Aquí se trata de una conclusión a la que no es fácil llegar en base a una inspección meramente impresionista. Al mismo tiempo, las dudas existentes relacionadas con la posición clasificatoria del grupo Quechua IIA de Torero (es decir, Cajamarca, Ferreñafe, Pacaraos, Yauyos, etc.) se ven reforzadas. No resulta sorprendiente descubrir que este grupo -s i de hecho de un grupo se trata- no cabe dentro de la bifurcación general de los dialectos quechuas, caracterizada por la división entre Quechua I y Quechua II. Esta constatación no significa, sin embargo, que dicha división no sea válida, más bien que resulta necesario refinarla. Es importante tomar nota de la distancia observada entre el Quechua de Cajamarca y Ferreñafe, por un lado, y las demás variedades quechuas asociadas con un grupo 'del norte del Perú' (Chachapoyas, Lamas), por el otro. Sin embargo, tenemos que advertir que la proximidad sugerida entre Cajamarca-Ferreñafe y el conjunto Quechua I depende enteramente de semejanzas en el léxico, pues el trabajo de Heggarty aún no toma en cuen- 58 ta, según propia declaración , los dato s morfol ógicos y fonéticos. A nuestro pare<:er, so n las considerac iones morfológicas que mejor definen al grupo Quechua I y que muestran su sepa ración del Quechua de Cajamarca. Consideremos, por ejemplo, el caso de los sufijos plurali zadores internos al verbo y el sistema de los sufijos verba les de dirección tan desarrollados en el Quechua I y cuya ausencia en el Quechua de Cajamarca es notoria. Reconstruir la genealogía interna del Quechua exclusivamente en base al léxico, sin incluir los argumentos fono lógicos y morfológicos tan esenciales, no puede ll eva r a conclusiones definitivas y, por consiguiente, tendremos que estar a la espera de un segundo a1iículo de Heggarty en el que queden reparadas aquellas deficiencias. Por la misma razón, y continuando con el caso de l Quechua de Cajamarca y Ferreñafe, el prese nte artículo deja fuera de discusión los parale los en el desarrollo del sistema verbal de referencia personal (asimismo paralelos fonéticos) , que parecen unir estos dialectos con el Quechua del sudeste de Bolivia y de Santiago del Estero en Argentina (cf. Adelaar 1995). En otras palabras, tenemos qu e tener mucho cuidado con la clasificación genea lógica de los dialectos quechuas, cuyos hablantes fueron llevados a lugares periféricos durante la marea de migraciones que acompañó la expansión incás ica y la conquista españo la. En este contexto, también se puede recordar la presencia de influencias léxicas del Quechua l en el Quechua de Catamarca y La Rioja encontradas por Nardi ( 1962). No podemos evitar ser sospechosos cuando leemos "que los dialectos (quechuas) hacia el lado sureño del continuo se hayan extendido tan lejos como para estar fuera de cualquier contacto significativo con las variedades del Perú central ". De hecho , la etnohistoria andina no fue tan sencilla. La conexión cercana entre el Quechua de Pacaraos y el conjunto Quechua 1, propuesta por Parker ( 1969) y por nosotros (Adelaar 1984 ), está fundamentada principalmente en la existencia de innovaciones morfológicas. Las particularidades léxicas del dialecto de Pacaraos se explican probablemente a través de un conservadurismo fuerte, por un lado, y contactos con una lengua aymará ica, por el otro. Tenemos algunas duda s acerca de la se lecc ión y la representatividad de los dato s ofrecidos por Revista Andina Pau/ Heggarty: Enigmas en el origen de las lenguas andinas Heggarty y su intención expresada de colectar nuevos datos en el campo para los dialectos quechuas de Pacaraos, Yauyos y Chachapoyas. En el caso de Pacaraos y Chachapoyas ya existen léxicos publicados (para Pacaraos,Adelaar 1982; para Chachapoyas, Taylor 1979). No queda claro por qué tales recopilaciones de léxico no hayan sido utilizadas , y en el caso del Quechua de Pacaraos hay que dudar seriamente de que se pueda todavía hacer una recopilación significativa del léxico de un dial ecto , cuyo conocimiento y uso ya estaban restringidos a personas de edad avanzada durante la época de 1970. También para Santiago del Estero y Lamas existen vocabu larios extensos que deberían ser tomados en cuenta (Bravo 1991; Alderetes 2001; Park, Weber y Cenepo Sangama 1976). Estamos de acuerdo con la crítica hecha por Heggarty de l trabajo de Büttner ( 1983 ). Sin embargo, debemos señalar una inexactitud histórica en la discusión aludida, cuando el autor dice "que las condiciones para el trabajo de campo eran más dificiles de cómo son hoy en día y la documentación sobre las lenguas andinas mucho más escasa". Esta excusa no va le para los dialectos quechuas cuando recordamos que la mayor actividad en relación con su estudio en el campo se dio justamente en los años 1960 y 1970. Fue después, durante los años 1980, que este tipo de trabajo llegó a estancarse, por razones consabidas, y desafortunadamente aún no se ha recuperado. Los casos particulares de vocablos discutidos en el artículo también solicitan algún comentario. En el caso del par piqa - urna, se puede notar que piqa está difundido en Pacaraos y en dialectos del conjunto Quechua I con el significado de 'seso' (por ejemplo, en San Pedro de Cajas, Tarma) . Por eso, debe quedar pendiente una conclusión acerca de su posible origen aymaráico. En el caso de inti - rupay parece que inli 'sol' es de origen quechua, debido a su probable parentesco con kunti 'oeste' y anti 'este'; resulta más dificil establecer el origen de rupay / lupi / nup ·¡ por falta de criterios. En el caso de cusku - tawa 'cuatro' se podría quizás conectar el segundo elemento con puquina tacpa 'cinco' y callahuaya taxwa 'seis' y llegar a la conclusi6n de que se tratara de un préstamo. En cuanto a la facilidad de reconocer los préstamos del castellano, hay algunas excepciones como la palabra punta 'primero', 'antes' , 'posición delantera' (en Quechua de Pacaraos y Nº 40, primer semestre del 2005 Tarma). Esta palabra cabe en el fonetismo quechua, no tiene otro uso que lo registrado y ya no refiere al significado normal que tiene la palabra 'punta' en castellano. Al final de este comentario quisiéramos subrayar que en el caso de lenguas cuyo posibl e parentesco se pierde en las tinieblas del tiempo , como es el caso del quechua y del aymara (hecho confirmado por el mismo Heggarty en este artículo), será indispensable incluir otras lenguas del subcontinente en un estudio comparativo como el presente. En este caso solo ha sido agregado el chipaya como tercer elemento en la comparación, pero esta lengua fue dejada de lado casi inmediatamente y sin mayor discusión. Falta una moti vación para no incluir el puquina, el atacameño, el cholón, el mochica, el shuar, el pano, las lenguas barbacoas, etc. En un momento en que en otras partes de América del Sur se registran importantes avances en la clasificación de las lenguas indígenas, tal limitación para la región centroandina parece un paso atrás. Y con relación a la referencia que hace el autor a la antigüedad del protoindoeuropeo, es necesario ac larar que son escasos los lingüistas indoeuropeanistas que toman en serio las propuestas del arqueólogo Renfrew al respecto. El so lo hecho de que los antiguos indoeuropeos conocían la rueda, basta para rechazar las fechas exageradas de 8000 a 9000 años mencionadas en el artículo (A lexander Lubotsky, comunicación personal ; ver tambi én Mallory 1989). BIBLIOGRAFIA ADELAAR, Willem F.H. 1982 Léxico del Quechua de Pacaraos. Documento 45 . Centro de Investigación de Lingüística Aplicada. Lima: Universidad Nacional Mayor de San Marcos. ADELAAR, Willem F.H. 1984 "Grammatica l vowel length and the classification of Quechua dialects. " lnternational Journal of' American Linguistics 50, pp. 25-47. ADELAAR, Willem F.H . 1995 "Raíces lingüísticas del Quichua de Santiago del Estero." En: Ana V Femández Garay y José Pedro Viegas Barros (coord.) Actas// Jornadas de Lingüísti- 59 Estudios y Debates ca Aborigen (Buenos Aires 15-18 de noviembre de 1994), pp. 25-50. Buenos Aires: Facultad de Filosofía y Letras, Instituto de Lingüística, Universidad de Buenos Aires. ALDERETES, Jorge R. 2001 El Quechua de Santiago del Estero. Gramática y vocabulario. Tucumán: Universidad Nacional de Tucumán . BRAVO, Domingo A. 1991 Diccionario Quichua Santiagueiio-Castel/ano. 5" edición. La Banda, Santiago del Estero: Ediciones Kelka. BÜTTNER, Thomas Th. 1983 Las lenguas de los Andes centrales. Estudios sobre la clasificación genética, areal y tipológica. Madrid: Ediciones Cultura Hispánica del Instituto de Cooperación Iberoamericana. MALLORY, J.P. 1989 In search of'the Indo-Europeans. Language, archaeology and myth. London: Thames and Hudson. NARDI , Ricardo L.J. 1962 "El Quechua de Catamarca y La Rioja." Cuadernos del Instituto Nacional de Investigaciones Folklóricas 3, pp. 189285. (Buenos Aires). PARK, Marinell ; WEBER Nancy y CENEPO SANGAMA, Víctor 1976 Diccionario Quechua San Martín. Lima: Ministerio de Educación, Instituto de Estudios Peruanos. PARKER, Gary J. 1969 "The evolution ofQuechua A." Working Papers in Linguistics l, 9, pp . 149-204. (Honolulu) University of Hawaii , Department of Linguistics. TAYLOR, Gérald 1979 Diccionario normalizado y comparativo Quechua: Chachapoyas-lamas. Paris: L'Harmattan. 60 Xavier Albó Centro de Investigación y Promoción del Campesinado (CIPCA), Bolivia. La lectura de este texto me ha resultado muy estimulante. Mis comentarios no lo serán tanto. No soy especialista en este tema específico y, además, tengo poco tiempo e información. He podido completar algo con la página www.quechua.org.uk, pero me siguen faltando algunas figuras y otros datos. Sobre muchos aportes técnicos, como los novedosos programas F,rrn y NEJGHBORNET, tan sugerentes , poco puedo comentar y mucho debo aprender. Mi comentario , son apenas unas primeras impresiones y se limita a unos pocos aspectos del artículo. Primero daré una apreciación global del trabajo, después añadiré algunas reflexiones de detalle acerca de la elaboración de la lista base y su ap licación en las lenguas y dialectos seleccionados y, finalmente , concluiré con una propuesta hacia un enfoque más ambicioso todavía. Una neo-glotocronología moderada y razonable Hace tiempo que daba por muerto y entetTado el enfoque glotocronológico de Swadesh que a tantos había entusiasmado a11os atrás, también a Torero en los Andes. Al menos aquel parentesco temprano que tenía con el Carbono 14 de lo s arqueólogos, siempre me había resultado sospechoso por la diferencia abismal que hay entre la fom1ación y evolución de sustancias físicas orgánicas y un instrumento de comunicación social como es el idioma. Cada uno baila a su ritmo; y el ritmo y las formas de la comunicación, que están en la raíz de muchos cambios lingüísticos, puede ser muy distinto de unos pueblos a otros y a lo largo del tiempo. Paul Heggarty comparte esa crítica. Sus comentarios a propósito del rápido proceso de estandarización de las lenguas modernas en torno a una variedad de mayor prestigio social, mucho más expuestas a los medios de comunicación, escuelas, etc., sugieren también un ritmo y orientación del cambio lingüístico, en este caso homogeneizador, muy distinto del que haya ocurrido en tiempos pasados (6.3.2 fin). Me junto pues a su alegoría final sobre la inaccesibilidad - o desenfoque- de ese "santo grial de una versión lingüística de la datación por radiocarbono" (sección 6.4 ). Revista Andina Pau/ Heggarty: Enigmas en el origen de las lenguas andinas Con todo, en otra parte el autor hace una concesión, ciertamente hipotética, a una datación cronológica "entre 6000 y 9500 años", cuando compara la distancia léxica entre quechua y aymara y la de las lenguas indoeuropeas más inestables. Pero enseguida añade: "a menos que haya alguna razón por la cual las lenguas andinas hayan ido perdiendo su vocabulario básico a un ritmo considerablemente más acelerado que las lenguas indoeuropeas" (6.1.4). Se me ocurre que esta razón podría ser tal vez el control vertica l de los pisos ecológicos, tan mencionado en la etnohistoria y antropología andina desde que John Murra llamó la atención sobre este rasgo. No sabemos desde cuándo ni con qué intensidad ha habido estos intercambios entre pisos ecológicos, pero parece que es algo bastante vinculado con la sobrevivencia en los Andes . En este contexto, es oportuno recordar que siempre se ha asociado más a los aymaras 1 con la puna y a los quechuas con los valles; hasta este nombre qhichwa (o qhirwa en aymara) quiere decir valle productor de maíz. Aun ahora hay zonas, por ejemplo en el norte de La Paz y el norte de Potosí , en que se habla aymara en las alturas y quechua en los valles de una misma serranía, con mucho intercambio y bilingüismo siquiera pasivo en ambas lenguas. ¿Podría explicar esta movilidad geográfica y la coexistencia de diversos pueblos en determinados va lles, con mucha interacción entre ellos, un ritmo más acelerado de préstamos de unos a otros? Puede ser también pertinente recordar que Ian Szemiñski, de la Universidad Hebrea de Jerusalén, ha cotejado sistemáticamente los términos andinos quechuas y aymaras de diversos textos coloniales con los principales diccionarios coloniales, y ha llegado a la conclusión de que son poquísimos los términos que puedan llamarse exclusivos de una u otra lengua 2• Dicho esto, el presente artícu lo retoma la temática y la intuición central de Swadesh, pero con una metodología nueva y con supuestos razonables mucho más moderados. Resulta muy refrescante la manera rigurosa y cautelosa con que Heggarty retoma el tema de reconstruir la evolu1 .2 Perdón por seguir escribiendo con y, para que siga siendo una opción alternativa incluso en castell ano. Comun icación personal. Nº 40, primer semestre del 2005 ción histórica mediante el análisis comparativo interdialectal de un conjunto limitado de palabras cuidadosamente se leccionadas. Deja claro que no puede plantearse una evolución lingüística en tiempos absolutos sino sólo como una secuencia ordinal. Salvo algunas insinuaciones sólo tentativas en las conclusiones finales , habla sólo de grados de diferencia evitando pronunciarse sobre el debate entre cambios o semejanzas por contacto o por evolución filogénética; prefiere hablar de correlatos y no de cognados o préstarnos. Se basa casi siempre en su propio trabajo personal de campo. Sus mediciones son mucho más complejas que las dicotómicas del pasado. In troduce además distinciones muy pertinentes, por ejemplo sobre la mayor o menor estabilidad léxica y semántica de las diversas palabras utili zadas en su lista .... Y cuando esta información, tan cu idadosamente recopilada, es procesada en los mencionados programas, los resultados resultan coherentes y, en algunos casos, también desafiantes, como en el cuestionamiento de la ubicación filogenética del quechua de Cajamarca y Ferreñafe. Sobre la lista base Con relación a mi segundo tema, sólo conozco la lista utilizada por Heggarty en su versión inglesa y castellana (bajada de la página web), más los pocos términos quechuas y aymaras incorporados en la discusión . Por tanto no puedo hacer un comentario de conjunto. Pero, con lo poco que he podido conocer, plantearé tres dudas. Primera duda: el autor ya nos advierte que "no siendo el lenguaje una estructura inherentemente matemática, cualquier intento para cuantificarlo ... no será más que una «interpretación»" y por eso pide "cierta «indulgencia» por parte de [los] lectores más escépticos" (4. l ). Añadiré un poco más de combustible para ese escepticismo, a partir de algunas gdudas que me plantea la lista misma de significados en inglés y castellano. ¿No se han colado duplicados, como 'seno' y 'mamar' (ñuñu-)? ¿Cómo tratar 'corazón', que en las lenguas andinas puede distinguirse el órgano y el afecto de la misma palabra (en aymara: 1/uxu 'válvula del corazón' vs. chuyma 'pulmón, tórax' , que es además la sede del afecto, etc.)? Parece un caso semejante al de sol/calor tratado en el texto (4.3). Estos y otros ejemplos me llevan al tema más complejo de hasta qué punto, al incorporar en mayor detalle la medición de aspectos semán- 61 Estudios y Debates ticos , surgen interferencias entre la concepción con que se elaboraron las listas de partida y la estructura semántica de las lenguas comparadas. Segunda duda: me gustaría saber más detalles sobre el "estatus especial" que se asigna a los préstamos castellanos para poder "tratarlos de distintas maneras de acuerdo con diferentes fines"; pero enseguida añade que en este análisis sólo tienen el status de "ausencia de datos" (final sección 3). De hecho, en otras partes como en las figuras 2 y 3, se mantiene el castellano como lengua de referencia, pero no me queda claro cuál ha sido en cada caso el tratamiento diferente. Haber puesto en cuarentena los casos en que algún dialecto sólo usa el préstamo castellano, parece razonable dada la finalidad inmediata del trabajo. Pero, efectivamente, con ello perdemos tal vez una información potencialmente pertinente para otras inferencias. ¿Por qué se perdió precisamente tal o cual palabra en esa lista considerada tan básica? Hacer un segundo análisis sin omitir esos préstamos de origen ya conocido, quizás nos podría dar una pista adicional sobre el peso que el contacto puede haber tenido en otros casos. Pensemos, por ejemplo, en la posible adición del quechua de Cochabamba, caricaturizado muchas veces como "quechuañol", a los dialectos analizados. Ahí , por ejemplo, el dúo "hermano/a" es tan común como ñaiia (hermana de ell a); probablemente se usa más que wawqi (hermano de él) y ciertamente mucho más que los términos cruzados pana y turi (hermana de él, he1mano de ella). En Cochabamba y en casi todo el quechua boliviano, el significado 'hablar' - recién añadido a la lista básica- se dice par/ay, como en castellano antiguo, mientras que la forma original rimay ahora significa sólo "atestiguar", "reñir" o se refiere al murmullo de los ríos - como ocurría ya cuando los antiguos ll amaron Rimaq al río de "Lima" y Apu Rimaq al mayor de todos los " ríos profundos" de Arguedas- y al "cuchicheo" de las gallinas. ¿Cómo tratar esos casos? ¿Qué pasaría, por ejemplo, si en la figura 8 - que distingue la representación en red NEJGHBORNET del subgrupo de significados menos estables y la del grupo de significados más estables- se añadiera una tercera representación que incluyera además los préstamos castellanos? La incorporación de préstamos castellanos es, a fin de cuentas, un dato lingüístico contemporáneo tan real como los que hayan ocurrido en el pasado. Por tanto, si al incluirlos se modificara algo la distancia entre dialectos, ¿no 62 podemos presumir que algo parecido habría ocun-ido en el pasado, sin castellano? Tercera duda: ¿por qué mantener en la li sta básica de 200 significados el conqepto 'con ' que puede tener tantas acepciones semánticas (compañía, instrumento, adición, propiedad, etc.) y que en las lenguas andinas se puede expresar en uno o varios sufijos? O, si se mantiene, ¿no habría que añadir entonces otros sufijos para que esta clase gramatical tan andina tenga mejo r representación? Estamos ahí en el umbral entre el enfoque léxico y el gramatical. Pero esto me lleva a la última parte, más general, de mi comentario. Del léxico a la gramática En términos aún muy genera les, que van más allá de este artículo, me deja todaví a insatisfecho deducir tanto de sólo el léxico, por mucho que la lista original de Swadesh se haya adaptado al contexto particular de las lenguas andinas. Cuando analizamos el diccionario de cualquier lengua moderna o lo que ocun-e actualmente entre lenguas en contacto, vemos que los préstamos léx icos so n lo primero que se introduce en otras lenguas, sobre todo si hay entre ellas un a relación soc iolingüística desigual. No digo que no valga el aná li sis comparativo de palabras para inferir correlaciones o distancia entre lenguas. Pero ¿bastará? El autor ya no s anuncia un análisis comparable de la fonología , que será muy bienvenido. Sin duda reforzará mucho de lo que aquí aparece, aunque probablemente añadirá, además , algunas otras cosas interesantes. ¿ Y qué decir de otros ámbito s gramaticales como la morfofonémica con sus juegos de sufijos, que es uno de los campos más ricos de las lenguas andinas? Aunque también aquí se reproduce el eterno debate entre semejanzas por contacto o por relación genética, este campo - más arraigado en el inconsciente y, por tanto, más resistente al cambio por simple contacto que el léxico- tiene una solidez mayor que otros. El trabajo preliminar que en ello ha reali zado nu estro común amigo y maestro Rodolfo Cerrón-Palomino ( 1994 ), comparando las estructuras paralelas del quechua y aymara, nos lo confirma y nos muestra además que ahí se puede llegar a una visión mucho más completa y sistemática que con una lista de vocabulario, por básico y universa l que se lo pretenda . Por lo que el presente artículo nos adelanta, creo que Paul Heggarty tiene agallas para lan za rse Revista Andina Paul Heggarty: Enigmas en el origen de las lenguas andinas también en este desafio mayor y salir airoso. Ya me imagino los gráficos generados por los programas FITCH o NEIGHBORNET, aplicados a datos gramaticales, y ya me muero de ganas de compararlos con los aquí presentados, a partir de la lista de palabras, unas más resistentes, otras más vulnerables. BIBLIOGRAFIA CERRÓN-PALOMINO , Rodolfo 1994 Quechumara. Estructuras paralelas de las lenguas quechua y aimara. La Paz: CIPCA. Rodolfo Cerrón-Palomino Pontificia Universidad Católica del Perú Facultad de Humanidades En la nota preliminar a la segunda edición de Lingüística Quechua (Cuzco: C.E.R.A. Bartolomé de Las Casas, 2003), llamábamos la atención sobre la necesidad de revisar algunos puntos relativos a la recon strucción del protoquechua, su posi ble emplazamiento inicial , su re lación con el protoaimara, y la clasificación de sus dialectos modernos. Señalábamos, entonces, que para una mejor comprensión de los problemas, sujetos a revisión , hacía falta reexaminar cuidadosamente los materiales disponibles, preñados de un enfoque teórico-metodológico renovado , a la par que del acceso a nuevas fuentes de información dialectal y documental. El artículo que pasaremos a comentar, se propone, coincidentemente, abordar tales temas de indudable importancia dentro de los estudios de lingüística andina. Para el lo, el autor, provisto de una drástica reformulación de la léxico-estadística tradicional, ensaya precisamente una aproximación novedosa a los problemas mencionados . Desarrollado de manera clara y accesible, no obstante discurrir sobre tópicos de naturaleza compleja, el trabajo que comentamos, luego de una breve exposición de los antecedentes de los temas estudiados, y tras anunciar la meta perseguid~, se estructura en-tomo a cuatro aspectos fundamentales que tienen que ver, aunque no necesariamente en el orden señalado, y con el riesgo de incurrir en simplificaciones, con los siguientes puntos : (a) descripción del progra_ma empleado en el procesamiento de los datos; Nº 40, primer semestre del 2005 (b) crítica razonada de la vieja léx ico-estadística, en general, y de su aplicación a las lenguas andinas; (c) selección lingüística y dialectal de los materiales analizados; y (d) interpretación de los datos a partir de la aplicac ión del método léxico-estadístico alternativo propuesto en (b) . En lo que sigue, procederemos a comentar brevemente tales puntos, destacando su pertinencia tanto teórica como metodológica, y formu lando algunas atingenci as y observaciones que el autor podrá tomar en cuenta, si las considera relevantes . En cuanto al primer aspecto, según se nos anuncia, el procedimiento de análisis filogenéti co, elaborado para su aplicación en la interpretación del pasado de las lenguas andinas, se inscribe dentro de un proyecto pluridisciplinario má s ambicioso que, bajo el nombre de "Métodos cuantitativos en la clasificación de lenguas", dirige la lingüista April McMahon en la Universidad de Sheffield (Inglaterra). Concretamente, el modelo se inspira en el método de la genética y la biología evolutivas, aplicado al estudio de las relaciones de parentesco de las especies biológicas , a partir de los índices de cuantificación derivados de las comparaciones del ADN de tales especies. De esta manera, el programa adaptado para los fin es estrictamente lingüísticos, constituye una herramienta que tiene la virtud de sintetizar y proyectar, en la form a de repre se ntaciones gráficas bidimensionales, las relaciones multidimensionales que resultan de los índices de cuantificación de semejanza, derivados del cotejo léxico-semántico de las lenguas y/o dialectos se leccionados para el estudio. A diferencia de los conocidos esquemas arbóreos que ilustran los viejos tratados de corte diacrónico, irremediablemente reduccionistas, el programa visualiza tipos de relaciones filogenéticas más sensibles a la realidad lingüística, siempre intrincada y compleja en el tiempo y en el espacio. El dispositivo, en suma, convierte la infon11ación cuantitativa en representaciones gráficas que semejan estrellas o redes, cuyas proyecciones traducen grados de diferencia o semejanza entre las entidades lingüísticas sometidas a comparación. Tales relaciones, insiste el autor, deben ser tom adas como producto de los contactos idiomáticos antes que de cualquier filiación genética. Ello, porque el materi al léxico-semántico, que sirve de aducto para la obtención de los índices de cuantificación, está libre de toda presunción de cognación, pero a la vez, siguiendo la práctica tradicional de l método comparativo, aparece na- 63 Estudios y Debates turalmente depurado de todo factor achacable al azar. De este modo, se supera el impasse que ha significado, en los trabajos de reconstrucción histórica, concretamente en el debate de las rel aciones entre el quechua y el aimara, la distinción sistemática entre préstamos y cognados como requisito de entrada, por lo demás no siempre observado en su aplicación. Lo que el método persigue es, una vez más, establecer los grados de relación entre las entidades cotejadas y no su filiación genética: de allí que el autor insista en que el programa busca visualizar las relaciones genealógicas antes que las genéticas propiamente dichas. Pues bien, en todo esto quisiéramos ver - y estamos seguros de que el autor comparte la idea con nosotros- , un saludable esfuerzo por tratar de acometer los problemas de filiación y clasificación idiomáticos, abordándolos desde otra perspectiva, en vista de la suerte de entrampamiento en el que se encuentran, al menos por el momento, los estudios de corte diacrónico aplicados en el área andina. En tal sentido, con todo lo atractivo y novedoso que pueda ser el método ideado, y al margen de su aplicación rigurosa en el presente caso, quisiéramos señalar que no se trata de una alternativa a los métodos tradicionales de la lingüística histórica, sino de un procedimiento aux iliar que puede ser empleado allí donde justamente no están dadas aún todas las condiciones para una aplicación exitosa de los mismos. De hecho, en el caso de las lenguas andinas, creemos que hay todavía mucho que trabajar en materia de reconstrucción comparativa e interna, y es de esperarse que por lo menos algunos de los problemas que ahora parecen insuperables puedan ir resolviéndose a medida que avance la investigación histórica. Estamos convencidos, en tal sentido, de que no es del todo imposible lograr establecer criterios más finos que permitan discernir mejor entre préstamos y cognados, reduciendo al máximo los índices de plausibilidad en una u otra dirección, una vez que conozcamos en mayor detalle la historia y evolución de nuestras lenguas andinas, como vienen probándolo los trabajos realizados en estos últimos tiempos. No dudamos que , dentro de tal contexto, técnicas auxiliares como la desarrollada por nuestro autor puedan alcanzar resultados más sorprendentes aun que los que ya nos proporciona, si bien a costa del soslayamiento elegante del problema de entrada mencionado. El segundo punto tratado, esta vez extensamente, tiene que ver con una ref01mulación drás- 64 tica del método léxico-estadístico, ensayada con resultados promisorios en otros ámbitos lingüísticos; esta vez adaptado especialmente por el autor a los efectos de su empleo en el cálculo de las 1 relaciones que guardan entre sí tanto los dialectos del quechua y del aimara, como las que existen entre ambas familias idiomáticas. Las innovaciones introducidas en el método son de tal magnitud que, ciertamente, constituyen una verdadera ruptura respecto de los principios teóricos y de procedimientos en los que se sustentaba aquél. En efecto, dentro de la técnica reformulada, aparte del descarte de la distinción entre préstamos y cognados, se rechaza enérgicamente la naturaleza binaria y absoluta del conteo de los elementos léxicos comparados, considerados como cognados o no (donde vale el todo o nada), dejando de lado las valoraciones intermedias a las que pueden prestarse perfectamente, desde el punto de vi sta formal y semántico, las entidades correlacionables. La versión reformulada toma en cuenta, preci samente, los distintos grados de relación que guardan entre sí los correlatos léxico-semánticos , y que a su vez son objeto de una medición escalar cuya cuantificación en cifras relativas y no absolutas servirá de aducto al programa de análisis filogenético mencionado. De esta manera, el corpus léxico-semántico que maneja el autor, que comprende en total 150 entidades (de las cuales 85 y 30 provienen, respectivamente, de las li stas mínima de 100 y máxima de 200 de las elaborada s por Swadesh, completadas con otras 35 tomadas de otras listas), aparte de haber sido sensibilizado a la realidad cultural y conceptual andina - hecho que en sí mismo cuestiona el supuesto carácter universal de las listas tradicionales- busca representar de manera "detallada, flexible y equilibrada" el carácter palimpséstico de las relaciones que se dan entre los dialectos y las lenguas del espacio andino. Pero hay algo más, igualmente cmcial, en la reformulación del corpus léxico-estadístico. Ocurre que, gracias a su aplicación a otras famili as lingüísticas, ya no es posible hablar de una estabilidad en bloque del corpus seleccionado, pues se ha demostrado que, dentro de él , se puede divisar un estrato inherentemente más estable que otro, lo que echa por tierra la noción de la tasa regular de decaimiento, invocada por el método tradicional y aplicada mecánicamente por quienes hicieron uso de éste para sus cálculos glotocronológicos. Resulta interesante constatar, en tal sentido, la suerte de "ampliación" de las posibilidades de Revista Andina Paul Heggarty: Enigmas en el origen de las lenguas andinas contar ahora con un corpus menos restringido, y habitualmente descartado por el modelo tradicional de la léx ico-estadística . Bien entendida, si n embargo, la sensibilización del corpus respecto de los grados de semejanza que guardan entre sí los correlatos léxico-semánticos supone, por parte del estudioso, un control más fino, en forma y significado, de los elementos cotejables. En efecto, tal como nos lo da a entender Heggarty, quienquiera que trabaje en esta dirección ya no puede contentarse con la consulta de meros g losa rios heteronímicos, a menos que esto sea inevi table, sobre todo tratándose de lenguas ya extinguidas, pues lo que está en juego es precisamente la medición más minuciosa de los grados de coincidencia, no necesariamente absoluta, que guardan recí procamente los correlatos léxicos, y que, a su vez, será crucial a la hora de interpretar los tipos de relación que guarden entre sí las entidades idiomáticas seleccionadas para el estudio. De allí que, a falta de datos más precisos, se haga necesario el trabajo de campo, y aquí, se hace inevitable la encuesta socio lingüística, en la que se ponen en juego la competencia bidialectal y la inteligibilidad entre los hablantes o usuarios de las lenguas o dialectos estudiados. Lo que no descarta, ciertamente, la propensión a caer en subjetivismos que pueden manifestarse en el establecimiento de falsas asociaciones, no ya cognadas, que a la larga distorsionen los resultados (después de todo, la etimología popular es algo de lo cual no se libran ni los más avezados especialistas). De todo esto es consciente el autor, quien hace muy bien en adelantarse a las objeciones y reparos que asaltan la mente incrédula de quien va leyendo el trabajo. Retomando la reflexión adelantada en relación con el primer punto discutido, quisiéramos insistir, una vez más, en que los estudios clásicos de corte diacrónico, aplicados a nuestras lenguas andinas, seguirán siendo, con todas las dificultades del caso, los que nos muestren a la larga, de manera más objetiva, los tipos de relación en forma y significado que guarden entre sí los elementos cotejables. Sobra decir que de todo ello es consciente el investigador, y, en tal sentido, se adelanta en señalar que la suya es una propuesta más bien programática ªrifes que algo acabado. Después de todo, personalmente, nos encontramos mucho más cómodos con esta nueva versión de la léxico-estadística, tras la aplicación, a todas luces mecánica y por momentos ingenua, del viejo modelo a las lenguas andinas, como en el caso de Büttner, nue- Nº 40, primer semestre del 2005 va mente sometido a juicio esta vez por el autor, o como en el caso de Torero, agregaríamos nosotros, en su estudio sobre la diferenciación interna de los dialectos del uro-chipaya. Respecto del tercer punto, relativo a la selección idiomática y dialectal , el trabajo se sustenta en la información obtenida para veinte entidades lingüísticas, ambigua aunque comprensiblemente, llamadas variedades, toda vez que el material registrado corresponde a familias de lengu as (quechua, aimara, uro-chipaya) y dialectos o lenguas pertenecientes a cada una de ellas. Aparte del material léxico del chipaya, idioma ajeno al quechua y al aimara, pero utilizado como elemento de control externo a e llos, las familias lingüísticas consideradas en el estudio están representadas por un número razonable de exponentes propios, seleccionados por el investigador, salvo un caso ( el quechua huanuqueño) para el cual se echó mano de un material previamente existente. Evidentemente, la necesidad de contar con informaciones más precisas, que pudieran satisfacer los requerimientos del nuevo modelo, obligaron al autor a efectuar personalmente la colecta del material en repetidas y frecuentes salidas a campo. Con todo, la arbitrariedad en la cobertura exponencial resulta patente, y es una lástima que el colega investigador, por razones de espacio, no nos haya explicitado las razones para ello, si bien está apercibido de la necesidad de alcanzar una muestra mucho más amplia y representativa de las entidades idiomáticas estudiadas, lo cual se toma urgente en algunos casos en vista del peligro de extinción que se cierne sobre ciertas variedades dialectales tanto quechuas como aimaras. En tal sentido, como señala el estudioso británico, será interesante tomar en cuenta en las versiones ulteriores de su trabajo en curso, la inclusión de di alectos como los de Chachapoyas, Ferreñafe, Cajatambo, Pacaraos, Yauyos y Huancayo, para referimos solamente a algunos de los dialectos quechuas que de alguna manera, y en mayor o menor medida, se han mostrado reacios a los intentos de clasificación que se han venido ensayando hasta la fecha. Afortunadamente, para algunos de ellos contamos con materiales léxicos más o menos solventes, aunque para otros no solamente no disponemos de ellos sino que, como en el caso de Cajatambo, la variedad misma está en franco proceso de obsolescencia. Como lo está, de manera mucho más dramática, y esta vez dentro de la familia aimara, la variedad yauyina de Cachuy. 65 Estudios y Debates Dentro de esta misma familia, se hace urgente la inclusión de datos provenientes de dialectos sureños periféricos, como los de Oruro (Bolivia}, el norte chileno, y Moquegua y Tacna en e l Perú. Para algunos de estos casos, obviamente, se hace urgente el trabajo de campo como la única alternativa que pueda proveernos del material lingü ísti co necesario, antes de que las variedades en cuestión se nos escapen de las manos. El cuarto punto abordado por el autor, de hecho la parte más reveladora del trabajo, presenta los resultados de la aplicación del programa a los datos numéricos arrojados por los índices de semejanza léxico-semántica que le sirvieron de aducto. Se procede en ella con la interpretación de tales resultados tras la aplicación del modelo filogenético ensayado, a la luz de los diagramas (neighb orn et) proyectados por él como educto de la información lingüística cuantificada. Como se recordará, el autor se proponía atacar, desde una perspectiva novedosa, empleando para ello nuevas técnicas interpretativas, los problemas diacrónicos más importantes e irresueltos dentro de la lingüística andina, a saber: (a) la relación quechua-aimara, (b) la escición inicial y la clasificación de los dialectos quechuas modernos, (c) la clasificación de los dialectos aimaras, y (d) el problema de los emplazamientos y desplazamientos iniciales de las familias lingüísticas involucradas. En lo concerniente al primer problema, resulta particularmente iluminador, por su carácter confirmatorio , la demostración de que, tan pronto como se introduce la distinción, dentro de los 150 elementos léxico-semánticos que sirven de comparación, entre significados más estables y menos estables en el tiempo, salte a la vista un hecho contundente: la aproximación entre las lenguas es mayor en el segundo caso y menor en el primero, lo que podría explicarse como resultado de una convergencia en el caso del léxico menos estable y, al mismo tiempo, cierta distancia mutua en relación con el léxico más perdurable. Es decir, pues, que en este punto, el modelo ensayado por el autor no hace sino confirmar, si bien de modo más categórico, lo que se ha venido sosteniendo en los últimos tiempos: si el quechua y el aimara se originaron alguna vez de un mismo tronco, esto debió haber ocurrido en un tiempo considerablemente remoto, no menor de seis a nueve mil enios. En cuanto al segundo problema, los resultados arrojados por el modelo son igualmente reveladores y no menos impactantes. En efecto, en rela- 66 ción con el asun to de la ruptura inici al del protoquechua, los diagramas proyectados configuran, contra la bifurcación tradicional postulada entre QI y QII, por lo menos una escisión tripartita, acorde por lo demás con la información sincrónica proporcionada por los dialectos modernos que, lejos de ofrecer realidades discontinuas, muestran un continuum a menudo soslayado, cuando no simplificado, por los tradicionales esquemas de corte arbóreo. Sobra deci r que, en este punto, la aplicación del método comparativo dejaba insatisfechos y hasta frustrados a quienes buscaron remediar, cuando no recusar de plano, la tesis de la bifurcación primordial. Y en cuanto a los problemas de índole clasificatoria, es igualmente pal mario constatar que los llamados dialectos del QIIA se aproximen, en la malla filogenética , al Ql antes que al QII, en contra de lo postulado inicialmente. En tal sentido, vale la pena subrayar lo señalado por el autor a manera de corolario de todo ello: " no es la si mplicidad analítica sino la fidelidad a la historia real nuestra meta en la lingüística histórica" . Por lo que toca al tercer punto, las proyecciones filogenéticas arrojadas por el programa en relación con la familia aimaraica, a diferencia de lo que ocurre con las del quechua, son de carácter bifurcante, lo cual, sin embargo, no constituye ninguna contradicción con la noción de una ruptura inicial natural y realista, pues en este caso hay razones de índole históri ca qu e permiten explicar el hecho: la existencia de só lo dos lenguas-testimonio. En relación con esta misma familia, hay otro aspecto que los diagramas parecen revelar, y que ti ene que ver con que sus componentes mayores (central y sureño) semostrarían menos cercanos entre sí en comparación con las variedades de la familia quechua. Finalmente, con respecto al cuarto punto, territorio minado que el autor trata más bien de refilón, no hay mucho que comentar, puesto que incide en aspectos para los cuales resulta prudente esperar futuros logros en el campo de la an dinística y de la lingüística histórica en general. Mientras tanto, resulta prematuro aún, en el mejor de los casos, dar por terminados los debates en torno a los emplazamientos originales de las protolenguas, sus tiempos absolutos de diversificac ión y expansión, así como su asociación co n las ci vilizaciones del pasado. Como bien señala el joven investigador, algunos de los resultados obtenidos, gracias al novedoso método empleado, no sólo no contradicen sino que también parece n confirmar Revista Andina Pau/ Heggarty: Enigmas en el origen de las lenguas andinas ciertas posturas que han venido imponiéndose en los últimos años, como por ejemplo la fragmentación inicial del aimara antes que la del quechua, o la posible cuna centroandina y no marítima del protoquechua. Ahora bien, en cuanto a los temas relacionados con la ruptura inicial del PQ y con la distancia mayor que las lenguas aimaraicas guardarían entre sí a diferencia de las del quechua -aspecto este último que nos parece desconcertante por decir lo menos- convendría llamar la atención, y sin ánimos de contradecir los resultados arrojados por el programa filogenético, sobre el hecho de que tales interpretaciones, si bien coherentes con los materiales (exclusivamente léxico-semánticos) que se emplearon como aducto, casi estaban llamadas a contradecir, por lo menos en el terreno de los hechos, las propuestas emanadas de la aplicación de los métodos tradicionales de la lingüística histórica, a su tumo basadas en el empleo de datos más bien fonológicos y morfológicos. En tal sentido, nos preguntamos si es que el tipo de material empleado en cada caso no sería el responsable del arribo a resultados parcialmente diferentes. En este aspecto, es de esperar que el colega investigador nos demuestre lo contrario ofreciéndonos en breve aquello que nos ha venido anunciando a lo largo de su trabajo: la ulterior medición de las relaciones lingüísticas y dialectales en función de la diversificación fonético-fonológica que separa a las entidades idiomáticas estudiadas. Después de todo, se trata de un tema cuya propuesta teórica ya ha venido dándola a conocer el autor por lo menos en un trabajo anterior. Para terminar, sólo resta saludar el ingreso con pie firme de este joven investigador a la arena, por momentos movediza, de la andinística, y cuyos trabajos futuros, siendo uno de sus adelantos el que comentamos, podrán abrir nuevos derroteros que conduzcan al esclarecimiento del pasado de nuestras lenguas originarias. Paradójicamente, por lo demás, el trabajo va dedicado a quien fuera, al margen de sus méritos indiscutibles, a un investigador nada permeable a la revisión de sus ideas y siempre reacio a reconocer abiertamente sus propias contradicciones. Nº 40, primer semestre del 2005 César ltier lnstitut Nationa/ des Langues et Civilisations Orientales, Frunce Gracias al novedoso y riguroso método elaborado por su autor, el presente artículo marcará sin duda un hito en la historia de las investigaciones sobre el desarrollo histórico de las familias quechua y aimara, en particular sobre el problema de la relación genética o de convergencia entre las mismas. Las siguientes observaciones, en su mayoría, apoyan la demostración, muy convincente, del autor. Emitiré algunas reservas, sin embargo, sobre las hipótesis presentadas en la última sección, "¿Tierras de origen, expansiones y fechas?". Coincido con el autor en que hay que matizar la oposición que estableció Torero entre quechua I y quechua II y, sobre todo, guardarse de deducir de ella un "evento dominante de ruptura en la historia temprana del quechua". P. Heggarty muestra que las variedades de Cajamarca y Ferreñafe, clasificadas como Qlla por Torero, en realidad son más cercanas, a nivel léxico, a los dialectos QI que a los dialectos Qllb y QIIc. En el caso del quechua de Ferreñafe, por lo menos, me parece que las evidencias morfológicas apuntan en el mismo sentido. La clasificación hecha por Torero de los dialectos de Cajamarca y Ferreñafe dentro del grupo QII ya fue cuestionada por Taylor ( 1984; 1996: : 5-8; 2000: 35-36, 44), quien propuso el concepto de "dialecto mixto" para abarcar tanto los dialectos de Ferreñafe, Cajamarca y Chachapoyas como los de Yauyos. Estableció, sin embargo, una distinción entre dos tipos de mixtura. Presentó evidencias internas que sugieren que los dialectos del norte del Perú son el producto de la superposición de dos olas expansivas del quechua, la más antigua procedente del centro y la segunda del espacio QII. En cambio, siempre según Taylor, la provincia de Yauyos constituiría un verdadero espacio de transición entre el área Ql y el área QII. Por eso, sugiero que reservemos la expresión de "dialecto mixto" para las variedades del norte del Perú y la de "dialecto intermedio", propuesta por P. Heggarty, para las de Yauyos. Si renunciamos al concepto de "quechua Ila", tendremos entonces que rebautizar los dialectos Qllb y Qllc de Torero, por ejemplo como QII septentrional y QII meridional, respectivamente. Existen evidencias para sustentar que la nitidez actual de la frontera septentrional del quechua 67 Estudios y Debates 11 meridional - ciertamente menor entre Huancavelica y Yauyos que en el límite departamental entre Huancavelica y Junín- es un hecho relativamente reciente y que, en el pasado, el área intermedia entre QI y QII bien pudo prolongarse mucho más hacia el sur y hacia la costa, configurando un verdadero continuo dialectal. Las Relaciones geográficas de Indias seña lan que en Cotahuasi (departamento de Arequipa) coexistían todavía en 1586 dos formas de quechua, la una vemacular, en retroceso, y la otra "general": " los indios[ ... ] hablan algunos dellos en su lengua quichua y la mayor parte en lengua general del inga" (Jiménez de la Espada, 1965: 31 O). Refiriéndose a una provincia un poco más meridional , otro de los autores de las Relaciones señala que "Los de la provincia de Cavana hablan la lengua general del Cuzco corruta y muy avillanada" (!bid.: 329). Por cierto, las variedades de quechua que se hablan actualmente en Cotahuasi y en Cabana no divergen de la lengua general colonial -de tipo QII meridional- tanto como para ver en ellas una forma "muy avillanada" de la misma y otra "lengua quichua" . Más bien, estos testimonios dejan sospechar que coexistían en esa época, en esas provincias, un quechua vehicular en proceso de vemacularización y variedades de quechua muy claramente distintas de la "lengua general". Algunos indicios filológicos sugieren que estas formas de quechua eran mucho más cercanas a lo que entendemos hoy por "quechua I" que a lo que conocemos actualmente como "ayacuchano" o "cuzqueño-collavino". Guarnan Poma, nativo de la provincia de Lucanas - no muy lejos de Cotahuasi- , al referirse a los aspectos más tradicionales de la cultura de su región, emplea a veces términos como lurin "abajo" (1936 : 431 , 432, 433), marka "pueblo" ( 1936: 458) o hunaq "día" ( 1936: 899), que hoy se considerarían privativos del conjunto quechua J. También existen indicios dialectológicos para sustentar que la (muy) relativa homogeneidad lingüística que presentan actualmente los departamentos de Huancavelica, Ayacucho, Apurímac, Arequipa, Cuzco y Puno es fruto de la expansión colonial de una lengua común, a partir de los centros urbanos particularmente importantes alrededor de los cuales se articulaban estas regiones : Huancavelica, Huamanga y Cuzco. De hecho, el área cubierta actualmente por el quechua ayacuchano coincide exactamente con el espacio éconómico que se articulaba, en la época 68 colonial, alrededor de las ciudades de Huamanga y Huancavelica. Y otro tanto puede decirse para el quechua cuzqueño. Por añadidura, en las zo nas geográficamente más periféricas del QII meridional, las que están más apartadas de1dichas ciudades, se observan rasgos inesperados que constituyen probablemente las hue llas de una diversidad dialectal que antiguamante fu e mayor. En el quechua de la provincia de Paucar del Sara Sara, por ejemplo, donde se habla hoy una variedad intermedia entre el ayacuchano y el cuzqueño, existen términos como imay "cuando" o usya"terminar" (Cáceres, 1992), que conocen también las hablas de tipo 1, cuando los dialectos de tipo 11 sólo conocen haykap (u otras formas deri vadas) y tuku-, respectivamente. En su morfología, estas variedades meridionales periféricas a veces han aplicado a formas "generales" significados que no lo son y que caracterizan más bien los dialectos del centro y centro norte del Perú. Así , en una franja que se extiende de la provincia de Paucar del Sara Sara (Ayacucho) hasta la de Abancay (Apurímac), el sufijo postverbo -rpari- no tiene el empleo muy limitado, casi lexicalizado, y el sentido "eyectivo" que presenta en las zonas cercanas a Huancavelica, Huamanga y Cuzco, sino el empleo frecuente y el sentido de "acción reali zada sin reserva o sin resistencia" que tiene el sufijo -rku-, en sus aplicaciones no espaciales, en los dialectos de Ancash, Huánuco , Cajatambo y Junín. Son sólo unos cuantos ejemplos que sugieren que las variedades periféricas del quechua sureño han retenido elementos léxicos y significados morfológicos procedentes de variedades intermedias del quechua, que se extinguieron debido a su desplazamiento por la " lengua general" . El QII probablemente no fue en su origen sino uno de los representantes más extremos de ese continuo dialectal , que luego supl antó otras lenguas quechuas y de otras familias. Las variedades de Yauyos serían entonces algo así como algunos de los eslabones hoy perdidos de un antiguo continuo que unía lo que hoy nos aparece como dos conjuntos dialectales relativamente bien distinguibles. Los eslabones también se pueden buscar más hacia el norte, como lo hace P. Heggarty al advertir que en el aspecto lexical , el quechua de Pacaraos se posiciona entre el quechua central y las variedades intermedi as de Yauyos. Lo confirma por lo menos un aspecto de su morfologí a: el empleo exclusivo de la forma -shpa, para el gerundio 1, considerada como típicamente QII, Revista Andina Pau/ Heggarty: Enigmas en el origen de las lenguas andinas frente a los demás dialectos del centro que usan principalmente la forma -r (Adelaar, 1987). El autor advierte que la semejanza en los significantes léxicos del quechua y del aimara es mucho mayor para los significados menos estables que para los más estables, lo cual sugiere un escenario de convergencia antes que de origen común. La morfología parece confirmar esta interpretac ión. Los sufijos quechuas que aparecen en las posiciones más internas del verbo, cuya frecuencia es más alta y que encontramos en toda la zona continua (la de mayor fragmentación dialectal), es decir los que parecen ser los más estables, no muestran ninguna semejanza, a nivel de significante, con sufijo aimara alguno. Sin embargo, es de notar que es precisamente en ese nivel de la morfología donde la semejanza es más fuerte en cuanto a significados. Sólo citaré, a manera de ilustración, el caso de los tres orientadores actanciales, que constituyen un aspecto esencial del sistema verbal de las lenguas quechuas y aimaras de la zona continua. El Orientador Actancial 1 (OA 1) -kU- orienta la acción hacia el sujeto, el OA2 -m(u)- la orienta hacia el punto donde se sitúa el segundo actante y el OA3 -pula desvía fuera del escenario conformado por estos dos actantes. El mismo sistema se vuelve a encontrar en aimara sureño (no he hecho el cotejo con el aimara central), aunque con otros significantes: respectivamente -si-, -ni- y -xa-. Algo equivalente sucede con otros aspectos esenciales de la morfología verbal de estas lenguas: por ejemplo los sistemas personal y aspecto-temporal. Por lo tanto, coincido con P. Heggarty en que la convergencia entre quechua y aimara fue "de muy gran alcance". Los indicios morfológicos sugieren inclusive que un proceso de pidginización estuvo en el origen de una de las dos familias: el protoquechua o el protoaimara sería el fruto de la remodelación de una tercera lengua por un dialecto aimara o quechua. De manera general, dada la estructura del quechua, creo que el estudio de las relaciones entre dialectos quechuas y entre el quechua y el aimara debe dedicarle por lo menos tanta atención a la semántica morfológica como a la semántica léxica y a la fonética. P. Heggarty constata que la distancia entre las variedades más diferentes es mayor dentro de la familia aimara que dentro de la familia quechua. En la parte final de su artículo, dedicada a las hipótesis relativas a los focos y fechas de expansión del quechua y del aimara, advierte muy pru- Nº 40, primer semestre del 2005 dentemente: "S iendo así, y siempre que no hubieran intervenido otros factores para perturbar sus procesos históricos respectivos , por defecto se supondría que las primeras diferenciaciones dentro del protoaimara se produjeron algún tiempo antes de que comenzara la fragmentación del protoquechua". Creo que existen indicios de que un factor histórico intervino para "revertir el supuesto de que sea la familia aimara la que desde más antigua data está divergiendo". Sabemos por las fuentes históricas que, en gran parte del mundo quechuahablante, las variedades locales coexistieron durante siglos con una variedad vehicular, cuya identidad dialectal pudo variar según las épocas. Existen testimonios tanto históricos como filológicos para sustentar que tal era la situación en la sierra central y norcentral del Perú, en las épocas incaica y colonial. Todo sugiere que el Tahuantinsuyo no hizo sino reforzar la función vehicular de una forma de quechua que, desde antes, venía desempeñando ese papel. Es probable que estas circunstancias limitaran las innovaciones locales y frenaran la divergencia lingüística. Incluso pudieron favorecer cierta convergencia entre variedades anteriormente más diferenciadas (tal vez ésta sea la explicación de la presencia de urna, "cabeza" en Chacpar). En tal caso, una correlación entre el horizonte temprano (800200 A.C.) y una primera expansión del quechua no sería inverosímil , sobre todo si tomamos en cuenta que la difusión de la cultura Chavín, desde Cajamarca hasta Ayacucho, abarca lo que parece haber sido el área cubierta por los dialectos quechuas antes de la propagación del QII. En el caso de la familia aimara, en cambio, la ausencia de contacto entre el aimara central y el aimara meridional en los últimos siglos e incluso, probablemente, en el último milenio, por lo menos, no pudo más que favorecer, en ambos lados, innovaciones no compartidas. Dicho en términos generales, lo que se llama "separación" de dos dialectos a partir de un tronco común es un largo proceso entre la primera innovación no común y la última innovación común. Este proceso puede verse frenado y alargado por el contacto entre los dos dialectos o entre éstos y una variedad vehicular procedente de la misma familia. Por lo tanto, la cuantificación de las semejanzas y diferencias entre dialectos de una misma lengua es un indicio pero no una prueba de la cronología relativa de la fragmentación de esa lengua. El método cuantitativo probablemente no pueda reemplazar 69 Estudios y Debates el método comparativo y la historia en la reconstrucción del desarrollo histórico de las lenguas. Tal vez la relativa lentitud de los avances realizados en este campo no se deba tanto a "los límites inherentes a lo que con confianza pueden decirnos las técnicas actualmente disponibles para la lingüística histórico-comparativa" como simplemente a la falta de aplicación en gran escala de estas técnicas. GUAMAN POMA DE AYALA, Felipe 1936 Nueva Coron ica y Buen Gobierno (Codex péruvien illustré) . Paris: Institut d 'Ethnologie. JIMÉNEZ DE LA ESPADA, Marcos (ed.) 1965 Relaciones geográficas de Indias. Madrid : Biblioteca de Autores Españoles. TAYLOR, Gerald 1984 "Yauyos, un microcosmos di alecta l", Revista Andina, t. 3, pp. 121-146. BILIOGRAFIA ADELAAR, Willem F. H. 1987 Morfología del quechua de Pacaraos. Lima: Universidad Nacional Mayor de San Marcos. CÁCERES VARGAS, Gloria 1992 Morfosintaxis del quechua de Coita, tesis presentada por ... para obtener el grado académico de magíster en ciencias de la educación, con mención en lengua y literatura. Lima: Universidad Nacional de Educación Enrique Guzmán y Valle. TAYLOR, Gerald El quechua de Ferreñafe. Fonología. 1996 morfología, léxico. Cajamarca: Acku Quinde. TAYLOR, Gerald, 2000 Estudios linguísticos sobre Chachapoyas. Lima: UNMSM - IFEA. RESPUESTA Pau/ Heggarty Universidad de Edimburgo Nos ha resultado a la vez agradable e instructivo leer en cada uno de los comentarios las muy valiosas y perceptivas reacciones de parte de cuatro destacados especialistas en lingüística andina, además de sus sugerencias, consejos, críticas acertadas y propios aportes con datos nuevos a los debates . A nuestro parecer, sus contribuciones conforman un modelo de debate lingüístico informado y perspicaz, por lo cual quisiéramos expresar nuestro agradecimiento a cada uno de ellos. Para empezar, nos corresponde dejar claro más de cuanto lo hemos logrado en el artículo mismo, quizás- que compartimos un buen número de las reservas expresadas por los comentaristas en lo que respecta a algunas cuestiones 70 metodológicas. En efecto, algunas de estas reservas son tan naturales que resultan incluso inevitables para cualquier científico familiarizado profundamente con la naturaleza del lenguaje, la historia de las lenguas, y las relaciones entre ellas. Todos los comentaristas, especialmente Adelaar, expresan un nivel de cautela bastante comprensible en cuanto a la aplicación de un método enteramente novedoso, de nuestra autoría, para cuantificar el grado de semejanza en semántica léxica. Se inscribe además dentro de un campo que a su vez queda muy novedoso, el de la aplicación a datos lingüís ti cos de métodos filogenéticos tirados de las ciencias biológicas. Para poder conocer más a fondo este nuevo campo de la lingüística, nos permitimos señalar a nuestros lectores dos libros que sin duda se volverán obras de referencia. Notamos, no obstante, que al momento de publicar el presente artículo, ambos si - Revista Andina Pau/ Heggarty: Enigmas en el origen de las lenguas andinas guen en prensa, por lo cual no fue posible ponerlos a disposición de los comentaristas. En julio del 2004, se llevó a cabo en la Universidad de Cambridge un primer simposio multidisciplinario sobre Métodos filogenéticos y la prehistoria de las lenguas, del cual se publicarán las actas, editadas por Renfrew, Forster & Clackson (2005, en prensa). Se espera igualmente la próxima publicación de McMahon & McMahon (2005 , en prensa), que considera enteramente la aplicación de métodos cuantitativos a la comparación de lenguas, incluyendo varios otros métodos además de los análisis filogenéticos. Terminología En primer lugar, intentaremos esclarecer algunas cuestiones relativas a la terminología, pues tal parece que en algunos casos no hemos sido lo suficientemente claros en función del sentido específico requerido. Al parecer, nuestro empleo del término " genealógico" antes que "genético" ha generado algunas confusiones. Para referimos a las relaciones de origen común entre los idiomas, nos hemos valido del término "genealógico", exactamente en el mismo sentido que tradicionalmente ha solido utilizarse entre los lingüistas la palabra "genético". Así, no hacemos sino adscribimos a una tendencia creciente en lingüística que opta por dicha elección en tanto que considera que "genealógico" ofrece una analogía más directa con respecto al tipo de relaciones de parentesco entre las lenguas "ancestrales", "hijas", "hermanas", etc. De igual modo, nos ayuda a evitar confusiones entre las varias disciplinas que se interesan por investigar los orígenes de las poblaciones humanas, por medio de comparaciones no sólo de sus lenguas sino también del perfil genético de esas poblaciones (en el sentido original biológico de la palabra 'genético'). En cuanto a nuestro uso de la palabra variedades, allí donde Cerrón-Palomino percibe una ambigüedad en este término es justamente donde vemos más bien su atractivo para nuestros fines. Lo más notorio del término dialecto son las varias interpretaciones a las cuales se presta, particularmente cuando s, le aplica al quechua. El quechua Ayacucho-Chanca, por ejemplo, ¿se debería considerar un dialecto diferente al Cuzco-Callao, o son ambos más bien sólo integrantes de un único "dialecto" que mejor habría que llamar el quechua sureño? El presente estudio busca, a propósito, Nº 40, primer semestre del 2005 investigar todos los niveles de diferencia que se dan al interior de la familia quechua, desde las variedades más similares hasta las más diferentes entre sí. En estudios como el nuestro, nos resulta indispensable un término que permita referir indistintamente a cualquier nivel de diferencia, libre de toda connotación, no deseada, con respecto al grado particular de similitud y/o de relación genealógica, sin necesidad de recurrir constantemente a especificaciones o calificativos . El ténnino 'variedad' - o por lo menos su equivalente en inglés 'variety'- ya ha logrado imponerse entre dialectólogos como término estándar. Albó, por su parte, caracteriza nuestro método como una "neo-glotocronología moderada y razonable". Por cierto, el empleo del término 'glotocronología ' tiene una larga historia como simple sinónimo de 'léxico-estadística' , pero, como lo han venido señalando muchos lingüistas desde hace ya varios años, es posible y preferible distinguirlos. Así, resulta perfectamente posible cuantificar cuánto se parecen dos lenguas en su semántica léxica (la léxico-estadística), sin que ello implique vemos en la obligación de adoptar alguno de los supuestos, inválidos, sobre tasas de cambio regulares a través del tiempo, propuestos con la finalidad de calcular fechas de separación de lenguas ancestrales a partir de sus cuantificaciones. Hoy en día, la mayoría de lingüistas aboga por que se reserve el término glotocronología únicamente para esta aplicación específica de la léxico-estadística: es decir, la datación. Pues, a partir de esta interpretación terminológica, debemos aclarar que nuestro método ciertamente no constituye ninguna forma de glotocronología , método que nosotros seguimos considerando "muerto y enterrado" (iY que en eterna paz descanse!). Más bien, en este contexto, lo que sí nos interesa "resucitar" es únicamente la esencia de un estudio léxico-estadístico como una forma de comparación entre lenguas a partir de su semántica léxica. Porque, de hecho, preferimos no asociar nuestro método, tan estrechamente, tampoco con el término léxico-estadística, con sus conocidas fallas metodológicas, ya que pusimos tanto esmero en desvincular nuestra propia técnica de ellas. Otro problema es hablar de "listas de palabras" como tradicionalmente se ha venido haciendo, que es tal como Albó sigue considerando cuando se refiere a nuestro "conjunto limitado de palabras cuidadosamente seleccionadas". En nuestro artículo, muy cuidadosamente, hablamos úni- 71 Estudios y Debates camente de "nuestra lista de 150 significados", no de "palabras", y eso justamente porque, a diferencia de la léxico-estadística tradicional, nuestro método de ninguna manera insiste en que a priori debe haber una correspondencia de uno a uno entre significado y lexema. Recuérdese que consideramos subsentidos, sinónimos, la importancia relativa en el léxico de cada lexema registrado, las correlaciones evidentes o plausibles entre lexemas, etc .. Así es que se explica porqué no resulta posible presentar tales datos para ninguna variedad andina en una simple lista de 150 lexemas equivalentes en quechua o en aimara. La estructura que se requiere necesariamente es más compleja que una simple lista, así que para ver los datos para cada variedad estudiada los lectores necesariamente tendrán que descargar nuestra base de datos, estructurada de la forma apropiada. Allí también, en las notas que acompañan a cada uno de los 150 significados, se encuentran las respuestas a preguntas como la de Albó, quien quiere saber cuáles son los sentidos exactos que buscamos para significados como 'con' (en este caso, no buscamos sino el sentido de acompañamiento). Se considerarán, además, un conjunto de explicaciones teóricas más completas en Heggarty (en preparación). Asuntos específicos sobre el método y los datos El comentario de Cerrón-Palomino incluye un resumen admirablemente claro y sucinto de nuestro enfoque metodológico, aunque contenga algunos fraseas que eventualmente pueden dar una impresión de que atribuimos a los métodos mismos ciertas capacidades 'diagnósticas' exageradas para fines lingüísticos; o bien, que aplicamos ciertos supuestos a priori con respeto a que algunas configuraciones particulares en los gráficos necesariamente corresponderían a explicaciones lingüísticas específicas. Nos referimos a los comentarios que citamos a continuación: "Tales relaciones, insiste el autor, deben ser tomadas como producto de los contactos idiomáticos antes que de cualquier filiación genética"; y "el autor insista en que el programa busca visualizar las relaciones genealógicas". En sentido riguroso, los programas de análisis filogenético no constituyen nada más que una manera para procesar los datos numéricos que les son introducidos como aducto , sean ellos cualesquieran. Cuando se trabaja con complejos 72 de hasta veinte o más variedades lingüísticas, como en nuestro estudio, las configuraciones multidimensionales de grados de similitud o diferencia entre todas ellas contienen sí mucha información muy útil sobre las relaciones que gi\iardan entre sí estas variedades, pero tales configuraciones llegan a ser muy intricadas, tal como se puede apreciar en las cifras en la Figura 2. Los programas de análisis filogenético no sirven sino para ayudarnos a visualizar estas relaciones muy complejas en una forma más fácilmente entendible, sobre todo por ser sintetizada en tan sólo dos dimensiones. Los programas son enteramente neutros con respecto a cuál podría ser la verdadera explicación histórica para cualquier grado de similitud o diferencia. Cualquier escenario real que proponemos como explicación de tales relaciones de similitud/diferencia, no es más que una interpretación, ofrecida desde nuestra capacidad como lingüistas. Así, en nuestro artículo intentamos identificar algunas configuraciones en los gráficos que parecen reflejar el origen común (la distinción muy nítida que opone todas las variedades del quechua a todas las aimaráicas), y otras que imaginamos reflejan sólo el contacto idiomático (los enlaces entre el aimara sureño y el quechua sureño para los significados menos estables). Así, a diferencia de lo que tal vez se pueda entender de los comentarios de Cerrón-Palomino, citados líneas arribas, no hay ninguna ' regla de interpretación ' sencilla que se puede aplicar automáticamente en todos los casos. Nótese más bien que es precisamente en esta tarea de interpretación, que tiene su mayor utilidad la di stinción entre significados inherentemente más estables y menos estables. Adelaar pregunta porqué no nos hemos valido de varios diccionarios ya publicados; entre ellos se podría destacar, por ejemplo, su léxico del quechua de Pacaraos (Adelaar 1982). La explicación se encuentra en los requisitos inherentes a nuestro método, tal como Cerrón-Palomino comprende en su comentario claramente, expresándolo además con mayor nitidez que nosotros mismos: "De allí que, a fa lta de datos más precisos, se haga necesario el trabajo de campo" . A continuación, Cerrón-Palomino advierte algunos riesgos metodológicos : "la propensión a caer en subjetivismos", las "falsas asociaciones" y la "etimología popular". Pues bien, debe quedar claro que en nin gún momento del procedimiento de recolección de datos se les pide a los informantes juzgar si unos lexemas dados son o no son correlatos, ni mucho Revista Andina Pau/ Heggarty: Enigmas en el origen de las lenguas andinas menos proveer ninguna etimología popular. Tales juicios corresponden siempre únicamente al lingüi sta, ya que necesariamente requieren conocimientos lingüísticos detallados. Estos conocimientos deben abarcar, a la vez, los cambios de sonido ocurridos en cada variedad en cuestión, y los cambios generales que se saben típicos de las lenguas andinas (se piensa por ejemplo en los clásicos patrones de metátesis: vea la documentación suplementaria que se puede descargar de nuestra página web). Albó, por su parte, pide un análisis que inc luya informaciones sobre préstamos del castellano, ya que opina que "quizás nos podría dar una pista adicional sobre el peso que el contacto puede haber tenido en otros casos". De hecho, tales cálculos, al igual que sus representaciones gráficas correspondientes, ya han sido producidos, y es muy cierto que son de utilidad: se nota, por ejemplo, una frecuencia mucho más elevada de préstamos del castellano entre los sign ificados menos estables que entre los más estables, lo que no hace sino confirmar la validez de la distinción que queremos establecer entre ellos. Tales resultados se prestan, no obstante, a esclarecer cuestiones bastante diferentes a las que forman el propósito de nuestro artículo - es decir, investigar los orígenes de los idiomas andinos- y los gráficos resultan mucho más expuestos a interpretaciones que no serían sino engañosas para este fin . Los comentaristas también ofrecen observaciones específicas sobre varios de los significados y lexemas que figuran en nuestra lista de 150 significados y/o en las ejemplificaciones de nuestro método, para expresar sus dudas y/o para ofrecemos más datos a su propósito. De hecho, en muchos de estos casos las complejidades que nos señalan son precisamente las que se ha buscado acomodar en el diseño de nuestro nuevo método de comparación en semántica léxica. Albó menciona, por ejemplo, el caso del significado hablar, y de hecho para las variedades bolivianas del quechua (y algunas otras) el lexema principal que figura en nuestra base de datos es, efectivamente, parlay (un préstamo antiguo del castellano); mientras que rimay no figura sino en ciertos sentidos más limitados. Así que, justamente, nuestros cál culos del grado tle similitud entre una de estas variedades y cualquier otra en la cual rimay sigue siendo la palabra básica, reflejan tales diferencias. Tales detalles para cada uno de los 150 significados se pueden consultar en nuestra base de datos. Nº 40, primer semestre del 2005 Los datos que nos aporta Adelaar para los significados cabeza y sol, por cierto, son de mucho va lor en el esfuerzo para establecer si algunos lexemas dados se deben identificar como de origen quechua o más bien aimara, datos históricos importantes y muy útiles en los casos en los cuales sí podemos alcanzar una respuesta conc luyente. Debemos repetir, sin embargo, que para calcular el grado de similitud entre las variedades en su semántica léxica, la dirección de ta les préstamos de hecho no ha de entrar en los cálculos: el dato crucial para producir tales resultados es únicamente la configuración de cuáles variedades comparten cuáles correlatos. Por supuesto, hay muchos casos bastante evidentes, tal como se da sobre todo cuando un lexema se revela 'panquechua ', al lado de otro ' pana imaráico'. Pero para producir nuestras cuantificaciones no se requiere ninguna decisión sobre cuál de las familias (aparte el castellano) resulte ser el origen de cualquier lexema dado. Es más: ningún dato de este tipo figura en ninguna parte de la base de datos. Tales conoci mientos nos sirven más bien en nuestras evaluaciones de la plausibilidad de que dos lexemas sean correlatos o no, tal como Adelaar mismo lo señala cuando habla del " posible origen aymaráico" de la raíz piqa. Pero, una vez más, aquí se trata precisamente de un tipo de escenario que nos hemos esforzado por acomodar en nuestro método. Justamente, en nuestra base de datos el lexema piqa se ha señalado con una plausibilidad relativamente alta que sea correlato con el aimara p 'iqi, exactamente como el mismo Adelaar sugiere. Selección de variedades Más de un comentarista cuestiona la selección de las variedades andinas incluidas en nuestro estudio hasta la fecha, y lamenta los pocos detalles que se dan en el artículo para justificar nuestras elecciones. A ellos convocamos, pues, a las explicaciones y justificaciones suplementarias presentadas en la página web de nuestro proyecto: debido a la carenc ia de espacio en el artículo mismo. Nuestros lectores bien pueden confiar en que tenemos plena conciencia de las limitaciones de nuestra cobertura actual de variedades andinas, y de lo deseable que es incluir otras más para llenar estas lagunas. Así que muchas de las variedades resaltadas por los comentaristas figuran ya desde hace tiempo en nuestra página web, en la lista de 73 Estudios y Debates las variedades adicionales que con más urgencia nos proponemos incluir, apenas se nos presente la ocasión para ulteriores trabajos de campo. En respuesta a algunos comentarios específicos, debería hacer recordar a los lectores que el quechua de Ferreñafe sí está incluido en nuestro estudio, variedad que hemos denotado con el topónimo más específico para nuestro lugar de trabajo de campo, Incahuasi. De igual manera, figuran ambas variedades del aimara central, es decir el cauqui de Cachuy y Canchán, y el jacaru de Tupe . En lo que concierne a las advertencias hec has por Adelaar acerca de la viabilidad de efectuar todavía trabajos de campo sobre el quechua de Chachapoyas y de Pacaraos, nuestras intenciones se basan para el primer caso en una consulta a Gerald Taylor, quien opinó que aún puede haber posibilidades para tales trabajos, para lo cual nos ha provisto de algunos nombres de pueblos e informantes . Para el segundo caso, nos basamos en nuestra propia visita a Pacaraos, donde - entre afectuosos recuerdos de un eminente quechuista holandés- sí hemos logrado encontrar algunos ancianos que recordaban algo de la variedad local del quechua. Sin embargo, fueron ellos mismos quienes nos animaron a regresar en otra ocasión para encontramos con dos hablantes más, quienes desafortunadamente no se encontraban en el pueblo durante el periodo en el que lo visitamos, pero los cuales se suponía estarían en mejores condiciones para ser nuestros informantes. No obstante, bien podemos imaginar que se confirmen las dudas de Adelaar en cuanto a la viabilidad del trabajo de campo necesario. En último lugar, tal vez nos sea permitido apelar a alguna consideración del hecho de que nuestro estudio se ha efectuado en el curso de sólo un año y medio, y que no forma sino parte de un proyecto de investigación cuyo objetivo principal es más bien de corte metodológico : desarrollar, poner a prueba y evaluar una nueva metodología. Este enfoque necesariamente influyó en nuestra selección de las variedades por incluir, tal como se explica en nuestra página web. La cobertura limitada de sólo veinte variedades se atribuye además a una insistencia por nuestra parte, en que para que tenga verdadero valor, nuestro método tenía que exigir un nivel de precisión y de detalle considerablemente más alto que la léxicoestadística tradicional, un estándar que supone como fu entes no diccionarios sino nuestros pro- 74 pios trabajos de campo, y en la mayoría de los casos hasta una segunda visita de confirmación a cada lugar de trabajo de campo. En vista de tales consideraciones, y de nu estros muchos centenares de horas de viaje por autobús a través de tres países andinos, no obstante la " inexactitud histórica" que Adelaar supone ver en nuestra aserción, seguimos sintiéndonos en condiciones como para reafirmar que efectivamente las condiciones para el trabajo de campo sí se han mejorado de forma notoria desde la época del estudio de Büttner (y bien sabemos en qué momento se llevó a cabo la mayoría de este trabajo). Tenemos todas las razones como para dudar de que nuestro itinerario hubiera sido tan fác il , o siquiera remotamente factible en un lapso tan corto por la red vial de los países andinos en los años 1960 y 1970. De igual manera, la gran mayoría del material publicado más útil e informativo sobre el cual hemos podido basar nuestras investi gaciones -obras claves sobre la lingüística andina, entre ellas algunas del mismo Adelaar- se ha publicado años después del trabajo léxico-estadístico de Büttner. Así que no nos estábamos refiriendo principalmente ni a los años tan difíciles de los 80's, ni a la situac ión de seguridad, tal co mo lo supone Adelaar. En nuestras afirmaciones al respecto medimos nuestras palabras con cuidado, y más bien son estas interpretaciones por parte de Adelaar que han llevado a lo que nos parece un simple malentendido, ya que no fa ltan otras consideraciones pertinentes, en vista de las cuales no hay ninguna "inexactitud histórica" en lo que hemos escrito. Adelaar clama además por extender la cobertura hasta variedades de otras familias lingüísticas andinas que no sean el quechua ni el aimara . No podemos, sin embargo, aceptar que en nuestro trabajo "Falta una motivac ión para no incluir" variedades como las que nos cita, entre ellas por ejemplo el puquina, ya que para esta lengua el trabajo de campo es evidentemente imposible, y los conocimientos que se tienen de su léxico no son lo suficientemente detallados ni fiables como para permitir que se le aplique nuestro método de manera adecuada. En cuanto a nuestra inclusión del chipaya, Adelaar la menciona en estos términos : " ... sólo ha sido agregado el chipaya como tercer elemento en la comparación, pero esta lengua fue dejada de lado casi inmediatamente y sin mayor discusión". Pero basta sólo echar un vistazo a las cifras y los gráficos correspondientes Revista Andina Paul Heggarty: Enigmas en el origen de las lenguas andinas para que quede manifiesto porqué no se ha procedido a discusiones ulteriores sobre la posición del chipaya frente a los demás idiomas andinos incluidos. Mas bien quisiéramos invitar a Adelaar a construir cualquier argumento informativo sobre la historia de las relaciones entre el chipaya y el quechua y/o el aimara, en base a los datos en las Figuras 2 y 3. Estos no tienen casi nada qu e enseñarnos al respecto, si no es sólo para confirmar la impresión de que el chipaya tenga algunas semejanzas algo mayores con el aimara que con el quechua; intentar sacarle cualquier otra conclusión sería caer en la pura especulación. Nuestros datos ofrecen evidencias abrumadoras de que no hay similitud significativa entre el chipaya y estas otras lenguas en nuestra muestra de léxico básico; y que por lo tanto, cualquier relación que pueda haber entre ellas es de orden complemente diferente y mucho más remoto aun que la que existe entre el quechua y el aimara. Por supuesto, tales observaciones de ninguna manera deberían disminuir la importancia de seguir investigando las relaciones posibles entre estas lenguas: sus paralelismos tipológicos, los contactos que ha habido entre ellas, y eventualmente sus enlaces de parentesco a niveles ex tremadamente remotos, si es que existe alguna metodología de verdad adecuada para investigarlo. Seguramente cada lector del presente artículo saludará la amplitud de los conocimientos del cual atestigua la nueva y magistral obra del mismo Adelaar (2003), a saber su Languages ofthe Andes, y hasta su coraje intelectual para abordar cuestiones tan amplias cuanto peliagudas de dilucidar. Sin embargo, el hecho es que aquí no se trata de si las tareas son de interés intrínseco o no ; sino de cuáles son los métodos adecuados para acometerlas en la investigación . Antes que lamentar que nuestro trabajo represente un "paso atrás" por la "limitación" de nuestra cobertura de variedades andinas, recordamos la posición tan clara que ocupa el chipaya en nuestros resultados. De ella se desprende más bien una advertencia, la cual nos revela allí donde en verdad podemos correr el riesgo de dar " pasos atrás" y contraproducentes. En la historia de la investigación de métodos cuantitativos par,\ fines lingüísticos, nada ha venido a atrasar esta empresa más que la ambición desmesurada en buscar emplear un método dado - la comparación en semántica léxica básica- para resolver cuestiones que simplemente no tenía la c_o mpetencia para resolver, tal como lo hemos Nº 40, primer semestre del 2005 señalado en nuestro artículo. Peor aun, las debacles de la glotocronología y luego de la llamada 'comparación multilateral ' de Greenberg ( 1987) llevaron no sólo a que estos dos métodos tenninasen siendo rotundamente desacreditados, sino que durante largos años se dejó sin investigar cualquier otro enfoque cuantitativo, inclusive aquellos razonab les y valiosos, al estar cortados por el mismo patrón que aquellos. Con las presentes investigaciones hemos buscado idear un método adecuado para distinguir de manera bastante fina entre variedades que se saben 'correlacionadas' en un grado bastante o muy estrecho. Por lo tanto, no necesariamente será el método indicado para comparaciones a escala mucho más amp lia, como para investigar eventuales relaciones que remontarían hasta épocas mucho más remotas aún, como las sugeridas por Adelaar. El ro l que cumple el chipaya, en nuestros resultados , es el de subrayar cuan débil pueda ser la señal de correlación en tales casos. Así , nos enseña las limitaciones inherentes en los datos mismos, y nos recuerda la mucha cautela con la cual debemos proceder para evitar caer en las mismas fallas metodológicas y especulativas del pasado. Detenerse un paso antes de la zancada final que nos llevaría a volver a caer al abismo, no constituye por lo tanto un paso ''atrás" . Con todo esto, no queremos decir que no sean posibles eventuales adaptaciones y extensiones de nuestro método, para que tal vez pueda contribuir de alguna manera a las cuestiones aun más amplias de las cuales nos habla Adelaar. Pero tales extensiones del método son pasos para dar sólo una vez que ya esté establecido y comprobado en casos mejor conocidos, tal como los que presentamos en el presente artículo . De hecho, entre los cuatro comentaristas, es el propio Ade laar quien parece el más escéptico en cuanto a la viabilidad del método. El alcance del presente artícu lo ya nos parece no poco ambicioso, ya que estamos presentando un método completamente novedoso, así que consideramos más prudente aplicarlo primero a las cuestiones para las cuales está mejor diseñado y resulta ser de evidente utilidad. A estas alturas, ha sido una decisión muy deliberada no aventurarnos todavía más lejos, sino esperar un momento mientras averiguamos qué terreno pisamos, y nos parece una ' limitación' bastante razonable que nos libra de repetir los catastróficos errores del pasado. 75 Estudios y Debates La semántica léxica al lado de la fonología, la morfología y la morfosintaxis Hay un aspecto de nuestro enfoque metodológico que es criticado por cada uno de los comentaristas. Todos ellos preguntan cuánto puede ser válido basar la clasificación de una familia lingüística en resultados derivados tan sólo de la semántica léxica y no de otros campos, notablemente de la fonología y la morfología. Así que, a todas luces, parece que no subrayamos de manera suficientemente clara que nosotros mismos somos plenamente conscientes de esta limitación, así como de sus consecuencias. Quizás no repetimos con la frecuencia debida a lo largo del artículo la reserva muy importante de que las deducciones que hicimos sobre las clasificaciones de las variedades andinas valen "sólo" en el nivel de la semántica léxica. Por supuesto, estos datos por sí solos de ninguna manera bastarán. Estamos, pues, enteramente de acuerdo con Cerrón-Palomino en que nuestro método no es "una alternativa a los métodos tradicionales de la lingüística histórica, sino un procedimiento auxiliar". No obstante, su utilidad no está limitada únicamente a los casos citados por Cerrón-Palomino, es decir aquellos en los cuales "no están dadas aún todas las condiciones para una aplicación exitosa de los mismos [los métodos tradicionales]". De hecho, entre las principales ventajas de nuestro método, y de los métodos cuantitativos en general, está la que resume Adelaar cuando observa que: "Aquí se trata de una conclusión a la que no es fácil llegar en base a una inspección meramente impresionista"; y nosotros añadiríamos: "no cuantificadas". Es este poder de síntesis el que nos permite evaluar de forma más equilibrada la importancia relativa de eventuales señales entrecruzadas en los datos (tal como los contactos entre las variedades centrales y sureñas del aimara y del quechua), al igual que su impacto proporcional dentro de la lista global de significados. Por otro lado, y aunque por ello corriéramos el riesgo de decepcionar a nuestros lectores, mejor haríamos en clarificar con anticipación algunos aspectos de la próxima etapa de nuestro estudio. Nuestra futura investigación, pues, consiste en una comparación de la similitud entre estas mismas variedades en el nivel fonético, término que empleamos no en su sentido más amplio sino en el más estrecho; es decir, no nos referimos a una comparación en el nivel fonológico. Más 76 específicamente, presentaremos nuestras cuantificaciones de la importancia relativa de todos los cambios de sonido divergentes que han surgido entre estas variedades en la pronun,ciación de unos 100 lexemas cognados; es decir, de cualquier diferencia de sonido entre ellas, surgida desde la época de su protolengua. Necesariamente , pues, tendremos que hacer dos estudios enteramente independientes, uno sobre la familia quechua, otro sobre la aimaráica. Además, la 'fonética histórica' es un campo en el cual ciertos cambios de sonido idénticos, o por lo menos muy parecidos, se ven con bastante frecuencia ocurrir de manera independiente y paralela en más de una variedad. Por lo tanto, aunque estos datos sobre la similitud fonética sí pueden ser de mucho interés y utilidad, no siempre resulta tan sencillo llegar, a partir de ellos, a interpretaciones directas para la historia y clasificación lingüística. Este método fonético no abarca criterios morfológicos ni sintácticos. Más bien, en vista del llamado de Albó para que ampliemos nuestras investigaciones, cabe otra advertencia. En toda empresa que busca convertir los datos lingüísticos en alguna forma cuantificada, existen ciertos problemas críticos para asegurar que ésta tenga verdadero sentido en cuanto representación numérica de las relaciones entre los idiomas. Estos problemas son particularmente dificiles de superar en la morfosintaxis, tal como se puede demostrar en el caso de los estudios comparativos y cuantitativos que hasta la fecha se han intentado en este campo. Sobre todo, estos estudios tienden a hacer sus comparaciones en base a listas muy limitadas de características gramaticales preseleccionadas, las cuales por lo tanto corren el riesgo de ser ni muy representativas ni equilibradas. Hemos intentado aportar soluciones a este problema, y otros más, a través del empleo de otro método, el cual hemos desarrollado para cuantificar la similitud de las lenguas en base a su morfosintaxis básica (tal como se explica en Heggarty en preparación). Sin embargo, aquel método busca cuantificar diferencias tipológicas más que fonéticas o de cognación de morfemas. Así que dado el elevado nivel general de similitud tipológica entre las lenguas andinas, resulta cuestionable si tal método podría o no contribuir de manera valiosa a muchas de las preguntas claves de la lingüística comparativa andina. No hemos de caer en el consabido error de interpretar como evidencias de parentesco genealógico ciertas es- Revista Andina Pau/ Heggarty: Enigmas en el origen de las lenguas andinas tructuras paralelas que bien podrían no ser nada más que semejanzas tipológicas bastante generales. Volviendo a nuestro método para la semántica léxica, allí dónde Itier escribe: "El método cuantitativo probablemente no pueda reemplazar el método comparativo y la historia en la reconstrucción de l desarrollo histórico de las lenguas", no sólo estamos enteramente de acuerdo, sino que incluso sustituiríamos "probablemente" por "sin ninguna duda". La contribución al debate que puede aportar el presente artículo se limita únicamente a la semántica léxica, y es al interior de este campo que intentamos proveer una visión global de las relaciones entre las variedades consideradas que sea explícitamente más equilibrada, por el hecho de haber sido estas relaciones cuantificadas y no sólo evaluadas de una manera más bien impresionista. Las impresiones no cuantificadas no siempre nos han llevado a una visión necesariamente certera; y efectivamente, como vemos, las evidencias de la semántica léxica no apoyan a la clasificación tradicional. Sin embargo, compartimos igualmente la convicción de Adelaar de que "Reconstruir la genealogía interna del Quechua exclusivamente en base al léxico, sin incluir los argumentos fono lógicos y morfológicos tan esenciales, no puede llevar a conclusiones definitivas". Evidentemente, la semántica léxica no es sino un nivel entre los varios que se tienen que tomar en cuenta para poder establecer la clasificación del quechua (o de cualquier otra familia o lengua). Más en sólo un artículo, el cual abarca ya no pocos temas y busca, ante todo, presentar una metodología para la comparación en la semántica léxica, no nos pareció apropiado - aun si para ello hubiera habido el espacio suficiente- entrar en detalle sobre los múltiples aspectos y detalles pertinentes a la clasificación del quechua. Así se explica porqué no hemos tratado, por ejemplo, como nos lo pide Adelaar, "los paralelos en el desarrollo del sistema verbal de referencia personal" entre ciertas variedades del quechua (ver más bien nuestra expi icación alternativa, 1íneas abajo). Es importante considerar que las relaciones que se evidenciall\ entre un conjunto de idiomas pueden variar de un nivel a otro. Además, tales diferencias pueden resultar muy informativas, ya que cada uno de los niveles tiene sus propias características. De un lado, la semántica léxica por lo general está más expuesta al contacto y al prés- Nº 40, primer semestre del 2005 tamo, aunque por nuestra técnica de la separación en sublistas más y menos estables hemos buscado aprovechar esta característica para fines 'diagnósticos'. De otro lado, la semántica léxica intrínsecamente padece algo menos que la fonética y la morfología de la tendencia a cambios en paralelo, los cuales remontan a innovaciones no compartidas sino parecidas pero independientes. Esta explicación puede va ler particularmente en casos en los cuales las variedades se desarrollan a partir de una etapa más ancestral del idioma, caracterizada por alguna libre variación entre algunos morfemas o sonidos alternativos. Son precisamente estos dos fenómenos los que tal vez puedan ofrecer una explicación alternativa para algunas de las semejanzas inesperadas observadas entre ciertas variedades del quechua que en la mayoría de los demás aspectos parecen bastante diferentes. Pensamos por ejemplo en las semejanzas entre el quechua argentino y ciertas variedades no sureñas, sacadas a la luz por Adelaar ( 1995) y de Granda ( 1999), entre otros. Ya que reconocemos que la semántica léxica por sí sola no podría bastar para establecer una verdadera genealogía del quechua, hay también que considerar la otra cara de la moneda: tampoco bastan sólo unos pocos criterios seleccionados de la morfología o la fonología. La gran fachada de la clasificación del quechua en base a una bifurcación QI-QII, se ha fundamentado en un número bastante limitado de rasgos morfológicos y fonológicos, los cuales no constituyen sino aspectos parciales de la cuestión. No quisiéramos, pues, sugerir que la bifurcación QI-QII se debe descartar en base únicamente a los datos léxicos. Evidentemente, tales evidencias serían insuficientes y nunca imaginamos que este método de por sí solo pudiera resolver de un tirón toda la clasificación del quechua. El hecho a remarcar es que justamente tales evidencias léxicas no están solas. Ellas, más bien, encuadran en un contexto en el cual durante los últimos años los argumentos morfológicos y fonológicos a favor de una bifurcación nítida QI- QII se han puesto cada vez más en tela de juicio. Esto se desprende de varios hallazgos de Taylor, y especialmente del desafio muy directo y convincente a los criterios tradicionales en Landerman ( 1991 ). Podemos también tomar en cuenta los datos suplementarios provistos a su vez por Itier en su comentario al presente artículo, los cuales le llevan a la conclusión de que "El QII probablemente 77 Estudios y Debates no fue en su origen sino uno de los representantes más extremos de ese continuo dialectal". Parece, pues, que Adelaar tiene algo más confianza que otros investigadores en lo convincente y lo sólido de los argumentos tradicionales de corte morfológico y fonológico. Así que lo que nos permite aquí atrevernos a ver en nuestros resultados algún grado de importancia en el debate es que demuestran que la semántica léxica también ofrece objeciones convincentes a la idea de una primera bifurcación nítida en la historia temprana del quechua. Su contribución al debate se encuentra en su capacidad de ponerjaque esta explicación tradicional , por no ser apta para explicar de manera convincente algunas de las relaciones manifiestas que se dan entre las variedades del quechua. De allí que la segunda tarea del presente estudio es proponer una explicación alternativa, en términos de una fragmentación mucho más paulatina, más bien en un continuo dialectal. Así, mientras que Adelaar aboga por que no abandonemos la distinción QJ- QII, ya que sólo "resulta necesario refinarla", nosotros no nos logramos convencer de que serán suficientes tales pequeños ajustes a la clasificación tradicional. Más aún, deberíamos armarnos del coraje incluso como para ir mucho más lejos si es necesario. Lo fundamental es acordarnos primero de lo que en verdad quiere decir el hablar en términos del QJ versus el QII. Por supuesto, es innegable que hay alguna 'distancia lingüística' considerable entre, de un lado, un grupo de muchas variedades del quechua central, y, del otro lado, un grupo de variedades norteñas y sureñas, algo más parecidas entre ellas que con las centrales. Hasta aquí todo resulta patente, y por cuanto sepamos no haya ningún lingüista que lo cuestione. Pero este único hecho no constituye por sí solo una justificación para hablar en términos de QJ versus QII, lo cual necesariamente implica una visión de un árbol genealógico en el cual las diferencias corresponden a una primera bifurcación y, la más fundamental, en la historia de la familia quechua. Imaginar que se trata sólo de "refinar" en algo el análisis de la bifurcación QJ-QII corre el riesgo de malinterpretar lo que supone el uso de estos términos. El asunto no es tan sencillo como para decir que hay algunas variedades claramente de 'tipo QJ' y otros de 'tipo QJJ' , si con estos términos no queremos decir nada más que dos polos particulares dentro de un continuum dialectal. 78 ¿Qué sentido pueden tener el contraste QJ versus QIJ, si existen variedades que se clasifican de los lados opuestos de la supuesta línea divisoria pero que en realidad son mucho más cei¡canas (en todos los sentidos) entre sí que a otras variedades al interior de su propia rama QI o QII? ¿Acaso podemos hablar de variedades "Q! Yi''? Es simplemente erróneo un árbol genealógico que separa en lados diferentes de la bifurcación supuestamente fundamental variedades manifiestamente intermedias que se saben muy cercanas entre sí. No es cuestión, pues, de refinar algunos detalles menores; el asunto es mucho más profundo. Una bifurcación - sobre todo una que se muestre tan fundamental y de base como la supuesta QI- QII- comporta por definición el concepto de una oposición, y de un desarrollo histórico marcado por una ruptura fundamental. Por lo tanto, tal bifurcación no se presta a ser "refinado" a tal punto que pueda ser compatible con su propia antítesis, a saber, los conceptos de variedades intermedias y del continuum dialectal. No se trata de dos análisis diferentes en un nivel abstracto pero que vienen a ser efectivamente la misma cosa; todo lo contrario, corresponden a dos visiones marcadamente diferentes de la historia temprana del quechua. En vista de lo que ya sabemos de lo complejo que ha sido la historia sociolingüística de los Andes, lo que hay que refinar tal vez no sea algún que otro detalle de la supuesta bifurcación primaria, sino nuestra visión global del proceso de la divergencia de las variedades del quechua. Eso implica quizás hasta reformar totalmente nuestra visión de la historia del quechua, para no insistir a priori en una sola bifurcación nítida fundamental y contemplar más bien la posibilidad de una imagen más compleja en forma de un continuum. La datación De hecho, es el mismo Adelaar quien acertadamente nos pide cuentas con su advertencia: "De hecho, la etnohistoria andina no fue tan sencilla". En cuanto al asunto particular al cual se refiere, ya ofrecimos líneas arriba (aunque someramente) una tentativa explicación alternativa. No obstante, Adelaar ciertamente tiene razón, ya que en aquel punto de nuestro texto hemos caído sí en una caracterización demasiado sencilla de la historia lingüística. Sin embargo, lo mismo se podría decir en lo que concierne a la sugestión al final del comenta- Revista Andina Pau/ Heggarty: Enigmas en el origen de las lenguas andinas rio de Adelaar: "El solo hecho que los antiguos indoeuropeos conocían la rueda basta para rechazar" cualquier fecha para el protoindoeuropeo que sea anterior a la invención de la rueda. La lingüística histórica ciertamente no es "tan sencilla" como para permitirse afirmaciones tan categóricas. Se trata aquí de una propuesta de la llamada paleontología lingüística , supuesto método de datación que viene resultando apreciado casi únicamente por filólogos del indoeuropeo, ansiosos por sacar más partido de sus reconstrucciones tan meticulosas. A la paleontología lingüística le falta alcanzar todavía cualquier reconocimiento en cuanto ortodoxia entre los lingüistas históricos, quienes más bien han demostrado, de manera repetida y convincente, que tal método se funda en una serie de supuestos inválidos. A falta del espacio aquí para entrar en detalles, más bien remitimos a los lectores a Sims-Williams (1998) y Heggarty (en prensa b). Así, el hecho es que no es demostrable que sea acertada ni la fecha que requiere la 'hipótesis desde Anatolia' para el indoeuropeo propuesta por Renfrew, ni tampoco la fecha más reciente propuesta en base a la paleontología lingüística. Tal como las describe a su vez el eminente lingüista Dixon ( 1997), tales fechas no son nada más que un "castillo de naipes". A falta de argumentos verdaderamente convincentes a favor de alguna de las fechas alternativas que se han propuesto, muy a propósito nosotros nos hemos cuidado de citar sólo una gama muy aproximada de fechas plausibles. Efectivamente, la única contribución a la cual nos hemos aventurado en materia de datación fue mencionar los ' supuestos por defecto'. Esto lo hicimos con el único propósito de lanzar un debate sobre las razones posibles para las cuales pudiéramos preferir 110 aplicarlos en el contexto específico de los Andes; y ya hemos visto cómo Albó e Itier inmediatamente nos han sugerido dos razones bastante plausibles. Por lo visto, la datación lingüística es una empresa eminentemente incierta. Las únicas conclusiones que de todo esto podemos obtener sin temor a yerro son: primero, que las supuest~s 'dataciones Iingüísticas' son muchísimo menos seguras de lo que a menudo se pretende; y segundo, que por lo tanto bien haríamos en ensanchar la gama de fechas que consideramos. De allí que nos aventuramos a mencionar, en el caso de los Andes, la posibilidad de conside- Nº 40, primer semestre del 2005 rar fechas para la expansión inicial del quechua tan tempranas como la época de la cultura Chavín. Prevemos volver a este asunto en nuestro artículo siguiente sobre cuantificaciones de similitud en fonética. Pero lo que menos quisiéramos pretender es .que ninguno de nuestros métodos propuestos tenga la finalidad ni la capacidad de proveer ninguna fecha absoluta para cualquier acontecimiento en la historia de los idiomas: imaginarlo no sería sino repetir los errores de la glotocronología y de la paleontología lingüística. Nos parece que para poder encajar ·el desarrollo histórico de las familias quechua y aimara dentro de una cronología bastante bien definida, hay un sólo método verdaderamente prometedor. Este consiste en aprovechamos de todas las herramientas de análisis de los idiomas de los cuales disponemos, para investigar, en cuanto más detalle podamos, cuáles son los escenarios lingüísticos más plausibles y que mejor explican las configuraciones que observamos en la diversidad lingüística al interior de cada familia. Son estos escenarios lingüísticos los que luego podemos intentar cuadrar al lado de las evidencias aportadas por otras disciplinas, las cuales sí tienen la fortuna de disponer de métodos de datación absoluta mucho más fidedignos; a saber, la arqueología y la genética de poblaciones. Es a través de esta nueva síntesis que esperamos poder avanzar hacia un único escenario histórico, coherente a través de todas estas disciplinas, de los orígenes de las poblaciones de los Andes. BIBLIOGRAFIA ADELAAR, Willem F. H. 1982 Léxico del Quechua de Pacaraos, Documento 45, Centro de Investigación de Lingüística Aplicada. Lima: Universidad Nacional Mayor de San Marcos. 1995 "Raíces lingüísticas del Quichua de Santiago del Estero", En: Ana V. Femández Garay y José Pedro Viegas Barros (coord.) Actas II Jornadas de Lingüística Aborigen (Buenos Aires 15-18 de noviembre de 1994), pp. 25-50. Facultad de Filosofia y Letras, Instituto de Lingüística, Universidad de Buenos Aires. 2004 Languages of the Andes (con Pieter Muysken) , Cambridge: Cambridge University Press. 79 Estudios y Debates DE GRANDA, Germán "Historia lingüística y tipológica 1999 genética del quechua de Santiago del Estero, Argentina", Revista Andina 33 , 109-36. DIXON, R. M. W. 1997 The Rise and Fa// of Languages. Cambridge : Cambridge University Press. GREENBERG, Joseph H. 1987 Language in the Americas. Stanford: Stanford University Press. HEGGARTY, Paul, en prensa b " Interdisciplinary indiscipline? Can phylogenetic methods meaningfully 80 be applied to language data - and to dating language?" En: Renfrew, Forster y Clackson (en prensa). RENFREW, Co lin, FORSTER, Peter y CLACKSON, James (coordinadores) en prensa Phylogen etic Methods and the Prehistory of Languages. Cambridge: McDonald Institute for Archaeological Research. SIMS-WILLIAMS , Patrick 1998 "Genetics, linguistics, and prehistory : thinking big and thinking straight" , Antiquity 277 , 505-27. Revista Andina