Enigmas en el origen de las lenguas andinas: aplicando

Transcripción

Enigmas en el origen de las lenguas andinas: aplicando
Enigmas en el origen de las lenguas
andinas: aplicando nuevas técnicas a las
incógnitas por resolver
Paul Heggarty
A Alfredo Torero, in memoriam.
l. Introducción
El presente artículo 1 es el resultado de un estudio comparativo de veinte variedades
de lenguas andinas de las familias quechua, aimara2 y uru-chipaya; basado en la recolección
de nuevos datos en un reciente trabajo de campo, al igual que en la aplicación de nuevas
técnicas para la interpretación de los mismos. La Figura 1 muestra la ubicación geográfica de
las veinte variedades consideradas en nuestro estudio, además de los principales grupos
geográficos dentro de la familia quechua.
2
Agradecemos al Dr. Rodolfo Cerrón-Palomino por sus valiosos y generosos consejos a lo largo de los
últimos tres años, tanto en lo vinculado con nuestros datos como en lo concerniente a nuestras dudas
en diferentes aspectos de la lingüística andina. De igual manera, no hubiera sido posible esta presentación de nuestro estudio sin el empei10 de Dante Oliva León, quien nos ayudó a lo largo del proceso
de su adaptación al castellano, y las agudas observaciones finales de Marco Ferrell, así como también
una mas del Dr. Rodolfo Cerrón-Palomino.
Sin pretender pronunciamos en el tema, para los fines puramente prácticos seguimos en el presente
artículo la nomenclatura propuesta por Cerrón-Palomino (1993). Así, el aru de Torero y el jaqi de
Hardman serán simplemente nuestro aimara (en tanto familia, y no en tanto lengua); mientras que
la lengua que para estos dos últimos autores es el aimara corresponde a lo que aquí siempre calificamos
de aimara sureño.
Nº 40, primer semestre del 2005
9
m
Figura 1. Familias lingüísticas de los Andes centrales
o
!!l.
e
a.
6'
(/1
'<
COLOMBIA
Lu~:ir,·, 1k r,·ali,.adún
S ub-g rup os de la
famili.1 quechua
,fo l r:.1haju
( 'lih:t1á1m ,k lo., 10 /11gm ·, .~ ,h· 1-ca li:ad,in d,
1n1b,~jo ,k· t1llllf'" de 1,11' 1Hricdt1dn u111s1dcn,da.,
,r.- r an1p11
('/ ld/11\:.H: IJ/t.'c.l flltfio
oCD
CT
O,)
;(/1
1
Ecuador
1
Q llh s..,n.n:.1
Qllh Truj,·
.\'n,
f:'.11c
1110¡41 .ff li11 ,:0111hi11t1dt1 10111a11do , ·0111" Ji1e111,·.1
¡'J C:llcit1flllt'J1/{· . /u .11//II/H. l,•l(IIC St 0 /("l/ ('l/ ll'tllll ' /I
fr¡
( ·n.,.,',11./'afo111111u COOJ). In,· c11aln ,1 _,11 n := .l"l'
h11,\ lll"011 1.:11 los
J'
.;
• l .,·1·iwnl111 ( f9i6)
'."':\,;
··""' '"'
'
-~.'"'
111a¡,a.,· ,le
/kll'd
l:i.:11<1dor
• 7i,rau(l 1r./J¡,w·,1/•,.,.,¡
• l'l,1:(1 y ( 'ama mi ( I fJ85)
PERI'
1
N. del Perú
J
/
{
··,
F
Sureño
.
. . _\ ···</
QI Yii nac
QI C haq1ar
...
"·•·.
1
Ql Hu:i. nu1,:11
Qllr A t:al\:i
E
.·11/
Lu;:arl·~ de n::.li t:11:itl n
lle 1ro1h:1jn,k ,·:1mr11
- ·
--- ~
---J A~C C:ll"hU.\
AyC Tupe
Cuzco-Collao
/folhia
BRASIL
Qll;i ln nhua~i
Qll:i C h... till:.i
ptHll
,.......,.
.1,,,.
Sub-grupos de la
familia aimara
1
Central
Qlh: Culn•
Qlh: Cu rn,
S. de Bolivia
;;o
Qlh: T :u¡uik
A~·S Hu:.inn né
Qlk Puno
A~'S Sii ll n l ltl
.\"17"!
AyS Pu1¡ui
l',111
Qlh: MU;l\\ll
~
No111,·: 1-:.n .1·fl•n mú.~ 1uril·tla<Íl'.1 dl'l,¡m•dma ,·11 d 11111k ,k· Arg1:111ina
¡¡;
/.ax ahrL·via111ra.1· ,ft· los nombrt·.1· y ,·laxific:a,·u,11,·s ti,· las 1'(1ricdacln· ('orrelpond,·11
)>
,·11 /m gr,¡tit·ol· ,·n rn_fi,rma orixmal ,·n in¿;h:.,. (por ,·r,·mp/11 .H' do :\yC
~
a.
5·
O,)
F
Qllc Pucuna
CD
<
¡¡;·
1/nr
n111 /(f.1 q11t·
K wky no AiC c:iuquil .
apw·,•,·,·n
·--\r··,~-\
ARGEÑTI NA
Famitta
Uru-Chipaya
j
Pau/ Heggarty: Enigmas en el origen de las lenguas andinas
Nuestro propósito fundamental consiste en cuantificar el grado de semejanza existente entre las variedades en cuestión, tanto en el nivel fonético 3 como en el semánticoléxico. Dichas cuantificaciones no se obtienen por medio de las técnicas tradicionales de
cuantificación - tales como la lexicoestadística- ampliamente criticadas, sino por métodos
más recientes desarrollados , en ambos casos (la fonética y la semántica léxica) , por nosotros
mismos . Estos métodos nos vienen resultando más adecuados que los tradicionales .
En una segunda etapa, analizamos el conjunto de resultados del proceso inici al de
cuantificación, a través de programas (software) para el análisis filogenético , también de
reciente aparición. Dichos programas posibilitan nuevas y reveladoras maneras de representar e interpretar las relaciones entre las familias idiomáticas implicadas, como también acerca
de su desarrollo histórico y, por extensión, el de sus pueblos hablantes.
Resulta importante aclarar desde el inicio que nuestros cotejos fonéticos se presentarán en un artículo posterior y que el presente se limita únicamente a los resultados concernientes a nuestro estudio léxico, los cuales desde ya arrojan un cariz novedoso e interesante
acerca de las preguntas clásicas sobre los orígenes y las relaciones entre las familias quechua
y aimara, entre ellas el añejo debate "quechumara" de si existe o no un tronco común en su
desarrollo. Aunque dicha cuestión resulta para Torero (2002: 154) un asunto zanjado , para
otros lingüistas ello todavía no tiene una respuesta definitiva. Según Cerrón-P alomino (2000: 337) : " En suma, la .cuestión del origen común de ambas lenguas no es un caso
cerrado"; para Campbell (1995 : 157): "La cuestión( ... ) tiene que dej arse abierta, y requiere
mayor investigación 4 ". Así, pues, luego de transcurridas cuatro décadas de haberse empezado a abordar la cuestión de manera científico-lingüística, el asunto continúa siendo un
caso irresuelto. Pareciera, pues, que estamos topándonos con los límites inherentes a lo que
con confianza pueden decirnos las técnicas actualmente a disposición de la lingüística
histórico-comparativa y que una respuesta definitiva a la cuestión quechumara escapara a
su alcance . Se han intentado novedosos enfoques metodológicos, por ejemplo en
Campbell ( 1995), y el perspicaz trabajo de Adelaar ( 1986). Sin embargo, a pesar de los frutos
obtenidos, el propio Campbell (1995 : 194) reconoce que siempre quedamos frente a "pistas
sugestivas, pero nada que sea concluyente". Como bien lo resume Cerrón-Palomino (2000: 337): "pese a [tales] intentos ( .. .) nos quedamos con la sensación de no haber
adelantado mucho en la dilucidación del problema".
Tal es el contexto dentro del cual se inscribe la presente investigación. Para lograr
cualquier progreso en el problema considerado, la lingüística comparativa parece necesitar
de nuevas técnicas que permitan abordar los datos comparativos con mayor sensibilidad
que las técnicas tradicionales, en particular, cualquier método que pueda ayudar a distinguir
los rasgos de origen común de aquellos que son producto de la convergencia. Es tarea del
presente artículo proponer y presentar algunas técnicas que pueden ayudarnos en este
sentido.
3
4
Como bien consideramos más adel ante , el estudio relativo al aspecto fonético queda pendiente para
una posterior publicación.
Toda traducción de citas en el presente a11ículo es nuestra.
Nº 40 , primer semestre del 2005
11
Estudios y Debates
2. Avance de resultados
Con el riesgo de invertir el orden convencional de presentación de un trabajo científico, pero con la ventaja de dar a nuestros lectores una idea general de lo que nu~stro método
busca proporcionar, comenzamos ofreciendo algunos de los principales resultados de nuestra investigación.
La Figura 2 presenta las cuantificaciones de semejanza de la semántica léxica (representada por una muestra de 150 significados) entre todas las variedades de las lenguas
andinas estudiadas por nosotros hasta la fecha, más el castellano como una referencia
externa. A su vez, estas cuantificaciones servirán luego como datos de entrada para los
programas de representación gráfica.
Inherentes a este conjunto de cuantificaciones de semejanza, están por descifrarse
unos datos "indicadores" sobre las relaciones -genealógicas 5 u otras- entre las variedades
en cuestión: la llamada se1ialfilogenética. En ciertas circunstancias históricas, esta señal
puede responder a una estructura de simples ramificaciones; aunque en otras, más bien, a
configuraciones superpuestas mucho más complejas.
Sin embargo, debido a la complejidad de las relaciones multidimensionales que se dan
entre un gran número de variedades a la vez, esta señal no es siempre comprensible a simple
vista, a partir de las cuantificaciones de semejanza. Así que para diferenciar y dilucidar la
señal que pueden esconder tales cifras de semejanza, las introducimos en los programas de
análisis filogenético que las convierten en distintos tipos de representación gráfica. Tales
programas han sido elaborados en tanto herramientas capaces de sintetizar las relaciones
multidimensionales, inherentes a las cifras, en aquella representación gráfica bidimensional
que con mayor fidelidad les corresponde, y que resulta mucho más fácil de visualizar.
Específicamente, estos programas sirven para el análisisfilogenético. Es decir. que
buscan graficar la filogenia de las variedades en cuestión, lo cual equivale, esencialmente, al
"árbol genealógico" tradicional. Para ser más precisos, los programas sirven para representar o "reconstruir" aquel proceso de desarrollo histórico que resulte más coherente con las
cuantificaciones de semejanza, que ya observamos entre las variedades, y que mejor las
explica.
Los programas a los que hacemos mención, fueron elaborados fuera de la lingüística,
en los campos de la genética y la biología evolutiva, donde se utilizaron, primero, para
comparar e investigar los niveles de parentesco entre especies biológicas, sobre la base de
cuantificaciones de semejanza derivadas de comparaciones del ADN de dichas especies. El
presente estudio, inserto en el contexto de la lingüística andina, está inscrito dentro de un
proyecto pluridisciplinario más amplio -Métodos Cuantitativos en la Clasificación de Lenguas"- dirigido por la lingüista April McMahon en la Universidad de Sheffield (Gran Breta-
5
6
12
En el presente artículo seguimos la propuesta de no referirnos a las relaciones de parentesco entre las
lenguas con el térn1ino genético sino, más bien, con el término g<'nea/ógico. Este último nos parece
más adecuado y evita posibles confusiones con las relaciones genéticas, propiamente dichas, en tre las
poblaciones hablantes de tales lenguas.
Nuestro proyecto de investigación fue financiado mediante la beca número AN6720/APN 12536
(2001-04) de The Arts and Huma11ities Research Board en el Reino Unido; a ellos nuestro agrade-
Revista Andina
z
Figura 2. Cuantificaciones de semejanza en semántica léxica para 20 variedades de lenguas andinas
o
.¡:,.
-º
~
~r
J .O=
~
diferencia tota l; 100 = identidad total. Las cifras en negrita denotan comparaciones entre
variedades de una misma familia lingüistica reconocida como tal.
Las ciúas en c:ursiva denotan comparaciones con el castellano. las que tienen un estatus
(/)
et)
particular. y se presentan aquí únicamente para fines ilustr:itivos.
3
et)
!:!?.
ro
a.
~
N
o
o
u,
'J
§
:¡¡
~
Sph
e
>
o
~
-~
.,,o
e
~
'§
o
ó
:,:
.J
o
o
6
.Eo
u
e
o
u
-'=
u
o
"·
·e
....
~
<I)
o
-;;;
<¡;
e
u
8;.,;'
,oe
o.
"
1
....
~
u
~
"e
8o
c..
i:_;
.e
.e
o• o• o o o o o o o 3 o
ü
;_;
;..;
•C.,
e
,,-.
'J
-'=
íi.
6
~
ü
ü
<
<
e
1
vi
<
]
·;
,-.
"
<I)
c..
6
-;
;;
<
g-
r.r.
<
o
c.
6
5.6
5.5
3.8
5./
9.7
8. /
4.0
2.5
3.7
n.n
! .O
n.5
n.n
/.9
1.3
5./
3.4
1.5
1.3
.!.9
n.n
castellano
Ync
91.6
88.1
83.2
79.6
82.2
73.5
71.3
77.9
74.4
72.8
74.8
73.6
70.6
72.0
27.6
27.7
16.8
16.8
18.5
7.3
QI : Y:i.nac
Che
91.1
81.3
76.7
79.4
72.2
71 .5
76.7
72.6
69.6
72.6
71.9
68.9
71.0
25.3
26.2
16.8
17.2
18.5
6.6
Q I: Chacpar
Hnc
79.8
75.0
78.1
70.5
69.5
73.6
71 .0
68.3
70.0
70.1
66.5
67.9
24.9
26.0
17.2
17.3
19.0
6.6
Ql: Huánuco
Lrs
77.0
83.1
78.8
77.6
84.0
79.2
79.9
80.5
80.2
77. 0
79.1
29.0
29.4
16.5
16.0
18. 1
6.0
Q?: Laraos
lnk
87.3
67.5
66.9
70.3
64.2
65.1
65.8
65.8
63.0
64.4
24.0
23.8
14_. 7
14.8
14.8
3.8
Qlla: lncahuasi
Ch1
79.6
76.8
75.7
71.4
73.1
72.9
72.4
70.7
72.0
27.9
29.3
17.7
16.4
16.5
7.8
Qlla: Chelilla
Trj
87.5
79.5
79.5
79.8
80.2
79.5
80.4
80.0
22.5
24.0
16.5
16.5
18.7
7.5
Q ll b: Troje
Sm
77.4
77.6
78.1
79.4
77.3
77.8
78.2
21.0
22.7
16.0
15.8
17.6
7.5
Q llb: Serena
Atl
87.3
86.7
86.5
87.3
83.3
84.1
26.6
27.7
19.3
18.8
20.6
7.4
Qllc: Atalla
Cuz
89.9
90.9
90.0
86.4
87.9
25.3
26.2
20.3
20.5
22.4
7.2
Qilc: Cuzco
Pun
91.8
93.9
87.7
88.5
26.3
27.5
23.5
22. 1
24.6
7 .7
Qllc: Puno
Tql
93.1
87.4
88. 1
25. 1
:!5.9
2 1.4
20.4
22.7
7.3
Qlh::: Taquilc
Cr.
88.2
89.4
26.4
27.5
23.2
21.3
24.~
7.2
Qll c: Curva
Pcn
96.2
23 .9
25.0
19.3
19.4
22.0
7.2
Qlk: Pocona
Mr w
24.5
25.9
19.8
19.7
22.6
7.3
Qllc: Marawa
-o
QJ
s.
if
<Q
<Q
QJ
?m
:::,
<e'
3Q)
(/)
Kwk
et)
:::,
~
Q
<e'
et)
:::,
a.
et)
93.8
56.0
55.5
56.2
7 .2
AC: Cae huy (Kawki)
Jqr
54.8
53.5
53.7
7.6
AC : Tupe (Jaqaru)
Hcn
9 1.6
87.1
14.4
AS: Huancané
StT
91.0
15.9
AS : Sullcatiti
Puk
15.9
AS : Puqui
(/)
C hi
Ch: Chipaya
:::,
¡¡;(/)
ro
:::,
ce
e
Q)
Q)
a.
s·
(;)
__J
Q)
(/)
Estudios y Debates
ña). Este proyecto busca aplicar tales programas a datos lingüísticos en diferentes familias
de lenguas del mundo.
Muchos lingüistas reaccionan con comprensibles reservas frente a la aplicación de
técnicas de esta naturaleza, a pesar de que ya a nivel mundial se observa un intel\éS creciente
acerca de cómo tales métodos se pueden aplicar valiosamente al estudio histórico-comparativo de las lenguas. Sin disponer del espacio suficiente para tratar a profundidad lo relacionado con ei funcionamiento de los programas, remitimos a nuestros lectores a la nueva guía
de McMahon y McMahon (en prensa), la cual expone en detalle, a un público lingüista,
cómo funcionan y por qué ellos pueden revelarse como he1ramientas muy útiles para la
investigación de la historia de las lenguas, una vez configurados de manera apropiada para
usos lingüísticos.
Tanto la recolección de datos como los análisis de los mismos para producir las presentes cuantificaciones de semejanza, son trabajo realizado enteramente por el autor del
presente artículo. Las representaciones gráficas, por otro lado, son trabajo de Robert
McMahon, genetista colaborador en el mencionado proyecto, quien aplicó a nuestras
cuantificaciones de semejanza dichos programas filogenéticos. Debemos subrayar que estos
últimos fueron elaborados por otros investigadores fuera de nuestro proyecto. Utilizamos el
programa FITCH, el cual forma parte del paquete PHYLIP de Felsenstein (2001 ), y sobre todo
NeighborNet (parte del paquete SplitsTree 4) de Bryant & Moulton (2002), ambos especialistas en bioinformática. Estamos en deuda con todos ellos por haber puesto a disposición
general dichos programas en la internet. Nosotros, pues, simplemente los hemos descargado
y configurado adecuadamente para interpretar datos lingüísticos y, posteriormente, hemos
introducido nuestras propias cuantificaciones de semejanza para obtener los gráficos.
La figura 3, por ejemplo, ilustra cómo nuestras cifras de semejanza se pueden convertir en una representación bastante simple del tipo "estrella", por medio del programa FITCH.
Este programa insiste en que toda relación entre las lenguas sea representada con el esquema del clásico árbol genealógico, es decir, de ramificaciones únicamente binarias. Para las
abreviaturas presentes en todos los gráficos, consultar la leyenda del mapa de la Figura 1.
Nótese que las líneas y su longitud representan grados de diferencia, y no de conexión, entre las variedades. Además, el hecho de que ciertas variedades parezcan de alguna
u otra forma "vinculadas" a estas representaciones, no implica, de ninguna manera, que
dicha relación sea necesariamente una relación genealógica más que de contacto. Como se
explicará más adelante, nuestra postura metodológica está libre de considerar que cualquier
correspondencia léxica particular entre dos variedades, sea un caso o de verdadera cognación
o de préstamo. Dejaremos dichas interpretaciones para la sección 6. Así, nos resulta perfectamente factible incluir en estos gráficos al chipaya y al castellano, pues aunque bien sepamos que no están emparentados ni con el quechua ni con el aimara, resulta muy ilustrativo
ver exactamente el lugar que ocupan en los gráficos respecto de estas dos familias.
cimiento por su apoyo. Para más detalles sobre este proyecto, consulte nuestra página web:
www.shef.ac.uk/english/language/quantling. Nuestras investigaciones sobre el cauqui fueron apoyadas por The Foundationfor Endangered Languages, www.ogmios.org.
14
Revista Andina
Paul Heggarty: Enigmas en el origen de las lenguas andinas
Figura 3. Representación tipo "estrella" de las relaciones entre 20 variedades de lenguas
andinas (más el castellano como referencia externa), producida por medio del programa
FITCH (ver texto) en base a las cifras de la Figura 2
SUREtilO
A2-StT
CENTRAL
A2-Hcn
Al MARA
A1 -Jqr
A1 -Kwk
CHIPYA
CASTELLANO
Ch-Chl
01-Chc
CENTRAL ' 01-Hnc
·
Q2c-AH
QUECHUA
01 -Ync
Q2e-Cuz
·. Q2a-lnk
CAJAMARCA - ·.
CAÑARIS
Q2c-Tql
Q2c-Crv
Q2b-Trj
Q2c-Pun
02b-Sm
SUREtilO
ECUADOR
La Figura 4 se vale de un procesamiento diferente y más flexible de los mismos datos
para producir- en contraste con la representación tipo estrella- una representación tipo red.
Esta tiene la ventaja particular de no obligar a que el output visual tenga la forma de un árbol
de ramificaciones binarias nítidas y distintas, si la señal filogenética en los datos no es
compatible con tal realidad histórica. Así, este tipo de representación ofrece una manera
mucho más fiel y útil de identificar y representar casos en los que las variedades han tejido
redes de relaciones mucho más complejas y superpuestas; por ejemplo, los continuos
dialectales y los escenarios de contacto intenso.
Además de los indicadores que puedan contener estos gráficos para la cuestión
quechumara, los demás aspectos salientes para nuestros fines son: la relativa homogeneidad de la familia quechua frente a la aimara y la posición en el árbol genealógico de las
variedades dtl Quechua II. Pero volveremos a estas cuestiones, entre otras, en la sección 6,
pues explicaremos primero cómo producimos nuestras cuantificaciones de semejanza entre
las lenguas sobre las cuales están basadas todas estas representaciones.
Nº 40, primer semestre del 2005
15
Estudios y Debates
Figura 4. Representación tipo "red" de las relaciones entre 20 variedades de lenguas
andinas (más el castellano como referencia externa), producida por medio del programa
NEIGHBORNET (ver texto) en base a las cifras de la Figura 2
CAJAMARCA·
CA~RIS
ECUADOR
CENTRAL
02-cPa,
QUECHUA
02-cMrw
SUREÑO
Al MARA
A2-Puk
A2-StT
SUREÑO
A 1-Jqr A1 -Kwk
CENTRAL
3. ¿Cognados o préstamos? Una nueva postura metodológica
Es sabido que hay precedentes en el estudio de las relaciones entre las lenguas
andinas, a partir de su semántica léxica, basados en el tradicional método de la lexicoestadística.
Así, el estudio de Torero ( 1972 [ 1970]) se limitó a la familia quechua y, por otra parte, el de
Hardman (1975 [1966]) a la familia aimara. Comparamos en la sección 6 algunos aspectos de
nuestros resultados con los de ellos.
El único intento significativo de tratar ambas familias dentro de un mismo estudio fue
el trabajo lexicoestadístico de Büttner ( 1983), pero este fue llevado a cabo con tan poco éxito
que resultó ampliamente desacreditado, y sus conclusiones descalificadas, debido a dos
fallas metodológicas fundamentales . La primera de ellas reside en una representación deformada de los datos lingüísticos, consecuencia a su vez del inflexible esquema de análisis,
propio de la lexicoestadística. Más adelante volveremos a este punto.
16
Revista Andina
Pau/ Heggarty: Enigmas en el origen de las lenguas andinas
La segunda falla metodológica consiste en que las conclusiones que Büttner se pennitió, en base a sus datos, resultan de una argumentación circular, tal como lo señalaron la
mayoría de críticos, entre ellos Torero (2002: 149) y Cerrón-Palomino (2003 [ 1987] : 372-3 73).
Ésta consiste en valerse de sus datos lexicoestadísticos como supuesta prueba de que las
familias quechua y aimara están emparentadas, e incluso, especifica a nivel de tronco. En esto
Büttner seguía a algunos otros practicantes de la lexicoestadística, quienes durante su auge
buscaron emplearla no sólo como técnica para medir cuán estrechamente ciertas lenguas
estaban emparentadas entre sí (una vez que este hecho fuera establecido de manera convincente por medio del método comparativo), sino también como un simplista " método de diagnóstico" para tratar de probar el parentesco en casos donde éste quedaba aún en duda :
El defecto de tal lógica consiste en la suposición de que la lista de significados de
Swadesh es de alguna manera inmune al préstamo, de tal modo que cualquier correspondencia que se encontrase en la lista, necesariamente, se deba considerar como producto de un
origen común, sin haber contemplado seriamente la explicación alternativa de que se pueda
tratar de préstamos entre familias no emparentadas. Evitamos a toda costa tal equivocado
supuesto. Más adelante volveremos a tratar este punto.
Siguiendo nuestra postura metodológica, a priori queda del todo por establecer si el
quechua y el aimara están o no emparentados; pero, siendo así , ¿cómo podría intentarse
cualquier fonna de lexicoestadística, dado que este método se basa fundamentalmente en la
noción de la cognación y, por lo tanto, sólo tiene sentido aplicarlo a lenguas entre las cuales
ya sabemos que existe una relación genealógica comprobada? Se requiere, pues, de una
postura totalmente diferente sobre cómo abordar las correspondencias aparentes, en forma
y significado, en la semántica léxica y la cuestión de su potencial cognación.
Dado el actual estado de nuestros conocimientos -o la falta de ellos- nos quedamos
sólo con unos paralelismos en forma y significado -por ejemplo, *yaca- - *yaci- (saber) o
*warmi - *marmi (mujer)- que bien podemos identificar; pero sin que podamos tener la
seguridad en todos los casos de porqué ni cómo hayan aparecido, si por origen común o por
contacto. Tal como lo expresa Cerrón-Palomino (2000: 309): "( ... ) la objeción central de la
indistinción entre elementos cognados y préstamos [es] una de las más fuertes , aunque,
como se verá, el asunto no es fácil de sortear".
A pesar de ello, la situación tal vez no sea, como puede parecer, un callejón sin ~alida.
El solo hecho de que no podamos estar seguros del origen de una correspondencia determinada no quiere decir que por lo tanto no nos quede más que echar a perder el conocimiento
lingüístico que tenemos, a propósito de la misma, como si careciera de toda utilidad . En lo
que sí podemos confiar, en muchos casos, es que a una correspondencia en forma y signifi cado como *yaca- - *yací- se le puede imputar, de manera más convincente, a algún tipo de
conexión histórica entre estas palabras (ya sea ésta el préstamo o el emparentamiento ), más
que al puro azar.
Proponemos, a continuación, una manera de aprovechar hechos de este tipo, los
cuales sí conbcemos con confianza, para investigar acerca de la naturaleza de las relaciones
entre las familias lingüísticas involucradas, pero sin caer en ninguna suposición sobre aquellos asuntos de los cuales no nos encontremos en condiciones adecuadas para estar seguros. Es decir, en ningún momento, nos aventuramos a especificar en nuestros datos ninguna
opinión respecto de si una determinada correspondencia en forma y significado entre las
Nº 40, primer semestre del 2005
17
Estudios y Debates
familias quechua y aimara implica, necesariamente, o bien un préstamo o bien un origen
común. Todo lo contrario, a priori evitamos adrede tomar posición sobre este asunto.
Para ello necesitamos recurrir a un término que no conlleve ninguna implicancia con
una u otra explicación, tal como sí conllevan los términos cognado, préstamo e, incluso,
correspondencia. Proponemos, entonces, en este sentido, el término correlato (y sus derivados correlación y correlacionados). Nuestro correlato se debe entender como un término general y neutro para cualquier correspondencia llamativa en forma y significado, que se
deba al origen común o bien al préstamo, y libre de cualquier supuesto, a priori, sobre dicha
naturaleza. Un correlato será, entonces, cualquier correspondencia que nos llama la atención en cuanto se le puede atribuir de manera más convincente a alguna forma de conexión
histórica (no especificada) que al puro azar.
Muy bien sabemos, por supuesto, que un gran número de los correlatos conocidos
se consideran entre la mayoría de los especialistas en lenguas andinas como préstamos
evidentes (entre ellos, varios numerales, por ejemplo). El problema consiste en que hay
también abundantes palabras sobre las cuales los análisis no están de acuerdo, pues se
prejuzgan de acuerdo con las diferentes posiciones sobre si el quechua y el aimara están o no
emparentados. Los que creen que hay emparentamiento identificarán ciertos correlatos como
verdaderos cognados (aunque siempre puedan discutir sobre exactamente cuáles); para
quienes no crean en tal emparentamiento, todos los correlatos necesariamente serán o bien
préstamos o bien puras coincidencias fortuitas. No queda sino la solución metodológica
señalada por Adelaar (1986: 380), a quien secunda Torero (2002: 155) así:"( ... ) cualquier progreso en la cuestión de las relaciones quechua-aru 'presupone metodológicamente un abandono total de ideas preconcebidas acerca del parentesco genético'". Sin embargo, esto
último es una espada de doble filo, ya que tampoco debemos partir del presupuesto de que
tal relación no exista.
De igual manera, mientras para Adelaar ( 1986: 380) "la comparación debería hacerse en
base a dos entidades lingüísticas 'depuradas' de préstamos", tal como para Campbell ( 1995: 182)
"las formas que son bastante similares a nivel fonético se deben descartar en cuanto sean
posibles préstamos", nosotros adoptamos una postura metodológica diametralmente opuesta. El hecho de que ciertos correlatos sean préstamos conocidos, o posibles, no supone de
ninguna manera que no resulten informativos, ni mucho menos que sean aptos sólo para ser
descartados de los datos comparativos. Intentamos una nueva postura que, por el contrario,
pueda aprovecharse de lo que sabemos del conjunto de correlatos que se dan entre el
quechua y el aimara, pero sólo si todos ellos, incluso aquellos de los que tengamos fuertes
sospechas de que sean préstamos, se retengan en los datos, asignándoseles a todos ellos un
mismo estatus no prejuzgado: en cuanto correlatos, nada más.
Por último, debemos clarificar que a los préstamos del castellano -ellos sí muy fáciles
de identificar en la gran mayoría de los casos- se les asigna en nuestros datos un estatus
especial, lo cual nos permite tratarlos de distintas maneras de acuerdo con diferentes fines .
Puesto que no pueden sino ocultar y confundir los orígenes e interrelaciones entre las lenguas andinas, que es lo que aquí nos interesa dilucidar, en el presente estudio los préstamos
del castellano tienen un estatus de "ausencia de datos" en función de aquellas relaciones.
18
Revista Andina
Paul Heggarty: Enigmas en el origen de las lenguas andinas
4. Cuantificaciones detalladas de semejanza en semántica léxica
Volvemos ahora a la primera fall a metodológica fundamental que socava el estudio de
Büttner: su tratamiento de los datos. En una época en la cual las condiciones para el trabajo
de campo eran más dificiles que hoy en día, y la documentación sobre las lenguas andinas
mucho más escasa, Büttner se valió de datos secundarios , los cuales trató de fom1a algo
incoherente.
Sus entradas para el significado caliente ( warm en la lista original de Swadesh)
ilustran bien el problema: Büttner da cognados de rup(h)a- para muchas variedades del
quechua, incluso el cuzqueño, pero q 'uiii para el quechua boliviano (Büttner 1983: 137). En
realidad, la mayoría de las variedades del quechua, y por cierto tanto el boliviano como el
cuzqueño, tienen ambas raíces en significados estrechamente relacionados en el campo
semántico de caliente; se trata de un solo ejemplo entre muchos . Como lo han demostrado
varios especialistas, los datos publicados de Büttner son simplistas. Así, Cerrón-Palomino (2003: 3 72), por ejemplo, habla de "escogitaciones asombrosamente ingenuas" y de ''arbitrariedad selectiva".
Sin embargo, es importante reconocer que el problema no consiste únicamente en el
hecho de que algunos de los datos de Büttner sean "equivocados" ; más bien, esto no es
sino síntoma de un problema inherente al mismo método de la lexicoestadística. Como en el
ejemplo de caliente, la lexicoestadística obliga de todas maneras a falsear relaciones conocidas entre las lenguas, por la inflexibilidad simplista del método, y por cuanto resultan in-ealistas
y no aptos para las lenguas andinas un gran porcentaje de los significados en las listas de
Swadesh. La camisa de fuerza propia de la lexicoestadística, aquella visión de "o todo o
nada", no nos permite introducir los datos en una configuración que bien sabemos es una
aproximación mucho más acertada de lo "correcto", para que podamos incluir de manera
flexible y adecuada toda la información que consideramos pertinente. En este caso, por
ejemplo, sabemos que ambas raíces rup(h)a- y q 'uñi están presentes en casi la totalidad de
las variedades quechuas, incluso la de Cuzco y la(s) de Bolivia. Sabemos, además, que hay
ciertas diferencias en los significados exactos de estas dos raíces, y en su empleo con
respecto a otros sinónimos: en algunas variedades rup(h)a- se refiere específicamente a la
luz o a calor del sol y/o a quemar, mientras q 'uñi a menudo quiere decir más bien abrigado
y/o simplemente caliente (en el sentido de la palabra warm de Swadesh, más bien que hot) .
Así , no es únicamente la representación de Büttner, sino cualquier representación
lexicoestadística, la que no alcanza a representar de manera apropiada ninguno de estos
conocimientos.
Críticas de este tipo no son nada nuevo para los especialistas en lingüística históricocomparativa, quienes han respondido duramente al método lexicoestadístico. Así, se requiere un enfoque metodológico radicalmente nuevo, de tal modo que lo que aquí proponemos
de ninguna manera resulta alguna suerte de "lexicoestadística refinada" y nada más , sino
una escisión respecto de aquella filosofia. Nuestro propósito es muy específico: representar,
en cifras que tengan un sentido coherente, el grado de semejanza entre las lenguas, en este
caso, en lo concerniente a la semántica léxica.
Por cie1io, nuestro método se basa fundamentalmente en la cuestión de si, para
expresar cada significado en una lista representativa, las lenguas diferentes se valen de
Nº 40, primer semestre del 2005
19
Estudios y Debates
lexemas que son o no correlatos, y ahí acaba cualquier semejanza con la lexicoestadística.
Sobre todo, nuestro método rechaza la falla más ampliamente criticada al método
lexicoestadístico: su insistencia simplista en selecciones absolutas del tipo "o todo o nada"
("sólo un lexema por significado", "o cognado o no", etc.). Así, expresa sus resultados
valiéndose únicamente de una clasificación binaria de O ó 1 para cada significado - dicho de
otra forma o bien 0% o bien l 00%-, dejando de lado todo tipo de valoración intermedia.
Hemos hecho, pues, todo lo posible a fin de concebir una estructura adecuada para nuestra
base de datos, que sea capaz de representar, de la manera más detallada, flexible y equilibrada
posible, la naturaleza exacta de las superposiciones y diferencias entre las lenguas en su
semántica léxica. De tal estructura se derivan directamente nuestras cuantificaciones mucho
más adecuadas que las que propondría la lexicoestadística tradicional.
4.1. ¿Cuantificar Lenguas?
No sorprende, pues, que el método y los cálculos que utilizamos sean mucho más
complejos que los de la lexicoestadística. Ello a tal punto que , sin disponer del espacio aquí
para explicar y justificar detalladamente todas nuestras asignaciones numéricas, en algunos
momentos nos veremos obligados a apelar a cierta "indulgencia" por parte de nuestros
lectores más escépticos. Así, apelamos a considerar cómo las cifras que proponemos efectivamente coinciden bastante bien con aquellos análisis y juicios no cuantificados a los
cuales estamos más acostumbrados los lingüistas.
En efecto, como bien sabemos, el intento de cuantificar cualquier aspecto del lenguaje es una tarea particularmente expuesta al escepticismo, lo que bien se puede comprender
dada la poco feliz historia en este campo hasta la fecha. Es justamente por eso que nuestros
métodos se han ido desarrollando dentro del contexto de una postura radicalmente nueva a
la cuestión de cómo se deben cuantificar y comparar las lenguas. Remitimos a los lectores
interesados a Heggarty (en preparación) 7 , donde se retoma esta tarea de cuantificación del
lenguaje, a partir de sus principios fundamentales, seguidos por una exposición completa de
nuestros métodos, tanto para la semántica léxica como para otros subsistemas del lenguaje,
tales como la fonética y la morfosintaxis.
Nuestra postura no es tan ingenua como para imaginar que cualquiera de nuestras
cifras constituya de alguna forma una cuantificación definitiva y absoluta, la única expresión
numérica correcta de los hechos lingüísticos. Una postura razonada frente a la cuantificación,
debe reconocer que no siendo el lenguaje una estructura inherente matemática, cualquier
intento para cuantificarlo inevitablemente no será más que una "interpretación" matemática
de conceptos lingüísticos. No podemos sino aspirar a una aproximación numérica que se
justifique por los hechos lingüísticos; en este caso las relaciones entre las lenguas en su
semántica léxica. Sin embargo, si la alcanzamos y podemos tener confianza en ella, entonces
ésta posee un gran valor potencial en tanto que nos permite abrir una extensa gama de
aplicaciones para el procesamiento numérico, tal como lo demostramos en la sección 6.
7
20
Cualquier investigador interesado puede solicitamos desde ya un a versión previa de los capítulos
relevantes a la semántica léxica.
Revista Andina
Pau/ Heggarty: Enigmas en el origen de las lenguas andinas
Aquí nos limitamos a dar una perspectiva general del método, lo cual se ilustrará
mejor por medio de ejemplos específicos de cómo evitamos las selecciones binarias e inflexibles de la lexicoestadística para cada uno de los principales tipos de problemas que se
encuentran cuando se intenta representar y cuantificar el grado de semejanza en la semántica
léxica.
4.2. Grados de coincidencia entre sinónimos
El concepto más básico en nuestro esquema de comparación es el de la coincidencia
de correlatos entre los lexemas que se emplean en cualquier par de variedades para expresar
un significado particular. Tal coincidencia puede ser total: por ejemplo, para el significado de
comer, entre el francés manger y el italiano mangiare. Contrariamente, puede ser nula: por
ejemplo, entre el francés manger y el castellano comer. Ambos casos son fáciles de representar numéricamente como una coincidencia de correlatos de I ó O. Pero una coincidencia
también puede ser sólo parcial, y esto en varios sentidos.
Un primer tipo de coincidencia parcial puede darse en los lexemas de los cuales
disponen las variedades diferentes para un determinado significado. Ateniéndonos al significado cabeza, por ejemplo, nuestro infonnante para el quechua de Chacpar emplea a la vez
urna y piqa, mientras que los hablantes del quechua cuzqueño disponen sólo de uma.
En primer lugar, nuestro método tiene que acomodar múltiples sinónimos en una
misma lengua. La fonna en la cual se calcula el grado de coincidencia entre los lexemas de
lenguas diferentes se puede ilustrar de forma más útil en términos de INTELIGIBILIDAD .
Un hablante del quechua de Chacpar siempre entendería el significado cabeza en una
conversación entre hablantes del quechua cuzqueño, ya que éstos emplearían
consistentemente la palabra urna, forma que aquél reconoce. Sin embargo, lo contrario no es
verdad: un hablante cuzqueño sólo entendería a los hablantes de Chacpar en aquellos
contextos en los cuales empleasen éstos la forma urna, y no en el resto de los casos cuando
utilicen más bien la alternativapiqa. La inteligibilidad siempre se debe analizar en cuanto una
relación de doble sentido, ya que no necesariamente hay simetría en los dos sentidos.
Teniendo en cuenta esta relación asimétrica, y suponiendo una frecuencia de uso
igual para las raíces urna y piqa en Chacpar, la coincidencia global de los dos sistemas se
calcula como sigue:
Figura 5: Cuantificaciones de coincidencia pasiva entre sinónimos: escenario AB -A
Dirección de
inteligibilidad
Lengua'
2
-+ Len2ua
Cuzco -+ Chacpar
Chacpar -+ Cuzco
Sinónimo A
Forma en
1
len2ua
urna
¿Reconocida
2
en len2ua ?
sí = 1
Sinónimo B
Forma en
1
len2ua
-
Evaluación
combinada para
¿Reconocida todos los sinónimos
2
en len2ua ?
1/ 1
= 1
urna
sí = 1
piqa
no = O
Evaluación global de coincidencia en inteligibilidad:
Nº 40, primer semestre del 2005
1
/2 +
0
1 --
lz
(1 + 112) ~ 2 = ·¡,
/2
=
21
Estudios y Debates
Sin embargo, la inteligibilidad mide sólo la coincidencia pasiva entre los sistemas, lo
cual no alcanza a registrar diferencias entre lenguas que tienen los mismos sinónimos, pero que
son empleados con diferente frecuencia en cada una de ellas. Se necesita, entonces, ulteriores
mecanismos para representar coincidencias entre los sinónimos, también en su empleo activo
en lenguas diferentes, lo que incluye la posibilidad de "ponderar" los sinónimos por su frecuencia e importancia relativas. Estos mecanismos efectúan ajustes correspondientes a las
cifras de coincidencia (nom1almente unas pequeñas reducciones). Resulta, así, una escala de
diferentes grados de coincidencia entre sinónimos, tal como se observa en la Figura 6.
Figura 6: Cuantificaciones de coincidencia en sinónimos: varios escenarios
Lengua
1
lengua ?
lengua 2?
lenguaj?
lengua4 ?
lengua5?
Correlatos presentes
(en cuanto sinónimos)
A
A
A
A
B
B
-
-
-
-
-
-
Evaluación de
semejanza entre
1
lengua ? y lengua'?
L
l
/3
l
¡2
-
e
e
o
Nótese que mientras se han hecho algunos intentos por ajustar la lexicoestadística
tradicional para permitir que se reconozca sinónimos múltiples -por ejemplo en el trabajo de
Oyen et al. (1992: IE-DATAI .txt)- éstos todavía no alcanzan a diferenciar los tres primeros
casos en la figura anterior, pues todos se representarían indistintamente con cifras de semejanza de 100%.
Para enfocar nuestra cuantificación de semejanza únicamente en el nivel de la semántica léxica, tal como Jo requiere el concepto de cognados, también para nuestros correlatos
hacemos abstracción de cualquier cambio fonético que pueda haber llegado a diferenciar las
formas fonéticas. (Para cuantificar la semejanza en el muy distinto campo de la fonética,
emplearemos un método completamente diferente en nuestro artículo posterior). Es decir,
empleamos aquí el término inteligibilidad en un sentido "lingüísticamente informado", por
el cual se considera a los correlatos siempre "inteligibles", aún entre variedades que los han
venido cambiando en "reflejos" fonéticos diferentes y propios.
4.3. Grados de coincidencia en el significado
También puede haber casos de coincidencia parcial entre la semántica léxica de lenguas diferentes, cuando los lexemas correlacionados se distribuyen diferentemente entre los
diversos sentidos más específicos de un determinado significado en la lista 8 , y/o también en
8
22
Como se puede observar, empleamos los términos sentido y significado con un claro propósito que
los diferencia. Así, un sentido .es una manera semántica más específica de utilizar uno de los significados en nuestra lista comparativa.
Revista Andina
Paul Heggarty: Enigmas en el origen de las lenguas andinas
otros significados relacionados con éste pero de forma más indirecta. El significado sol
ofrece una valiosa ilustración de algunos de los muchos tipos diferentes de configuración
que puede haber, en este caso entre cinco de nuestras variedades andinas:
quechua de Atalla: posee inti en el sentido de cue,po celeste, pero rupay en el
sentido de luz/calor del sol;
aimara de Puqui :
posee inti en el sentido de cuerpo celeste, pero tupi (correlato
con rupay) en el sentido de luz/calor del sol;
quechua de Laraos: posee inti en ambos sentidos; rupa- se conoce solamente en
cuanto a raíz verbal hacer calor (sol), quemar;
quechua de Chetilla: posee solamente rupay; no se conoce inti (salvo indirectamente por medio del castellano);
el chipaya:
tiene thuñi en el sentido de cuerpo celeste, pero siy en el sentido de luz/calor del sol; no se conoce inti; en cuanto a la raíz
lupi, ver más abajo.
Desde estas formas se desprende una amplia gama de configuraciones complejas y
grados de coincidencia entre los varios pares de variedades. En seguida se presenta una
selección de tales configuraciones, las cuales podemos ordenar en una escala decreciente de
inteligibilidad, de la siguiente manera:
Atalla- Puqui
Correlatos de inti y de rupay en todos los sentidos del signifi(a)
cado de sol.
Correlatos en el sentido principal de cuerpo celeste; mientras
(b)
Atalla - Laraos
que en el sentido secundario de luz/calor del sol el hablante
del quechua de Atalla entendería un subsentido algo diferente,
y el hablante de Laraos sólo entendería un sentido algo más
indirectamente relacionado ( quemar o hacer calor) .
Correlatos en el sentido secundario de luz/calor del sol, pero
(c)
Atalla- Chetilla
en el sentido principal de cuerpo celeste el hablante del quechua
de Atalla entendería un subsentido algo diferente (luz/calor
del sol), mientras que el hablante de Chetilla no reconocería la
palabra que se emplea en Atalla.
A la vez, en el sentido principal de cuerpo celeste y el secundaChetilla - Laraos
(d)
rio de luz/calor del sol, el hablante de Laraos sólo entendería
un sentido algo más indirectamente relacionado ( quemar o hacer calor), mientras que el hablante de Chetilla no reconocería
la palabra que se emplea en Laraos.
Ninguna coincidencia entre los correlatos, ni en el sentido prinAtalla - Chipaya
(e)
cipal ni en el secundario.
En estbs cinco casos, el sistema de representación y cuantificación de nuestro modelo arroja debidamente una escala decreciente de cuantificaciones de inteligibilidad, la cual
corresponde con la escala que acabamos de exponer, en base a criterios lingüísticos (aunque
no cuantificados), como sigue:
(a) = 1; (b)= 0,83; (c) = 0,56; (d) = O, 17; (e)= O.
Nº 40, primer semestre del 2005
23
Estudios y Debates
Hay que recordar que la Jexicoestadística tradicional, o la versión de Dyen et al. (1992),
sólo hubiera podido proveer cifras absolutas de O o 1 para cada una de estas relaciones .
En la Figura 7 se expone una perspectiva general de cómo nuestro modelo llega a la
obtención de estas cifras. Simplificando en algo el procedimiento, se puede 1decir que el
método reconoce Jo que constituye efectivamente una escala de diferentes grados de coincidencia en los significados entre los correlatos, como sigue:
inteligibilidad entera y exacta;
inteligibilidad próxima en subsentidos del mismo significado global (aquí, sol), que
asegura un alto grado de inteligibilidad;
inteligibilidad indirecta en un significado bastante diferente, pero siempre relacionado de forma suficientemente próxima dentro del mismo campo semántico como para
contribuir, por lo menos, a un cierto grado de inteligibilidad;
ausencia de cualquier inteligibilidad.
Nuestro principio fundamental para expresar en cifras las relaciones entre las lenguas
es que, a falta de un argumento lingüístico indiscutible para proceder a cifras aún más
precisas, las relaciones se deben representar en términos de los escalones iguales que
numéricamente resulten más simples: a saber, para un caso como éste donde los escalones
son cuatro, las evaluaciones son de 1, \ , 1/ 3 y O respectivamente.
La Figura 7 ilustra igualmente cómo nuestro método incorpora en sus cálculos el
hecho de que uno de los dos subsentidos que reconozcamos es algo más básico que el otro.
En este caso, el sentido de cuerpo celeste se considera más básico que el enfoque más
estrecho, sólo en la luz o el calor que proviene del mismo. Siguiendo de nuevo el principio de
ponderación que aplicamos por defecto, esta relación se representa por la proporción desigual más simple que haya, o sea 2: 1.
Un ejemplo en el plano diacrónico puede ayudar a ilustrar la flexibilidad y adecuación
de nuestro modelo. Cerrón-Palomino (comunicación personal, 2004) nos informa que en el
sentido de luz/calor del sol, la lengua chipaya tiene una raíz nativa siy, pero que además la
forma aimara lupi es ya conocida por algunos hablantes del chipa ya. En tal contexto, bien se
puede imaginar que lupi podría acabar por entrar en el chipaya, tal como ya ha ocurrido con
varios préstamos del aimara. Nuestro sistema podría representar, por medio de una evaluación progresivamente más alta de coincidencia con el aimara, varias fases en un proceso por
el cual tupi paulatinamente podría pasar a ser siempre más preeminente en el chipaya. Se
puede imaginar cómo podría pasar de un rol de sinónimo menor conjuntamente con la raíz
nativa siy (situación que se evaluaría en una comunidad con el aimara de O, 11 ), hasta la
paridad con siy (0,22), o hasta desplazar completamente la palabra nativa (0,33). En los
mismos términos de la escala que presentamos más arriba, este último escenario es de correlatos
exactos en el sentido secundario de luz/calor del sol, pero sin ningún correlato en el sentido
principal de cuerpo celeste . Así, esta evaluación de 0,33 cabe debidamente en su posición
correcta en la escala. Si lupi debiera extenderse más allá del sentido secundario de luz/calor
del sol al sentido principal de cuerpo celeste, el cual tiene una mayor ponderación, el cálculo
de la coincidencia léxica con el aimara aumentaría aún más.
24
Revista Andina
z
o
.¡:.
?
Figura 7. Cálculos de los grados de coincidencia de correlatos entre cinco variedades de lenguas andinas
en su semántica léxica para el significado sol. O= diferencia total; 1 = identidad total
~
~:r
..,
CD
VI
Lenguas
CD
3
CD
ic.
~
N
o
oo,
-
En ambas
direcciones de
inteligibilidad:
Lengua 1
_.
Subsentido A: cuerpo celeste
1
1
la que en la lengua2 tiene un
correlato:
o
Entrada
en
1
lengua
o C'·
E<o
"O
·¡;
o
e:
o
u
e_-o
E·;::
e:
-",,..o"
~-º
~
o
~]~
::; ·"'
;53]
~
UJ
';;'
~
-~ "O
e:
Lengua'
B "O
e:
e:" -~~o
::,
" "O
e:~ ""' E
"'
§ ~ §
u ·e: " u
e:
1;l
1
.::,
I
~~--.~~-,-~~~-.~~,e"',, {l ·-g
"'
"' " "O
..o
E -o "'
<
Entrada
e: ..o
en
:§
"'O
lengua'
~ .::E
"""
"'
IU
"O
"'
"O
GJ :-:
-~·3
o=
o "'O·et
inti
1
rup_ay
inti
1
Atalla -. Laraos
Laraos-. Atalla
Atalla -. Chetilla
inti
inti
inti
1
1
Iup_i
rupay
(inti)
Chetilla -. Atalla
rupay
Chetilla -. Laraos
rupay
Laraos -. Chetilla
inti
Atalla--+ Chipaya
inti
thuñi
Chipaya-. Atalla
'¡,
1
';,
o
o
o
os·
E-o
,, "O
o
::!
i::"
~ 'E
::: t
E~ ::, "
-""'
" ==~
"O
e: -g o
u
u.J,,
'1,
rupay
(rupay)
'1.
(rup_ay)
(inti)
o
rupay
sir
o
] !!
e: e: o
~E]
; ~
-~
§ ~]
O·-
1U
--
t-
o
o
::;
"'
"'
:¡;
Atalla-. Puki
1
Grado de
coincidencia
global
la que en la lengua es
correlato en cuanto:
Puki -. Atalla
o
Componentes
ponderados
Subsentido B: luz/calor del sol
-g
';;'
"O
·¡;
o
e:
o
u
~
o
.::,
iJ
1
cu r.n ~
CU
"'O
IU :":
g~
o
X
o
"O
·;; "'O
-= ""'
":r. ~
-~
ºü
"'O u=
"""
g~ .S
et
'1,
"/,
.¿ . -;.
aJ
' "O
..o:::
::, o
"' o.
<.c0
X
] .g
" "'~
:::
= "
::, o
..o' "O
:::
= suma de los
dos componentes
ponderados para
los dos subsentidos
"' o.
~
s.
if
~
2/3
1/3
4/6
1/6
5/6 = 0,83
~
2/9
3/9
5/9
ce·
m
::::,
=
0,56
3
11)
';,
o
o
o
VI
'1,
2/18
1/18
3/ 18 = 0,17
o
o
o
o
CD
::::,
~
Q
ce·
CD
::::,
c.
CD
¡¡;VI
ro
::::,
(C
e
11)
VI
11)
::::,
c.
N
o,
5·
11)
VI
Estudios y Debates
4.4. Grados de coincidencia de formas: lexemas compuestos de morfemas múltiples
Puede haber una coincidencia léxica parcial no sólo en el significado sino también en
la forma, allí donde hay lexemas compuestos por más de un morfema, de los cuales sólo uno
es correlato entre lenguas diferentes. El ejemplo habitual es el de los lexemas del castellano
y francés, corazón y coeur. En este caso, las raíces son correlatos entre sí, pero el primer
lexema lleva además un morfema adicionado diacrónicamente (lat. -atio, -ationis > -azón)
que no se encuentra en la forma francesa. Nuevamente la Jexicoestadística no alcanza a
representar coincidencias léxicas parciales de este tipo.
La cognación es un atributo de los morfemas y no necesariamente de los lexemas
enteros, y lo mismo se aplica, por supuesto, a nuestro concepto de correlación . Así, nuestro
análisis segmenta los lexemas complejos (siempre que ello se requiera) y pregunta si los
morfemas individuales que componen dicho lexema son correlatos o no . Los cálculos incluyen ponderaciones apropiadas que reflejan la importancia relativa de los morfemas, con las
cuales se evalúa la coincidencia global entre un par como corazón-coeur en 0,67 (\ ), dado
que los morfemas principales -las raíces- son correlatos, mientras que es sólo en el sufijo menos significativo para la inteligibilidad- donde no hay correlación.
En las lenguas andinas muchas de las formas constituidas por morfemas múltiples
son nombres compuestos. Por ejemplo, el jacaru sim(i) ts 'aaka para diente (literalmente
"boca hueso"), o el quechua ecuatoriano simi kara para labio ("boca piel "). Estas formas
crean coincidencias complejas, de inteligibilidad parcial, con otras variedades del quechua
que guardan los mismos correlatos en sus significados originales u otros (en este caso simi
para boca). Para representar y cuantificar tales relaciones, es indispensable un análisis por
morfema.
4.5. Calificación de plausibilidad de correlaciones
Gran parte del debate quechumara se reduce a discusiones sobre cuáles de las aparentes correspondencias, en forma y significado, constituyen o no correlatos llamativos que
reclamen otra explicación que el simple azar; y así, de si una reconstrucción propuesta resulta
"convincente" o más bien "muy especulativa". Por ejemplo, en el significado de cerro se
encuentran dos formas reconstruidas como *queu para el protoaimara y *urqu para el
protoquechua (siguiendo a Cerrón-Palomino 2000: 311 ). Éstas demuestran un cierto grado
de coincidencia fonética sugestiva de alguna fonna de conexión histórica, pero no completamente convincente como para que todos los lingüistas estén de acuerdo en que el caso no es
más que una mera coincidencia producto más bien del azar.
Para cualquier caso discutible de este tipo, se especifica en nuestra base de datos un
nivel de cuán plausible sea que haya una relación histórica entre las dos (o más) formas
fonéticas candidatas. Reconocemos que tales evaluaciones de plausibilidad son todavía
algo impresionistas; sin embargo, en la medida de lo posible las mismas se han obtenido a
partir de la aplicación de diferentes principios, y toman en cuenta los cambios de sonido que
se saben típicos de las lenguas andinas. Así, para luz/calor del sol, la idea de que lupi del
aimara y nup 'i deljacaru sean correlatos con el rupay del quechua se evalúa como plausibilidad muy elevada.
26
Revista Andina
Pau/ Heggarty: Enigmas en el origen de las lenguas andinas
Dicho sistema permite que se produzca un conjunto independiente de resultados para
cada nivel de plausibilidad, en un degradé que va desde una visión más especulativa hasta
una mucho más cauta de lo que se considera una correlación convincente entre morfemas.
Esta serie resultante tiene diferentes utilidades; aunque para una discusión más amplia sobre
este punto remitimos a los lectores a Heggarty (en preparación). Aquí nos limitamos apresentar esencialmente los resultados que corresponden a nuestra posición relativamente cauta,
según la cual se toma por ejemplo p 'iqi -piqa (cabeza) como correlatos, pero *queu- *urqu
(cerro) y *huma - *qam (tú) como no muy convincentes y algo especulativos.
4.6. Objetividad
Probablemente, aquello que más esté poniendo a prueba la buena voluntad de nuestros lectores en el curso de esta exposición, es que nuestro método esté expuesto a juicios
potencialmente subjetivos. Ello, sobre todo, en lo que respecta a qué ponderación, o cuál de
los grados en nuestras escalas, corresponde a una configuración determinada en los datos
lingüísticos.
Buscamos minimizar este problema, en primer lugar, definiendo nuestras categorías,
objetivamente, en función de principios de análisis lingüístico, tales como los conceptos de
hiponimia e hiperonimia, los cuales, en este sentido, se nos revelan como pautas particularmente útiles. En muchos casos, estas pautas permiten que nuestras evaluaciones sean
objetivas, basadas en principios coherentes. Sin embargo, queda en la naturaleza misma del
lenguaje -particularmente en el borroso ámbito de la semántica léxica- el hecho de que en
varias situaciones limítrofes sea más probable que nunca podamos eliminar por completo la
subjetividad. Esto, no obstante, no quiere decir que no haya maneras de reducir el efecto de
desequilibrio que tal subjetividad pueda ejercer en nuestras cuantificaciones.
Es importante reconocer que las diferencias de opinión subjetiva tienden a limitarse a
un nivel de diferencias relativamente menor en casos limítrofes. Resulta dificil entrever, por
ejemplo, que sea subjetiva la cuestión de si un lexema dado fuera el representante principal de
un significado en una lengua determinada, o si simplemente no existiese en dicha lengua. Sin
embargo, donde sí puede haber una pregunta subjetiva es al tener que escoger cuál de dos
sinónimos próximos es en verdad el más importante. Es sólo la postura de la lexicoestadística
la que termina haciendo de esto un problema grave, por no ser capaz de representar los
posibles niveles intermedios y forzarnos a la ejecución de un análisis en términos de "todo o
nada", amplificando así, en sus cálculos, el impacto de cualquier subjetividad.
Gracias a estas escalas, se puede limitar el impacto de la subjetividad sólo a las
cuestiones de menor trascendencia, que en suma son las únicas a las que afecta. Confiadamente, podemos saber si un lexema determinado es a todas luces altamente pertinente, aun si
puede haber un elemento de subjetividad para evaluar la ponderación exacta que le debemos
otorgar frente a otros. En otros casos, para un lexema que se sabe muy poco significativo,
puede quedar algo "subjetiva" la decisión de si lo descartamos por completo, o si más bien
lo preferimos incluir con una ponderación particularmente baja, o sólo como un subsentido
muy limitado. Pero cualquiera que sea el que prefiramos entre estos análisis alternativos, el
impacto en nuestros resultados no será sino del orden de O, 1 a 0,2, en vez del drástico viraje
de Oa 1, que es todo lo que puede ofrecernos la lexicoestadística. Así que mientras nuestros
Nº 40, primer semestre del 2005
27
Estudios y Debates
principios no alcanzan a eliminar por completo la subjetividad, consiguen por lo menos
limitar estrechamente su impacto en los resultados globales.
Recuérdese la ilustración que hemos dado líneas arriba de cómo nuestro sistema
permite que se representen las diferentes fases por las cuales el préstamo tupi podría paulatinamente entrar en la lengua chipaya. De las cifras que allí se aprecian, queda claro cómo dos
evaluaciones subjetivas -cada una de las cuales le atribuye a la forma tupi un grado diferente de preeminencia en la lengua- no tendrían sino un impacto muy limitado en las
cuantificaciones globales de semejanza. En cualquiera de los casos la diferencia numérica
sería mínima: de Oa O, 11 ; de O, 11 a 0,22; o de 0,22 a 0,33 (o incluso diferencias más pequeñas).
Se puede prever, aún, un mayor refinamiento de nuestro modelo en algunos aspectos,
pero tal como ya está configurado nos sentimos lo suficientemente confiados como para
presentarlo en tanto técnica que ofrece representaciones numéricas, que corresponden fielmente a los grados de diferencia que podemos establecer en base a nuestro juicio lingüístico.
Si finalmente disponemos de una técnica para medir el grado de semejanza en la semántica
léxica, que resulte mucho más adecuada, equilibrada y detallada que la lexicoestadística, ya
es hora de poner atención en lo que podrían ser los nuevos aportes que ésta nos pueda
ofrecer.
4.7. Ajustes a la lista de significados para las lenguas andinas
Existe un aspecto más en el cual nuestro método debe ser cuidadoso: en lo que
respecta a la naturaleza de las lenguas a las que se les aplica el método aquí. Tal como lo han
venido señalando muchos lingüistas que han intentado aplicar la lexicoestadística a regiones fuera de Europa, listas de significados como las de Swadesh requieren de ajustes considerables para adecuarlas al uso con lenguas estructuralmente muy diferentes, que tienen sus
orígenes en culturas también muy distintas . Tal vez la li sta CALMS EA (~ulturally ªnd
Linguistically Meaningful for S.outh-.E.ast Asia) de Matisoff (2001 ), escogida para tener sentido cultural y lingüístico en el sureste asiático, sea el ejemplo más conocido. Para el presente
estudio, hemos adaptado nuestra propi a lista " CALMA" de significados apropiados para los
Andes, para garantizar, en primer lugar, que la lista de significados utilizados para la comparación de las variedades andinas les sea pertinente, significativa y adecuada.
Nuestra lista resulta, pues, una versión extensamente modificada de las listas originales de Swadesh, ya que nos vimos obligados a aplicar distintos tipos de cambios en función
de las realidades lingüística y cultural de los Andes. En algunos casos, bastó con ajustar en
algo los significados de Swadesh, allí donde el campo semántico era inadecuadamente amplio o estrecho para las lenguas andinas, pero buen número de los significados de Swadesh
han requerido de una "cirugía" más radical. En primer lugar, algunos de sus significados
únicos, como old (viejo/vieja), se han tenido que separar en los dos conceptos distintos que
les corresponden en muchas lenguas andinas . Ilustrando con las formas del quechua
cuzqueño, la calidad de old no se considera igual al aplicársele al varón o a la mujer, en tanto
que estos dos conceptos requieren de raíces distintas, machu y paya, respectivamente. A la
inversa, en muchos casos fusionamos los que para Swadesh son dos significados independientes en su lista; por ejemplo, la distinción de wife (esposa) vs. woman (mujer). La fusión
de tales significados evita el problema de "raíces compartidas", identificado por Kessler (2001 ).
28
Revista Andina
Pau/ Heggarty: Enigmas en el origen de las lenguas andinas
Muchos problemas de este tipo se deben al hecho de que las estructuras gramaticales típicas
de las lenguas andinas se diferencian de las de las lenguas europeas. Es por estas diferenci as
que descalificamos varios de los significados en las listas de Swadesh, ya que, a diferencia
del inglés y/o del castellano, en las lenguas andinas las oposiciones entre significados como
morir-matar, él-ellos (he-they), y o- nosotros, son puramente gramaticales, antes que
lexicales. Ello quiere decir que en las lenguas andinas tales oposiciones no pertenecen a la
semántica léxica, el campo que es el objeto de nuestro estudio, sino a la gramática.
En suma, hemos recortado y rehecho radicalmente las listas de Swadesh. De los 150
significados en nuestra lista global , 85 de ellos se hallan también en la lista de 100 significados de Swadesh, y 30 en la lista de 200. Los 35 restantes se completaron con significados que
a menudo se han empleado en otros estudios lexicoestadísticos, los cuales hemos introducido a propósito para garantizar un equilibrio {;ntre algunos significados que se saben particularmente estables a través del tiempo , así como otros que se saben mucho menos estables
(ver más abajo). Nuestra lista completa de significados aparece en el Apéndice.
Embleton (1986: 92-3) ha argumentado que, por debajo de un número total de 200
significados, una lista empieza a perder poder discriminatorio para la dilucidación filogenética.
La autora, sin embargo, se refería al método lexicoestadístico tradicional, donde la valoración
que corresponde a cada uno de los 200 significados se limita a un fonnato binario, es decir, 1
ó O. Ya que la precisión de nuestro método va mucho más allá, para cualquier significado
individual se puede obtener una amplia gama de valoraciones intermedias que van desde O
hasta 1, atravesando distintos escalones fraccionales . De esta manera, podemos alcanzar un
nivel mucho más alto de "resolución" para cada uno de los significados en la lista, lo cual
hace más que compensar el hecho de limitarnos a algo menos de 200 significados en total.
5. Los Datos
5.1. Selección de las variedades consideradas hasta la fecha
Los datos que utilizamos fueron recolectados por nosotros mismos en diferentes
trabajos de campo, salvo los correspondientes a dos de las veinte variedades que muestra la
Figura 1, para cuya obtención nos valimos de las siguientes fuentes :
Para el chipaya, datos recolectados y analizados por Cerrón-Palomino & Bailón Aguirre
(en preparación). A ellos nuestro agradecimiento por la generosa voluntad de
hacérnoslos disponibles antes de publicados.
Para el quechua de Huánuco, datos obtenidos de Weber et al. ( 1998).
Por supuesto, recae sobre nosotros la responsabilidad de cualquier interpretación
errónea de los datos que de estas fuentes obtuvimos.
Nuestro estudio debe verse como una primera etapa de lo que idealmente deberá
ampliarse, a !'argo plazo, a una cobertura más extensa de las variedades lingüísticas andinas.
Nos proponemos abarcar progresivamente muchas variedades más, con lo cual podremos
cubrir algunas lagunas patentes en nuestra actual cobertura, tales como el quechua de Santiago del Estero, de Lamas y de Junín, así como un mayor número de variedades de QI. Las
. variedades que con más urgencia tendremos que incluir son aquellas que se ven enfrentadas
Nº 40, primer semestre del 2005
29
Estudios y Debates
a su inminente extinción y que se cuentan además entre las más informativas para cuestiones
de clasificación, como lo son para el quechua las variedades de Pacaraos, Yauyos y
Chachapoyas. Hasta que podamos recolectar nuestros propios datos para estas variedades, y
con el fin de proveer por lo menos algunas nuevas luces sobre ellas -aunque basadas en datos
ya existentes- incluimos aquí abajo un análisis a partir de los resultados de Torero ( 1972),
estudio que abarca un número más grande de variedades del quechua peruano que el nuestro .
Por limitaciones de espacio en el presente artículo, no entraremos en mayores detalles
sobre las razones que justifican nuestra selección de variedades, así como tampoco sobre
los detalles concernientes a ubicaciones geográficas ni informantes. Sin embargo, exponemos una información completa sobre estos asuntos en www.quechua.org.uk.
5.2. Estado actual de nuestros datos: calidad y fiabilidad
Nuestra postura metodológica requiere que se investigue y analice los datos léxicos
hasta un nivel considerablemente más detallado de lo que exigían los intentos precedentes
para cuantificar la semejanza en semántica léxica, exactamente lo que se requiere para contrarrestar las muchas críticas válidas dirigidas a dichos intentos. No obstante que hayamos
hecho todo lo posible para garantizar la fiabilidad de nuestros datos, dentro del limitado
tiempo disponible para nuestro trabajo de campo, no sería realista pretender ser un "experto"
en las relaciones precisas, en la semántica léxica, de las veinte variedades andinas que
abarcamos. Y si bien siempre buscamos estandarizar nuestro proceso de trabajo de campo
para que éste sea uniforme en cada caso, siempre hay algún margen para la subjetividad en
los resultados obtenidos, dada la naturaleza inherentemente fluida de la semántica léxica.
La tarea más compleja que requiere nuestro método, para ser aplicado coherentemente, es la de abarcar cualquier reflejo fonético de todos los lexemas pertinentes que se encuentran en todas las variedades consideradas para un significado determinado en la lista.
Tuvimos que buscar un equilibrio entre la posibilidad de que a veces nuestros informantes
pudieran no producir todas las formas relevantes, y la de inducir determinadas respuestas
involuntariamente, con el propósito de haber querido confirmar la presencia de correlatos
esperados a partir de nuestra experiencia con otras variedades. En cuanto a la tarea de
identificar correlatos, ésta pudo verse dificultada, en ciertos casos, por el efecto de cambios
de sonido inesperados entre las variedades comparadas. Para recolectar datos como los
nuestros, lo ideal sería un proceso de etapas múltiples, aunque hasta la fecha no haya sido
posible efectuar visitas de retorno para la confinnación de datos sino tan solo en siete de las
veinte localidades de nuestro trabajo de campo.
Así, reconocemos que hasta el momento nuestros datos siguen siendo algo provisionales y que, seguramente, ellos podrían beneficiarse de las contribuciones de especialistas
en los dialectos en cuestión. En efecto, quisiéramos aprovechar de la ocasión que nos ofrece
el presente artículo para invitar y agradecer cualquier tipo de contribución, comentario,
sugerencia, crítica o corrección a nuestros datos (o incluso para proveernos datos de otras
variedades). Para este fin, y para exponer nuestra base de datos a los juicios de nuestros
colegas, ponemos a disposición nuestros datos léxicos en formato Microsoft Access, el cual
se puede descargar de nuestras páginas web . (A su debido tiempo agregaremos las
trascripciones fonéticas correspondientes).
30
Revista Andina
Pau/ Heggarty: Enigmas en el origen de las lenguas andinas
Sin embargo, confiamos en que nuestros datos, en este estado actual, poseen desde
ya un nivel mucho más confiable que en estudios anteriores, como el de Büttner (1983) ,
particularmente porque nuestro método se ha elaborado a propósito para ser más flexible y
minimizar el impacto en los resultados globales de cualquier juicio subjetivo. Así, los errores
u omisiones que puede haber afectarían probablemente sólo a las palabras y sentidos menores, los cuales no contribuyen sino a una fracción de los resultados globales para un determinado significado, de tal forma que no tendrían un impacto numérico muy significativo en
los resultados globales, ni por lo tanto en las representaciones que de ellos se derivasen. De
ahí nuestra confianza en ofrecer nuestros datos desde ya, como un recurso que esperamos
sea lo suficientemente confiable para ser de real utilidad, y que sirva como base para adecuaciones ulteriores . Se mantendrá actualizada y se ampliará nuestra página web con cualquier
versión revisada de nuestros resultados.
6. Interpretaciones acerca de la historia y los orígenes
6.1. La hipótesis quechumara
6.1.1. Contrastes entre significados más estables y menos estables en el tiempo
El criterio original, en base al cual Swadesh seleccionó sus listas de significados, era
el de enfocarse en un "vocabulario básico", presuntamente de por sí muy estable a través del
tiempo y particularmente resistente al préstamo. En efecto, varios estudiosos se han valido
de esta suposición en el debate quechumara en tanto argumento en contra de cualquier
origen común reciente. Adelaar ( 1986: 382) señala que "Un parentesco genético cercano
entre los dos grupos debería ser visible en elementos léxicos tan básicos como los aquí
citados", a saber: atar, dormir, casa,perro, agua, uno, nariz. Cerrón-Palomino (2000: 313)
concuerda en que "( ...) un parentesco cercano entre ambas lenguas debería mostrar, en
principio, una mayor comunidad léxica entre este sector del vocabulario, cosa que no ocurre." En efecto, Cerrón-Palomino contrasta explícitamente la baja comunidad léxica resultante
en el vocabulario básico entre el aimara y el quechua, frente a la mucho más alta encontrada
dentro de cada familia: "Por el contrario, el cotejo del vocabulario básico de AS [aimara
sureño] y de AC [aimara central] (cf Apéndice D), así como el de QC [quechua central] y QS
[quechua sureño], arroja un promedio que va entre un 60% y 70% de elementos compartidos,
de manera que nadie discute la relación de membresía genética que guardan entre sí".
Tal como la mayoría de los investigadores, sin embargo, estos dos autores se limitan a lo
que se puede inferir de lo que se supone es el sector más estable del vocabulario que representan
las listas de Swadesh. Aquí intentamos llevar mucho más adelante esta lógica, y de hecho el
primer punto importante que hay que notar es que tal supuesto resulta mucho menos simple de
lo que parece a primera vista. Inclusive en la lista de 200 significados de Swadesh, muchos de
ellos se han revelado empíricamente bastante mestables en muchas familias lingüísticas.
En efecto, algunos investigadores han querido llevar más lejos esta observación,
intentando establecer para cada significado individual de la lista su propio ritmo de reemplazo léxico a través del tiempo. Por lo general, sin embargo, los estudiosos han hecho esto con
. el único propósito de aislar el núcleo de significados más estables, lo cual consideraban más
Nº 40, primer semestre del 2005
31
Estudios y Debates
útil para sus propios fines, descartando todos los menos estables. Starostin (1991), por
ejemplo, depura la lista hasta, tan sólo, 55 significados, y luego aun sólo 35 .
Algunos pocos investigadores, por otro lado, han intentado aprovechar más bien las
diferencias que se dan entre los significados más estables y menos estables. Esto\lo han hecho
Dyen et al. (1992), pero sólo para intentar "rehabilitar" el método glotocronológico presuntamente apto para calcular fechas de separación entre las lenguas. Sin embargo, a diferencia de
estos últimos, nosotros no compartimos su suposición, empíricamente inválida, de que estos
ritmos de cambios léxicos sean absolutos y mantengan necesariamente una regularidad mecánica a través del tiempo en todas las lenguas y en todas las circunstancias históricas . Guardando esta distancia, nosotros no nos aventuramos a intentar dataciones absolutas.
El propósito nuestro es valernos sólo del hecho de la diferencia relativa en estabilidad inherente, y esto no para establecer dataciones, sino como una herramienta adicional
para investigar la cuestión del origen común versus la convergencia por medio del contacto
intenso. Es decir, nos proponemos confrontar nuestras cuantificaciones de semejanza en
semántica léxica para dos sectores contrastantes del vocabul ario : uno que se sabe típicamente muy estable y otro netamente menos estable. Este método se basa en una propuesta
metodológica de McMahon & McMahon (en prensa: cap.4 §4.3), en base al estudio más
detallado actualmente disponible sobre la estabilidad respectiva de determinados significados, el de Lohr (1999).
Lohr llegó a sus evaluaciones de estabilidad en base a dos criterios. En primer lugar,
para cada significado, consultó diccionarios de las protolenguas para cuatro familias diferentes (protoindoeuropeo, protoafroasiático, protoaustronesio, y protosinotibetano) para
ver si hubiera perdurado rasgos fonéticos suficientemente claros como para permitir a los
especialistas reconstruir un lexema para este significado. El número de las familias (entre Oy
4) en las cuales se ha revelado posible reconstruir un lexema para un significado determinado
constituye para Lohr su "tasa de reconstructibilidad" para este significado. En segundo
lugar, para cada significado examinó el número total de reemplazos léxicos, dentro de unos
lapsos conocidos en varias ramas del indoeuropeo, lo que le dio su "ritmo de reemplazo
léxico" promedio para cada significado.
En el presente estudio en base a nuestra lista global de 150 significados, para que un
significado determinado se incluya en la sublista más estable, hemos empleado los criterios
siguientes:
que este significado se pueda reconstruir en al menos tres, o todas las cuatro, de las
familias de Lohr;
que sufra no más de dos reemplazos léxicos a través de todos los casos fechados del
estudio de Lohr, lo que corresponde a un promedio de un reemplazo no más frecuente
de una vez cada 15. 700 años.
A la inversa, para que sea incluido en nuestra sublista menos estable, un significado
tiene que cumplir:
que se le pueda reconstruir en una sola como máximo, o bien ninguna, de las cuatro
familias de Lohr;
que sufra por lo menos cinco reemplazos léxicos a través de todos los casos fechados
del estudio de Lohr, lo que corresponde a un promedio de por lo menos un reemplazo
cada 6.300 años.
32
Revista Andina
Pau/ Heggarty: Enigmas en el origen de las lenguas andinas
Detalles más amplios se encuentran en McMahon & McMahon (en prensa: ch.4
§4.3) y Lohr ( 1999).
Otros estudios confinnan que los significados identificados por Lohr, en cuanto más
estables o menos estables, parecen tener validez general para las diversas familias de lenguas. Hay una correlación estadística muy significativa entre las tasas de reemplazo de Lohr
y las calculadas independientemente - en base a datos de familias lingüísticas distintas,
salvo el indoeuropeo incluido en ambos estudios- por Dyen et al. ( 1992: IE-RATEI .txt).
Además, nuestros propios resultados apo rtan ulterior confirmación de que efectivamente las sublistas siguen siendo válidas - en cuanto más estable y menos estable- a través
de familias lingüísticas diferentes : en este caso, las andinas. En primer lugar, los significados
menos estables son los que pretendemos sean más susceptibles de verse reemplazados por
préstamos y, efectivamente, en la sublista menos estable encontramos tres veces más préstamos del castellano que sustituyen a los lexemas nativos que en la sublista más estable. En
segundo lugar, encontramos un contraste muy marcado y revelador entre nuestros resultados para las dos sublistas diferentes, tal como no tardaremos en explicar.
Es éste, pues, el segundo criterio crucial al cual obedeció la selección de nuestra lista
"andina" de significados (tal como adelantamos en la sección §4.7): en la lista global tienen
que figurar dos sublistas particulares de similar extensión, una de significados más estables
y otra de significados mucho menos estables. Todos los demás significados deben tener un
ritmo de estabilidad intermedia entre estos extremos. La última columna del cuadro en el
Apéndice identifica cuáles significados figuran en cuál de las sublistas, por su nivel de
estabilidad. De los 150 significados en total , 31 calificaron en cuanto menos estables y 42
como más estables.
Aunque los numerales de tres a diez eran candidatos potenciales para la sublista más
estable, su rol al interior de un sistema ( el numérico) implica que no son enteramente independientes los unos de los otros, tal como lo evidencian los sistemas numerales las mismas
lenguas andinas (Cerrón-Palomino 1987: 366). Ello constituye un potencial desequilibrio para
las comparaciones entre nuestras dos sublistas, así que preferimos excluir a propósito de
nuestra lista más estable todos los numerales por encima de dos, tal como Swadesh los
excluyó de su lista de 100 significados.
6.1.2. ¿Origen común o más bien convergencia por contacto:>
La Figura 8 presenta las representaciones NeighborNet, correspondientes a nuestras diferentes sublistas de significados: la menos estable (a la izquierda), la más estable (a la
derecha).
Basta con una primera mirada para que estos gráficos muestren que indiscutiblemente hay alguna característica que aparta de manera muy nítida nuestras dos sublistas. En
efecto, con respecto al gráfico que arroja la sublista de los significados intermedios restantes
(que aquí no ~e reproduce por falta de espacio), las dos configuraciones en la Figura 8 se
apartan en direcciones diametralmente opuestas.
Un contraste tan marcado clama por una explicación en términos de algún factor de
peso en condiciones de explicarla; y en efecto, el único que parece viable es precisamente
· que haya diferencias en la estabilidad inherente de los significados en las dos subli stas. En
Nº 40, primer semestre del 2005
33
Estudios y Debates
Figura 8. Representaciones neighbomet de las relaciones entre variedades del quechua y
el aimara calculadas en base a nuestras cuantificaciones de semejanza en semántica léxica,
para nuestras dos diferentes sublistas de significados, ambos gráficos a la misma escala.
Las cifras indican las distancias entre las 'raíces' de las dos familias . 1
Significados menos estables
Significados más estables
A2SIT ·· ... ... _SUREFIO
SUREf.10
CENTRAL .//A1Kwt
···",'2~1T
,·' A1.Jqr
CENTRAL
~-~ ~---..
CA.JAMAR.CA . ·'
CARARIS
ECUADOR ./
/
a:z...
01Chc:
ECUADOR ' QZ.chl
CENTRAL
º'"""'
SURE!iro
°'""'
QUECHUA
......... ···sü"REAo
"""" ..
QUECHUA
el caso de que no hubiéramos observado ninguna diferencia importante entre las configuraciones gráficas que resultan de las dos sublistas, bien hubiéramos tenido motivos para
dudar de la validez de nuestra afirmación de que éstas se diferencian netamente en sus tasas
de estabilidad. Resulta que tenemos al contrario todas las razones ara confiar en su validez.
Siendo así, podemos con bastante confianza proceder a algunas interpretaciones
útiles de tan contrastantes configuraciones. La interpretación más económica salta a la vista:
estas configuraciones son eminentemente compatibles con un escenario de convergencia
por medio del contacto como explicación para la relación, y lo son mucho menos con el
origen común.
Nótese en particular cómo dentro de cada familia, el contraste que se da entre las
sublistas resulta completamente a la inversa del que se observa entre las dos familias . Al
34
Revista Andina
Paul Heggarty: Enigmas en el origen de las lenguas andinas
pasar de la sublista menos estable a la más estable, la familia aimara se reduce a un agrupamiento mucho más compacto, mientras que la red enmarañada de los dialectos del quechua
se contrae de fonna aun más espectacular. Ello constituye evidencia complementaria de que
se debe esperar que las lenguas que han ido divergiendo, a partir de un origen común,
deberían resultar más similares en los significados más estables que en los menos estables.
Para el caso del quechua respecto del aimara como familias, sin embargo, observamos configuraciones precisamente contrarias.
Adelaar y Cerrón-Palomino encontraron en la lista global de Swadesh indicios en
contra de cualquier origen común relativamente reciente para el quechua y el aimara. Aquí
hemos llevado más lejos sus observaciones, considerando las listas de Swadesh no sólo
como entidad completa e indivisible, sino también considerando el contraste llamativo entre
los resultados para nuestras diferentes sublistas de significados. También hemos aplicado
nuevas técnicas de análisis capaces de extraer la señal filogenética que se esconde en los
datos complejos. El resultado inspira algo más de confianza para aseverar que si alguna vez
hubo origen común entre las dos familias, se trataría de uno extremadamente remoto.
Sin embargo, resulta importante esta última concesión, pues sí existe un escenario
alternativo que hubiera podido llevar a un resultado como el de los dos gráficos en la Figura 8. Si las familias tuvieran un origen común muy remoto se pudiera haber producido tantos
cambios, a lo largo de los varios milenios trascurridos desde entonces, como para dejar no
más que unos pocos cognados en la sublista más estable. En la sublista menos estable se
hubieran perdido aún más cognados, pero ya que esta sublista es la más susceptible al
préstamo estas pérdidas hubieran podido verse compensadas por un contacto intenso que
reintroducía correlatos bajo la forma de préstamos . Tal proceso naturalmente afectaría mucho más a la lista menos estable, con tal de que finalmente hubiera muchos más correlatos prestados- en ella que cognados supérstites en la lista más estable. Tal escenario hubiera
podido devenir en configuraciones parecidas a las que hemos observado en los Figura 8.
Por lo menos uno de los elementos de tal escenario ya está dado, pues como es bien
sabido, no faltan razones para suponer que ha habido un contacto intenso entre estas
lenguas desde hace milenios. Más bien, ¿no sería sino lógico que la lista menos estable haya
sido prácticamente inundada de préstamos, mucho más que la más estable? Algunos, por
cierto, sí; pero para tener una perspectiva sobre cuántos, recuérdese que las variedades
dentro de cada familia también han sido expuestas a los contactos que se han ido produciendo desde que se fragmentaron de sus protolenguas respectivas, pero notablemente sin que
tales contactos se hayan mostrado suficientes como para perturbar, ni mucho menos revertir,
la señal muy clara de su parentesco también respectivo.
Para poder dilucidar más el balance de las probabilidades entre los dos escenarios, tal
vez nos pueda aportar algo el examen detenido de los correlatos en cada sublista, para ver
cuáles se pueden identificar indudablemente como préstamos en vez de posibles cognados
verdaderos. Sin embargo, como hemos visto, "el asunto no es fácil de sortear" (CerrónPalomino 2000: 309).
Hay una señal más en los datos que queda por explicar si imaginarnos que no hubiera
un origen común quechumara: que haya un grado siquiera limitado de semejanza entre el
quechua y el aimara en la sublista más estable. Esta señal atestigua la intensidad peculiar del
·contacto entre las lenguas andinas, en el sentido de que su impacto en ellas se revela de una
Nº 40, primer semestre del 2005
35
Estudios y Debates
intensidad insólita frente a la historia de las cuatro familias que a Lohr le sirvieron de base
para obtener sus evaluaciones de estabil idad. Este hecho apoya una visión de la relación
quechua-aimara en tanto caso claro de una convergencia de muy gran alcance.
\
6. 1.3. Diferentes niveles de plausibilidad
En el escenario sin origen común , se deben c_o nsiderar como préstamos , o semejanzas
fortuitas, inclusive a los correlatos de la sublista más estable. En tal caso, es revelador
observar lo que ocurre cuando relajamos los criterios de Jo qu e constituye una correspondencia fonética plausible.
Nuestra escala de evaluaciones de plausibilidad permite obtener un conjunto de
resultados para cada uno de los varios niveles de plausibilidad. Todas los grá ficos que aq uí
presentamos son los que corresponden a nuestro nivel de plausibilidad 5, es decir, la postura
medianamente cauta del autor respecto de cuánta similitud fonética debe haber para requerir
otra explicación que no sea el puro azar. En este nivel, pares como el *queu - *urqu cerro o
*hac 'a - *hatu(n) grande de Cerrón-Palom ino (2000: 311) no se suponen históricamente
conectados, mientras lupi - rupay sí . El mismo Cerrón-Palomino se interesarí a sin duda en
ver los resultados, más bien, de nuestro nivel 2, ya que este nivel entiende como históricamente conectados todos los pares de palabras que para él "podrían inferirse mediante una
simple inspección" en tanto que "cognados probables" o "cognados muy probables", incluyendo los dos ejemplos que acabamos de mencionar.
Son potencialmente informativas las diferencias entre los resultados de los diversos
niveles de plausibilidad. No nos sorprende que a medida que se relaja e l criterio de pl ausibilidad, los nodos que representan las supuestas raíces de las familias quechua y aimara
paulatinamente se aproximan por lo menos en algo . Y aunque el efecto de acercamiento es
ligeramente más importante para los significados más estables , aun en la interpretación más
"especulativa" de lo que puede constituir una correlación ( es decir, nuestro nivel de plausibilidad 1), los dos gráficos siguen en la configuración contraria a lo que sería compatible de
manera sencilla y directa con la hipótesis del origen común. Las raíces de las dos familias
resultan mucho más cercanas para los significados menos estables (una distanci a de 24,7)
que para los más estables (47,6), y los gráficos correspondientes (que aquí no se reproducen
por falta de espacio) siguen en exactamente la misma configuración genera l a los de la
Figura 8.
6. 1.4. Recapitulación
Resulta que aunque nuestra técnica no puede ofrecer una respuesta del todo definitiva, sí provee indicios suplementarios claramente inclinados a favor de uno de los lados del
debate, es decir, en contra de un origen común en todo pasado que no sea extremadamente
remoto. Todavía no se pueden ofrecer comparaciones directas con otras familias lingüísticas,
hasta que completemos un estudio de ellas por medio del mismo método que aquí empleamos. Sin embargo, limitándonos a una comparación somera con las lenguas de la famili a
indoeuropea, señalamos cómo son únicamente las más distantes entre ellas las que comparten tan pocos correlatos entre los significados más estables como el quechua y el aimara
36
Revista Andina
Paul Heggarty: Enigmas en el origen de las lenguas andinas
entre sí. Así que, a menos que haya alguna razón por la cual las lenguas andinas hayan ido
perdiendo su vocabulario bás ico a un ritmo considerablemente más acelerado que las lenguas indoeuropeas más inestables, cualquier presunto origen común quechumara debería
remontarse por lo menos tan lejos como la profundidad en el tiempo de la familia indoeuropea,
es decir, entre 6000 y 9500 años. En cualquier caso aún quedaría mucho por explicar, ya que
en base a la interpretación "por defecto" de nuestros resultados, éstos son altamente consistentes con el contacto como explicación mucho más sencilla y directa que el origen común
para la configuración de correlatos que se observan entre el aimara y el quechua.
6.2. Historia y clasificación de los dialectos del quechua
6.2. l. Investigación de la historia de lcts/ámilias lingüísticas: 1: innovaciones compartida.1·
o grctdos de semejanza'!
Aparte de la cuestión quechumara, también podemos valernos de nuestros resultados por los indicadores que puedan contener sobre la historia individual de cada familia.
Empecemos con la familia quechua.
Primero debemos tener en cuenta las advertencias de Landerman ( 1991: 165), para
quien la verdadera filogenia de una familia lingüística sólo se puede basar en las innovaciones compartidas, y no en retenciones compartidas ni en innovaciones paralelas . Entonces,
a primera vista, ya que nuestros datos no son más que cuantificaciones de semejanza en
semántica léxica sin ninguna especificación de cuál de los correlatos corresponde al estado
ancestral en la protolengua, para Landerman no serían válidas como rasgos "diagnósticos"
informativos para investigar el árbol genealógico del quechua.
Landerman sin duda optaría por la aplicación del método "cladístico" de Ringe et
al. (2002) que busca una "filogeni a perfecta", es decir, una estructura arbórea compatible
con tocios los rasgos diferenciadores entre las variedades o, en su defecto , con casi la
totalidad de ellos.
En efecto, si fuera aplicado al caso del quechua, este método tal vez podría traernos
alguna iluminación. Sin embargo, éste no se ha revelado libre de problemas : la realidad
lingüística rara vez es compatible con una filogenia perfecta (ver McMahon & McMahon en
prensa: cap.3 *2). Más aún, la cuestión resulta mucho menos categórica de lo que admite
Landerman, por lo menos en la semántica léxica.
En primer lugar, pese a lo que supone la teoría según la cual son sólo las innovacion es
compartidas las que nos pueden servir de indicadores confiables de una filogenia , en la
práctica parece que evaluaciones de semejanza basadas únicamente en la semántica léxica
nos dan resultados que están en acuerdo estrecho con filogenias basadas en rasgos diagnósticos reconocidos. El estudio reciente de la familia indoeuropea realizado por Gray &
Atkinson (2003) ha obtenido un árbol genealógico que reproduce fielmente las rami fícaciones tradiciona)es establecidas por el método comparativo, no obstante que el suyo fuera
basado en datos que no llevaban especificación alguna de cuáles cognados representaban
retenciones compartidas de formas ancestrales, y cuáles innovaciones compartidas. De
hecho, es lógico: para sus 200 significados, y entre todas las lenguas investigadas, Gray &
-Atkinson se encontraron con 2449 juegos diferentes de cognados, así que la gran mayoría de
Nº 40, primer semestre del 2005
37
Estudios y Debates
ellos -todos menos los 200 estados ancestrales- necesariamente tenían que ser innovaciones de todas maneras.
Además, en muchos casos el hecho es que simplemente no sabemos cuál de dos o
más formas que se registran en una familia es la protoforma original, ni exáctamente qué
sentido tenía. En el caso del numeral cuatro, para este sentido ciertas variedades del quechua
utilizan la raíz ta wa, y otras cusku. El asunto es que no hay manera de saber cuál de entre
ellas es la palabra "original" y cuál la innovación. Es más : en ciertos casos, no hay buenas
razones para suponer que no hubiera sido posible que ambas formas no existiesen como
sinónimos en el protoquechua (un poli11111r/is1110) , y que ambas ramas de la familia hayan
" innovado" en lo que cada una perdió una de las dos formas.
Mas todo esto no quiere decir que por lo tanto un contraste entre dos grupos de
variedades como las que poseen fa wa y las que poseen cusku no nos pueda proveer el e
datos valiosos para la clasificación. Este contraste sí junta correctamente todas aquellas
variedades que comparten alguna innovación , y las separa correctamente con respecto de
las demás, que son las que guardan la forma original. Aun si no podemos identificar en un
caso particular cuál de los dos grupos es el que ha innovado, de hecho esto no importa -siempre que podamos esperar que otros rasgos nos ayuden a identificar otras ramificaciones
que pueda haber entre las variedades restantes que guardan la forma original. Así. aun si
para un determinado rasgo diferenciador no sabemos cuál de las dos ( o más) formas sea la
original , siempre hay información útil en el simple hecho de que haya un contraste entre las
variedades que tienen una de las formas o la otra. Es muy importante fijarse en que la señal
tílogenética - o sea, los indicadores clasificatorios- no reside en la semejanza que puede
"unir" ciertas variedades (ya sean las innovadoras entre sí, o bien las conservadoras entre
sí) . Más bien, la señal filogenética reside en el contraste que diferencia unas variedades de
otras: las innovadoras en oposición a las conservadoras. Landerma n hace bi en en reco rdarnos la importancia de las innovaciones compartidas, pero en ma teri a de metodolog ía
filogenética su argumentación está en parte equivocada y, por ende, ta mbién lo son sus
conclusiones indebidamente pesimistas acerca de las perspectivas para el progreso en la
clasificación del quechua.
En parte su pesimismo se basa en su postura de que para el análisis del desarrollo
histórico de una familia lingüística, só lo sirve un método capaz de encontrar una filogenia
perfecta, lo cual lo lleva a excluir otros métodos tales como nuestras cuantificaciones de
semejanza global. Detrás de esto está una cuestión incluso más fundamental en lo que
Landerman parte a priori desde un supuesto simplificador algo curioso: que como " meta"
deberíamos estar buscando sólo una filogenia perfecta, como si ésta fuera la única representación válida - y/o necesariamente la más exacta- de las relaciones históricas entre las variedades de una familia. Es una postura eminentemente cuestionable, afortiori cuando se trata
de una familia como la quechua, la cual hasta hoy en muchas de las regiones donde se hablan
sus variedades toma la forma de muy extensos continuos dialectales.
6.2.2. la primera ramificación del quechua
Apoyándonos en tales argumentos, nos sentimos lo suficientemente confiados como
para presentar nuestros resultados en cuanto contribuciones pote ncialmente útiles al enten-
38
Revista Andina
Paul Heggarty: Enigmas en el origen de las lenguas andinas
dimiento del desarrollo histórico del quechua. Aportan, por lo menos, datos comparativos
nuevos y más detallados desde el campo de la semántica léxica y, por ende, complementarios
a los criterios esencialmente fonológicos y morfológicos en los cuales se ha basado la
clasificación tradicional de la familia quechua y la visión correspondiente de su desarrollo
histórico.
6.2.2.1. Nuestros datos y Landennan ( 1991)
Para detenernos únicamente en las relaciones dentro del quechua, podemos quitar de
nuestro cotejo todas las variedades ajenas a esta familia (lo que ajusta ligeramente el gráfico). Limitándonos a este conjunto de datos, por medio del programa FITCH que insiste en
representar ramificaciones únicamente binarias, podemos producir una representación simple en forma de un árbol genealógico, tal como se ve en la Figura 9. (E l rol del castellano en
este árbol es só lo en cuanto referencia externa para proveer la " raíz" artificial que requiere
esta representación).
Figura 9. Representación tipo "fenograma" de las relaciones entre 15 variedades del
quechua producida por medio del programa FlTCH (ver texto) en base a las cifras de la
Figura 2, y tomando al castellano como referencia externa y raíz artificial
RAMAS Y ALGUNAS SUBRAMAS
SEGUN LAS CLASIFICACIONES TRADICIONALES
CENTRAL
02c Atl
02c Cuz
CUZCO, PUNO,
NORTE DE LA PAZ
SUREÑO
Q2c Pun
CUZCOCOLLAO
SUR DE BOLIVIA
02b TrJ
ECUADOR
~ - - Q2bSm
QP
Lrs
, LARAOS
~ - - - Q2alnk
CAJAMARCACAÑARJS
02a Cht
j CENTRAL
Nº 40, primer semestre del 2005
39
Estudios y Debates
Los dos gráficos siguientes, mientras tanto, son representaciones NeighborNet más
sensitivas a cualquier señal en los datos que pueda contradecir una estructura de ramificaciones únicamente binarias (ver sección 2). La Figura I O se basa en la sublista de los 42
significados más estables, los cuales son considerados por ciertos lingüistas como los
indicadores más fieles de la filogenia de una familia lingüística, mientras la Figura 11 muestra
los resultados para la lista entera de los 150 significados, la cual provee infonnación más
detallada, de mayor resolución.
Figura I O. Representación tipo "red" de las relaciones entre 15 variedades del quechua
producida por el programa NeighborNet (ver texto) en base a las cifras
para los 31 significados más estables
Q1-Hnc
CENTRAL
Q1-Chc
Q1-Ync
Q2-cCrv
·· ... 02-oCuz
SUREÑO
ECUA~~R ·..
Q2-aCht
NORTE DE PERU
En cada una de estas representaciones, lo que más llama la atención es que los
dialectos quechua que tradicionalmente se han clasificado como Qlla - las variedades de
Cajamarca e Incahuasi (fell"eñafe)- aparecen más cercanos a los dialectos Ql que al Qllb y al
Qllc. Es decir, el Qlla termina ubicándose al "otro lado" de la ruptura principal que tradicionalmente se supone se dio en la familia. Este resultado parece respaldar la conclusión más
general de Landerman ( 1991: 265): que incluso la bifurcación más fundamental, la que opone
al Quechua l del Quechua Il, está en tela de juicio, y con ella muchas suposiciones tradicionales acerca de la historia y la expansión de la familia quechua.
Reproducimos en la Figura 12 los tres árboles genealógicos que Lande1111an ( 1991: 268)
considera consistentes con los criterios morfológicos y fonológicos tradicionales. A propósito de ellos, el investigador concluye que: "las relaciones entre los tres grupos están indeterminadas. Es posible cada una de las siguientes [relaciones)":
40
Revista Andina
Paul Heggarty: Enigmas en el origen de las lenguas andinas
Figura 11 . Representación tipo " red'' de las relaciones entre 15 variedades del quechua
producida por medio del programa NeighborNet (ver texto) en base a las cifras de la Figura 2
ECUADOR
Q2b3m
02a lnk.
CAJAMARCA · CAÑARIS
Figura 12. Los tres árboles genea lógicos posibles para la historia temprana del quechua,
según Landem1an ( 199 1: 268)
PQ
= Protoqu echua
C
= Ct!ntral
PQ
M
e
s
S
= Sureño
NP
= Norte d el Perú
PQ
NP
M
e
NP
PQ
s
A
e
NP
s
Nuestra Figuras 9, 1O y 11 no coinciden con la clasificac ión tradicional representada
por el árbol de l lado derecho, s ino un poco más con la representación del centro. El grupo
que Landerman identifica como del "norte del Perú" (" North Peruvian" ), su "NP", corresponde al menos en parte al tradicional Q ll a. A nuestros resultados se ha llegado por medio de un
método enteramente diferente de l de Landerman , así que éstos constituyen evidencias com-
Nº 40, primer semestre del 2005
41
Estudios y Debates
plementarias e independientes. Ambos ponen en entredicho la bifurcación primaria que
propone la clasificación tradicional.
6.2.2.2. Los datos lexicoestadísticos de Torero (1972) para el quechua
En homenaje y en memoria de uno de los fundadores de la ciencia de la lingüística
comparativa quechua, Alfredo Torero, nos permitimos presentar la Figura 13, la cual se basa
no en datos nuestros, sino en los del estudio lexicoestadístico del propio Torero ( 1972). Ya
que esperamos que ello pueda constituir otra valiosa contribución suya a la clasificación del
quechua, hemos introducido sus datos en el mismo programa NeighborNet, el cual arroja
como resultado la interpretación gráfica de la Figura 13. El estudio de Torero se basó únicamente en la lista de 100 significados de Swadesh pero, respecto de nuestro estudio, tiene la
ventaja de una cobertura mucho más densa de los dialectos del QI (para utilizar el término
acuñado por el mismo Torero) en el Perú central.
Figura 13. Representación neighbornet de las relaciones entre 37 variedades del quechua
calculada en base a las cuantificaciones lexicoestadísticas de Torero ( 1972).
Ver la leyenda de las abreviaturas en el cuadro adjunto
CENTRAL
SUREÑO
Qlle:Chuq
Qlb: Lam•
ECUADOR, LAMAS
Y CHACHAPOYAS
42
Revista Andina
Paul Heggarty: Enigmas en el origen de las lenguas andinas
Leyenda para las 37 variedades del quechua en el estudio de Torero (1972), li stadas siguiendo el orden en Torero ( 1972: 76-80). Lo que aquí se presenta como "clasificación
tradicional" sigue la que se encuentra detallada en Cerrón-Palomino (2003: Cap.8), a su vez
"siguiendo fundamentalmente a Torero" (Cerrón-Palomino 2003: 225). Los signos de interrogación denotan variedades para las cuales opinamos que existen ciertas razones para
calificarlas más bien de "intermedias"
Lugar
Abr.
Nombre i.:o mpl c!o
Departamento
Cl,,sificación
y/o provincia
trndicional
Lugar
Abr.
Nombre i.:ornpkto
Departamento
Clasificación
y/o provincia
trae\ ic ional
Coro
Corongo
Ancash
Ql
Tant
Tantará
Huancavelica
Sihu
Sihuas
Ancash
Ql
Paca
Pacaraos
Lima
QJO
Huar
Huari
Ancash
Ql
Ferr
Ferre,iafe
Lambayeque
Q lla
Monz
Monzón
Huánuco
Ql
Caja
Cajamarca
Cajamarca
Q ll a
QlP
Pana
Pana o
Huánuco
Ql
Lara
Laraos
Lima (Yauyos)
Q fl a''
Cará
Carás [sic]
Ancash
Ql
Linc
Lincha
Lima (Yauyos)
Q ll aº
Ocro
Oc ros
Ancash
Ql
C hac
Chac ha poyas
Amazonas
Qllb
Ch iq
Chiqui án
Ancash
Ql
Pich
Pichincha
Pichincha
Qllb
La U
La Unión
Huánuco
Ql
Lama
Lamas
San Martín
Qllb
Caja
Cajatambo
Lima
Ql
Surc
Surcubamba
Huancavelica
Qllc
A nd a
Andajes
Lima
Ql
A yac
Ayacucho
Ayacucho
Q ll c
Tapu
T apuc
Paseo
Ql
Puqu
Puquio
Ayacuc ho
Qllc
Ulcu
Ulcumayo
Junín
Ql
Grau
Grau
Ap urímac
Qllc
Tarm
Tarma
Junín
Ql
C uzc
Cuzco
Cuzco
Qllc
Jauj
Jauja
Junín
Ql
Muñe
Muñecas
La Paz
Qllc
A li s
Alis
Lim a (Yauyos)
Qf?
Poto
Potosi
Potosí
Qllc
Chon
C hongos Bajo
Junín
Ql
Chuq
Ch uqui saca
C huqui saca
Qllc
Caer
Ca era
Lima (Yauyos)
Qf?
Stgo
Stgo del Estero Stgo del Estero
Huan
Huangáscar
Lima (Yauyos)
Qf ?
!
Q ll c
Tal como ya hemos dejado en claro, tenemos reservas serias a propósito de la utilidad
y la adecuación del método lexicoestadí stico tradicional del cual se valió Torero. Al mismo
tiempo, Torero no publicó sus cuantificaciones del grado de semejanza entre las variedades
en su semántica léxica, aunque es en base a aquellas cuantificaciones que él mismo calculó,
por el método glotocronológico, las fechas de separación entre las variedades que luego
propuso (Torero 1972). En tanto que dichas fechas guardan una relación estrecha con las
cuantificacion~s de semejanza, las empleamos en sustitución de ellas.
Desafortunadamente, Torero nunca publicó las listas exactas de las palabras que
seleccionó para que se las pudiese inspeccionar al detalle. Sin embargo, tal como muchos en
la andinística, tenemos una considerable confianza en el discernimiento lingüístico de Torero
que respalda sus datos, por lo cual consideramos que aun como están, éstos merecen ser
Nº 40, primer semestre del 2005
43
Estudios y Debates
investigados por medio de las novedosas herramientas de análisis que no le fueron disponibles. En efecto, ello resulta muy revelador.
La Figura 13 ilustra la utilidad y capacidad discriminatoria de la representación
NeighborNet . Efectivamente, ésta puede ais lar ciertas configuraciones exiJtentes en los
datos, las cuales en el gráfico se realizan como una serie de líneas paralelas, consistentes con
alguna fom1a de "ruptura" entre las variedades. Aquellas líneas que hemos señalado con 1- S
separan la mayoría de las variedades sureñas, a la derecha de la ruptura, de todas las demás
variedades, a la izquierda. Sin embargo, que hayan tantas líneas 1- S - trece en total- refleja
las muchas relaciones entrecruzadas presentes en los datos, las cuales asocian también
variedades que se encuentran de lados opuestos de esta ruptura 1- S.
Además, en sus detalles, el gráfico difiere en dos puntos importantes de la clasificación para el quechua que el mismo Torero fue uno de los primeros en proponer. Una vez más,
son las variedades de Cajamarca y de Ferreñafe las que aparecen "fuera de su sitio" con
respecto al árbol genealógico tradicional, lo que apoya de nuevo a las objeciones de Landennan
respecto a la idea tradicional de una ruptura primaria 1-11.
Existe también otra serie de líneas paralelas, las cuales hemos señalado con C- 1, y que
sugieren otra ruptura, la que a su vez separa casi todas las variedades Ql del resto. En su
conjunto, estas dos rupturas separan no dos sino tres grupos principales. Es muy importante, sin embargo, señalar que ni las líneas C-1, ni las 1- S, ni ambas en conjunto, encajan bien
en ninguno de los esquemas que sugieren los tres árboles de Landerman.
Ello porque de un examen más detenido de la Figura 13 se desprende que las demás
variedades del "norte de Perú" - es decir, las más orientales, de Chachapoyas y Lamas- de
ninguna manera aparecen agrupadas con las más occidentales de Cajamarca y Ferreñafe.
Más bien, estos supuestos "subgrupos" occidental y oriental se posicionan muy apartados
el uno del otro: éste se acerca más al quechua ecuatoriano, aquél al quechua central. Tal
configuración está claramente en contra de la idea de un grupo unitario "norte de Perú", y
apoya más bien a la visión revisada de Torero, la cual diferencia muy fuertemente las variedades occidentales de las orientales en su clasificación.
Siendo justos con Landerman, debemos aclarar que al principio él presenta su "norte
de Perú" esencialmente como un término únicamente geográfico. Además, trata
específicamente de la cuestión de si los dos supuestos subgrupos - el occidental y el oriental- tienen o no alguna relación genealógica estrecha (Landerman 1991: §4.3 .3 ), y se ve
obligado a dejar abierta tal cuestión. Sin embargo, no asocia claramente las variedades
orientales con otra de sus ramas, y continúa empleando su "NP" en sus árboles para un
tercer grupo genealógico distinto del C( entra!) y del S(ureño ). Si por ello entiende un grupo
unitario que incluye las variedades de Chachapoyas y Lamas con las de Cajarnarca y Ferreñafe,
entonces esto invalida cada uno de los tres árboles que propone, por lo menos según los
datos léxicos de Torero.
6.2.2.3. Un continuo dialectal antes que una nítida ramificación
¿Cuál puede ser, entonces, el análisis correcto? Una pista la ofrecen las variedades de
Yauyos y de Pacaraos: tal como las del Qlla, éstas se posicionan entre las rupturas C- 1 e 1- S.
Es decir, se ven eminentemente intermedios entre los dos grupos de variedades centrales y
sureñas, tal como lo hace en nuestro propio estudio la única de estas variedades que hemos
44
Revista Andina
Pau/ Heggarty: Enigmas en el origen de las lenguas andinas
podido incluir hasta la fecha, el quechua de Laraos. Además, las variedades de Yauyos
conforman un grupo relativamente unitario, que se parecen más entre sí que a casi cualquier
otra variedad. Tal homogeneidad niega la separación de estas variedades a un lado y al otro
de la ruptura principal QI-QII, tal como se la presenta en Cerrón-Palomino (2003: 247), a su
vez "siguiendo fundamentalmente a Torero" (p. 225). Ésta clasificación tradicional quiere
juntas en el Qlla a las variedades de Laraos y Lincha (pp . 237-8), mientras coloca las de Alis
(p. 234) y de Huangáscar en el Ql (pp. 235-6). Tal clasificación supondría que existe entre
ellos una división fundamental y de data muy antigua. Los resultados de Torero para la
semántica léxica, por lo menos, resultan enteramente contrarios a tan radical división. En
efecto, no sólo la variedad de Huangáscar dista del QI, sino que es precisamente ella entre
todas las variedades intermedias la más cercana al QII.
Antes que todo, la configuración global en la Figura 13 dista muchísimo de ser un
árbol de bifurcaciones nítidas; todo al contrario, representa una red muy compleja de relaciones. Recuérdese que NeighborNet de ninguna manera teje siempre tales redes. Más bien , el
programa está configurado para producir simples árboles ramificados, siempre y cuando la
señal en los datos sea consistente con tal configuración: obsérvese la ramificación binaria
muy nítida entre el aimara central y sureño. Que las relaciones principales entre las variedades de la familia quechua devienen más bien en una red compleja se debe precisamente al
hecho de que la señal en los datos no es inherentemente compatible con una historia de
bifurcaciones nítidas.
Nuestros resultados respaldan, pues, el punto de vista de Landerman - basado en
una lógica independiente, en otros campos que el léxico- de que el mejor análisis del desarrollo temprano del quechua no debe ser en términos de una bifurcación primaria binaria. Sin
embargo, lo que no apoyan nuestros resultados es su suposición de que la única respuesta
alternativa se debe buscar en alguna otra configuración del mismo tipo de estructura de
"árbol genealógico", ni siquiera una trifurcación.
Lo que estos resultados reclaman es una revisión aun más profunda. ¿Por qué necesariamente se debe tratar de una ruptura? La falta de una señal filogenética nítida no se debe
considerar ni un "problema", ni una "desilusión", ni una "pena", como parece considerarlo
Landerman al no poderse reconstruir un árbol con bifurcaciones nítidas.Nuestro objetivo no
es el de dibujar un árbol, sino simplemente entender la realidad histórica del proceso de
desarrollo de la familia lingüística quechua. Nuestro éxito no se mide en términos de cuán
ordenadas - ni mucho menos, cuán idealmente binarias- sean las series de ramificaciones
que dibujamos en un gráfico como representación de la historia del quechua. Más bien,
nuestro éxito debería evaluarse simplemente en términos de cuánto logremos acercamos a
una visión de dicha historia lo más compatible con los datos lingüísticos. No nos tenemos
que sentir "decepcionados", como parece sentirse Landerman (1991: 269)-"concluimos a
nuestro pesar"-, al ver que no se alcance encajar los datos en una estructura arbórea. El
cuadro que aquí ofrecemos bien puede ser más complejo que un simple árbol. Pero no es la
simplicidad analítica, sino la fidelidad a la historia real, nuestra meta en la lingüística histórica.
Todas las representaciones de nuestros datos y de los de Torero abogan de manera
convincente, por lo menos en lo que concierne a los indicios léxicos, por la hipótesis de que
simplemente no hubo un solo evento dominante de ruptura en la historia temprana del
quechua. Al contrario, los datos son más compatibles con un escenario totalmente diferente:
Nº 40, primer semestre del 2005
45
Estudios y Debates
una fragmentac ión mucho más paulatina, compleja y entrecruzada, la cual de vino en un
continuo dialectal, sin duda a lo largo de muchos sig los .
Evidentemente, parece que luego, en una etapa muy posterior a los albores de la
divergencia de la familia, finalmente se produjeron algunas rupturas más o i'nenos nítid as
hacia los dos lados más apartados del continuo dialectal. Las líneas C- 1 en la Figura 13
corresponden a una ruptura que separa las variedades centrales de las que podríamos llamar
las variedades "intermedias"; mientras que las líneas 1- S corresponden a una ruptura entre
las variedades intermedias y las sureñas. Nótese, sin embargo, que la ruptura C- 1 se ve
apenas más significativa que las que separan entre sí los cuatro mayores subgrupos al
interior de las variedades sureñas. A fin de cuentas, para nuestra visión de las primeras
etapas del desarrollo de la familia quechua, mejor haríamos en revisar la importancia relativa
de los análisis de bifurcación y de continuo dialectal , claramente más a favor del segundo de
lo que suponen las clasificaciones tradicionales.
En efecto, nuestra visión del desarrollo temprano del quechua en tanto que divergencia paulatina en un continuo dialectal disipa de golpe buena parte de la controversia acerca
del lugar que deberían ocupar en nuestra clasificación los varios dialectos "intermedios".
Las variedades de quechua que se habla(ba)n en Pacaraos y en varios lugares de la provincia
de Yauyos no toman parte consistente en los rasgos que tradicionalmente se consideran
diagnósticos de una ruptura fundamental que opondría una rama QI a otra Qll (ver Adelaar
1987 y Taylor 1984a, 1984b, 1987).
Estas variedades a menudo se han calificado de "problemáticas" para la clasificación.
Lo que se sugiere aquí es que no son ellas el "problema" por no caber fácilmente en ningún
nicho dentro en un árbol genealógico: el problema consiste más bien en insistir a priori en
una estructura de árbol como necesariamente la única representac ión posible de la histori a
del quechua. En un continuo dialectal, mientras tanto, el estatus intermedio no es "problemático", sino precisamente lo esperado para aquellas variedades que - también en un sentido
geográfico- se encuentran en regiones intermedias entre el quechua central y el sureño.
Esquivando la frontera nítida QI-Qll entre Huancayo y Huancavelica sobre la cual se ha
insistido tanto, bien podemos trazar una gradiente mucho menos tajante que vaya del llamado Ql al llamado Qll: basta pasar por las regiones montañosas del interior del departamento
de Lima, allí donde justamente se encuentran muchas de las variedades intermedias.
6.2. 3. Rupturas menores dentro de la familia quechua
Hemos tenido cuidado en calificar siempre nuestro escenario como uno válido sólo para
las etapas iniciales de la divergencia del quechua. Pues luego, una vez que los dialectos hacia
el lado sureño del continuo se hubieron extendido tan lejos como para estar fuera de cualquier
contacto significativo con las variedades del Perú central, el modelo del árbol genealógico
vuelve a ser medianamente más apropiado para identificar ciertas ramificaciones menores, particularmente dentro de las regiones sureñas. Así, mientras nuestros resultados ponen en tela de
juicio la ubicación del Qlla dentro de la familia, confirman por lo menos su identidad en tanto
grupo separado, tal como respaldan el contraste tradicional entre el Qllb y el Qllc.
Además, dentro del mismo Qllc, la distinción primaria que se suele destacar contempla una rama Ayacucho-Chanca frente a otra Cuzco-Collao, la cual abarca todos las varieda-
46
Revista Andina
Pau/ Heggarty: Enigmas en el origen de las lenguas andinas
des desde Cuzco hacia el sur, hasta el sur de Bolivia y el norte de Argentina. Esta distinción
encuentra respaldo como la bifurcación primaria dentro del QIJc, aunque se deba reconocer
que nuestro estudio comprende, a la fecha , sólo un representante del quechua AyacuchoChanca, y además una muy norteña (la comunidad de Atalla, cerca de la ciudad de
Huancavelica). Nos proponemos cuanto antes agregar unas variedades más intermedias
entre ésta y la cuzqueña, lo que bien podría darnos un cuadro más complejo y más consistente con los análi sis que a menudo se proponen para esta región en tanto continuo dialectal.
Mientras hacíamos nuestra selección de las variedades por incluir, decidimos escoger una concentración más densa de variedades al interior de una de las ramas tradicionales
- a saber, la de Cuzco-Callao- con el propósito de ver cuán sensitivo puede ser nuestro
método para distinguir entre las variedades más estrechamente emparentadas. Efectivamente, resulta que a su vez al interior de la misma rama Cuzco-Callao, la siguiente ramificación
que se da según nuestros resultados refleja directamente la ruptura geográfica entre las
variedades del quechua que se hablan al norte y al sur del área aimara-hablante (entorno al
Lago Titicaca, en el sur de Perú y el norte de Bolivia) .
Para el tradicional Ql, por el momento nuestra cobertura abarca demasiado pocas
variedades como para dar una resolución suficiente de alguna estructura interna dentro de
esta rama, pero una mirada al NeighborNet que resulta de los datos de Torero en la Figura 13
da algunas indicaciones. No entraremos aquí en detalles, sino para constatar que una vez
más la señal de red que se encuentra en los datos parece menos compatible con bifurcaciones nítidas al interior del quechua central que con un continuo dialectal.
6.3. La estructura interna de la familia aimara
6.3. /. Jacaru y cauqui: ¿dos lenguas distintas o variedades de una sola ?
Uno de los debates animados en la lingüística de la familia aimara gira en torno al
estatus de las dos variedades supérstites del aimara central: el cauqui ( de Cachuy) y eljacaru
(de Tupe)9 . Hardman sostiene que son lo suficientemente diferentes una de la otra como
para merecer el estatus de dos lenguas distintas, si bien estrechamente emparentadas. La
visión alternativa, tal como lo presenta Cerrón-Palomino (2000: 63-5, 286), replica que tal
caracterización exagera el grado mínimo de diferencia que guardan entre sí y que, más correctamente, ellas se deberían definir como dos variedades estrechamente emparentadas de lo
que esencialmente es una misma lengua.
Pudo haber algunos argumentos en el contexto social para recurrir al término " lengua"
antes que al de "dialecto", a fin de insistir en un estatus y prestigio equitativos de cada una de
las dos variedades. Aquí, sin embargo, nos limitaremos a criterios lingüísticos internos.
Hardman infonna de ciertas diferencias en morfosintaxis y fonología, pero para CeITónPalomino éstas resultan mínimas. A juicio de un nuevo estudio del sistema fonológico del
cauqui por Darlte Oliva (comunicación personal, tesis en preparación) , y unos cotejos preli-
9
Para má s detalles sobre la postura que seguimos en la nomencl atura de las lenguas an dinas, ver la
sección espec ial en nuestras páginas web.
Nº 40, primer semestre del 2005
47
Estudios y Debates
minares de nuestros propios datos fonéticos para las dos variedades, las diferencias entre
ellas parecen más bien no ser tantas tampoco en este campo. Además, durante nuestro
trabajo de campo, nuestros informantes, hablantes nativos de estas variedades, informaron
\
de una inteligibilidad mutua casi total.
Finalmente, mucho de la argumentación de Hardman para identificar a las dos variedades como lenguas distintas se reduce a sus cálculos de las diferencias léxicas entre ell as,
por medio de la lexicoestadística. A éstas se les alude en Hardman ( 1975), donde presenta
sus cálculos globales del porcentaje de cognados, aunque no sistemáticamente sus listas de
palabras. ¿Cuál de las dos posiciones se ve respaldada por nuestros propias clas ificaciones
para la semejanza léxica?
Un aspecto de la posición de Hardman se basa en que sus cálculos la llevan a considerar el cauqui como considerablemente más cercano al aimara sureño de cuanto lo es el
jacaru. En primer lugar, nuestros resultados están de acuerdo en que, efectivamente, el
cauqui ostenta con el aimara sureño una cuota de semejanza algo más alta (un promedio de
55,9%) que eljacaru (54,0%). Sin embargo, la diferencia es mucho menos significativa que en
la lista de 100 palabras en el estudio de Hardman. Más pertinentes aun son nuestras cifras de
semejanza entre los mismos cauqui y jacaru. Para nuestra lista de significados, los dos
resultan algo menos diferentes el uno del otro (una cuota de semejanza de 93,8%) que las
variedades del aimara sureño entre sí (91,6% ; 91,0%; 87,1%), tal como también muchas
variedades del quechua entre sí (por ejemplo, el cuzqueño y el puneño: 89,9%). Sin embargo,
todas estas últimas no se suelen considerar lenguas distintas , sino sólo variantes regionales
de una " lengua" más amplia que las abarca: en estos casos, respectivamente, el aimara
sureño y el quechua Cuzco-Collao. Pues, a fortiori en el caso del cauqui y el jacaru, parece
ciertamente algo exagerado tildarlos de lenguas distintas.
La explicación para la discrepancia entre nuestras cifras y las de Hardman bien podrí a
buscarse simplemente en la calidad de los datos disponibles . De nuestros informantes pudimos conseguir datos para todos los 150 significados en nuestra lista (aunque, como siempre,
en algunos casos los lexemas nativos se han visto reemplazados por préstamos del castellano). Mientras tanto, el conjunto de datos al cual tenía acceso Hardman para su estudio en
1966 era muy incompleto: para el cauqui sólo había alcanzado conseguir datos para 59 de los
significados de la lista de 100 de Swadesh, y 95 de la lista de 200.
En el conjunto total de nuestras cuantificaciones en la Figura 2, y en las varias representaciones gráficas expuestas, también se pueden encontrar pautas interesantes para la
dilucidación de la cuestión dificil de exactamente cuántas "lenguas" distintas uno puede
querer distinguir dentro de la familia quechua. Sin embargo, una vez más tenernos que
advertir que nuestras cuantificaciones reflejan diferencias únicamente en la semántica léx ica,
no en la fonética ni en la gramática, así que no tratan sino de parte de la cuestión. Además,
más útil sería disponer de un patrón de cotejo externo, lo cual nos proponernos ofrecer a su
debido tiempo una vez que hayamos apli cado nuestros métodos también a una se lección de
lenguas europeas.
48
Revista Andina
Paul Heggarty: Enigmas en el origen de las lenguas andinas
6.3.2. La relación entre el aimara sureiio y central
Pasando a la relación entre el aimara sureño y central, consultemos nuevamente el
gráfico izquierdo en la Figura 8, es decir, el que corresponde a los significados menos estables y más expuestos al préstamo. La configuración que allí se nota indica que ciertas
diferencias entre el aimara sureño y central corresponden a diferencias paralelas entre el
quechua sureño y quechua central, tal como las representa la serie de líneas paralelas que
hemos señalado con S-C. Estas líneas corresponden a un cierto número de significados para
los cuales las variedades sureñas del quechua y las sureñas del aimara comparten corre latos
las unas con las otras, pero sin compartirlos con las variedades centrales de sus respectivas
familias . Además, o alternativamente, las mismas líneas S-C pueden representar significados
en los cuales son las variedades centrales de cada familia las que comparten correlatos entre
sí, pero no con alguna variedad sureña.
Sea como fuere, lo más interesante es que estas líneas S-C se desvanecen en la
sublista de significados que se saben más estables, es decir, menos expuestos a cambios
inducidos por el contacto. Esto sugiere, como candidato de preferencia para explicar esta
configuración en los gráficos, el préstamo debido al contacto. Así , las líneas S-C que separan variedades de la misma familia corresponden a préstamos que han venido reemplazando
a los lexemas originales de la protolengua en ciertas variedades descendientes de ella prestados justamente a partir de las variedades geográficamente vecinas de la otra familia.
Efectivamente, pues, existe una correlación muy estrecha con la misma geografía: las variedades del aimara central se colocan del lado derecho a la par que las del quechua central;
mientras que las variedades del aimara sureño se alinean al lado izquierdo, tal como lo hace
el quechua sureño.
Entre las variedades del quechua que se suelen calificar de "sureñas", sólo una
produce una nota aparentemente di screpante, y es precisamente la más septentrional entre
ellas, a saber, la de Atalla (Huancavelica). Ésta se pone más bien del lado de los grupos
centrales, lo que de hecho cabe con una explicación geográfica tal que ella esté menos
afectada por contactos con el aimara sureño. En cuanto a las variedades del quechua ecuatoriano, bien se puede imaginar que estén poco involucradas con cualquiera de las ramas del
aimara. No obstante, por defecto se ven obligadas a ponerse del lado de aquellas variedades
con las cuales estén más estrechamente emparentadas, lo que explicaría que se agrupen con
el quechua sureño.
Esta capacidad de la representación NeighborNet para aislar tales efectos del contacto con las variedades locales del quechua resulta iluminadora para evaluar la profundidad en
el tiempo de la separación entre el aimara central y sureño. Pues si ahora podemos identificar
este componente de contacto que separa las variedades centrales del aimara de las sureñas,
podemos constatar que aun si lo descartáramos, quedaría algo más de profundidad en la
bifurcación principal de la familia aimara que a través de toda la familia quechua. En otras
palabras, la distancia entre las variedades más diferentes es mayor dentro de la familia aimara
que en la quechua.
Se aprecia además una bifurcación binaria mucho más nítida y profunda, aunque en
esto las consideraciones hechas líneas arriba sobre el análisis del quechua nos deben servir
de advertencia para no dar demasiada importancia a la bifurcación nítida que observamos en
Nº 40, primer semestre del 2005
49
Estudios y Debates
la familia aimara. Porque bien hubiéramos podido quedarnos con una señal indistinguible de
una bifurcación simplemente en virtud de la constelación particular de variedades de esta
familia que por casualidad socio-histórica haya sobrevivido hasta la fecha . Es decir, la familia
aimara bien pudo haber sido en sus orígenes más bien un continuo dialectal , dentro del cual
las formas ancestrales deljacaru/cauqui y del aimara altiplánico pudieron ocupar posiciones
hacia los extremos. Tal escenario sería, además, perfectamente compatible con las evidencias
considerables de otras variedades -¿intermedias?- del aimara, las cuales antiguamente se
hablaron tan ampliamente a través del sur del Perú.
Siempre que el análisis se enfoque únicamente en variedades supérstites de una familia lingüística se corre el riesgo de falsear la realidad histórica de la misma. Europa ha vivido en
los últimos siglos un proceso similar de extinción de variedades intermedias, aunque en este
caso principalmente por un proceso de estandardización entorno a una variedad de mayor
prestigio social. Si comparamos únicamente las lenguas estándar que a este proceso sobrevivieron, nos quedamos con árboles engañosamente sencillos, compuestos de lenguas netamente
distintas, para familias como la romance, la gern1ánica y la eslava. Más bien , en cada caso la
verdadera historia fue una de muy lenta y duradera fragmentación en inmensos continuos
dialectales desde sus inicios hasta la muy tardía aparición de los estados nacionales.
De lo anterior, existe un problema potencial de interpretación también para la historia
del quechua y del aimara. A saber, no hay ninguna garantía de que aquellas variedades que
han logrado sobrevivir hasta hoy representen los polos más extremos de la variación que
antes pudo haber habido dentro de cada familia, ni que atestigüen toda la profundidad de su
desarrollo histórico . No obstante, aun a falta de esta garantía, en la práctica casi no nos
queda más remedio que tratar de avanzar en base a la suposición de que así fuera , y en ta l
caso nuestros resultados aportan una confirmación de que las variedades dentro de la
fami lia aimara sean algo más diferentes entre sí de cuanto lo son las variedades del quechua.
6.4. ¿Tierras de origen, expansiones y fechas?
Siendo así, y siempre que no hubieran intervenido otros factores para perturbar sus
procesos históricos respectivos, por defecto se supondría que las primeras diferenciaciones
dentro del protoaimara se produjeron algún tiempo antes de que comenzara la fragmentación
del protoquechua. Así, nuestros resultados por lo menos son compatibles con las pautas
más generales del escenario que actualmente, más a menudo, se propone en la andinística.
Este escenario supone una expansión primero del aimara, predominantemente hacia el sur,
desde el foco original en el Perú central, que generalmente se asume para esta familia. A esta
primera expansión, le habría sucedido algunos siglos más tarde la del quechua, el cual se
habría expandido tanto hacia el norte como hacia el sur, fragmentándose en el transcurso de
este proceso. Si bien nuestras cuantificac iones no necesariamente pueden excluir otros
escenarios, por lo menos sugieren que cualqu ier alternativa q ue propone una fragmentación
del quechua, anterior a la del aimara, tendrá que acompañarse de alguna justificación en
cuanto a factores históricos, lo sufic ientemente fuertes, para revertir el supuesto de que es la
familia aimara la que desde más antigua data está divergiendo .
En lo que respecta a proponer fechas absol utas para estos eventos, recuérdese que
los métodos basados en los datos lingüísticos no han logrado ninguna aceptación general
50
Revista Andina
Pau/ Heggarty: Enigmas en el origen de las lenguas andinas
como instrumentos viables. Los intentos hasta la fecha (principalmente la glotocronología)
dependen de suposiciones metodológicas muy poco sólidas y ampliamente desacreditadas.
El santo grial de una versión lingüística de la datación por radiocarbono sin duda nunca será
alcanzable, ya que el problema es intrínseco a la naturaleza misma del lenguaje, y de cómo
cambia a través del tiempo : su susceptibilidad inherente a las fuerzas inconstantes de la
historia humana.
Tenemos sí algunos medios para obtener por lo menos una perspectiva relativa
sobre las fechas, en particular a través del cotejo de los grados de diversidad que encontramos dentro del quechua y del aimara, frente a lo que se observa en otras familias lingüísticas
para las cuales sí tenemos cronologías evidenciadas (particularmente las de Europa) . Y
mientras este cotejo de ninguna manera nos pueda dar una fecha exacta, sí puede arrojar por
lo menos lapsos indicativos de fechas, aunque bastante amplios, compatibles con estas
cuantificaciones de diversidad . Más allá de estos limites, para más precisión necesitamos
herramientas que nos proporcionen una vista mejor enfocada en las relaciones exactas
dentro de cada una de las familias lingüísticas y, a la vez, entre ellas. Podemos entonces pasar
a la búsqueda de las correlaciones más convincentes entre estas relaciones lingüísticas y los
varios flujo s migratorios -o expansiones simplemente culturales- evidenciados independientemente en los registros arqueológicos e históricos .
Definiti vamente, los desarrollos más recientes en las investigaciones en este sentido
para las lenguas indoeuropeas dan que pensar a los investigadores que se proponen intentar este procedimiento para el caso andino. En los últimos años se ha venido cuestionando
más y más la fecha tradicional de 6000 a 6500 años de antigüedad (a la fecha actual), la cual
desde hace largos años se ha "s upuesto" para los albores de la divergencia lingüística
indoeuropea. Se ha argumentado que los indicios lingüísticos que se han reunido a su favor,
al fin y al cabo, no constituyen pruebas inequívocas para dataciones específicas, sino sólo
para establecer lapsos más amplios. Por lo tanto, son posibles otros escenarios que llevan al
protoindoeuropeo a un origen de dos a tres milenios más antiguo aun: a saber, 8000 a 9000
años de antigüedad (Renfrew 1989, Gray & Atkinson 2003).
De la misma manera, existen muy pocos indicios sólidos de que las familias quechua
y aimara sean tan jóvenes y, por ende, sus primeras di spersiones tan recientes, como a
menudo se ha propuesto: es decir, de unos pocos siglos antes o después de hace 2000 años.
Los hechos lingüísticos bien podrían mostrarse compatibles con lapsos muchos más amplios, según los cuales la historia de estas familias lingüísticas podría remontarse a una
época de varios siglos más temprana de cuánto actualmente se imagina.
En el contexto de la visión ahora extendida de que los orígenes del quechua se han de
buscar en el Perú central, y de lo relativo al viraje reciente a favor de un foco original para el
quechua más bien en el interior que en regiones litorales, se anuncia tentadora la idea de una
conexión con culturas aún tan antiguas como Chavín. Que conste, sin embargo, que por lo
menos, según los indicios actuales -aunque todavía impresionistas-, este escenario sigue
pareciéndonos' todavía tan temprano para el quechua que queda en el ámbito especulativo.
Lo mismo señala Cerrón-Palomino (2003: 22) respecto de las sugerencias tentativas sobre
alguna relación del protoquechua con la cultura Cara!.
Por el momento, entonces, dejamos de lado toda cuestión vinculada con la datación
·y con los vínculos posibles con determinadas culturas arqueológicas, a la espera de una
Nº 40, primer semestre del 2005
51
Estudios y Debates
investigación más profunda una vez que hayamos completado el análisis de nuestro segundo tipo de datos -a saber, cuantificaciones de las diferencias entre las lenguas andinas en su
fonética y ya no en su semántica léxica. Antes de ello, expresamos nuestro anhelo de recibir
las réplicas, críticas y contribuciones de los especialistas en lingüí sti ca andina a este primer
intento de aplicación de novedosas herramientas metodológicas, reunidas de la lingüísti ca y
de otras disc iplinas, a las cuestiones más espinosas de la clasi fic ación y de la prehistoria del
quechua y el aimara.
Paul Heggart~0
Universidad de Edimburgo
1O
Este trabajo ha sido realizado en el marco de un proyecto auspiciado por la Universidad de Sheffie ld.
52
Revista Andina
Pau/ Heggarty: Enigmas en el orig en de las lenguas and inas
Apéndice
Lista adaptada de 150 significados con relevancia cultural y lingüística en los Andes
~
Inglés
Castellano
;,En li stas de
Swa dcsh de
ceniza
back
espalda
be sick
estar et~f<!rmo
X
~]
""'
int.
X
baja
baja
bell y (stomach)
barriga
big
grande
bird
pájaro
X
bite, to
morder
X
X
int.
b lack
blood
negro
X
X
int .
sangre
X
int.
bone
hueso
X
in t.
X
int.
int.
baja
branch
rama
baja
bread
')Q/1
baja
breast
seno
baja
X
brother (man's)
hermano (del varón)
brother (woma n's) hermano (de la mujer)
alta
a lta
clo ud
nube
X
cold
/i-ío
X
come, to
venir
cry, to
llorar
day
día
die, to
morir
dog
perro
X
int.
X
alta
X
alta
in t.
int.
drink, to
tomar, beber
X
X
int.
d ry
seco
X
X
int.
ear
oreja
X
X
alta
ea t, to
comer
X
X
alta
egg
eight
huevo
X
X
alta
elbow
empty
e ye
face
fa r (away)
fa t (grease)
fi ngemai l
ti re
aNum
ocho
codo
vacío
ojo
cara
lejos
grasa
wia
fiifgo
Nº 40, primer semestre del 2005
int .
baja
alta
X
baja
X
X
X
X
X
X
¡,E n listas de
Swadcsh dl'
five
tl ower
tl y, to
foot
forehead
fou r
fox
fu ll
give, to
go, to
gold
grass
green
ha ir
hand
happy
head
cinco
flor
volar
pie
/i·ente (la)
cuatro
int.
li ve, to
alta
lo use
in t.
man, male
]':
~ ;§
É~
IOO? 200?
!l
~
aNum
int.
alta
X
alta
X
baja
aNum
zorro
mt.
lleno
dar
a l ta
X
X
ir
alta
alta
oro
mt.
hierba, nasto
verde (color)
cabello
X
muno
X
X
1111.
baja
int.
X
Castellano
feliz, aler,re
cabeza
hear, to
oír
heart
corazón
heavv
lnesado
hide, to
esconder (all'o)
high up
arriba, en alto
hi t, to
lvol,,ear
horn
cuerno
hot
caliente
husba nd
e.muso
knee
rodilla
know, to
saber
laugh, to
reir
leaf
hoja
left (hand side)
izauierda
leg
lnierna
ti ck, to
lumer
lig ht (not heavv) /;viano , lií!ero
lip
labio
int.
X
Inglés
~i
X
100? 200?
ashes
-g;
baja
X
alta
X
mt .
int.
int.
X
X
X
int.
X
alta
X
baja
int.
alta
X
int.
X
int.
X
baja
int.
int.
X
X
X
X
int.
int.
int
X
X
baja
int.
alta
mt
baja
alta
vivir
1,,iojo
varón, hombre
X
X
int
baja
53
Estudios y Debates
----,
¡,En li slá.~ de
Ing lés
Castellano
Sw11dcsh de
100'/ 200'/
man y
meat
moon
mountain
mouse
mouth
name
nave \
neck
new
ni ght
nin e
nose
not
o \d (man)
o \d (woman)
one
person
push, to
ra in
red
right (hand side)
ri ver
road
root
rope
salt
sand
see, to
seed
se ven
sew, to
shadow
sister (man's)
sister (woman's)
si t, to
six
skin
54
muchu(s)
ca rn e
/w,a
cerro
ratón
boca
nombre
ombligo
cuello
nuevo
noche
nueve
nariz
no
vieio (varón)
vieja (mujer)
X
X
X
X
;
durnúr
int .
s mall
p c<¡11 e1iu
int .
smoke
int .
speak, to
int.
spit, to
humo
hablar
escupir
estar en pie
estrella
¡piedra
ch1,par, mamar
sol
dulce
nadar
cola, rabo
diez
lve11sar (cmzitar)
este
tú
tres
cansar(.se)
lengua
diente
árbul
dos
caminar. andar
agua
nosotros (inclusive)
stand, to
int.
stone
X
baja
suck, to
a lta
sun
a lta
in t.
sweet
swi m, to
tail
ten
think (over), to
this
thou (you sg.)
three
baja
tire
int.
tongue
tooth
tree
two
aN um
a lt a
X
X
a lt a
int.
int.
X
X
X
a lt a
baja
X
int.
baja
X
alta
wa lk, to
water
X
baja
we (inclusive)
X
alta
int.
X
X
X
int.
what?
w hite
X
int.
who?
X
int.
w ind
w ing
with
aN um
X
a lta
int.
woman
worm
int.
ye ar
int.
ye ll ow
young (fe ma le)
a lt a
X
X
aNum
X
baja
;;
H
1
IOO'/ 200?
sleep, to
star
X
Swadcs h de
Castellano
ba¡a
a lta
lversona, ser humano
empujar
lluvia
lviel
Ing lés
;¡
baja
X
X
estar sentado
seis
¡,En listas de
X
X
l/110
roiu
derecha (mano)
río
camino, carretera
raíz
soga, cuerda
sal
arena
ver
semilla
siete
coser
sombra
hermana (del varón,)
hermana (de la mujer)
~
_¡;
young (male)
que?
blanco
quién?
viento
ala
\
alta
X
llll.
int.
int.
a lta
alt ::i
X
alta
bap
1111.
X
alt a
lnl.
baja
baja
X
aNum
baj a
int.
X
alta
X
aNum
X
alta
X
X
alta
X
X
int .
'"'
alta
bajJ
X
X
X
a lta
alta
int.
1nt
X
'"'
a lta
baja
int.
COJT
miúer
g usan o
mio
amarillo
ju ven (nn!jer)
joven (varón)
X
X
int
a ha
baja
1111 .
int.
in t.
Revista Andina
BIBLIOGRAFIA
ADELAAR, Wi llem F.H .
1986
"La Relación quechua-aru: Perspectivas para la se paración del léxico", Revista
Andina, 4:2 , 379-426.
1987
Morfología del quechua de Pacaraos. Lima
BRYANT, David y V. Moulton
2002
"NeighborNet: an agglomerative method for the construction of planar
phylogenetic networks", Proceedings of th e Workshop in Algorithms for
Bioinformatics.
BÜTTNER, Thomas Th.
1983
Las lenguas de los Andes centrales. Madrid: Ediciones Cultura Hispánica.
CAMPBELL, Lyle
1995
"The Quechumaran hypothesis and lessons for distant genetic comparison",
DiachronicaX/1. (Amsterdam) 2, 157-99. John Benjamins Publishing Company.
CERRÓN-PALOMINO , Rodolfo
1993
"Quechuística y aimarística: una propuesta terminológica", Alma Mater . (Lima)
5, 41-55. Universidad Nacional Mayor de San Marcos.
2000
Lingüística aimara. Cuzco: Centro de Estudios Regionales Andinos Bartolomé
de Las Casas.
2003 [1987]
Lingüística quechua. Cuzco: Centro de Estudios Regionales Andinos Bartolomé
de Las Casas.
CERRÓN-PALO!r11NO, Rodolfo y Enrique Bailón Aguirre
en preparación
Vocabulario chipaya-caste//ano. castellano-chipaya. Lima: Fondo Editorial de la
Pontificia Universidad Católica del Perú.
Nº 40, primer semestre del 2005
55
Estudios y Debates
OY EN, lsidore; KRUSKAL Joseph B. y BLACK, Paul
1992
"An Tndoeuropea n classifícation: a lexicostati sti ca l experiment", Transactions
of th e Ameri can Philosophical Society, 82. Datos disponibles en:
www.ldc .upenn.edu
1
EMBLETON, Sheila M.
1986
Statistics in Historical Linguistics. Bochum: Brockmeyer.
FELSENSTEIN, J.
2001
PHYL!P: Phy loge11y !11fere11ce Pa ckage. Version 3. 6. Department of Genetics,
University of Washington.
GRAY, Russell D. y ATKINSON , Quentin D .
"Language-tree divergence times support the Anatolian theory of lndo-Europ ean
2003
origin", Nature, 426, 435-439 .
HARDMAN, Martha J.
1975 [ 1966]
"Eljaqaru, el kawki y e l aymara", Actas del Simpos io de Montevideo. (México)
433-56. Editoria l Galache.
HEGGARTY, Paul A.
en preparac ión
Measured Language: .fi"om Firsl Principies to New Techniques fo r Putting
Numbers 011 Language Similarity. Oxford: Bl ackwell .
KESSLER, Brett
2001
The Significance of Word Lisis: Stalistical Tests far ln vestigating Historical
Connections Between Languages. Stanford: Center for the Study of Language
and Tnformation (CS LI Publications).
LANDERMAN , Peter N.
1991
Quechua Dialects and their Classification. Tes is doctoral , UCLA . Ann Arbor,
Michigan : U.M.I. Dissertation Services.
LOHR, Mari sa
1999
Methodsjor th e Genetic C/ass1jicatio11 of Languages . Tesis doctora l no publicada , Un iversidad de Ca mbridge.
MATISOFF, James A.
2000
" On the uselessness of glottochronology for the subgrouping ofTibeto-Burman ",
en: RENFREW, Colin, April McMahon & Larry Trask (eds.): Tim e-Depth in
Historical Linguistics. (Cambridge) McDon ald lnstitute fo r Archaeological
Research , 333-71.
M CMAHON , April y MCMAHON , Robert
en prensa
Language C/assification by Numbers. Oxford : Oxford Uni vers ity Press.
56
Revista Andina
Paul Heggarly: Enigmas en el origen de las lenguas andinas
RENFREW, Col in
1987
Archaeology and language: The Puzzle of Indo-European Origins . London :
Jonothan Cape.
RTNG E, D.A. ; WARNOW, T. , y TAYLOR
2002
" lndo-European and computational cladistics", Transactions of'th e Philological
Society, 100( 1), 59-129.
STAROSTTN, Sergei A.
199 1
"Altaiskaia probl ema i proiskhozhdenie iaponskogo iazyka", Nauka, Glavnaia
redaktsiia vostochnoi literatwy (Moscú) .
SWADESH, Morris
1952
"Lexico-statistical dating of prehistoric ethnic contacts: with special reference
to North American Indians and Eskimos", Proceedings of the American
Philosophical Society, 96, 452-463 .
TAYLOR, Gerald
1987
"A lgunos datos nuevos sobre el quechua de Yauyos (Vitis y Hu ancaya)",
Revista Andina (Cuzco), 9, 253-65 .
1984a
" Yauyos, un microcosmo dialectal quechua", Revista Andina (Cuzco), 3, 12146.
1984b
Estudios de dialectología quechua (Chachapoyas, Ferreñafe, YauyoJ) .
Chosica - Lima: Universidad Nacional de Educación.
TORERO, Alfredo
1972[1970]
2002
"Lingüística e historia de la sociedad andina", en ESCOBAR, A. (ed.): El reto del
multilingüismo en el Perú. (Lima) Instituto de Estudios Peruanos .
Idiomas de los Andes - lingüística e Historia. Lima: Editorial Horizonte / IFEA.
WEBER, David J., J. Felix CAYCO Z., Teodoro CAYCO V. y Marlene BALLENA DÁVILA
(compilado res)
1998
Rimaycuna - Quechua de Huánu co. Lima: Instituto Lingüístico de Verano.
Nº 40, primer semestre del 2005
57
Estudios y Debates
COMENTARIOS
Willem F.H. Adelaar
F.B.J. Kuiper Instituut, Países Bajos.
El artículo de Paul Heggarty retoma la discusión sobre la posición genealógica del quechua y
del aymara, esta vez con un método moderno y
refinado, con "programas elaborados fuera de la
lingüística", cuya validez ya fue comprobada, según el autor, con familias lingüísticas en otras partes del mundo. Para el lector no familiarizado con
las consideraciones metodológicas tratadas en este
artículo, resulta dificil evaluar su plusvalía. Sin
embargo, la representación de las relaciones entre
variedades del quechua y del aymara incluidas en
la Figura 8 del artículo muestra que el método
utilizado no hace sino confirmar lo que todos ya
sabíamos: la distancia genealógica entre el quechua
y el aymara (emparentados o no) sigue siendo
enonne, cuando al mismo tiempo el cuadro actual
se ve borroso por la gran cantidad de préstamos
ocurridos entre el quechua y el aymara en su totalidad, así como entre dialectos geográficamente
cercanos de cada grupo. Un aspecto interesante
de las conclusiones de Heggarty concierne la confirmación de una mayor separación genealógica
de las lenguas aymaráicas frente a una relativa
homogeneidad dentro del grupo quechua. Aquí se
trata de una conclusión a la que no es fácil llegar
en base a una inspección meramente impresionista.
Al mismo tiempo, las dudas existentes relacionadas con la posición clasificatoria del grupo
Quechua IIA de Torero (es decir, Cajamarca,
Ferreñafe, Pacaraos, Yauyos, etc.) se ven reforzadas. No resulta sorprendiente descubrir que este
grupo -s i de hecho de un grupo se trata- no cabe
dentro de la bifurcación general de los dialectos
quechuas, caracterizada por la división entre
Quechua I y Quechua II. Esta constatación no
significa, sin embargo, que dicha división no sea
válida, más bien que resulta necesario refinarla.
Es importante tomar nota de la distancia observada entre el Quechua de Cajamarca y Ferreñafe,
por un lado, y las demás variedades quechuas
asociadas con un grupo 'del norte del Perú'
(Chachapoyas, Lamas), por el otro. Sin embargo,
tenemos que advertir que la proximidad sugerida
entre Cajamarca-Ferreñafe y el conjunto Quechua
I depende enteramente de semejanzas en el léxico,
pues el trabajo de Heggarty aún no toma en cuen-
58
ta, según propia declaración , los dato s morfol ógicos y fonéticos. A nuestro pare<:er, so n las considerac iones morfológicas que mejor definen al
grupo Quechua I y que muestran su sepa ración
del Quechua de Cajamarca. Consideremos, por
ejemplo, el caso de los sufijos plurali zadores internos al verbo y el sistema de los sufijos verba les
de dirección tan desarrollados en el Quechua I y
cuya ausencia en el Quechua de Cajamarca es notoria. Reconstruir la genealogía interna del Quechua
exclusivamente en base al léxico, sin incluir los
argumentos fono lógicos y morfológicos tan esenciales, no puede ll eva r a conclusiones definitivas
y, por consiguiente, tendremos que estar a la espera de un segundo a1iículo de Heggarty en el que
queden reparadas aquellas deficiencias. Por la
misma razón, y continuando con el caso de l
Quechua de Cajamarca y Ferreñafe, el prese nte
artículo deja fuera de discusión los parale los en el
desarrollo del sistema verbal de referencia personal (asimismo paralelos fonéticos) , que parecen
unir estos dialectos con el Quechua del sudeste de
Bolivia y de Santiago del Estero en Argentina (cf.
Adelaar 1995). En otras palabras, tenemos qu e
tener mucho cuidado con la clasificación genea lógica de los dialectos quechuas, cuyos hablantes
fueron llevados a lugares periféricos durante la marea
de migraciones que acompañó la expansión incás ica
y la conquista españo la. En este contexto, también
se puede recordar la presencia de influencias léxicas
del Quechua l en el Quechua de Catamarca y La
Rioja encontradas por Nardi ( 1962). No podemos
evitar ser sospechosos cuando leemos "que los
dialectos (quechuas) hacia el lado sureño del continuo se hayan extendido tan lejos como para estar
fuera de cualquier contacto significativo con las
variedades del Perú central ". De hecho , la
etnohistoria andina no fue tan sencilla.
La conexión cercana entre el Quechua de
Pacaraos y el conjunto Quechua 1, propuesta por
Parker ( 1969) y por nosotros (Adelaar 1984 ),
está fundamentada principalmente en la existencia de innovaciones morfológicas. Las particularidades léxicas del dialecto de Pacaraos se explican probablemente a través de un conservadurismo fuerte, por un lado, y contactos con una lengua aymará ica, por el otro.
Tenemos algunas duda s acerca de la se lecc ión
y la representatividad de los dato s ofrecidos por
Revista Andina
Pau/ Heggarty: Enigmas en el origen de las lenguas andinas
Heggarty y su intención expresada de colectar
nuevos datos en el campo para los dialectos
quechuas de Pacaraos, Yauyos y Chachapoyas.
En el caso de Pacaraos y Chachapoyas ya existen
léxicos publicados (para Pacaraos,Adelaar 1982;
para Chachapoyas, Taylor 1979). No queda claro
por qué tales recopilaciones de léxico no hayan
sido utilizadas , y en el caso del Quechua de
Pacaraos hay que dudar seriamente de que se pueda todavía hacer una recopilación significativa del
léxico de un dial ecto , cuyo conocimiento y uso ya
estaban restringidos a personas de edad avanzada
durante la época de 1970. También para Santiago
del Estero y Lamas existen vocabu larios extensos
que deberían ser tomados en cuenta (Bravo 1991;
Alderetes 2001; Park, Weber y Cenepo Sangama
1976).
Estamos de acuerdo con la crítica hecha por
Heggarty de l trabajo de Büttner ( 1983 ). Sin embargo, debemos señalar una inexactitud histórica
en la discusión aludida, cuando el autor dice "que
las condiciones para el trabajo de campo eran más
dificiles de cómo son hoy en día y la documentación sobre las lenguas andinas mucho más escasa". Esta excusa no va le para los dialectos
quechuas cuando recordamos que la mayor actividad en relación con su estudio en el campo se
dio justamente en los años 1960 y 1970. Fue después, durante los años 1980, que este tipo de
trabajo llegó a estancarse, por razones consabidas, y desafortunadamente aún no se ha recuperado.
Los casos particulares de vocablos discutidos en el artículo también solicitan algún comentario. En el caso del par piqa - urna, se puede
notar que piqa está difundido en Pacaraos y en
dialectos del conjunto Quechua I con el significado de 'seso' (por ejemplo, en San Pedro de Cajas,
Tarma) . Por eso, debe quedar pendiente una conclusión acerca de su posible origen aymaráico. En
el caso de inti - rupay parece que inli 'sol' es de
origen quechua, debido a su probable parentesco
con kunti 'oeste' y anti 'este'; resulta más dificil
establecer el origen de rupay / lupi / nup ·¡ por falta
de criterios. En el caso de cusku - tawa 'cuatro' se
podría quizás conectar el segundo elemento con
puquina tacpa 'cinco' y callahuaya taxwa 'seis' y
llegar a la conclusi6n de que se tratara de un préstamo. En cuanto a la facilidad de reconocer los
préstamos del castellano, hay algunas excepciones como la palabra punta 'primero', 'antes' , 'posición delantera' (en Quechua de Pacaraos y
Nº 40, primer semestre del 2005
Tarma). Esta palabra cabe en el fonetismo quechua,
no tiene otro uso que lo registrado y ya no refiere
al significado normal que tiene la palabra 'punta'
en castellano.
Al final de este comentario quisiéramos subrayar que en el caso de lenguas cuyo posibl e
parentesco se pierde en las tinieblas del tiempo ,
como es el caso del quechua y del aymara (hecho
confirmado por el mismo Heggarty en este artículo), será indispensable incluir otras lenguas del
subcontinente en un estudio comparativo como
el presente. En este caso solo ha sido agregado el
chipaya como tercer elemento en la comparación,
pero esta lengua fue dejada de lado casi inmediatamente y sin mayor discusión. Falta una moti vación para no incluir el puquina, el atacameño, el
cholón, el mochica, el shuar, el pano, las lenguas
barbacoas, etc. En un momento en que en otras
partes de América del Sur se registran importantes avances en la clasificación de las lenguas indígenas, tal limitación para la región centroandina
parece un paso atrás. Y con relación a la referencia que hace el autor a la antigüedad del protoindoeuropeo, es necesario ac larar que son escasos
los lingüistas indoeuropeanistas que toman en
serio las propuestas del arqueólogo Renfrew al
respecto. El so lo hecho de que los antiguos
indoeuropeos conocían la rueda, basta para rechazar las fechas exageradas de 8000 a 9000 años
mencionadas en el artículo (A lexander Lubotsky,
comunicación personal ; ver tambi én Mallory
1989).
BIBLIOGRAFIA
ADELAAR, Willem F.H.
1982
Léxico del Quechua de Pacaraos. Documento 45 . Centro de Investigación de
Lingüística Aplicada. Lima: Universidad
Nacional Mayor de San Marcos.
ADELAAR, Willem F.H.
1984
"Grammatica l vowel length and the
classification of Quechua dialects. "
lnternational Journal of' American
Linguistics 50, pp. 25-47.
ADELAAR, Willem F.H .
1995
"Raíces lingüísticas del Quichua de Santiago del Estero." En: Ana V Femández
Garay y José Pedro Viegas Barros
(coord.) Actas// Jornadas de Lingüísti-
59
Estudios y Debates
ca Aborigen (Buenos Aires 15-18 de
noviembre de 1994), pp. 25-50. Buenos Aires: Facultad de Filosofía y Letras, Instituto de Lingüística, Universidad de Buenos Aires.
ALDERETES, Jorge R.
2001
El Quechua de Santiago del Estero.
Gramática y vocabulario. Tucumán:
Universidad Nacional de Tucumán .
BRAVO, Domingo A.
1991
Diccionario Quichua Santiagueiio-Castel/ano. 5" edición. La Banda, Santiago
del Estero: Ediciones Kelka.
BÜTTNER, Thomas Th.
1983
Las lenguas de los Andes centrales. Estudios sobre la clasificación genética,
areal y tipológica. Madrid: Ediciones
Cultura Hispánica del Instituto de Cooperación Iberoamericana.
MALLORY, J.P.
1989
In search of'the Indo-Europeans. Language, archaeology and myth. London:
Thames and Hudson.
NARDI , Ricardo L.J.
1962
"El Quechua de Catamarca y La Rioja."
Cuadernos del Instituto Nacional de Investigaciones Folklóricas 3, pp. 189285. (Buenos Aires).
PARK, Marinell ; WEBER Nancy y CENEPO
SANGAMA, Víctor
1976
Diccionario Quechua San Martín. Lima:
Ministerio de Educación, Instituto de
Estudios Peruanos.
PARKER, Gary J.
1969
"The evolution ofQuechua A." Working
Papers in Linguistics l, 9, pp . 149-204.
(Honolulu) University of Hawaii ,
Department of Linguistics.
TAYLOR, Gérald
1979
Diccionario normalizado y comparativo Quechua: Chachapoyas-lamas.
Paris: L'Harmattan.
60
Xavier Albó
Centro de Investigación y Promoción del
Campesinado (CIPCA), Bolivia.
La lectura de este texto me ha resultado muy
estimulante. Mis comentarios no lo serán tanto.
No soy especialista en este tema específico y,
además, tengo poco tiempo e información. He
podido completar algo con la página
www.quechua.org.uk, pero me siguen faltando algunas figuras y otros datos. Sobre muchos aportes técnicos, como los novedosos programas F,rrn
y NEJGHBORNET, tan sugerentes , poco puedo comentar y mucho debo aprender. Mi comentario ,
son apenas unas primeras impresiones y se limita
a unos pocos aspectos del artículo.
Primero daré una apreciación global del trabajo, después añadiré algunas reflexiones de detalle
acerca de la elaboración de la lista base y su ap licación en las lenguas y dialectos seleccionados y,
finalmente , concluiré con una propuesta hacia un
enfoque más ambicioso todavía.
Una neo-glotocronología moderada y razonable
Hace tiempo que daba por muerto y entetTado
el enfoque glotocronológico de Swadesh que a tantos había entusiasmado a11os atrás, también a Torero en los Andes. Al menos aquel parentesco temprano que tenía con el Carbono 14 de lo s
arqueólogos, siempre me había resultado sospechoso por la diferencia abismal que hay entre la fom1ación y evolución de sustancias físicas orgánicas y
un instrumento de comunicación social como es el
idioma. Cada uno baila a su ritmo; y el ritmo y las
formas de la comunicación, que están en la raíz de
muchos cambios lingüísticos, puede ser muy distinto de unos pueblos a otros y a lo largo del tiempo.
Paul Heggarty comparte esa crítica. Sus comentarios a propósito del rápido proceso de
estandarización de las lenguas modernas en torno a
una variedad de mayor prestigio social, mucho más
expuestas a los medios de comunicación, escuelas,
etc., sugieren también un ritmo y orientación del
cambio lingüístico, en este caso homogeneizador,
muy distinto del que haya ocurrido en tiempos
pasados (6.3.2 fin). Me junto pues a su alegoría
final sobre la inaccesibilidad - o desenfoque- de
ese "santo grial de una versión lingüística de la
datación por radiocarbono" (sección 6.4 ).
Revista Andina
Pau/ Heggarty: Enigmas en el origen de las lenguas andinas
Con todo, en otra parte el autor hace una concesión, ciertamente hipotética, a una datación
cronológica "entre 6000 y 9500 años", cuando
compara la distancia léxica entre quechua y aymara
y la de las lenguas indoeuropeas más inestables.
Pero enseguida añade: "a menos que haya alguna
razón por la cual las lenguas andinas hayan ido
perdiendo su vocabulario básico a un ritmo considerablemente más acelerado que las lenguas
indoeuropeas" (6.1.4).
Se me ocurre que esta razón podría ser tal vez
el control vertica l de los pisos ecológicos, tan
mencionado en la etnohistoria y antropología
andina desde que John Murra llamó la atención
sobre este rasgo. No sabemos desde cuándo ni
con qué intensidad ha habido estos intercambios
entre pisos ecológicos, pero parece que es algo
bastante vinculado con la sobrevivencia en los
Andes . En este contexto, es oportuno recordar
que siempre se ha asociado más a los aymaras 1
con la puna y a los quechuas con los valles; hasta
este nombre qhichwa (o qhirwa en aymara) quiere decir valle productor de maíz. Aun ahora hay
zonas, por ejemplo en el norte de La Paz y el
norte de Potosí , en que se habla aymara en las
alturas y quechua en los valles de una misma serranía, con mucho intercambio y bilingüismo siquiera pasivo en ambas lenguas. ¿Podría explicar
esta movilidad geográfica y la coexistencia de diversos pueblos en determinados va lles, con mucha interacción entre ellos, un ritmo más acelerado de préstamos de unos a otros?
Puede ser también pertinente recordar que Ian
Szemiñski, de la Universidad Hebrea de Jerusalén, ha cotejado sistemáticamente los términos
andinos quechuas y aymaras de diversos textos
coloniales con los principales diccionarios coloniales, y ha llegado a la conclusión de que son
poquísimos los términos que puedan llamarse
exclusivos de una u otra lengua 2•
Dicho esto, el presente artícu lo retoma la temática y la intuición central de Swadesh, pero
con una metodología nueva y con supuestos razonables mucho más moderados. Resulta muy
refrescante la manera rigurosa y cautelosa con que
Heggarty retoma el tema de reconstruir la evolu1
.2
Perdón por seguir escribiendo con y, para que
siga siendo una opción alternativa incluso en
castell ano.
Comun icación personal.
Nº 40, primer semestre del 2005
ción histórica mediante el análisis comparativo
interdialectal de un conjunto limitado de palabras
cuidadosamente se leccionadas. Deja claro que no
puede plantearse una evolución lingüística en tiempos absolutos sino sólo como una secuencia
ordinal. Salvo algunas insinuaciones sólo tentativas en las conclusiones finales , habla sólo de grados de diferencia evitando pronunciarse sobre el
debate entre cambios o semejanzas por contacto
o por evolución filogénética; prefiere hablar de
correlatos y no de cognados o préstarnos. Se basa
casi siempre en su propio trabajo personal de
campo. Sus mediciones son mucho más complejas que las dicotómicas del pasado. In troduce además distinciones muy pertinentes, por ejemplo
sobre la mayor o menor estabilidad léxica y semántica de las diversas palabras utili zadas en su
lista .... Y cuando esta información, tan cu idadosamente recopilada, es procesada en los mencionados programas, los resultados resultan coherentes y, en algunos casos, también desafiantes,
como en el cuestionamiento de la ubicación
filogenética del quechua de Cajamarca y Ferreñafe.
Sobre la lista base
Con relación a mi segundo tema, sólo conozco
la lista utilizada por Heggarty en su versión inglesa y castellana (bajada de la página web), más los
pocos términos quechuas y aymaras incorporados en la discusión . Por tanto no puedo hacer un
comentario de conjunto. Pero, con lo poco que he
podido conocer, plantearé tres dudas.
Primera duda: el autor ya nos advierte que
"no siendo el lenguaje una estructura inherentemente matemática, cualquier intento para cuantificarlo ... no será más que una «interpretación»"
y por eso pide "cierta «indulgencia» por parte de
[los] lectores más escépticos" (4. l ). Añadiré un
poco más de combustible para ese escepticismo,
a partir de algunas gdudas que me plantea la lista
misma de significados en inglés y castellano. ¿No
se han colado duplicados, como 'seno' y 'mamar'
(ñuñu-)? ¿Cómo tratar 'corazón', que en las lenguas andinas puede distinguirse el órgano y el
afecto de la misma palabra (en aymara: 1/uxu 'válvula del corazón' vs. chuyma 'pulmón, tórax' ,
que es además la sede del afecto, etc.)? Parece un
caso semejante al de sol/calor tratado en el texto
(4.3). Estos y otros ejemplos me llevan al tema
más complejo de hasta qué punto, al incorporar
en mayor detalle la medición de aspectos semán-
61
Estudios y Debates
ticos , surgen interferencias entre la concepción
con que se elaboraron las listas de partida y la
estructura semántica de las lenguas comparadas.
Segunda duda: me gustaría saber más detalles
sobre el "estatus especial" que se asigna a los
préstamos castellanos para poder "tratarlos de
distintas maneras de acuerdo con diferentes fines"; pero enseguida añade que en este análisis
sólo tienen el status de "ausencia de datos" (final
sección 3). De hecho, en otras partes como en las
figuras 2 y 3, se mantiene el castellano como lengua de referencia, pero no me queda claro cuál ha
sido en cada caso el tratamiento diferente. Haber
puesto en cuarentena los casos en que algún dialecto sólo usa el préstamo castellano, parece razonable dada la finalidad inmediata del trabajo.
Pero, efectivamente, con ello perdemos tal vez
una información potencialmente pertinente para
otras inferencias. ¿Por qué se perdió precisamente tal o cual palabra en esa lista considerada tan
básica? Hacer un segundo análisis sin omitir esos
préstamos de origen ya conocido, quizás nos podría dar una pista adicional sobre el peso que el
contacto puede haber tenido en otros casos.
Pensemos, por ejemplo, en la posible adición
del quechua de Cochabamba, caricaturizado muchas veces como "quechuañol", a los dialectos
analizados. Ahí , por ejemplo, el dúo "hermano/a"
es tan común como ñaiia (hermana de ell a); probablemente se usa más que wawqi (hermano de
él) y ciertamente mucho más que los términos
cruzados pana y turi (hermana de él, he1mano de
ella). En Cochabamba y en casi todo el quechua
boliviano, el significado 'hablar' - recién añadido
a la lista básica- se dice par/ay, como en castellano antiguo, mientras que la forma original rimay
ahora significa sólo "atestiguar", "reñir" o se refiere al murmullo de los ríos - como ocurría ya
cuando los antiguos ll amaron Rimaq al río de
"Lima" y Apu Rimaq al mayor de todos los " ríos
profundos" de Arguedas- y al "cuchicheo" de las
gallinas. ¿Cómo tratar esos casos? ¿Qué pasaría,
por ejemplo, si en la figura 8 - que distingue la
representación en red NEJGHBORNET del subgrupo
de significados menos estables y la del grupo de
significados más estables- se añadiera una tercera
representación que incluyera además los préstamos castellanos? La incorporación de préstamos
castellanos es, a fin de cuentas, un dato lingüístico contemporáneo tan real como los que hayan
ocurrido en el pasado. Por tanto, si al incluirlos se
modificara algo la distancia entre dialectos, ¿no
62
podemos presumir que algo parecido habría ocun-ido en el pasado, sin castellano?
Tercera duda: ¿por qué mantener en la li sta
básica de 200 significados el conqepto 'con ' que
puede tener tantas acepciones semánticas (compañía, instrumento, adición, propiedad, etc.) y
que en las lenguas andinas se puede expresar en
uno o varios sufijos? O, si se mantiene, ¿no habría
que añadir entonces otros sufijos para que esta
clase gramatical tan andina tenga mejo r representación? Estamos ahí en el umbral entre el enfoque
léxico y el gramatical. Pero esto me lleva a la última parte, más general, de mi comentario.
Del léxico a la gramática
En términos aún muy genera les, que van más
allá de este artículo, me deja todaví a insatisfecho
deducir tanto de sólo el léxico, por mucho que la
lista original de Swadesh se haya adaptado al contexto particular de las lenguas andinas. Cuando
analizamos el diccionario de cualquier lengua moderna o lo que ocun-e actualmente entre lenguas
en contacto, vemos que los préstamos léx icos so n
lo primero que se introduce en otras lenguas, sobre todo si hay entre ellas un a relación soc iolingüística desigual. No digo que no valga el aná li sis
comparativo de palabras para inferir correlaciones o distancia entre lenguas. Pero ¿bastará?
El autor ya no s anuncia un análisis comparable de la fonología , que será muy bienvenido. Sin
duda reforzará mucho de lo que aquí aparece, aunque probablemente añadirá, además , algunas otras
cosas interesantes. ¿ Y qué decir de otros ámbito s
gramaticales como la morfofonémica con sus juegos de sufijos, que es uno de los campos más
ricos de las lenguas andinas? Aunque también aquí
se reproduce el eterno debate entre semejanzas
por contacto o por relación genética, este campo
- más arraigado en el inconsciente y, por tanto,
más resistente al cambio por simple contacto que
el léxico- tiene una solidez mayor que otros. El
trabajo preliminar que en ello ha reali zado nu estro común amigo y maestro Rodolfo Cerrón-Palomino ( 1994 ), comparando las estructuras paralelas del quechua y aymara, nos lo confirma y nos
muestra además que ahí se puede llegar a una visión mucho más completa y sistemática que con
una lista de vocabulario, por básico y universa l
que se lo pretenda .
Por lo que el presente artículo nos adelanta,
creo que Paul Heggarty tiene agallas para lan za rse
Revista Andina
Paul Heggarty: Enigmas en el origen de las lenguas andinas
también en este desafio mayor y salir airoso. Ya me
imagino los gráficos generados por los programas
FITCH o NEIGHBORNET, aplicados a datos gramaticales, y ya me muero de ganas de compararlos con
los aquí presentados, a partir de la lista de palabras, unas más resistentes, otras más vulnerables.
BIBLIOGRAFIA
CERRÓN-PALOMINO , Rodolfo
1994
Quechumara. Estructuras paralelas de
las lenguas quechua y aimara. La Paz:
CIPCA.
Rodolfo Cerrón-Palomino
Pontificia Universidad Católica del Perú
Facultad de Humanidades
En la nota preliminar a la segunda edición de
Lingüística Quechua (Cuzco: C.E.R.A. Bartolomé
de Las Casas, 2003), llamábamos la atención sobre la necesidad de revisar algunos puntos relativos a la recon strucción del protoquechua, su posi ble emplazamiento inicial , su re lación con el
protoaimara, y la clasificación de sus dialectos
modernos. Señalábamos, entonces, que para una
mejor comprensión de los problemas, sujetos a
revisión , hacía falta reexaminar cuidadosamente
los materiales disponibles, preñados de un enfoque teórico-metodológico renovado , a la par que
del acceso a nuevas fuentes de información dialectal
y documental. El artículo que pasaremos a comentar, se propone, coincidentemente, abordar
tales temas de indudable importancia dentro de
los estudios de lingüística andina. Para el lo, el
autor, provisto de una drástica reformulación de
la léxico-estadística tradicional, ensaya precisamente una aproximación novedosa a los problemas mencionados . Desarrollado de manera clara
y accesible, no obstante discurrir sobre tópicos
de naturaleza compleja, el trabajo que comentamos, luego de una breve exposición de los antecedentes de los temas estudiados, y tras anunciar la
meta perseguid~, se estructura en-tomo a cuatro
aspectos fundamentales que tienen que ver, aunque no necesariamente en el orden señalado, y
con el riesgo de incurrir en simplificaciones, con
los siguientes puntos : (a) descripción del progra_ma empleado en el procesamiento de los datos;
Nº 40, primer semestre del 2005
(b) crítica razonada de la vieja léx ico-estadística,
en general, y de su aplicación a las lenguas andinas;
(c) selección lingüística y dialectal de los materiales analizados; y (d) interpretación de los datos a
partir de la aplicac ión del método léxico-estadístico alternativo propuesto en (b) . En lo que sigue,
procederemos a comentar brevemente tales puntos, destacando su pertinencia tanto teórica como
metodológica, y formu lando algunas atingenci as
y observaciones que el autor podrá tomar en cuenta, si las considera relevantes .
En cuanto al primer aspecto, según se nos
anuncia, el procedimiento de análisis filogenéti co,
elaborado para su aplicación en la interpretación
del pasado de las lenguas andinas, se inscribe dentro de un proyecto pluridisciplinario má s ambicioso que, bajo el nombre de "Métodos cuantitativos en la clasificación de lenguas", dirige la lingüista April McMahon en la Universidad de
Sheffield (Inglaterra). Concretamente, el modelo
se inspira en el método de la genética y la biología
evolutivas, aplicado al estudio de las relaciones
de parentesco de las especies biológicas , a partir
de los índices de cuantificación derivados de las
comparaciones del ADN de tales especies. De
esta manera, el programa adaptado para los fin es
estrictamente lingüísticos, constituye una herramienta que tiene la virtud de sintetizar y proyectar, en la form a de repre se ntaciones gráficas
bidimensionales, las relaciones multidimensionales
que resultan de los índices de cuantificación de
semejanza, derivados del cotejo léxico-semántico
de las lenguas y/o dialectos se leccionados para el
estudio. A diferencia de los conocidos esquemas
arbóreos que ilustran los viejos tratados de corte
diacrónico, irremediablemente reduccionistas, el
programa visualiza tipos de relaciones filogenéticas
más sensibles a la realidad lingüística, siempre
intrincada y compleja en el tiempo y en el espacio. El dispositivo, en suma, convierte la infon11ación cuantitativa en representaciones gráficas que
semejan estrellas o redes, cuyas proyecciones traducen grados de diferencia o semejanza entre las
entidades lingüísticas sometidas a comparación.
Tales relaciones, insiste el autor, deben ser tom adas como producto de los contactos idiomáticos
antes que de cualquier filiación genética. Ello,
porque el materi al léxico-semántico, que sirve de
aducto para la obtención de los índices de
cuantificación, está libre de toda presunción de
cognación, pero a la vez, siguiendo la práctica
tradicional de l método comparativo, aparece na-
63
Estudios y Debates
turalmente depurado de todo factor achacable al
azar. De este modo, se supera el impasse que ha
significado, en los trabajos de reconstrucción histórica, concretamente en el debate de las rel aciones entre el quechua y el aimara, la distinción sistemática entre préstamos y cognados como requisito de entrada, por lo demás no siempre observado en su aplicación. Lo que el método persigue es,
una vez más, establecer los grados de relación entre las entidades cotejadas y no su filiación
genética: de allí que el autor insista en que el programa busca visualizar las relaciones genealógicas
antes que las genéticas propiamente dichas.
Pues bien, en todo esto quisiéramos ver - y
estamos seguros de que el autor comparte la idea
con nosotros- , un saludable esfuerzo por tratar
de acometer los problemas de filiación y clasificación idiomáticos, abordándolos desde otra perspectiva, en vista de la suerte de entrampamiento
en el que se encuentran, al menos por el momento, los estudios de corte diacrónico aplicados en
el área andina. En tal sentido, con todo lo atractivo y novedoso que pueda ser el método ideado, y
al margen de su aplicación rigurosa en el presente
caso, quisiéramos señalar que no se trata de una
alternativa a los métodos tradicionales de la lingüística histórica, sino de un procedimiento aux iliar que puede ser empleado allí donde justamente
no están dadas aún todas las condiciones para una
aplicación exitosa de los mismos. De hecho, en el
caso de las lenguas andinas, creemos que hay todavía mucho que trabajar en materia de reconstrucción comparativa e interna, y es de esperarse
que por lo menos algunos de los problemas que
ahora parecen insuperables puedan ir resolviéndose a medida que avance la investigación histórica. Estamos convencidos, en tal sentido, de que
no es del todo imposible lograr establecer criterios más finos que permitan discernir mejor entre
préstamos y cognados, reduciendo al máximo los
índices de plausibilidad en una u otra dirección,
una vez que conozcamos en mayor detalle la historia y evolución de nuestras lenguas andinas,
como vienen probándolo los trabajos realizados
en estos últimos tiempos. No dudamos que , dentro de tal contexto, técnicas auxiliares como la
desarrollada por nuestro autor puedan alcanzar
resultados más sorprendentes aun que los que ya
nos proporciona, si bien a costa del soslayamiento elegante del problema de entrada mencionado.
El segundo punto tratado, esta vez extensamente, tiene que ver con una ref01mulación drás-
64
tica del método léxico-estadístico, ensayada con
resultados promisorios en otros ámbitos lingüísticos; esta vez adaptado especialmente por el autor a los efectos de su empleo en el cálculo de las
1
relaciones que guardan entre sí tanto los dialectos
del quechua y del aimara, como las que existen
entre ambas familias idiomáticas. Las innovaciones introducidas en el método son de tal magnitud
que, ciertamente, constituyen una verdadera ruptura respecto de los principios teóricos y de procedimientos en los que se sustentaba aquél. En
efecto, dentro de la técnica reformulada, aparte
del descarte de la distinción entre préstamos y
cognados, se rechaza enérgicamente la naturaleza
binaria y absoluta del conteo de los elementos
léxicos comparados, considerados como cognados
o no (donde vale el todo o nada), dejando de lado
las valoraciones intermedias a las que pueden prestarse perfectamente, desde el punto de vi sta formal y semántico, las entidades correlacionables.
La versión reformulada toma en cuenta, preci samente, los distintos grados de relación que guardan entre sí los correlatos léxico-semánticos , y
que a su vez son objeto de una medición escalar
cuya cuantificación en cifras relativas y no absolutas servirá de aducto al programa de análisis
filogenético mencionado. De esta manera, el corpus léxico-semántico que maneja el autor, que comprende en total 150 entidades (de las cuales 85 y
30 provienen, respectivamente, de las li stas mínima de 100 y máxima de 200 de las elaborada s por
Swadesh, completadas con otras 35 tomadas de
otras listas), aparte de haber sido sensibilizado a
la realidad cultural y conceptual andina - hecho
que en sí mismo cuestiona el supuesto carácter
universal de las listas tradicionales- busca representar de manera "detallada, flexible y equilibrada" el carácter palimpséstico de las relaciones que
se dan entre los dialectos y las lenguas del espacio
andino. Pero hay algo más, igualmente cmcial, en
la reformulación del corpus léxico-estadístico.
Ocurre que, gracias a su aplicación a otras famili as
lingüísticas, ya no es posible hablar de una estabilidad en bloque del corpus seleccionado, pues se
ha demostrado que, dentro de él , se puede divisar
un estrato inherentemente más estable que otro,
lo que echa por tierra la noción de la tasa regular de
decaimiento, invocada por el método tradicional y
aplicada mecánicamente por quienes hicieron uso
de éste para sus cálculos glotocronológicos.
Resulta interesante constatar, en tal sentido,
la suerte de "ampliación" de las posibilidades de
Revista Andina
Paul Heggarty: Enigmas en el origen de las lenguas andinas
contar ahora con un corpus menos restringido, y
habitualmente descartado por el modelo tradicional de la léx ico-estadística . Bien entendida, si n
embargo, la sensibilización del corpus respecto
de los grados de semejanza que guardan entre sí
los correlatos léxico-semánticos supone, por parte del estudioso, un control más fino, en forma y
significado, de los elementos cotejables. En efecto, tal como nos lo da a entender Heggarty, quienquiera que trabaje en esta dirección ya no puede
contentarse con la consulta de meros g losa rios
heteronímicos, a menos que esto sea inevi table,
sobre todo tratándose de lenguas ya extinguidas,
pues lo que está en juego es precisamente la medición más minuciosa de los grados de coincidencia,
no necesariamente absoluta, que guardan recí procamente los correlatos léxicos, y que, a su vez,
será crucial a la hora de interpretar los tipos de
relación que guarden entre sí las entidades
idiomáticas seleccionadas para el estudio. De allí
que, a falta de datos más precisos, se haga necesario el trabajo de campo, y aquí, se hace inevitable
la encuesta socio lingüística, en la que se ponen en
juego la competencia bidialectal y la inteligibilidad entre los hablantes o usuarios de las lenguas o
dialectos estudiados. Lo que no descarta, ciertamente, la propensión a caer en subjetivismos que
pueden manifestarse en el establecimiento de falsas asociaciones, no ya cognadas, que a la larga
distorsionen los resultados (después de todo, la
etimología popular es algo de lo cual no se libran
ni los más avezados especialistas). De todo esto
es consciente el autor, quien hace muy bien en
adelantarse a las objeciones y reparos que asaltan
la mente incrédula de quien va leyendo el trabajo.
Retomando la reflexión adelantada en relación con
el primer punto discutido, quisiéramos insistir,
una vez más, en que los estudios clásicos de corte
diacrónico, aplicados a nuestras lenguas andinas,
seguirán siendo, con todas las dificultades del caso,
los que nos muestren a la larga, de manera más
objetiva, los tipos de relación en forma y significado que guarden entre sí los elementos cotejables.
Sobra decir que de todo ello es consciente el investigador, y, en tal sentido, se adelanta en señalar que la suya es una propuesta más bien
programática ªrifes que algo acabado. Después de
todo, personalmente, nos encontramos mucho más
cómodos con esta nueva versión de la léxico-estadística, tras la aplicación, a todas luces mecánica
y por momentos ingenua, del viejo modelo a las
lenguas andinas, como en el caso de Büttner, nue-
Nº 40, primer semestre del 2005
va mente sometido a juicio esta vez por el autor, o
como en el caso de Torero, agregaríamos nosotros, en su estudio sobre la diferenciación interna
de los dialectos del uro-chipaya.
Respecto del tercer punto, relativo a la selección idiomática y dialectal , el trabajo se sustenta
en la información obtenida para veinte entidades
lingüísticas, ambigua aunque comprensiblemente,
llamadas variedades, toda vez que el material registrado corresponde a familias de lengu as
(quechua, aimara, uro-chipaya) y dialectos o lenguas pertenecientes a cada una de ellas. Aparte
del material léxico del chipaya, idioma ajeno al
quechua y al aimara, pero utilizado como elemento de control externo a e llos, las familias lingüísticas consideradas en el estudio están representadas por un número razonable de exponentes propios, seleccionados por el investigador, salvo un
caso ( el quechua huanuqueño) para el cual se echó
mano de un material previamente existente. Evidentemente, la necesidad de contar con informaciones más precisas, que pudieran satisfacer los
requerimientos del nuevo modelo, obligaron al
autor a efectuar personalmente la colecta del material en repetidas y frecuentes salidas a campo.
Con todo, la arbitrariedad en la cobertura exponencial resulta patente, y es una lástima que el
colega investigador, por razones de espacio, no
nos haya explicitado las razones para ello, si bien
está apercibido de la necesidad de alcanzar una
muestra mucho más amplia y representativa de
las entidades idiomáticas estudiadas, lo cual se
toma urgente en algunos casos en vista del peligro
de extinción que se cierne sobre ciertas variedades
dialectales tanto quechuas como aimaras. En tal
sentido, como señala el estudioso británico, será
interesante tomar en cuenta en las versiones ulteriores de su trabajo en curso, la inclusión de di alectos como los de Chachapoyas, Ferreñafe, Cajatambo, Pacaraos, Yauyos y Huancayo, para referimos solamente a algunos de los dialectos quechuas que de alguna manera, y en mayor o menor
medida, se han mostrado reacios a los intentos de
clasificación que se han venido ensayando hasta
la fecha. Afortunadamente, para algunos de ellos
contamos con materiales léxicos más o menos
solventes, aunque para otros no solamente no disponemos de ellos sino que, como en el caso de
Cajatambo, la variedad misma está en franco proceso de obsolescencia. Como lo está, de manera
mucho más dramática, y esta vez dentro de la
familia aimara, la variedad yauyina de Cachuy.
65
Estudios y Debates
Dentro de esta misma familia, se hace urgente la
inclusión de datos provenientes de dialectos
sureños periféricos, como los de Oruro (Bolivia},
el norte chileno, y Moquegua y Tacna en e l Perú.
Para algunos de estos casos, obviamente, se hace
urgente el trabajo de campo como la única alternativa que pueda proveernos del material lingü ísti co necesario, antes de que las variedades en cuestión se nos escapen de las manos.
El cuarto punto abordado por el autor, de
hecho la parte más reveladora del trabajo, presenta los resultados de la aplicación del programa a
los datos numéricos arrojados por los índices de
semejanza léxico-semántica que le sirvieron de
aducto. Se procede en ella con la interpretación de
tales resultados tras la aplicación del modelo
filogenético ensayado, a la luz de los diagramas
(neighb orn et) proyectados por él como educto
de la información lingüística cuantificada. Como
se recordará, el autor se proponía atacar, desde
una perspectiva novedosa, empleando para ello
nuevas técnicas interpretativas, los problemas
diacrónicos más importantes e irresueltos dentro
de la lingüística andina, a saber: (a) la relación
quechua-aimara, (b) la escición inicial y la clasificación de los dialectos quechuas modernos, (c) la
clasificación de los dialectos aimaras, y (d) el problema de los emplazamientos y desplazamientos
iniciales de las familias lingüísticas involucradas.
En lo concerniente al primer problema, resulta
particularmente iluminador, por su carácter confirmatorio , la demostración de que, tan pronto
como se introduce la distinción, dentro de los 150
elementos léxico-semánticos que sirven de comparación, entre significados más estables y menos estables en el tiempo, salte a la vista un hecho
contundente: la aproximación entre las lenguas es
mayor en el segundo caso y menor en el primero,
lo que podría explicarse como resultado de una
convergencia en el caso del léxico menos estable
y, al mismo tiempo, cierta distancia mutua en relación con el léxico más perdurable. Es decir, pues,
que en este punto, el modelo ensayado por el
autor no hace sino confirmar, si bien de modo más
categórico, lo que se ha venido sosteniendo en los
últimos tiempos: si el quechua y el aimara se originaron alguna vez de un mismo tronco, esto debió haber ocurrido en un tiempo considerablemente remoto, no menor de seis a nueve mil enios.
En cuanto al segundo problema, los resultados
arrojados por el modelo son igualmente reveladores y no menos impactantes. En efecto, en rela-
66
ción con el asun to de la ruptura inici al del protoquechua, los diagramas proyectados configuran,
contra la bifurcación tradicional postulada entre
QI y QII, por lo menos una escisión tripartita,
acorde por lo demás con la información sincrónica proporcionada por los dialectos modernos que,
lejos de ofrecer realidades discontinuas, muestran
un continuum a menudo soslayado, cuando no
simplificado, por los tradicionales esquemas de
corte arbóreo. Sobra deci r que, en este punto, la
aplicación del método comparativo dejaba insatisfechos y hasta frustrados a quienes buscaron
remediar, cuando no recusar de plano, la tesis de
la bifurcación primordial. Y en cuanto a los problemas de índole clasificatoria, es igualmente pal mario constatar que los llamados dialectos del
QIIA se aproximen, en la malla filogenética , al Ql
antes que al QII, en contra de lo postulado inicialmente. En tal sentido, vale la pena subrayar lo
señalado por el autor a manera de corolario de
todo ello: " no es la si mplicidad analítica sino la
fidelidad a la historia real nuestra meta en la lingüística histórica" . Por lo que toca al tercer punto, las proyecciones filogenéticas arrojadas por el
programa en relación con la familia aimaraica, a
diferencia de lo que ocurre con las del quechua,
son de carácter bifurcante, lo cual, sin embargo,
no constituye ninguna contradicción con la noción de una ruptura inicial natural y realista, pues
en este caso hay razones de índole históri ca qu e
permiten explicar el hecho: la existencia de só lo
dos lenguas-testimonio. En relación con esta misma familia, hay otro aspecto que los diagramas
parecen revelar, y que ti ene que ver con que sus
componentes mayores (central y sureño) semostrarían menos cercanos entre sí en comparación
con las variedades de la familia quechua. Finalmente, con respecto al cuarto punto, territorio
minado que el autor trata más bien de refilón, no
hay mucho que comentar, puesto que incide en
aspectos para los cuales resulta prudente esperar
futuros logros en el campo de la an dinística y de
la lingüística histórica en general. Mientras tanto,
resulta prematuro aún, en el mejor de los casos,
dar por terminados los debates en torno a los
emplazamientos originales de las protolenguas,
sus tiempos absolutos de diversificac ión y expansión, así como su asociación co n las ci vilizaciones del pasado. Como bien señala el joven investigador, algunos de los resultados obtenidos,
gracias al novedoso método empleado, no sólo no
contradicen sino que también parece n confirmar
Revista Andina
Pau/ Heggarty: Enigmas en el origen de las lenguas andinas
ciertas posturas que han venido imponiéndose en
los últimos años, como por ejemplo la fragmentación inicial del aimara antes que la del quechua, o
la posible cuna centroandina y no marítima del
protoquechua.
Ahora bien, en cuanto a los temas relacionados con la ruptura inicial del PQ y con la distancia
mayor que las lenguas aimaraicas guardarían entre
sí a diferencia de las del quechua -aspecto este
último que nos parece desconcertante por decir lo
menos- convendría llamar la atención, y sin ánimos de contradecir los resultados arrojados por el
programa filogenético, sobre el hecho de que tales
interpretaciones, si bien coherentes con los materiales (exclusivamente léxico-semánticos) que se
emplearon como aducto, casi estaban llamadas a
contradecir, por lo menos en el terreno de los
hechos, las propuestas emanadas de la aplicación
de los métodos tradicionales de la lingüística histórica, a su tumo basadas en el empleo de datos
más bien fonológicos y morfológicos. En tal sentido, nos preguntamos si es que el tipo de material empleado en cada caso no sería el responsable
del arribo a resultados parcialmente diferentes.
En este aspecto, es de esperar que el colega investigador nos demuestre lo contrario ofreciéndonos
en breve aquello que nos ha venido anunciando a
lo largo de su trabajo: la ulterior medición de las
relaciones lingüísticas y dialectales en función de
la diversificación fonético-fonológica que separa
a las entidades idiomáticas estudiadas. Después
de todo, se trata de un tema cuya propuesta teórica ya ha venido dándola a conocer el autor por lo
menos en un trabajo anterior.
Para terminar, sólo resta saludar el ingreso
con pie firme de este joven investigador a la arena,
por momentos movediza, de la andinística, y cuyos trabajos futuros, siendo uno de sus adelantos
el que comentamos, podrán abrir nuevos derroteros que conduzcan al esclarecimiento del pasado
de nuestras lenguas originarias. Paradójicamente,
por lo demás, el trabajo va dedicado a quien fuera,
al margen de sus méritos indiscutibles, a un investigador nada permeable a la revisión de sus ideas
y siempre reacio a reconocer abiertamente sus
propias contradicciones.
Nº 40, primer semestre del 2005
César ltier
lnstitut Nationa/ des Langues et
Civilisations Orientales, Frunce
Gracias al novedoso y riguroso método elaborado por su autor, el presente artículo marcará sin
duda un hito en la historia de las investigaciones
sobre el desarrollo histórico de las familias quechua
y aimara, en particular sobre el problema de la
relación genética o de convergencia entre las mismas. Las siguientes observaciones, en su mayoría,
apoyan la demostración, muy convincente, del
autor. Emitiré algunas reservas, sin embargo, sobre las hipótesis presentadas en la última sección,
"¿Tierras de origen, expansiones y fechas?".
Coincido con el autor en que hay que matizar
la oposición que estableció Torero entre quechua I
y quechua II y, sobre todo, guardarse de deducir
de ella un "evento dominante de ruptura en la
historia temprana del quechua". P. Heggarty muestra que las variedades de Cajamarca y Ferreñafe,
clasificadas como Qlla por Torero, en realidad son
más cercanas, a nivel léxico, a los dialectos QI que
a los dialectos Qllb y QIIc. En el caso del quechua
de Ferreñafe, por lo menos, me parece que las
evidencias morfológicas apuntan en el mismo sentido. La clasificación hecha por Torero de los dialectos de Cajamarca y Ferreñafe dentro del grupo
QII ya fue cuestionada por Taylor ( 1984; 1996: :
5-8; 2000: 35-36, 44), quien propuso el concepto
de "dialecto mixto" para abarcar tanto los dialectos de Ferreñafe, Cajamarca y Chachapoyas como
los de Yauyos. Estableció, sin embargo, una distinción entre dos tipos de mixtura. Presentó evidencias internas que sugieren que los dialectos del
norte del Perú son el producto de la superposición de dos olas expansivas del quechua, la más
antigua procedente del centro y la segunda del
espacio QII. En cambio, siempre según Taylor, la
provincia de Yauyos constituiría un verdadero
espacio de transición entre el área Ql y el área QII.
Por eso, sugiero que reservemos la expresión de
"dialecto mixto" para las variedades del norte del
Perú y la de "dialecto intermedio", propuesta por
P. Heggarty, para las de Yauyos. Si renunciamos al
concepto de "quechua Ila", tendremos entonces
que rebautizar los dialectos Qllb y Qllc de Torero, por ejemplo como QII septentrional y QII
meridional, respectivamente.
Existen evidencias para sustentar que la nitidez actual de la frontera septentrional del quechua
67
Estudios y Debates
11 meridional - ciertamente menor entre
Huancavelica y Yauyos que en el límite departamental entre Huancavelica y Junín- es un hecho
relativamente reciente y que, en el pasado, el área
intermedia entre QI y QII bien pudo prolongarse
mucho más hacia el sur y hacia la costa, configurando un verdadero continuo dialectal. Las Relaciones geográficas de Indias seña lan que en
Cotahuasi (departamento de Arequipa) coexistían todavía en 1586 dos formas de quechua, la
una vemacular, en retroceso, y la otra "general":
" los indios[ ... ] hablan algunos dellos en su lengua
quichua y la mayor parte en lengua general del
inga" (Jiménez de la Espada, 1965: 31 O). Refiriéndose a una provincia un poco más meridional ,
otro de los autores de las Relaciones señala que
"Los de la provincia de Cavana hablan la lengua
general del Cuzco corruta y muy avillanada" (!bid.:
329). Por cierto, las variedades de quechua que se
hablan actualmente en Cotahuasi y en Cabana no
divergen de la lengua general colonial -de tipo QII
meridional- tanto como para ver en ellas una forma "muy avillanada" de la misma y otra "lengua
quichua" . Más bien, estos testimonios dejan sospechar que coexistían en esa época, en esas provincias, un quechua vehicular en proceso de
vemacularización y variedades de quechua muy
claramente distintas de la "lengua general". Algunos indicios filológicos sugieren que estas formas
de quechua eran mucho más cercanas a lo que
entendemos hoy por "quechua I" que a lo que
conocemos actualmente como "ayacuchano" o
"cuzqueño-collavino".
Guarnan Poma, nativo de la provincia de
Lucanas - no muy lejos de Cotahuasi- , al referirse
a los aspectos más tradicionales de la cultura de
su región, emplea a veces términos como lurin
"abajo" (1936 : 431 , 432, 433), marka "pueblo"
( 1936: 458) o hunaq "día" ( 1936: 899), que hoy
se considerarían privativos del conjunto quechua
J. También existen indicios dialectológicos para
sustentar que la (muy) relativa homogeneidad lingüística que presentan actualmente los departamentos de Huancavelica, Ayacucho, Apurímac,
Arequipa, Cuzco y Puno es fruto de la expansión
colonial de una lengua común, a partir de los centros urbanos particularmente importantes alrededor de los cuales se articulaban estas regiones :
Huancavelica, Huamanga y Cuzco.
De hecho, el área cubierta actualmente por el
quechua ayacuchano coincide exactamente con el
espacio éconómico que se articulaba, en la época
68
colonial, alrededor de las ciudades de Huamanga
y Huancavelica. Y otro tanto puede decirse para
el quechua cuzqueño. Por añadidura, en las zo nas
geográficamente más periféricas del QII meridional, las que están más apartadas de1dichas ciudades, se observan rasgos inesperados que constituyen probablemente las hue llas de una diversidad dialectal que antiguamante fu e mayor. En el
quechua de la provincia de Paucar del Sara Sara,
por ejemplo, donde se habla hoy una variedad
intermedia entre el ayacuchano y el cuzqueño,
existen términos como imay "cuando" o usya"terminar" (Cáceres, 1992), que conocen también
las hablas de tipo 1, cuando los dialectos de tipo 11
sólo conocen haykap (u otras formas deri vadas)
y tuku-, respectivamente. En su morfología, estas variedades meridionales periféricas a veces han
aplicado a formas "generales" significados que no
lo son y que caracterizan más bien los dialectos
del centro y centro norte del Perú. Así , en una
franja que se extiende de la provincia de Paucar
del Sara Sara (Ayacucho) hasta la de Abancay
(Apurímac), el sufijo postverbo -rpari- no tiene
el empleo muy limitado, casi lexicalizado, y el
sentido "eyectivo" que presenta en las zonas cercanas a Huancavelica, Huamanga y Cuzco, sino el
empleo frecuente y el sentido de "acción reali zada sin reserva o sin resistencia" que tiene el sufijo
-rku-, en sus aplicaciones no espaciales, en los
dialectos de Ancash, Huánuco , Cajatambo y
Junín. Son sólo unos cuantos ejemplos que sugieren que las variedades periféricas del quechua sureño han retenido elementos léxicos y significados morfológicos procedentes de variedades intermedias del quechua, que se extinguieron debido a su desplazamiento por la " lengua general" .
El QII probablemente no fue en su origen sino
uno de los representantes más extremos de ese
continuo dialectal , que luego supl antó otras lenguas quechuas y de otras familias. Las variedades
de Yauyos serían entonces algo así como algunos
de los eslabones hoy perdidos de un antiguo continuo que unía lo que hoy nos aparece como dos
conjuntos dialectales relativamente bien
distinguibles. Los eslabones también se pueden
buscar más hacia el norte, como lo hace P. Heggarty
al advertir que en el aspecto lexical , el quechua de
Pacaraos se posiciona entre el quechua central y
las variedades intermedi as de Yauyos. Lo confirma por lo menos un aspecto de su morfologí a: el
empleo exclusivo de la forma -shpa, para el
gerundio 1, considerada como típicamente QII,
Revista Andina
Pau/ Heggarty: Enigmas en el origen de las lenguas andinas
frente a los demás dialectos del centro que usan
principalmente la forma -r (Adelaar, 1987).
El autor advierte que la semejanza en los
significantes léxicos del quechua y del aimara es
mucho mayor para los significados menos estables que para los más estables, lo cual sugiere un
escenario de convergencia antes que de origen común. La morfología parece confirmar esta interpretac ión. Los sufijos quechuas que aparecen en
las posiciones más internas del verbo, cuya frecuencia es más alta y que encontramos en toda la
zona continua (la de mayor fragmentación
dialectal), es decir los que parecen ser los más
estables, no muestran ninguna semejanza, a nivel
de significante, con sufijo aimara alguno. Sin embargo, es de notar que es precisamente en ese
nivel de la morfología donde la semejanza es más
fuerte en cuanto a significados. Sólo citaré, a manera de ilustración, el caso de los tres orientadores
actanciales, que constituyen un aspecto esencial
del sistema verbal de las lenguas quechuas y
aimaras de la zona continua. El Orientador
Actancial 1 (OA 1) -kU- orienta la acción hacia el
sujeto, el OA2 -m(u)- la orienta hacia el punto
donde se sitúa el segundo actante y el OA3 -pula desvía fuera del escenario conformado por estos dos actantes. El mismo sistema se vuelve a
encontrar en aimara sureño (no he hecho el cotejo
con el aimara central), aunque con otros
significantes: respectivamente -si-, -ni- y -xa-.
Algo equivalente sucede con otros aspectos esenciales de la morfología verbal de estas lenguas:
por ejemplo los sistemas personal y aspecto-temporal. Por lo tanto, coincido con P. Heggarty en
que la convergencia entre quechua y aimara fue
"de muy gran alcance". Los indicios morfológicos
sugieren inclusive que un proceso de pidginización
estuvo en el origen de una de las dos familias: el
protoquechua o el protoaimara sería el fruto de la
remodelación de una tercera lengua por un dialecto aimara o quechua. De manera general, dada la
estructura del quechua, creo que el estudio de las
relaciones entre dialectos quechuas y entre el
quechua y el aimara debe dedicarle por lo menos
tanta atención a la semántica morfológica como a
la semántica léxica y a la fonética.
P. Heggarty constata que la distancia entre las
variedades más diferentes es mayor dentro de la
familia aimara que dentro de la familia quechua.
En la parte final de su artículo, dedicada a las
hipótesis relativas a los focos y fechas de expansión del quechua y del aimara, advierte muy pru-
Nº 40, primer semestre del 2005
dentemente: "S iendo así, y siempre que no hubieran intervenido otros factores para perturbar sus
procesos históricos respectivos , por defecto se
supondría que las primeras diferenciaciones dentro del protoaimara se produjeron algún tiempo
antes de que comenzara la fragmentación del
protoquechua". Creo que existen indicios de que
un factor histórico intervino para "revertir el supuesto de que sea la familia aimara la que desde
más antigua data está divergiendo". Sabemos por
las fuentes históricas que, en gran parte del mundo quechuahablante, las variedades locales coexistieron durante siglos con una variedad vehicular,
cuya identidad dialectal pudo variar según las
épocas. Existen testimonios tanto históricos como
filológicos para sustentar que tal era la situación
en la sierra central y norcentral del Perú, en las
épocas incaica y colonial. Todo sugiere que el
Tahuantinsuyo no hizo sino reforzar la función
vehicular de una forma de quechua que, desde
antes, venía desempeñando ese papel. Es probable que estas circunstancias limitaran las innovaciones locales y frenaran la divergencia lingüística. Incluso pudieron favorecer cierta convergencia entre variedades anteriormente más diferenciadas (tal vez ésta sea la explicación de la presencia de urna, "cabeza" en Chacpar). En tal caso,
una correlación entre el horizonte temprano (800200 A.C.) y una primera expansión del quechua
no sería inverosímil , sobre todo si tomamos en
cuenta que la difusión de la cultura Chavín, desde
Cajamarca hasta Ayacucho, abarca lo que parece
haber sido el área cubierta por los dialectos
quechuas antes de la propagación del QII. En el
caso de la familia aimara, en cambio, la ausencia
de contacto entre el aimara central y el aimara
meridional en los últimos siglos e incluso, probablemente, en el último milenio, por lo menos, no
pudo más que favorecer, en ambos lados, innovaciones no compartidas. Dicho en términos generales, lo que se llama "separación" de dos dialectos a partir de un tronco común es un largo proceso entre la primera innovación no común y la
última innovación común. Este proceso puede
verse frenado y alargado por el contacto entre los
dos dialectos o entre éstos y una variedad
vehicular procedente de la misma familia. Por lo
tanto, la cuantificación de las semejanzas y diferencias entre dialectos de una misma lengua es un
indicio pero no una prueba de la cronología relativa de la fragmentación de esa lengua. El método
cuantitativo probablemente no pueda reemplazar
69
Estudios y Debates
el método comparativo y la historia en la reconstrucción del desarrollo histórico de las lenguas.
Tal vez la relativa lentitud de los avances realizados en este campo no se deba tanto a "los límites
inherentes a lo que con confianza pueden decirnos las técnicas actualmente disponibles para la
lingüística histórico-comparativa" como simplemente a la falta de aplicación en gran escala de
estas técnicas.
GUAMAN POMA DE AYALA, Felipe
1936
Nueva Coron ica y Buen Gobierno
(Codex péruvien illustré) . Paris: Institut
d 'Ethnologie.
JIMÉNEZ DE LA ESPADA, Marcos (ed.)
1965
Relaciones geográficas de Indias. Madrid : Biblioteca de Autores Españoles.
TAYLOR, Gerald
1984
"Yauyos, un microcosmos di alecta l",
Revista Andina, t. 3, pp. 121-146.
BILIOGRAFIA
ADELAAR, Willem F. H.
1987
Morfología del quechua de Pacaraos.
Lima: Universidad Nacional Mayor de
San Marcos.
CÁCERES VARGAS, Gloria
1992
Morfosintaxis del quechua de Coita, tesis presentada por ... para obtener el grado académico de magíster en ciencias de
la educación, con mención en lengua y
literatura. Lima: Universidad Nacional de
Educación Enrique Guzmán y Valle.
TAYLOR, Gerald
El quechua de Ferreñafe. Fonología.
1996
morfología, léxico. Cajamarca: Acku
Quinde.
TAYLOR, Gerald,
2000
Estudios linguísticos sobre Chachapoyas. Lima: UNMSM - IFEA.
RESPUESTA
Pau/ Heggarty
Universidad de Edimburgo
Nos ha resultado a la vez agradable e instructivo leer en cada uno de los comentarios las muy
valiosas y perceptivas reacciones de parte de cuatro destacados especialistas en lingüística andina,
además de sus sugerencias, consejos, críticas acertadas y propios aportes con datos nuevos a los
debates . A nuestro parecer, sus contribuciones
conforman un modelo de debate lingüístico informado y perspicaz, por lo cual quisiéramos expresar nuestro agradecimiento a cada uno de ellos.
Para empezar, nos corresponde dejar claro más de cuanto lo hemos logrado en el artículo
mismo, quizás- que compartimos un buen número de las reservas expresadas por los comentaristas en lo que respecta a algunas cuestiones
70
metodológicas. En efecto, algunas de estas reservas son tan naturales que resultan incluso inevitables para cualquier científico familiarizado profundamente con la naturaleza del lenguaje, la historia de las lenguas, y las relaciones entre ellas.
Todos los comentaristas, especialmente
Adelaar, expresan un nivel de cautela bastante
comprensible en cuanto a la aplicación de un método enteramente novedoso, de nuestra autoría,
para cuantificar el grado de semejanza en semántica léxica. Se inscribe además dentro de un campo que a su vez queda muy novedoso, el de la
aplicación a datos lingüís ti cos de métodos
filogenéticos tirados de las ciencias biológicas. Para
poder conocer más a fondo este nuevo campo de
la lingüística, nos permitimos señalar a nuestros
lectores dos libros que sin duda se volverán obras
de referencia. Notamos, no obstante, que al momento de publicar el presente artículo, ambos si -
Revista Andina
Pau/ Heggarty: Enigmas en el origen de las lenguas andinas
guen en prensa, por lo cual no fue posible ponerlos a disposición de los comentaristas. En julio
del 2004, se llevó a cabo en la Universidad de
Cambridge un primer simposio multidisciplinario
sobre Métodos filogenéticos y la prehistoria de
las lenguas, del cual se publicarán las actas, editadas por Renfrew, Forster & Clackson (2005, en
prensa). Se espera igualmente la próxima publicación de McMahon & McMahon (2005 , en prensa), que considera enteramente la aplicación de
métodos cuantitativos a la comparación de lenguas, incluyendo varios otros métodos además de
los análisis filogenéticos.
Terminología
En primer lugar, intentaremos esclarecer algunas cuestiones relativas a la terminología, pues
tal parece que en algunos casos no hemos sido lo
suficientemente claros en función del sentido específico requerido. Al parecer, nuestro empleo
del término " genealógico" antes que "genético"
ha generado algunas confusiones. Para referimos
a las relaciones de origen común entre los idiomas, nos hemos valido del término "genealógico",
exactamente en el mismo sentido que tradicionalmente ha solido utilizarse entre los lingüistas la
palabra "genético". Así, no hacemos sino adscribimos a una tendencia creciente en lingüística que
opta por dicha elección en tanto que considera
que "genealógico" ofrece una analogía más directa
con respecto al tipo de relaciones de parentesco
entre las lenguas "ancestrales", "hijas", "hermanas", etc. De igual modo, nos ayuda a evitar confusiones entre las varias disciplinas que se interesan por investigar los orígenes de las poblaciones
humanas, por medio de comparaciones no sólo de
sus lenguas sino también del perfil genético de
esas poblaciones (en el sentido original biológico
de la palabra 'genético').
En cuanto a nuestro uso de la palabra variedades, allí donde Cerrón-Palomino percibe una
ambigüedad en este término es justamente donde
vemos más bien su atractivo para nuestros fines.
Lo más notorio del término dialecto son las varias
interpretaciones a las cuales se presta, particularmente cuando s, le aplica al quechua. El quechua
Ayacucho-Chanca, por ejemplo, ¿se debería considerar un dialecto diferente al Cuzco-Callao, o
son ambos más bien sólo integrantes de un único
"dialecto" que mejor habría que llamar el quechua
sureño? El presente estudio busca, a propósito,
Nº 40, primer semestre del 2005
investigar todos los niveles de diferencia que se
dan al interior de la familia quechua, desde las
variedades más similares hasta las más diferentes
entre sí. En estudios como el nuestro, nos resulta
indispensable un término que permita referir indistintamente a cualquier nivel de diferencia, libre
de toda connotación, no deseada, con respecto al
grado particular de similitud y/o de relación
genealógica, sin necesidad de recurrir constantemente a especificaciones o calificativos . El ténnino 'variedad' - o por lo menos su equivalente en
inglés 'variety'- ya ha logrado imponerse entre
dialectólogos como término estándar.
Albó, por su parte, caracteriza nuestro método como una "neo-glotocronología moderada y
razonable". Por cierto, el empleo del término
'glotocronología ' tiene una larga historia como
simple sinónimo de 'léxico-estadística' , pero,
como lo han venido señalando muchos lingüistas
desde hace ya varios años, es posible y preferible
distinguirlos. Así, resulta perfectamente posible
cuantificar cuánto se parecen dos lenguas en su
semántica léxica (la léxico-estadística), sin que ello
implique vemos en la obligación de adoptar alguno de los supuestos, inválidos, sobre tasas de
cambio regulares a través del tiempo, propuestos
con la finalidad de calcular fechas de separación
de lenguas ancestrales a partir de sus cuantificaciones. Hoy en día, la mayoría de lingüistas
aboga por que se reserve el término glotocronología únicamente para esta aplicación específica
de la léxico-estadística: es decir, la datación. Pues,
a partir de esta interpretación terminológica, debemos aclarar que nuestro método ciertamente no
constituye ninguna forma de glotocronología ,
método que nosotros seguimos considerando
"muerto y enterrado" (iY que en eterna paz descanse!). Más bien, en este contexto, lo que sí nos
interesa "resucitar" es únicamente la esencia de
un estudio léxico-estadístico como una forma de
comparación entre lenguas a partir de su semántica léxica. Porque, de hecho, preferimos no asociar
nuestro método, tan estrechamente, tampoco con
el término léxico-estadística, con sus conocidas
fallas metodológicas, ya que pusimos tanto esmero en desvincular nuestra propia técnica de ellas.
Otro problema es hablar de "listas de palabras" como tradicionalmente se ha venido haciendo, que es tal como Albó sigue considerando cuando se refiere a nuestro "conjunto limitado de palabras cuidadosamente seleccionadas". En nuestro artículo, muy cuidadosamente, hablamos úni-
71
Estudios y Debates
camente de "nuestra lista de 150 significados",
no de "palabras", y eso justamente porque, a diferencia de la léxico-estadística tradicional, nuestro método de ninguna manera insiste en que a
priori debe haber una correspondencia de uno a
uno entre significado y lexema. Recuérdese que
consideramos subsentidos, sinónimos, la importancia relativa en el léxico de cada lexema registrado, las correlaciones evidentes o plausibles entre
lexemas, etc .. Así es que se explica porqué no
resulta posible presentar tales datos para ninguna
variedad andina en una simple lista de 150 lexemas
equivalentes en quechua o en aimara. La estructura que se requiere necesariamente es más compleja que una simple lista, así que para ver los datos
para cada variedad estudiada los lectores necesariamente tendrán que descargar nuestra base de
datos, estructurada de la forma apropiada. Allí
también, en las notas que acompañan a cada uno
de los 150 significados, se encuentran las respuestas a preguntas como la de Albó, quien quiere
saber cuáles son los sentidos exactos que buscamos para significados como 'con' (en este caso,
no buscamos sino el sentido de acompañamiento). Se considerarán, además, un conjunto de explicaciones teóricas más completas en Heggarty
(en preparación).
Asuntos específicos sobre el método y los datos
El comentario de Cerrón-Palomino incluye un
resumen admirablemente claro y sucinto de nuestro enfoque metodológico, aunque contenga algunos fraseas que eventualmente pueden dar una
impresión de que atribuimos a los métodos mismos ciertas capacidades 'diagnósticas' exageradas para fines lingüísticos; o bien, que aplicamos
ciertos supuestos a priori con respeto a que algunas configuraciones particulares en los gráficos
necesariamente corresponderían a explicaciones
lingüísticas específicas. Nos referimos a los comentarios que citamos a continuación: "Tales relaciones, insiste el autor, deben ser tomadas como
producto de los contactos idiomáticos antes que
de cualquier filiación genética"; y "el autor insista
en que el programa busca visualizar las relaciones
genealógicas".
En sentido riguroso, los programas de análisis filogenético no constituyen nada más que una
manera para procesar los datos numéricos que les
son introducidos como aducto , sean ellos
cualesquieran. Cuando se trabaja con complejos
72
de hasta veinte o más variedades lingüísticas, como
en nuestro estudio, las configuraciones multidimensionales de grados de similitud o diferencia
entre todas ellas contienen sí mucha información
muy útil sobre las relaciones que gi\iardan entre sí
estas variedades, pero tales configuraciones llegan a ser muy intricadas, tal como se puede apreciar en las cifras en la Figura 2. Los programas de
análisis filogenético no sirven sino para ayudarnos a visualizar estas relaciones muy complejas
en una forma más fácilmente entendible, sobre
todo por ser sintetizada en tan sólo dos dimensiones. Los programas son enteramente neutros
con respecto a cuál podría ser la verdadera explicación histórica para cualquier grado de similitud
o diferencia. Cualquier escenario real que proponemos como explicación de tales relaciones de
similitud/diferencia, no es más que una interpretación, ofrecida desde nuestra capacidad como lingüistas. Así, en nuestro artículo intentamos identificar algunas configuraciones en los gráficos que
parecen reflejar el origen común (la distinción muy
nítida que opone todas las variedades del quechua
a todas las aimaráicas), y otras que imaginamos
reflejan sólo el contacto idiomático (los enlaces
entre el aimara sureño y el quechua sureño para
los significados menos estables). Así, a diferencia
de lo que tal vez se pueda entender de los comentarios de Cerrón-Palomino, citados líneas arribas,
no hay ninguna ' regla de interpretación ' sencilla
que se puede aplicar automáticamente en todos
los casos. Nótese más bien que es precisamente
en esta tarea de interpretación, que tiene su mayor utilidad la di stinción entre significados
inherentemente más estables y menos estables.
Adelaar pregunta porqué no nos hemos valido de varios diccionarios ya publicados; entre ellos
se podría destacar, por ejemplo, su léxico del
quechua de Pacaraos (Adelaar 1982). La explicación se encuentra en los requisitos inherentes a
nuestro método, tal como Cerrón-Palomino comprende en su comentario claramente, expresándolo
además con mayor nitidez que nosotros mismos:
"De allí que, a fa lta de datos más precisos, se haga
necesario el trabajo de campo" . A continuación,
Cerrón-Palomino advierte algunos riesgos metodológicos : "la propensión a caer en subjetivismos",
las "falsas asociaciones" y la "etimología popular". Pues bien, debe quedar claro que en nin gún
momento del procedimiento de recolección de
datos se les pide a los informantes juzgar si unos
lexemas dados son o no son correlatos, ni mucho
Revista Andina
Pau/ Heggarty: Enigmas en el origen de las lenguas andinas
menos proveer ninguna etimología popular. Tales
juicios corresponden siempre únicamente al lingüi sta, ya que necesariamente requieren conocimientos lingüísticos detallados. Estos conocimientos deben abarcar, a la vez, los cambios de sonido
ocurridos en cada variedad en cuestión, y los cambios generales que se saben típicos de las lenguas
andinas (se piensa por ejemplo en los clásicos
patrones de metátesis: vea la documentación suplementaria que se puede descargar de nuestra
página web).
Albó, por su parte, pide un análisis que inc luya informaciones sobre préstamos del castellano,
ya que opina que "quizás nos podría dar una pista adicional sobre el peso que el contacto puede
haber tenido en otros casos". De hecho, tales cálculos, al igual que sus representaciones gráficas
correspondientes, ya han sido producidos, y es
muy cierto que son de utilidad: se nota, por ejemplo, una frecuencia mucho más elevada de préstamos del castellano entre los sign ificados menos
estables que entre los más estables, lo que no hace
sino confirmar la validez de la distinción que queremos establecer entre ellos. Tales resultados se
prestan, no obstante, a esclarecer cuestiones bastante diferentes a las que forman el propósito de
nuestro artículo - es decir, investigar los orígenes
de los idiomas andinos- y los gráficos resultan
mucho más expuestos a interpretaciones que no
serían sino engañosas para este fin .
Los comentaristas también ofrecen observaciones específicas sobre varios de los significados
y lexemas que figuran en nuestra lista de 150 significados y/o en las ejemplificaciones de nuestro
método, para expresar sus dudas y/o para ofrecemos más datos a su propósito. De hecho, en
muchos de estos casos las complejidades que nos
señalan son precisamente las que se ha buscado
acomodar en el diseño de nuestro nuevo método
de comparación en semántica léxica. Albó menciona, por ejemplo, el caso del significado hablar,
y de hecho para las variedades bolivianas del
quechua (y algunas otras) el lexema principal que
figura en nuestra base de datos es, efectivamente,
parlay (un préstamo antiguo del castellano); mientras que rimay no figura sino en ciertos sentidos
más limitados. Así que, justamente, nuestros cál culos del grado tle similitud entre una de estas
variedades y cualquier otra en la cual rimay sigue
siendo la palabra básica, reflejan tales diferencias.
Tales detalles para cada uno de los 150 significados se pueden consultar en nuestra base de datos.
Nº 40, primer semestre del 2005
Los datos que nos aporta Adelaar para los
significados cabeza y sol, por cierto, son de mucho va lor en el esfuerzo para establecer si algunos
lexemas dados se deben identificar como de origen quechua o más bien aimara, datos históricos
importantes y muy útiles en los casos en los cuales sí podemos alcanzar una respuesta conc luyente. Debemos repetir, sin embargo, que para
calcular el grado de similitud entre las variedades
en su semántica léxica, la dirección de ta les préstamos de hecho no ha de entrar en los cálculos: el
dato crucial para producir tales resultados es únicamente la configuración de cuáles variedades comparten cuáles correlatos. Por supuesto, hay muchos casos bastante evidentes, tal como se da sobre todo cuando un lexema se revela 'panquechua ',
al lado de otro ' pana imaráico'. Pero para producir nuestras cuantificaciones no se requiere ninguna decisión sobre cuál de las familias (aparte el
castellano) resulte ser el origen de cualquier lexema
dado. Es más: ningún dato de este tipo figura en
ninguna parte de la base de datos. Tales conoci mientos nos sirven más bien en nuestras evaluaciones de la plausibilidad de que dos lexemas sean
correlatos o no, tal como Adelaar mismo lo señala
cuando habla del " posible origen aymaráico" de la
raíz piqa. Pero, una vez más, aquí se trata precisamente de un tipo de escenario que nos hemos
esforzado por acomodar en nuestro método. Justamente, en nuestra base de datos el lexema piqa
se ha señalado con una plausibilidad relativamente alta que sea correlato con el aimara p 'iqi, exactamente como el mismo Adelaar sugiere.
Selección de variedades
Más de un comentarista cuestiona la selección de las variedades andinas incluidas en nuestro estudio hasta la fecha, y lamenta los pocos
detalles que se dan en el artículo para justificar
nuestras elecciones. A ellos convocamos, pues, a
las explicaciones y justificaciones suplementarias
presentadas en la página web de nuestro proyecto: debido a la carenc ia de espacio en el artículo
mismo.
Nuestros lectores bien pueden confiar en que
tenemos plena conciencia de las limitaciones de
nuestra cobertura actual de variedades andinas, y
de lo deseable que es incluir otras más para llenar
estas lagunas. Así que muchas de las variedades
resaltadas por los comentaristas figuran ya desde
hace tiempo en nuestra página web, en la lista de
73
Estudios y Debates
las variedades adicionales que con más urgencia
nos proponemos incluir, apenas se nos presente
la ocasión para ulteriores trabajos de campo.
En respuesta a algunos comentarios específicos, debería hacer recordar a los lectores que el
quechua de Ferreñafe sí está incluido en nuestro
estudio, variedad que hemos denotado con el
topónimo más específico para nuestro lugar de
trabajo de campo, Incahuasi. De igual manera, figuran ambas variedades del aimara central, es decir el cauqui de Cachuy y Canchán, y el jacaru de
Tupe .
En lo que concierne a las advertencias hec has
por Adelaar acerca de la viabilidad de efectuar
todavía trabajos de campo sobre el quechua de
Chachapoyas y de Pacaraos, nuestras intenciones se basan para el primer caso en una consulta a
Gerald Taylor, quien opinó que aún puede haber
posibilidades para tales trabajos, para lo cual nos
ha provisto de algunos nombres de pueblos e informantes . Para el segundo caso, nos basamos en
nuestra propia visita a Pacaraos, donde - entre
afectuosos recuerdos de un eminente quechuista
holandés- sí hemos logrado encontrar algunos
ancianos que recordaban algo de la variedad local
del quechua. Sin embargo, fueron ellos mismos
quienes nos animaron a regresar en otra ocasión
para encontramos con dos hablantes más, quienes desafortunadamente no se encontraban en el
pueblo durante el periodo en el que lo visitamos,
pero los cuales se suponía estarían en mejores
condiciones para ser nuestros informantes. No
obstante, bien podemos imaginar que se confirmen las dudas de Adelaar en cuanto a la viabilidad
del trabajo de campo necesario.
En último lugar, tal vez nos sea permitido
apelar a alguna consideración del hecho de que
nuestro estudio se ha efectuado en el curso de
sólo un año y medio, y que no forma sino parte de
un proyecto de investigación cuyo objetivo principal es más bien de corte metodológico : desarrollar, poner a prueba y evaluar una nueva metodología. Este enfoque necesariamente influyó en
nuestra selección de las variedades por incluir, tal
como se explica en nuestra página web. La cobertura limitada de sólo veinte variedades se atribuye además a una insistencia por nuestra parte, en
que para que tenga verdadero valor, nuestro método tenía que exigir un nivel de precisión y de
detalle considerablemente más alto que la léxicoestadística tradicional, un estándar que supone
como fu entes no diccionarios sino nuestros pro-
74
pios trabajos de campo, y en la mayoría de los
casos hasta una segunda visita de confirmación a
cada lugar de trabajo de campo.
En vista de tales consideraciones, y de nu estros muchos centenares de horas de viaje por autobús a través de tres países andinos, no obstante
la " inexactitud histórica" que Adelaar supone ver
en nuestra aserción, seguimos sintiéndonos en
condiciones como para reafirmar que efectivamente las condiciones para el trabajo de campo sí se
han mejorado de forma notoria desde la época del
estudio de Büttner (y bien sabemos en qué momento se llevó a cabo la mayoría de este trabajo).
Tenemos todas las razones como para dudar de
que nuestro itinerario hubiera sido tan fác il , o siquiera remotamente factible en un lapso tan corto
por la red vial de los países andinos en los años
1960 y 1970. De igual manera, la gran mayoría del
material publicado más útil e informativo sobre el
cual hemos podido basar nuestras investi gaciones -obras claves sobre la lingüística andina, entre ellas algunas del mismo Adelaar- se ha publicado años después del trabajo léxico-estadístico
de Büttner. Así que no nos estábamos refiriendo
principalmente ni a los años tan difíciles de los
80's, ni a la situac ión de seguridad, tal co mo lo
supone Adelaar. En nuestras afirmaciones al respecto medimos nuestras palabras con cuidado, y
más bien son estas interpretaciones por parte de
Adelaar que han llevado a lo que nos parece un
simple malentendido, ya que no fa ltan otras consideraciones pertinentes, en vista de las cuales no
hay ninguna "inexactitud histórica" en lo que hemos escrito.
Adelaar clama además por extender la cobertura hasta variedades de otras familias lingüísticas
andinas que no sean el quechua ni el aimara . No
podemos, sin embargo, aceptar que en nuestro
trabajo "Falta una motivac ión para no incluir"
variedades como las que nos cita, entre ellas por
ejemplo el puquina, ya que para esta lengua el
trabajo de campo es evidentemente imposible, y
los conocimientos que se tienen de su léxico no
son lo suficientemente detallados ni fiables como
para permitir que se le aplique nuestro método de
manera adecuada. En cuanto a nuestra inclusión
del chipaya, Adelaar la menciona en estos términos : " ... sólo ha sido agregado el chipaya como
tercer elemento en la comparación, pero esta lengua fue dejada de lado casi inmediatamente y sin
mayor discusión". Pero basta sólo echar un vistazo a las cifras y los gráficos correspondientes
Revista Andina
Paul Heggarty: Enigmas en el origen de las lenguas andinas
para que quede manifiesto porqué no se ha procedido a discusiones ulteriores sobre la posición del
chipaya frente a los demás idiomas andinos incluidos. Mas bien quisiéramos invitar a Adelaar a
construir cualquier argumento informativo sobre
la historia de las relaciones entre el chipaya y el
quechua y/o el aimara, en base a los datos en las
Figuras 2 y 3. Estos no tienen casi nada qu e enseñarnos al respecto, si no es sólo para confirmar la
impresión de que el chipaya tenga algunas semejanzas algo mayores con el aimara que con el
quechua; intentar sacarle cualquier otra conclusión sería caer en la pura especulación. Nuestros
datos ofrecen evidencias abrumadoras de que no
hay similitud significativa entre el chipaya y estas otras lenguas en nuestra muestra de léxico básico; y que por lo tanto, cualquier relación que
pueda haber entre ellas es de orden complemente
diferente y mucho más remoto aun que la que
existe entre el quechua y el aimara.
Por supuesto, tales observaciones de ninguna
manera deberían disminuir la importancia de seguir investigando las relaciones posibles entre estas lenguas: sus paralelismos tipológicos, los contactos que ha habido entre ellas, y eventualmente
sus enlaces de parentesco a niveles ex tremadamente remotos, si es que existe alguna metodología de verdad adecuada para investigarlo. Seguramente cada lector del presente artículo saludará la
amplitud de los conocimientos del cual atestigua
la nueva y magistral obra del mismo Adelaar (2003), a saber su Languages ofthe Andes, y
hasta su coraje intelectual para abordar cuestiones tan amplias cuanto peliagudas de dilucidar.
Sin embargo, el hecho es que aquí no se trata de si
las tareas son de interés intrínseco o no ; sino de
cuáles son los métodos adecuados para acometerlas en la investigación . Antes que lamentar que
nuestro trabajo represente un "paso atrás" por la
"limitación" de nuestra cobertura de variedades
andinas, recordamos la posición tan clara que ocupa el chipaya en nuestros resultados. De ella se
desprende más bien una advertencia, la cual nos
revela allí donde en verdad podemos correr el riesgo
de dar " pasos atrás" y contraproducentes.
En la historia de la investigación de métodos
cuantitativos par,\ fines lingüísticos, nada ha venido a atrasar esta empresa más que la ambición
desmesurada en buscar emplear un método dado
- la comparación en semántica léxica básica- para
resolver cuestiones que simplemente no tenía la
c_o mpetencia para resolver, tal como lo hemos
Nº 40, primer semestre del 2005
señalado en nuestro artículo. Peor aun, las debacles
de la glotocronología y luego de la llamada 'comparación multilateral ' de Greenberg ( 1987) llevaron no sólo a que estos dos métodos tenninasen
siendo rotundamente desacreditados, sino que
durante largos años se dejó sin investigar cualquier otro enfoque cuantitativo, inclusive aquellos razonab les y valiosos, al estar cortados por el
mismo patrón que aquellos.
Con las presentes investigaciones hemos buscado idear un método adecuado para distinguir de
manera bastante fina entre variedades que se saben 'correlacionadas' en un grado bastante o muy
estrecho. Por lo tanto, no necesariamente será el
método indicado para comparaciones a escala
mucho más amp lia, como para investigar eventuales relaciones que remontarían hasta épocas
mucho más remotas aún, como las sugeridas por
Adelaar. El ro l que cumple el chipaya, en nuestros resultados , es el de subrayar cuan débil pueda ser la señal de correlación en tales casos. Así ,
nos enseña las limitaciones inherentes en los datos mismos, y nos recuerda la mucha cautela con
la cual debemos proceder para evitar caer en las
mismas fallas metodológicas y especulativas del
pasado. Detenerse un paso antes de la zancada
final que nos llevaría a volver a caer al abismo, no
constituye por lo tanto un paso ''atrás" .
Con todo esto, no queremos decir que no sean
posibles eventuales adaptaciones y extensiones
de nuestro método, para que tal vez pueda contribuir de alguna manera a las cuestiones aun más
amplias de las cuales nos habla Adelaar. Pero tales extensiones del método son pasos para dar
sólo una vez que ya esté establecido y comprobado en casos mejor conocidos, tal como los que
presentamos en el presente artículo . De hecho,
entre los cuatro comentaristas, es el propio
Ade laar quien parece el más escéptico en cuanto a
la viabilidad del método. El alcance del presente
artícu lo ya nos parece no poco ambicioso, ya que
estamos presentando un método completamente
novedoso, así que consideramos más prudente
aplicarlo primero a las cuestiones para las cuales
está mejor diseñado y resulta ser de evidente utilidad. A estas alturas, ha sido una decisión muy
deliberada no aventurarnos todavía más lejos, sino
esperar un momento mientras averiguamos qué
terreno pisamos, y nos parece una ' limitación'
bastante razonable que nos libra de repetir los
catastróficos errores del pasado.
75
Estudios y Debates
La semántica léxica al lado de la fonología, la
morfología y la morfosintaxis
Hay un aspecto de nuestro enfoque metodológico que es criticado por cada uno de los comentaristas. Todos ellos preguntan cuánto puede ser
válido basar la clasificación de una familia lingüística en resultados derivados tan sólo de la semántica léxica y no de otros campos, notablemente de
la fonología y la morfología. Así que, a todas luces, parece que no subrayamos de manera suficientemente clara que nosotros mismos somos
plenamente conscientes de esta limitación, así
como de sus consecuencias. Quizás no repetimos
con la frecuencia debida a lo largo del artículo la
reserva muy importante de que las deducciones
que hicimos sobre las clasificaciones de las variedades andinas valen "sólo" en el nivel de la semántica léxica. Por supuesto, estos datos por sí
solos de ninguna manera bastarán.
Estamos, pues, enteramente de acuerdo con
Cerrón-Palomino en que nuestro método no es
"una alternativa a los métodos tradicionales de la
lingüística histórica, sino un procedimiento auxiliar". No obstante, su utilidad no está limitada únicamente a los casos citados por Cerrón-Palomino,
es decir aquellos en los cuales "no están dadas aún
todas las condiciones para una aplicación exitosa
de los mismos [los métodos tradicionales]". De
hecho, entre las principales ventajas de nuestro
método, y de los métodos cuantitativos en general, está la que resume Adelaar cuando observa
que: "Aquí se trata de una conclusión a la que no
es fácil llegar en base a una inspección meramente
impresionista"; y nosotros añadiríamos: "no cuantificadas". Es este poder de síntesis el que nos
permite evaluar de forma más equilibrada la importancia relativa de eventuales señales
entrecruzadas en los datos (tal como los contactos
entre las variedades centrales y sureñas del aimara
y del quechua), al igual que su impacto proporcional dentro de la lista global de significados.
Por otro lado, y aunque por ello corriéramos
el riesgo de decepcionar a nuestros lectores, mejor haríamos en clarificar con anticipación algunos aspectos de la próxima etapa de nuestro estudio. Nuestra futura investigación, pues, consiste
en una comparación de la similitud entre estas
mismas variedades en el nivel fonético, término
que empleamos no en su sentido más amplio sino
en el más estrecho; es decir, no nos referimos a
una comparación en el nivel fonológico. Más
76
específicamente, presentaremos nuestras cuantificaciones de la importancia relativa de todos los
cambios de sonido divergentes que han surgido
entre estas variedades en la pronun,ciación de unos
100 lexemas cognados; es decir, de cualquier diferencia de sonido entre ellas, surgida desde la
época de su protolengua. Necesariamente , pues,
tendremos que hacer dos estudios enteramente
independientes, uno sobre la familia quechua, otro
sobre la aimaráica. Además, la 'fonética histórica'
es un campo en el cual ciertos cambios de sonido
idénticos, o por lo menos muy parecidos, se ven
con bastante frecuencia ocurrir de manera independiente y paralela en más de una variedad. Por
lo tanto, aunque estos datos sobre la similitud
fonética sí pueden ser de mucho interés y utilidad, no siempre resulta tan sencillo llegar, a partir
de ellos, a interpretaciones directas para la historia y clasificación lingüística.
Este método fonético no abarca criterios
morfológicos ni sintácticos. Más bien, en vista
del llamado de Albó para que ampliemos nuestras
investigaciones, cabe otra advertencia. En toda
empresa que busca convertir los datos lingüísticos
en alguna forma cuantificada, existen ciertos problemas críticos para asegurar que ésta tenga verdadero sentido en cuanto representación numérica de las relaciones entre los idiomas. Estos problemas son particularmente dificiles de superar
en la morfosintaxis, tal como se puede demostrar
en el caso de los estudios comparativos y cuantitativos que hasta la fecha se han intentado en este
campo. Sobre todo, estos estudios tienden a hacer sus comparaciones en base a listas muy limitadas de características gramaticales preseleccionadas, las cuales por lo tanto corren el riesgo
de ser ni muy representativas ni equilibradas.
Hemos intentado aportar soluciones a este
problema, y otros más, a través del empleo de
otro método, el cual hemos desarrollado para cuantificar la similitud de las lenguas en base a su
morfosintaxis básica (tal como se explica en
Heggarty en preparación). Sin embargo, aquel
método busca cuantificar diferencias tipológicas
más que fonéticas o de cognación de morfemas.
Así que dado el elevado nivel general de similitud
tipológica entre las lenguas andinas, resulta cuestionable si tal método podría o no contribuir de
manera valiosa a muchas de las preguntas claves
de la lingüística comparativa andina. No hemos
de caer en el consabido error de interpretar como
evidencias de parentesco genealógico ciertas es-
Revista Andina
Pau/ Heggarty: Enigmas en el origen de las lenguas andinas
tructuras paralelas que bien podrían no ser nada
más que semejanzas tipológicas bastante generales.
Volviendo a nuestro método para la semántica léxica, allí dónde Itier escribe: "El método cuantitativo probablemente no pueda reemplazar el
método comparativo y la historia en la reconstrucción de l desarrollo histórico de las lenguas",
no sólo estamos enteramente de acuerdo, sino que
incluso sustituiríamos "probablemente" por "sin
ninguna duda". La contribución al debate que puede
aportar el presente artículo se limita únicamente a
la semántica léxica, y es al interior de este campo
que intentamos proveer una visión global de las
relaciones entre las variedades consideradas que
sea explícitamente más equilibrada, por el hecho
de haber sido estas relaciones cuantificadas y no
sólo evaluadas de una manera más bien
impresionista. Las impresiones no cuantificadas
no siempre nos han llevado a una visión necesariamente certera; y efectivamente, como vemos,
las evidencias de la semántica léxica no apoyan a
la clasificación tradicional.
Sin embargo, compartimos igualmente la convicción de Adelaar de que "Reconstruir la genealogía interna del Quechua exclusivamente en base
al léxico, sin incluir los argumentos fono lógicos y
morfológicos tan esenciales, no puede llevar a
conclusiones definitivas". Evidentemente, la semántica léxica no es sino un nivel entre los varios
que se tienen que tomar en cuenta para poder
establecer la clasificación del quechua (o de cualquier otra familia o lengua). Más en sólo un artículo, el cual abarca ya no pocos temas y busca,
ante todo, presentar una metodología para la comparación en la semántica léxica, no nos pareció
apropiado - aun si para ello hubiera habido el espacio suficiente- entrar en detalle sobre los múltiples aspectos y detalles pertinentes a la clasificación del quechua. Así se explica porqué no hemos tratado, por ejemplo, como nos lo pide
Adelaar, "los paralelos en el desarrollo del sistema verbal de referencia personal" entre ciertas
variedades del quechua (ver más bien nuestra expi icación alternativa, 1íneas abajo).
Es importante considerar que las relaciones
que se evidenciall\ entre un conjunto de idiomas
pueden variar de un nivel a otro. Además, tales
diferencias pueden resultar muy informativas, ya
que cada uno de los niveles tiene sus propias características. De un lado, la semántica léxica por
lo general está más expuesta al contacto y al prés-
Nº 40, primer semestre del 2005
tamo, aunque por nuestra técnica de la separación
en sublistas más y menos estables hemos buscado aprovechar esta característica para fines 'diagnósticos'. De otro lado, la semántica léxica intrínsecamente padece algo menos que la fonética y la
morfología de la tendencia a cambios en paralelo,
los cuales remontan a innovaciones no compartidas sino parecidas pero independientes. Esta explicación puede va ler particularmente en casos en
los cuales las variedades se desarrollan a partir de
una etapa más ancestral del idioma, caracterizada
por alguna libre variación entre algunos morfemas
o sonidos alternativos. Son precisamente estos
dos fenómenos los que tal vez puedan ofrecer una
explicación alternativa para algunas de las semejanzas inesperadas observadas entre ciertas variedades del quechua que en la mayoría de los
demás aspectos parecen bastante diferentes. Pensamos por ejemplo en las semejanzas entre el
quechua argentino y ciertas variedades no sureñas,
sacadas a la luz por Adelaar ( 1995) y de Granda ( 1999), entre otros.
Ya que reconocemos que la semántica léxica
por sí sola no podría bastar para establecer una
verdadera genealogía del quechua, hay también
que considerar la otra cara de la moneda: tampoco
bastan sólo unos pocos criterios seleccionados de
la morfología o la fonología. La gran fachada de la
clasificación del quechua en base a una bifurcación QI-QII, se ha fundamentado en un número
bastante limitado de rasgos morfológicos y
fonológicos, los cuales no constituyen sino aspectos parciales de la cuestión.
No quisiéramos, pues, sugerir que la bifurcación QI-QII se debe descartar en base únicamente a los datos léxicos. Evidentemente, tales evidencias serían insuficientes y nunca imaginamos
que este método de por sí solo pudiera resolver
de un tirón toda la clasificación del quechua. El
hecho a remarcar es que justamente tales evidencias léxicas no están solas. Ellas, más bien, encuadran en un contexto en el cual durante los últimos
años los argumentos morfológicos y fonológicos
a favor de una bifurcación nítida QI- QII se han
puesto cada vez más en tela de juicio. Esto se
desprende de varios hallazgos de Taylor, y especialmente del desafio muy directo y convincente
a los criterios tradicionales en Landerman ( 1991 ).
Podemos también tomar en cuenta los datos suplementarios provistos a su vez por Itier en su
comentario al presente artículo, los cuales le llevan a la conclusión de que "El QII probablemente
77
Estudios y Debates
no fue en su origen sino uno de los representantes
más extremos de ese continuo dialectal". Parece,
pues, que Adelaar tiene algo más confianza que
otros investigadores en lo convincente y lo sólido
de los argumentos tradicionales de corte
morfológico y fonológico.
Así que lo que nos permite aquí atrevernos a
ver en nuestros resultados algún grado de importancia en el debate es que demuestran que la semántica léxica también ofrece objeciones convincentes a la idea de una primera bifurcación nítida
en la historia temprana del quechua. Su contribución al debate se encuentra en su capacidad de
ponerjaque esta explicación tradicional , por no
ser apta para explicar de manera convincente algunas de las relaciones manifiestas que se dan
entre las variedades del quechua.
De allí que la segunda tarea del presente estudio es proponer una explicación alternativa, en
términos de una fragmentación mucho más paulatina, más bien en un continuo dialectal. Así, mientras que Adelaar aboga por que no abandonemos
la distinción QJ- QII, ya que sólo "resulta necesario refinarla", nosotros no nos logramos convencer de que serán suficientes tales pequeños ajustes a la clasificación tradicional. Más aún, deberíamos armarnos del coraje incluso como para ir
mucho más lejos si es necesario.
Lo fundamental es acordarnos primero de lo
que en verdad quiere decir el hablar en términos
del QJ versus el QII. Por supuesto, es innegable
que hay alguna 'distancia lingüística' considerable entre, de un lado, un grupo de muchas variedades del quechua central, y, del otro lado, un grupo
de variedades norteñas y sureñas, algo más parecidas entre ellas que con las centrales. Hasta aquí
todo resulta patente, y por cuanto sepamos no
haya ningún lingüista que lo cuestione. Pero este
único hecho no constituye por sí solo una justificación para hablar en términos de QJ versus QII,
lo cual necesariamente implica una visión de un
árbol genealógico en el cual las diferencias corresponden a una primera bifurcación y, la más fundamental, en la historia de la familia quechua.
Imaginar que se trata sólo de "refinar" en algo
el análisis de la bifurcación QJ-QII corre el riesgo
de malinterpretar lo que supone el uso de estos
términos. El asunto no es tan sencillo como para
decir que hay algunas variedades claramente de
'tipo QJ' y otros de 'tipo QJJ' , si con estos términos no queremos decir nada más que dos polos
particulares dentro de un continuum dialectal.
78
¿Qué sentido pueden tener el contraste QJ versus
QIJ, si existen variedades que se clasifican de los
lados opuestos de la supuesta línea divisoria pero
que en realidad son mucho más cei¡canas (en todos
los sentidos) entre sí que a otras variedades al
interior de su propia rama QI o QII? ¿Acaso podemos hablar de variedades "Q! Yi''? Es simplemente erróneo un árbol genealógico que separa en
lados diferentes de la bifurcación supuestamente
fundamental variedades manifiestamente intermedias que se saben muy cercanas entre sí.
No es cuestión, pues, de refinar algunos detalles menores; el asunto es mucho más profundo.
Una bifurcación - sobre todo una que se muestre
tan fundamental y de base como la supuesta
QI- QII- comporta por definición el concepto de
una oposición, y de un desarrollo histórico marcado por una ruptura fundamental. Por lo tanto, tal
bifurcación no se presta a ser "refinado" a tal punto que pueda ser compatible con su propia antítesis, a saber, los conceptos de variedades intermedias y del continuum dialectal. No se trata de dos
análisis diferentes en un nivel abstracto pero que
vienen a ser efectivamente la misma cosa; todo lo
contrario, corresponden a dos visiones marcadamente diferentes de la historia temprana del
quechua. En vista de lo que ya sabemos de lo complejo que ha sido la historia sociolingüística de los
Andes, lo que hay que refinar tal vez no sea algún
que otro detalle de la supuesta bifurcación primaria, sino nuestra visión global del proceso de la
divergencia de las variedades del quechua. Eso
implica quizás hasta reformar totalmente nuestra
visión de la historia del quechua, para no insistir a
priori en una sola bifurcación nítida fundamental
y contemplar más bien la posibilidad de una imagen más compleja en forma de un continuum.
La datación
De hecho, es el mismo Adelaar quien acertadamente nos pide cuentas con su advertencia: "De
hecho, la etnohistoria andina no fue tan sencilla".
En cuanto al asunto particular al cual se refiere,
ya ofrecimos líneas arriba (aunque someramente)
una tentativa explicación alternativa. No obstante, Adelaar ciertamente tiene razón, ya que en
aquel punto de nuestro texto hemos caído sí en
una caracterización demasiado sencilla de la historia lingüística.
Sin embargo, lo mismo se podría decir en lo
que concierne a la sugestión al final del comenta-
Revista Andina
Pau/ Heggarty: Enigmas en el origen de las lenguas andinas
rio de Adelaar: "El solo hecho que los antiguos
indoeuropeos conocían la rueda basta para rechazar" cualquier fecha para el protoindoeuropeo que
sea anterior a la invención de la rueda. La lingüística histórica ciertamente no es "tan sencilla" como
para permitirse afirmaciones tan categóricas. Se
trata aquí de una propuesta de la llamada paleontología lingüística , supuesto método de datación
que viene resultando apreciado casi únicamente
por filólogos del indoeuropeo, ansiosos por sacar
más partido de sus reconstrucciones tan meticulosas. A la paleontología lingüística le falta alcanzar todavía cualquier reconocimiento en cuanto
ortodoxia entre los lingüistas históricos, quienes
más bien han demostrado, de manera repetida y
convincente, que tal método se funda en una serie
de supuestos inválidos. A falta del espacio aquí
para entrar en detalles, más bien remitimos a los
lectores a Sims-Williams (1998) y Heggarty (en
prensa b).
Así, el hecho es que no es demostrable que
sea acertada ni la fecha que requiere la 'hipótesis
desde Anatolia' para el indoeuropeo propuesta
por Renfrew, ni tampoco la fecha más reciente
propuesta en base a la paleontología lingüística.
Tal como las describe a su vez el eminente lingüista Dixon ( 1997), tales fechas no son nada más
que un "castillo de naipes". A falta de argumentos verdaderamente convincentes a favor de alguna de las fechas alternativas que se han propuesto, muy a propósito nosotros nos hemos cuidado
de citar sólo una gama muy aproximada de fechas
plausibles.
Efectivamente, la única contribución a la cual
nos hemos aventurado en materia de datación fue
mencionar los ' supuestos por defecto'. Esto lo
hicimos con el único propósito de lanzar un debate sobre las razones posibles para las cuales pudiéramos preferir 110 aplicarlos en el contexto específico de los Andes; y ya hemos visto cómo
Albó e Itier inmediatamente nos han sugerido dos
razones bastante plausibles. Por lo visto, la
datación lingüística es una empresa eminentemente incierta.
Las únicas conclusiones que de todo esto
podemos obtener sin temor a yerro son: primero,
que las supuest~s 'dataciones Iingüísticas' son
muchísimo menos seguras de lo que a menudo se
pretende; y segundo, que por lo tanto bien haríamos en ensanchar la gama de fechas que consideramos. De allí que nos aventuramos a mencionar,
en el caso de los Andes, la posibilidad de conside-
Nº 40, primer semestre del 2005
rar fechas para la expansión inicial del quechua
tan tempranas como la época de la cultura Chavín.
Prevemos volver a este asunto en nuestro artículo siguiente sobre cuantificaciones de similitud
en fonética. Pero lo que menos quisiéramos pretender es .que ninguno de nuestros métodos propuestos tenga la finalidad ni la capacidad de proveer ninguna fecha absoluta para cualquier acontecimiento en la historia de los idiomas: imaginarlo
no sería sino repetir los errores de la glotocronología
y de la paleontología lingüística. Nos parece que
para poder encajar ·el desarrollo histórico de las
familias quechua y aimara dentro de una cronología bastante bien definida, hay un sólo método
verdaderamente prometedor. Este consiste en aprovechamos de todas las herramientas de análisis de
los idiomas de los cuales disponemos, para investigar, en cuanto más detalle podamos, cuáles son
los escenarios lingüísticos más plausibles y que
mejor explican las configuraciones que observamos en la diversidad lingüística al interior de cada
familia. Son estos escenarios lingüísticos los que
luego podemos intentar cuadrar al lado de las evidencias aportadas por otras disciplinas, las cuales
sí tienen la fortuna de disponer de métodos de
datación absoluta mucho más fidedignos; a saber,
la arqueología y la genética de poblaciones. Es a
través de esta nueva síntesis que esperamos poder
avanzar hacia un único escenario histórico, coherente a través de todas estas disciplinas, de los
orígenes de las poblaciones de los Andes.
BIBLIOGRAFIA
ADELAAR, Willem F. H.
1982
Léxico del Quechua de Pacaraos, Documento 45, Centro de Investigación de
Lingüística Aplicada. Lima: Universidad
Nacional Mayor de San Marcos.
1995
"Raíces lingüísticas del Quichua de Santiago del Estero", En: Ana V. Femández
Garay y José Pedro Viegas Barros
(coord.) Actas II Jornadas de Lingüística Aborigen (Buenos Aires 15-18 de noviembre de 1994), pp. 25-50. Facultad
de Filosofia y Letras, Instituto de Lingüística, Universidad de Buenos Aires.
2004
Languages of the Andes (con Pieter
Muysken) , Cambridge: Cambridge
University Press.
79
Estudios y Debates
DE GRANDA, Germán
"Historia lingüística y tipológica
1999
genética del quechua de Santiago del
Estero, Argentina", Revista Andina 33 ,
109-36.
DIXON, R. M. W.
1997
The Rise and Fa// of Languages. Cambridge : Cambridge University Press.
GREENBERG, Joseph H.
1987
Language in the Americas. Stanford:
Stanford University Press.
HEGGARTY, Paul,
en prensa b
" Interdisciplinary indiscipline?
Can phylogenetic methods meaningfully
80
be applied to language data - and to
dating language?" En: Renfrew, Forster
y Clackson (en prensa).
RENFREW, Co lin, FORSTER, Peter y
CLACKSON, James (coordinadores)
en prensa
Phylogen etic Methods and the
Prehistory of Languages. Cambridge:
McDonald Institute for Archaeological
Research.
SIMS-WILLIAMS , Patrick
1998
"Genetics, linguistics, and prehistory :
thinking big and thinking straight" ,
Antiquity 277 , 505-27.
Revista Andina