Correlaciones y Memoria en el Ajedrez

Transcripción

Correlaciones y Memoria en el Ajedrez
Trabajo Final de Licenciatura en Física
Correlaciones y Memoria
en el Ajedrez
Autora: Ana Laura Schaigorodsky
Directores: Orlando V. Billoni - Juan I. Perotti
Facultad de Matemática, Astronomía y Física
Universidad Nacional de Córdoba
Córdoba, 27 de Marzo de 2013
Dedicado a la memoria de
Cecilia Bogudloff.
Agradecimientos
A Orlando Billoni y Juan Perotti por su inconmensurable apoyo y confianza.
A Carlos, Marga y Emilia, mis padres y hermana, por su eterno cariño y paciencia.
A Matías, por estar siempre a mi lado.
A mis amigos y compañeros, en especial a Belén, Gus, Xime y Rafa.
A los profesores de FaMAF que me han enseñado tanto, en especial a Pancho, Omar,
Ricardo y Anfi.
Resumen
Un estudio reciente realizado por Blasius y Tönjes [1] ha atraído la atención de la comunidad científica, pues agrega el juego del Ajedrez a la lista
de sistemas cuyo comportamiento se ajusta a una ley de tipo Zipf-Pareto.
Específicamente, en el trabajo mencionado se muestra que la popularidad
de las partidas se distribuye de acuerdo a leyes de potencias. Este escenario plantea nuevos interrogantes acerca de los mecanismos particulares que
generan este tipo de distribución en el juego del ajedrez. En este trabajo
se extenderá el análisis de dichos resultados empleando herramientas de
la mecánica estadística para determinar la existencia de correlaciones de
largo alcance en secuencias de partidas. Con este fin, se construyen series
temporales a partir de una base de datos de partidas de ajedrez ordenada
cronológicamente, similar a la empleada en el trabajo antes mencionado.
Los resultados obtenidos indican que el sistema presenta correlaciones de
largo alcance y que su existencia está determinada por la presencia de jugadores de alto nivel. Estos resultados son semejantes a los encontrados en
otros sistemas complejos que se ajustan a una ley de Zipf, como lo es lengua
escrita[2], indicando que los mecanismos que dan origen a esta ley deben
tener en cuenta efectos de memoria.
Clasificación: 02.50.Ey Stochastic Processes - 01.80.+b Physics of Games ans
Sports - 05.45.Tp Time Series Analysis.
Palabras Calves: Serie Temporal - Ajedrez - Hurst - DFA - Rango Reescalado Correlaciones de Largo Alcance - Memoria.
5
Abstract
A recent study by Blasius and Tönjes[1] has attracted the attention of
the scientific community by adding the game of chess to the list of systems
whose behaviour follows a Zipf-Pareto’s law. Specifically, in the study the
authors find that the game popularity is distributed following with power
laws. This scenery gives rise to new questions about the particular mechanisms that generate this kind of distribution in the game of chess. In this
study we will extend the analysis of those results by employing tools of
statistical mechanics to determine the existence of long-range correlations
in game sequences. To that end, time-series are constructed using a chronological ordered chess data base, similar to the one used in the previously
mentioned study. Our results indicate that the system exhibits long-range
correlations and that its existence is determined by the presence of high
level players. This result is similar to those found in other complex systems that follow Zipf’s law, like the written language[2], indicating that the
mechanisms that give rise to this law have to take in to account memory
effects.
7
Índice general
1. Introducción
11
2. Ajedrez
13
2.1. Reglas y Aspectos Generales del Juego . . . . . . . . . . . . . . . . . .
13
2.2. La Historia del Ajedrez . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
2.3. Sistema de puntuación Elo . . . . . . . . . . . . . . . . . . . . . . . . .
17
3. Conceptos y Definiciones
21
3.1. Estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
3.2. El efecto Hurst . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
3.3. Procesos Auto-similares
. . . . . . . . . . . . . . . . . . . . . . . . . .
26
3.4. Incrementos Estacionarios en Procesos Auto-similares . . . . . . . . . .
27
3.5. Cálculo del exponente de Hurst H . . . . . . . . . . . . . . . . . . . . .
29
3.5.1. Método de Rango Reescalado R/S . . . . . . . . . . . . . . . .
30
3.5.2. Método DFA . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
3.6. Ley de Zipf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
3.6.1. La Ley de Zipf en el Ajedrez . . . . . . . . . . . . . . . . . . . .
34
4. Resultados
41
4.1. Base de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
41
4.2. Estudio General de la Base de Datos . . . . . . . . . . . . . . . . . . .
42
9
10
ÍNDICE GENERAL
4.3. Distribuciones Libres de Escala . . . . . . . . . . . . . . . . . . . . . .
47
4.4. Análisis de Correlaciones . . . . . . . . . . . . . . . . . . . . . . . . . .
50
5. Conclusiones
67
A. Apéndice
69
A.0.1. Implementación del Método de Rango Reescalado . . . . . . . .
69
A.0.2. Implementación del Método de DF A . . . . . . . . . . . . . . .
71
1. Introducción
El estudio de sistemas biológicos y sociales complejos ha atraido la atención de
muchos científicos en el área de la física en las últimas décadas, hecho reflejado en la
cantidad de trabajos publicados por los mismos en dichas áreas de investigación. Entre
los sistemas estudiados se puede mencionar la distribución de votos en elecciones [3],
popularidad [4], crecimiento poblacional[5], movimiento colectivo de aves[6] y dinámica
y población de bacterias [7], por mencionar algunos tópicos significativos.
Un aspecto poco estudiado debido a la falta de datos suficientes es la forma en la
que ciertos agentes aprenden a tratar con sistemas de alta complejidad [8]. En particular, este aspecto está estrechamente relacionado con la toma de decisiones, donde
un individuo (o grupo de individuos) tiene que elegir un curso acción entre una gran
variedad de alternativas posibles. Este problema es ubicuo, ya que es posible identificarlo en una gran variedad de escenarios, los que comprenden decisiones personales, de
negocios, en manejo de empresas, o en la política. Este es un problema extremadamente complejo dado el gran número de factores que influyen en un proceso de decisión,
sumado a la enorme cantidad de posibilidades que usualmente se presentan a la hora
de elegir. Un entendimiento de estos problemas en términos de leyes de estadíticas
constituye un enorme desafío. En este contexto los juegos de mesa son muy estudiados
actualmente[1, 9], debido a la existencia registros y de la disposición de bases datos
suficientemente grandes como para realizar estudios estadísticos. En un juego de mesa
usualmente dos oponentes deben decidir la continuación de una partida de entre un
gran número de variantes determinadas por las reglas del juego. En particular el ajedrez ha tenido siempre un lugar privilegiado dentro de los juegos de mesa debido a su
complejidad, siendo además necesario un arduo entrenamiento a fin de lograr un buen
desempeño.
Un trabajo reciente de Blasius et. al [1] puso en evidencia un nuevo aspecto del
juego que despertó mucho interés en la comunidad científica [10, 11]. Estudiando cierto
11
12
CAPÍTULO 1. INTRODUCCIÓN
registro de partidas encontraron que, al ordenar las partidas de acuerdo a su popularidad, estas siguen una ley de Zipf. El hecho de que existan partidas populares no es
sorprendente dado que las aperturas, es decir los primeros movimientos, son comunes
a muchas partidas, sin embargo el hecho de que sigan una ley tipo Zipf-Pareto causa
asombro. La ley de Zipf se ha observado en sistemas de naturaleza muy diversa incluyendo la frecuencia de palabras de un cuerpo literario[12, 13, 14], la distribución
del producto bruto interno en paises[15], y la distribución de tormentas solares[16],
por citar algunos ejemplos. A la par de la diversidad de sistemas en los cuales la ley
se observa, existe un gran número de modelos estadísticos que logran explicarla[17],
aún cuando los mecanismos particulares que dan origen a la ley quedan muchas veces
ocultos al punto de poner en duda si esta ley posee algún significado profundo[18]. Sin
embargo, un aspecto muy interesante ha sido observado en cuerpos literarios donde
la ley de Zipf se manifiesta. Al estudiar una serie temporal asociada a secuencias de
palabras, Montemurro y Pury [2] detectaron correlaciones de largo alcance en la serie.
El origen de estas correlaciones es aún desconocido y continúa siendo estudiado en la
actualidad[19].
La respuesta de muchos sistemas puede ser considerada como una secuencia estacionaria de símbolos que guardan cierta correlación, en particular, este tipo de análisis se
vió impulsado en las últimas dos décadas a partir del estudio de secuencias de ADN[20].
Las secuencias simbólicas requieren de un mapeo previo a una serie temporal para lo
cual se debe establecer previamente una función de asignación[19] la cual dependerá
del tipo de correlaciones que se desee estudiar. Una vez obtenida la serie temporal es
posible emplear diversas técnicas para el estudio de correlaciones como lo son el análisis
de rango reescalado (R/S) o el detrended fluctuation analysis DF A.
En este trabajo se utilizó una base de datos con una secuencia de partidas de Ajedrez
ordenadas cronológicamente, similar a la empleada en el trabajo de Blasius y Tönjes[1],
se estableció un mecanismo de para asignar una serie temporal a esta secuencia y luego
se analizaron dichas series con las técnicas R/S y DF A a fin de determinar el tipo
correlaciones presentes en las mismas. Previamente se realizó un estudio estadístico de
la base de datos y se reprodujeron algunos resultados de Blasius y Tönjes.
2. Ajedrez
2.1.
Reglas y Aspectos Generales del Juego
El Ajedrez es un juego de mesa de estrategia entre dos jugadores y toma lugar en
un tableto con 64 cuadrados en una cuadrícula de 8x8. Cada jugador comienza con
16 piezas: un rey, una dama, dos torres, dos caballos, dos alfiles y ocho peones, cada
una de las cuales se mueve de forma diferente. Las piezas son utilizadas para atacar
y capturar las piezas del oponente, con el objetivo de realizar “jaque mate” al rey del
oponente colocándolo situación de inminente captura. El curso del juego esta dividido
en tres etapas: apertura, medio juego y final.
El tablero de ajedrez consiste en ocho filas, denotadas por números del 1 al 8, y
ocho columnas, denotadas por letras de “a” a “h” (Figura 2.1). Las piezas se dividen
convencionalmente en blancas y negras, y los jugadores son referidos como “las blancas”
y “las negras”.
Figura 2.1: Posición inicial de las piezas en el tablero de ajedrez.
13
14
CAPÍTULO 2. AJEDREZ
El jugador blanco siempre mueve primero. Un jugador no puede realizar ningún movimiento el cual deje en situación de jaque a su rey, si un jugador no tiene movimientos
legales posibles el juego concluye, ya sea en jaque mate (el jugador sin posibilidad de
movimientos legales pierde) si el rey está en situación de jaque, o en ahogado (empate)
si el rey no está en jaque.
A continuación se describen los movimientos de cada pieza[21]:
Rey: puede moverse un cuadrado en cualquier dirección. Esta pieza también tiene
un movimiento especial llamado enroque, una sola vez en el juego cada rey tiene
permitido moverse dos espacios a lo largo de la primera fila hacia la torre y luego la
torre es colocada en el último cuadrado cruzado por el rey. Este movimiento está
permitido siempre y cuando ambas piezas no hayan realizado ningún movimiento
previo, el rey no se encuentra en situación de jaque y los casilleros que separan
al rey y la torre no se encuentran ocupados.
Torre: puede moverse cualquier número de casilleros a lo largo de cualquier fila o
columna.
Alfil: puede moverse cualquier número de casilleros diagonalmente.
Dama: combina el poder del alfil y la torre.
Caballo: puede moverse en forma de “L”, dos casillero verticalmente y uno horizontalmente, o uno verticalmente y dos horizontalmente. El caballo es la unica
pieza que puede saltar sobre otras piezas.
Peón: puede moverse hacia adelante a lo largo de la misma columna de a un
casillero a la vez si el mismo está desocupado, excepto en su primer movimiento
donde tiene permitido desplazarse dos cuadrados; o puede moverse a un casillero ocupado por una pieza del oponente si se encuentra diagonalmente a un
solo movimiento de distancia. A su vez el peón posee una habilidad de captura
especial llamada “captura al paso” en la cual, si un peón se desplaza dos casilleros en su primer movimiento dejando a éste junto a un peón del adversario,
puede ser capturado como si hubiera avanzado solo un casillero. El peón también
posee la capacidad de promoción, cuando avanza hasta la octava fila debe ser
intercambiado por otra pieza a elección del jugador.
Las jugadas y posiciones en el ajedrez son registrados mediante una notación especial, llamada notación algebraica la cual consiste de una letra mayúscula que indica
2.1. REGLAS Y ASPECTOS GENERALES DEL JUEGO
15
la pieza en movimiento (K para el rey, Q para la dama, R para la torre, B para el
alfil y N para el caballo) más la coordenada de destino de la misma. Por ejemplo, Qg5
significa que la dama realiza un movimiento al casillero g5 (fila 5, columna g). La letra
P que indica al peón no se utliza, por lo tanto e4 simplemente significa que el peón se
desplaza hacia el casillero e4. En la situación particular donde dos piezas de la misma
especie pueden moverse al mismo casillero se incluye una letra adicional indicando la
columna de partida, por ejemplo Ngf3 significa que el caballo de la columna g realiza
un movimiento hacia la posición f3.
Si una pieza realiza una captura en uno de sus movimiento, se incluye una “x” antes
del casillero de destino, entonces Bxf3 significa que el alfil captura la pieza ubicada en
f3. Cuando un peón realiza una captura se utiliza la designación de la columna de la
cual parte en lugar de la inicial de la pieza, y el número de fila es omitido en caso de
ser inequívoco, por ejemplo, exd5 significa que el peón en la columna “e” captura a la
pieza localizada en d5. El enroque es indicado por las notaciones especiales, 0-0 para
el enroque hacia el flanco del rey y 0-0-0 para el enroque hacia el flanco de la reina.
A su vez la promoción de un peón es indicado por el movimiento del mismo seguido
de la primera letra de la pieza por la cual es intercambiado, por lo tanto d8Q indica
que el peón que realiza un movimiento al casillero d8 es intercambiado por la dama.
El símbolo “+” indica que el jugador ha colocado al rey del oponente en situación de
jaque.
Al finalizar la partida “1-0” indica que las blancas ganaron, “0-1” que las negras
ganaron y “1/2-1/2” si la partida concluyó en empate.
A continuación se muestra un ejemplo de una partida completa registrada entre
Garry Kasparov (blancas) y Viktor Kortschnoj (negras) jugada en Islandia en el año
2000 cuyo resultado fué empate:
16
CAPÍTULO 2. AJEDREZ
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
e4
d4
Nc3
Bg5
e5
Be3
Qg4
a3
bxc3
Bd3
Qf4
Ne2
0-0
Bxe2
c4
Bxd4
Qxd4
e6
d5
Nf6
Bb4
h6
Ne4
Kf8
Bxc3+
c5
h5
Qa5
Nxc3
Nxe2+
Nc6
cxd4
Nxd4
Bd7
18.
19.
cxd5 exd5
Bf3
Bc6
1/2-1/2
2.2.
La Historia del Ajedrez
El juego del ajedrez ha fascinado a la humanidad por más de 1500 años. El predecesor más similar tuvo origen en el norte de la India con el nombre de chaturanga 1 ,
no obstante sus comienzos son tan remotos que resulta imposible determinar su origen
exacto. La primera referencia escrita al juego es en un poema de finales del Siglo VI.
La teoría más probable es que el chaturanga se expandiera hacia el este en dirección a
China y Japón, y hacia el oeste a Persia, donde pasó a llamarse shatranj 2 [22].
Es desde Persia donde el ajedrez comienza a evolucionar hasta lograr su forma
El término chaturanga significa cuatro secciones y refiere a una formación militar. Llevaba este
nombre ya que se jugaba entre cuatro personas y en un tablero de 74 casillas.
2
El término shatranj se deriva de la palabla chaturanga. En la cultura popular Persa se escribía
algunas veces como sad (’cien’) + ranj (’preocupaciones’).
1
2.3. SISTEMA DE PUNTUACIÓN ELO
17
actual. Esta versión más parecida al juego moderno fue transmitida primero a España
y de allí al resto de Europa. La diferencia más grande entre el shatranj y el ajedrez actual
es la movilidad de las piezas equivalentes a la dama y el alfil, las cuales sólo podían
avanzar al igual que los peones, y la no existencia del enroque. Por esta diferencia
de movilidad de estas piezas tan claves en el ajedrez actual, las aperturas eran, en
comparación, increíblemente lentas.
Hacia el Siglo XII el juego del ajedrez se había expandido prácticamente en todo el
continente europeo, y dejó de ser simplemente un entretenimiento para convertirse en
un atractivo para el arte y la ciencia.
A finales del Siglo XV, con la finalidad de agilizar las aperturas, la movilidad de
algunas piezas cambió, el peón ahora podría avanzar dos posiciones en el primer movimiento, y la dama y el afil adquirieron las capacidades de movilidad de la actualidad.
Debido a que la reina se convirtió en la pieza más poderosa la nueva versión del juego
fue apodada en algunos libros de los Siglos XV y XVI “ajedrez de la dama”.
Entre los Siglos XVII y XIX, con la llegada del movimiento cultural e intelectual
europeo que trajo consigo la Ilustración y la enmancipación del pensamiento, el ajedrez
comienza a desligarse de las doctrinas medievales y se establece como el juego predilecto
de la clase intelectual[22], al mismo tiempo que comienza a atraer cada ver más la
atención de la clase aristocrática y las cortes reales, a las que fueron invitados los
jugadores más prominentes de la época.
A medida que el juego cobraba popularidad se establecieron ciertas reglas que persisten en la actualidad, como la limitación del tiempo de juego, el enroque y las reglas
de ahogado (o stalemate) en la que el juego termina en empate, hasta entonces variaba
dependiendo de la época y zona geográfica: victoria para el jugador en posición de
tablas, el mismo solo perdía el turno, o simplemente no estaba permitido, entre otras
posibilidades.
2.3.
Sistema de puntuación Elo
A través de la historia hubo numerosos intentos por determinar un sistema que fuera
capaz de puntuar las capacidades de los jugadores. En 1970 la Federación Internacional
de Ajedrez, FIDE, implementó un sistema de puntuación llamado Elo que utiliza un
método estadístico para calcular los niveles relativos de habilidad de los jugadores. Este
método fue inventado por el físico y ajedrecista aficionado Árpád Élő, y siendo aplicado
18
CAPÍTULO 2. AJEDREZ
también a otras formas de competición como scrabble y juegos de rol de participación
masiva por internet como World of Warcraft.
El problema de la calificación de los jugadores es un problema que cae dentro
del área de la estadística del modelado de ’comparación de pares’, cuyos datos se
obtienen de cualquier resultado que indique preferencia por un objeto sobre otro. En
el caso ajedrez los resultados de los partidos no son mas que la consecuencia de la
comparación entre dos jugadores para determinar cuál de ellos es el ’preferido’ (o si no
existe ’preferencia’ como en el caso del empate).
A partir del estudio de torneos pasados, Élő observó que la distribución de rendimientos, esto es, la distribución de probabilidades de que un jugador se desempeñe a
un cierto nivel, era similiar a la de una distribución normal. Una de las ventajas de
utilizar la distribución normal para modelar los desempeños de los jugadores es que
la diferencia entre las distribuciones de rendimiento de dos jugadores es también una
distribución normal, solo que más dispersa3 [23].
En la actualidad la Federación de Ajedrez Estadounidense (USCF) utiliza la distribución logística en lugar de la normal, a pesar de que al analizar datos de comparación
de pares no existe una diferencia significativa si se asume una distribución normal o
logística para las diferencias entre los rendimientos de los jugadores[24].
En el sistema de Elo cada jugador posee un puntaje numérico el cual no es calculado
de forma absoluta sino que es estimado a partir de victorias, derrotas y empates en
enfrentamientos contra otros jugadores. Calculando la diferencia entre los Elos de dos
jugadores es posible estimar el resultado esperado del partido. Si un jugador A que
posee un Elo RA se enfrenta a un jugador B con Elo RB , las puntuaciones esperadas
de los jugadores serán,
1
EA =
(R
1 + 10 B −RA )/400
1
EB =
,
(R
1 + 10 A −RB )/400
donde las puntuaciones que un jugador puede obtener en un partido son 1 si el jugador
gana, 21 si el juego termina en empate y 0 si pierde. De esta forma una diferencia de
200 puntos significa que el jugador de mayor Elo posee un puntaje esperado de 0,75,
que es la probabilidad de victoria Pv más la mitad de probabilidad de empate Pe , ya
que en el sistema de Elo un empate se considera media victoria más media derrota, es
Desviaciones estándar de las distribucines obtenidas por Élő: σ = 200 puntos para la distribución
√
individual de un jugador y σ = 2 200 puntos para la distribución de dos jugadores.
3
2.3. SISTEMA DE PUNTUACIÓN ELO
decir,
EA = Pv +
19
Pe
.
2
Una de las contribuciones más importantes de Élő fue la introducción de un algoritmo simple que actualiza las calificaciones de los jugadores en base a los resultados de un
torneo. Si el jugador en cuestión supera el puntaje esperado su Elo aumenta, y en caso
contrario disminuye. Estas actualizaciones se realizan de manera incremental y existe
un límite máximo para los ajustes de los Elos de los jugadores por partido llamado Kfactor, el cual depende de la categoría (K = 16 Elo para maestros y K = 32 Elo para
jugadores menos expertos). Suponiendo que un jugador A posee un puntaje esperado
de EA puntos, pero en la realidad obtuvo SA , su actualización de Elo será,
′
RA
= RA + K · (SA − EA ).
La escala de puntuaciones tiene un límite mínimo en cero, y por más que el máximo
no está limitado, sería inaudito que un jugador excediera los 3000 Elo. En la actualidad,
los jugadores de ajedrez poseen Elos menores a 2900, mientras que, debido al desarrollo
de las reglas eurísticas, el puntaje de los motores de ajedrez 4 supera los 3000 Elo[9].
El sistema de puntuación de Elo es utilizado por FIDE y USCF para clasificar
tanto los torneos como los jugadores en categorías. La FIDE clasifica los torneos considerando el promedio de Elo de los jugadores. Las categorías cambian cada 25 puntos,
comenzando con la categoría 1 con Elos de 2251 a 2275, hasta la categoría 22 con
Elos superiores a 2776 para los hombres, y las mismas categorías para el caso de las
mujeres pero con 200 puntos menos, por lo tanto la correspondiente categoría 1 sería
de 2051 hasta 2075. Por otra parte la Federación de Ajedrez Estadounidense clasifica
a los jugadores en 14 categorías según su Elo, desde la categoría A (Elos de 100 a 199)
hasta la categoría Senior Master (Elo 2400 ó superior) en incrementos de 200 Elo.
Un motor de ajedrez es un programa de computadora el cual calcula posiciones y movimientos de
ajedrez y que a su vez se comunica con una interfaz gráfica para usuarios.
4
3. Conceptos y Definiciones
3.1.
Estadística
Un proceso estocástico (P.E.) es una colección de variables aleatorias ordenadas
{X(t)}t∈T , donde T ⊆ R, t es un parámetro (generalmente asociado al tiempo) y
X(t) representa el estado del proceso en el instante t. Si T es un conjunto numerable,
entonces el proceso estocástico se dice que es en tiempo discreto, en caso contrario se
dice que es en tiempo contínuo.
Uno de los resultados de la estadística más utilizados de forma automática, y sin
tomar cuidado de las condiciones bajo las cuales se deriva, es el que establece que la varianza del valor medio de una muestra es igual a la varianza de una observación dividido
el tamaño de la muestra, es decir, dado un conjunto de observaciones independientes
ordenadas X1 , ..., XN con media µ = E(Xi ) y varianza σ 2 = var(Xi ) = E[(Xi − µ)2 ],
P
donde E[Xi ] representa el valor de espectación de Xi , la varianza de X = n1 ni=1 Xi es
var(X) =
σ2
n
(3.1)
A fin de estudiar las condiciones bajo las cuales esta ecuación es válida, se considera
un conjunto de observaciones realizadas aleatoriamente {Xi : i = 1, ..., n}, donde el
índice i denota un orden natural como por ejemplo tiempo o posición. De esta forma
X1 , ..., XN son variables aleatorias que comparten la misma distribución marginal F .
No es complicado establecer las condiciones bajo las cuales la Ec. (3.1) es válida
1. La media µ = E(Xi ) existe y es finita.
2. La varianza σ 2 = var(Xi ) existe y es finita.
3. X1 , ..., XN son no correlacionados, es decir
ρ(i, j) = 0
21
i 6= j
22
CAPÍTULO 3. CONCEPTOS Y DEFINICIONES
donde
ρ(i, j) =
γ(i, j)
σ2
es la autocorrelación entre Xi y Xj , y
γ(i, j) = E[(Xi − µ)(Xj − µ)]
es la autocovarianza entre Xi y Xj .
Las suposiciones 1 y 2 dependen solo de la distribución marginal F y es relativamente simple verificar su cumplimiento al momento de realizar un experimento. La
suposición 3 resulta ser la más problemática. En ciertas situaciones se considera que la
dependencia entre las observaciones es lo suficientemente débil como para ser despreciable a los fines prácticos. Sin embargo esto no es siempre posible, ya que correlaciones
significativas pueden producirse a pesar de las precauciones tomadas.
Es por esto que es de importancia estudiar cómo la Ec. (3.1) es afectada cuando las
observaciones están correlacionadas. Con el fin de que X n sea significativo, se asume
la media µ = E(Xi ) constante. La Ec. general de la varianza es
var(X) =
n
n
1 X
σ2 X
γ(i,
j)
=
ρ(i, j).
n2 i,j=1
n2 i,j=1
(3.2)
Si las correlaciones para i 6= j suman cero, esto es,
n
X
ρ(i, j) = 0,
(3.3)
i6=j
entonces
n
X
ρ(i, j) = n
i,j
y la Ec. (3.1) resulta válida. Es decir, este es el caso donde X1 , ..., XN son no correlacionados. Si la Ec.(3.3) no se cumple la varianza de X es
var(X) =
σ2
[1 + δn (ρ)]
n
(3.4)
con un término de corrección distinto de cero
δn (ρ) =
1X
ρ(i, j).
n i6=j
(3.5)
Si el proceso estocástico es estacionario la media µ = E(Xi ) es constante y las
correlaciones ρ(i, j) solo dependen de la separación |i − j|, entonces es posible escribir
3.1. ESTADÍSTICA
23
la Ec. (3.5) de forma más simple de la forma
δn (ρ) = 2
n
X
k=1
!
k
1−
ρ(k).
n
(3.6)
Es importante también estudiar el comportamiento asintótico de var(X) cuando
n → ∞. La varianza de X es proporcional a n−1 siempre y cuando
δ(ρ) = n→∞
lı́m δn (ρ) = n→∞
lı́m
1X
ρ(i, j)
n i6=j
(3.7)
exista, sea finito y mayor a -1. Entonces se obtiene, para el comportamiento asintótico,
var(X) ≈
σ2
σ2
[1 + δ(ρ)] = c(ρ) ,
n
n
(3.8)
donde ≈ significa asintóticamente y c(ρ) = 1 + δ(ρ).
La mayoría de las series temporales en la literatura exhiben este comportamiento. Los más conocidos son los procesos ARMA (autoregressive moving average) y los
procesos de Markov[25].
La Ec. (3.8) es una generalización de la Ec. (3.1) ya que permite una contante c(ρ)
distinta de 1. Sin embargo esta generalización no es suficiente, existen conjuntos de
datos para los cuales la varianza de X difiere de la Ec. (3.1) no solo en una constante,
sino también en la velocidad a la cual converge a cero. La forma más simple de modelar
este comportamiento es considerar un decaimiento más lento proporcional a n−α para
algún α ∈ (0, 1), es decir,
σ2
var(X) ≈ c(ρ) α ,
(3.9)
n
donde ahora la constante c(ρ) está definida como:
c(ρ) = n→∞
lı́m nα−2
X
ρ(i, j).
(3.10)
i6=j
La relación entre la Ec. (3.9) y la estructura de las correlaciones se observa simplemente al considerar correlaciones dependientes solamente de la distancia |i−j| (proceso
estocástico estacionario). Analizando las Ec. (3.6) y (3.10) se concluye que el comportamiento asintótico de la suma de todas las correlaciones con separaciones −n+1, ..., n−1
debe ser proporcional a n1−α
n−1
X
k=−(n−1)
ρ(k) ≈ constante · n1−α ,
(3.11)
24
CAPÍTULO 3. CONCEPTOS Y DEFINICIONES
lo que implica que
P∞
−∞
ρ(k) diverge, ya que α < 1.
Especificamente la Ec. (3.11) es válida si
ρ(k) ≈ cρ |k|−α
(3.12)
cuando |k| → ∞, y donde cρ es una constante positiva. En este caso, como las correlaciones decaen más lentamente que 1/n no existe escala caracerística tal que las
mismas puedan ser despreciadas. La interpretación intuitiva de la Ec. (3.12) es que
el proceso tiene memoria de largo alcance. Es decir, la dependencia entre los eventos
separados por una gran distancia disminuye lentamente con el aumento de |k|. Un proceso estacionario cuyas correlaciones decaen lentamente según la Ec. (3.12) es llamado
proceso estacionario con memoria de largo alcance o dependencia de largo alcance. De
otra manera, un proceso estacionario Xt es llamado estacionario con memoria de largo
alcance o dependencia de largo alcance, o correlaciones de largo rango, si existe un
número real α ∈ (0, 1) y una constante cρ > 0 tal que
ρ(k)
= 1.
k→∞ cρ k −α
lı́m
(3.13)
La definición dada por la Ec. (3.13) es una definición asintótica, y como tal solo
describe el comportamiento de las correlaciones cuando las distancias tienden a infinito;
cada correlación individual puede ser arbitrariamente pequeña.
La densidad espectral f (λ) de una función de autocorrelación ρ(k) puede ser definida como
∞
σ2 X
ρ(k)eikλ ,
f (λ) =
2π k=−∞
donde λ es la frecuencia. Entonces, la Ec. (3.12) implica que
f (λ) ≈ cf |λ|α−1 = cf |λ|−β
(3.14)
cuando λ → 0 y donde cf es una constante positiva.
3.2.
El efecto Hurst
Desde la antigüedad el río Nilo ha sido conocido por su comportamiento característico a largo plazo. Extensos períodos de sequía, durante los cuales los niveles del
río tendían a ser bajos, seguidos por extensos períodos de crecidas, con niveles altos.
3.2. EL EFECTO HURST
25
De forma general la serie temporal de niveles del Nilo resulta estacionaria. Al observar
intervalos de tiempos reducidos, parecen surgir ciclos o tendencias locales. Sin embargo
la serie completa no exhibe ciclos persistentes (Figura 3.1).
Figura 3.1: Nivel mínimo anual del río Nilo (622-1281 d.C.).
El hidrólogo Harold E. Hurst advirtió este compotamiento al investigar el problema
de regularización del flujo del Nilo (1951). Más especificamente descubrió que puede
ser descrito como sigue: Suponiendo que se desea calcular la capacidad de un reservorio
ideal en un intervalo de tiempo (t, t + k), donde por ideal se refiere a que el flujo es
uniforme dentro del reservorio, que el nivel al tiempo t+k es igual al nivel al tiempo t y
que el reservorio no desborda. A fin de simplificar el problema, se asume que el tiempo
es discreto y que no existen pérdidas en el reservorio (por evaporación, derrame, etc.).
Denotando al flujo entrante al tiempo i por Xi y al flujo entrante acumulado al tiempo
P
j por Yj = ji=1 Xi , la capacidad ideal es igual a
i
i
R(t, k) = máx [Yt+i − Yt − (Yt+k − Yt )] − mı́n [Yt+i − Yt − (Yt+k − Yt )],
06i6k
06i6k
k
k
(3.15)
donde R(t, k) es llamado rango ajustado. A fin de estudiar las propiedades independientemente de la escala utilizada, R(t, k) es normalizado mediante
v
u
t+k
u1 X
2
S(t, k) = t
(Xi − X t,k ) ,
k
i=t+1
(3.16)
26
CAPÍTULO 3. CONCEPTOS Y DEFINICIONES
donde X t,k =
1
k
Pt+k
i=t+1
Xi . La razón
R/S =
R(t, k)
S(t, k)
(3.17)
es el rango reescalado ajustado o estadística R/S. Hurst observó que al graficar el logarítmo de R/S vs. k, para valores considerables de k, log (R/S) se encontraba dispersado
alrededor de una recta con pendiente mayor a 21 . En términos probabilísticos esto es
log E[R/S] ≈ a + H log(k),
H>
1
2
(3.18)
Hurst descubrió que en el caso del río Nilo, asi como en muchos registros hidrológicos, geofísicos y climatológicos, R/S se comporta como una constante por k H para
algún H > 21 . Este es el llamado efecto Hurst.
El parámetro α en la Ec. (3.12) está relacionada con el exponente de Hurst H
mediante la ecuación α = 2 − 2H[26]. Es decir, H > 1/2 implica que α < 1, y por lo
tanto se puede decir que se trata de un proceso con memoria de largo alcance.
3.3.
Procesos Auto-similares
Los procesos auto-similares fueron introducidos por Kolmogorov (1941) dentro de
un contexto teórico. Sin embargo, los estadistas ignoraban la reelevancia de dicho concepto hasta que fue introducido por Mandelbrot. No obstante, la idea de auto-similitud
es más antigua. Mandelbrot se refiere, por ejemplo, a las pinturas con flujos turbulentos
de Leonardo da Vinci las que exhiben torbellinos coexistentes de todos los tamaños y
por lo tanto auto-similitud. Una figura geométrica se dice auto-similar de forma determinística si las mismas estructuras geométricas son observadas independientemente de
la distancia a la que se la examine.
Desde el punto de vista estocástico, la auto-similitud está definida en términos de
la distribución del proceso. Un proceso estocástico Yt con parámetro temporal contínuo
t se dice auto-similar con parámetro de auto-similitud H si, para todo factor de estiramiento c positivo, el proceso reescalado con escala temporal ct, c−H Yct , es igual en
distribución al proceso original, en otras palablas, la distribución posee invariancia de
escala. Por lo tanto, recorridos habituales de la muestra son cualitativamente iguales,
independientemente de la distancia a la cual se observe.
Un proceso estocástico Yt tiene incrementos estacionarios si, para todo k > 1 y
tiempos t1 , ..., tk cualesquiera, la distribución de (Yt1 +c − Yt1 +c−1 , ..., Ytk +c − Ytk +c−1 )
3.4. INCREMENTOS ESTACIONARIOS EN PROCESOS AUTO-SIMILARES
27
no depende de c ∈ R. Dada esta definición es posible obtener un resultado de sumo
interés.
Suponiendo que Yt es un proceso estocástico tal que Y1 6= 0 con probabilidad positiva
e Yt es el límite en distribución de la secuencia de sumas parciales normalizadas
[nt]
1 X
Snt
→d Yt
Xi =
an i=1
an
donde [nt] denota la parte entera de nt, →d significa convergencia en distribución1 ,
X1 , X2 , ... es una secuencia estacionaria de variables aleatorias, y a1 , a2 , ... es una secuencia de constantes positivas normalizadoras tales que log(an ) → ∞. Entonces existe
una constante H > 0 tal que para todo u > 0,
lı́m
n→∞
anu
= uH
an
e Yt es auto-similar con parámetro de auto-similitud H y tiene incrementos estaciose
narios. Es decir, independientemente del parámetro de estiramiento u elegido, aanu
n
comporta asintóticamente, para n → ∞, como una ley de potencias con el mismo exponente H. Esto significa que, cuando un proceso es el límite de las sumas parciales
normalizadas de variables aleatorias, es necesariamente auto-similar. Por lo tanto se
puede decir que el rol de los procesos auto-similares dentro de los procesos estocásticos
es análogo al rol central de las distribuciones estables dentro de las distribuciones.
3.4.
Incrementos Estacionarios en Procesos Autosimilares
Dado un proceso auto-similar Yt con parámetro de auto-similitud H, la propiedad
Yt =d tH Y1 ,
donde =d es igualdad en distribuciones, implica el siguiente comportamiento límite de
Yt cuando t → ∞:
1. Si H < 0, entonces Yt →d 0.
Una secuencia de variables aleatorias X1 , X2 , ... se dice converger en distribución a una variable
aleatoria X si, ∀x ∈ R para el cual F es contínua, lı́mn→∞ Fn (x) = F (x), donde Fn y F son las
funciones de distribución acumuladas de las variables Xn y X respectivamente.
1
28
CAPÍTULO 3. CONCEPTOS Y DEFINICIONES
2. Si H = 0, entonces Yt =d Y1 .
3. Si H > 0 e Yt 6= 0, entonces |Yt | →d ∞.
Analogamente, para t → 0 se tiene:
1. Si H < 0 e Yt 6= 0, entonces |Yt | →d ∞.
2. Si H = 0, entonces Yt =d Y1 .
3. Si H > 0, entonces Yt →d 0.
El rango de H puede ser restringido a H > 0, ya que si los incrementos del proceso auto-similar son estacionarios, entonces el proceso es matemáticamente patológico
para valores negativos de H. Más especificamente, para H < 0, Yt no es un proceso
mensurable.
El aspecto de la función de covarianza γy (t, s) = cov(Yt , Ys ) = E[(Yt −µt )(Ys −µs )] de
un proceso auto-similar Yt con incrementos estacionarios es el resultado de considerar H
positivo e Y0 = 0 con probabilidad igual a 1. Asumiendo E(Yt ) = 0 a fin de simplificar
notación, s < t, y denotando por σ 2 = E[(Yt − Yt−1 )2 ] = E[Y12 ] la varianza del proceso
incremental Xt = Yt − Yt−1 , entonces,
E[(Yt − Ys )2 ] = E[(Yt−s − Y0 )2 ] = σ 2 (t − s)2H .
Por otro lado,
E[(Yt − Ys )2 ] = E[Yt2 ] + E[Ys2 ] − 2E[Yt Ys ] = σ 2 t2H + σ 2 s2H − 2γy (t, s),
por lo tanto,
1
γy (t, s) = σ 2 [t2H − (t − s)2H + s2H ].
2
Las covarianzas de la secuencia de incrementos Xi = Yi − Yi−1 (i = 1, 2, 3, ...) son
calculadas de forma similar. Utilizando la auto-similitud se obtiene, para la covarianza
entre Xi y Xi+k (k > 0),
1
γ(k) = σ 2 [(k + 1)2H − 2k 2H + (k − 1)2H ]
2
para k > 0 y γ(k) = γ(−k) para k < 0. Y por lo tanto las correlaciones están dadas
por
1
ρ(k) = [(k + 1)2H − 2k 2H + (k − 1)2H ]
2
3.5. CÁLCULO DEL EXPONENTE DE HURST H
29
para k > 0 y ρ(k) = ρ(−k) para k < 0.
El comportamiento asintótico de ρ(k) es analizado mediante la expansión de Taylor:
Primero cabe notar que ρ(k) = 21 k 2H g(k −1 ) donde g(x) = (1 + x)2H − 2 + (1 − x)2H . Si
0 < H < 1 y H 6= 1/2, entonces el primer término distinto de cero en la expansión de
Taylor de g(x), expandido alrededor del origen, es 2H(2H − 1)x2 . Por lo tanto, para
k → ∞, ρ(k) es equivalente a H(2H − 1)k 2H−2 , es decir,
ρ(k)
→1
H(2H − 1)k 2H−2
para k → ∞. Para 1/2 < H < 1, esto significa que las correlaciones decaen lentamente
de forma que
∞
X
−∞
ρ(k) = ∞,
por lo tanto, la Ec. (3.13) es válida, lo que significa que el proceso posee memoria
de largo alcance y que el exponente H resulta ser el exponente de Hurst. Un valor
de H entre 1/2 y 1 indica un “comportamiento persistente”, esto significa que a un
incremento en la serie temporal le sigue otro incremento a corto plazo.
Para H = 1/2, todas las correlaciones para distancias no nulas son cero, y las
observaciones Xi resultan no correlacionadas.
3.5.
Cálculo del exponente de Hurst H
Sea un conjunto de datos {Xi : i = 1, ..., N } en los cuales se desea estudiar las
correlaciones de Xi y Xi+n sobre diferentes escalas temporales n a fin de determinar
la presencia de memoria de largo alcance. Con el fin de librarse de un desplazamiento
P
(offset) constante en los datos se acostumbra sustraer la media hXi = m = N1 N
i=1 Xi a
f
fin de obtener una serie centrada en cero, Xi ≡ Xi −m. Cuantitativamente la correlación
entre dos valores de X separados por n está definida por la función de auto-correlación
−n
1 NX
fX
f
C(n) =
X
i i+n
N − n i=1
Si {Xi } son no correlacionadas, C(n) es cero para n > 0. Además, como se mencionó
previamente, en el caso de las correlaciones de largo alcance, C(n) decae como ley de
potencia
C(n) ∼ n−γ
30
CAPÍTULO 3. CONCEPTOS Y DEFINICIONES
con exponente 0 < γ < 1. Muchas veces no es posible realizar un cálculo directo de C(n)
debido a la presencia de ruido superpuesto al conjunto de datos o bien, a tendencias
subyacentes de origen desconocido cuyas escalas tampoco son conocidas [27], y por lo
tanto se debe calcular el exponente γ de forma indirecta.
Los métodos más utilizados a fin de determinar la existencia de correlaciones de
largo alcance en una serie temporal se centran en el cálculo del coeficiente de Hurst
H, entre los cuales se pueden mencionar el método de rango reescalado o estadística
R/S, detrended fluctuation analysis o DFA, variancia agregada, periodograma, wavelet
analysis y estimador local Whittel[26]. En este trabajo se emplearán los dos primeros
métodos mencionados.
3.5.1.
Método de Rango Reescalado R/S
A fin de calcular H se debe primero estimar la dependencia del rango reescalado
con los rangos temporales de las observaciones. Para esto la serie temporal de N observaciones es dividida en series de menor longitud n = N, N/2, N/4, ... no superpuestas.
Para cada sub-conjunto de observaciones de longitud n, X = X1 , X2 , ..., Xn , se
computa:
1. La media:
m=
n
1X
Xi
n i=1
2. Una serie centrada en la media:
f =X −m
X
t
t
t = 1, 2, ..., n
3. La desviación acumulada de la serie respecto de la media:
Y (t) =
t
X
i=1
4. El rango R:
f
X
i
t = 1, 2, ..., n
R(n) = máx[Y (1), Y (2), ..., Y (n)] − mı́n[Y (1), Y (2), ..., Y (n)]
5. La desviación estándar S:
v
u
n
u1 X
(Xi − m)2
S(n) = t
n i=1
3.5. CÁLCULO DEL EXPONENTE DE HURST H
31
Luego, se promedia el rango reescalado R(n)/S(n) sobre todas las series temporales
parciales de hlongitud
n, y finalmente, se estima H ajustando los datos a la ley de
i
R(n)
potencias E S(n) = CnH . Para esto se emplea la Ec. (3.18) y se realiza una regresión
lineal a fin de calcular la pendiente H.
3.5.2.
Método DFA
El DFA, Detrended Fluctuation Analysis[27], es un método de determinación de
correlaciones de largo alcance en series temporales no estacionarias consolidado para
determinar comportamiento de escala de conjuntos de datos con presencia de ruido
y tendencias de origen y forma desconocida. En este sentido el método resulta más
adecuado que el método R/S.
El método calcula una función de fluctuación F (n) específica a una escala temporal
n[28], la cual, para series temporales con correlaciones de largo alcance tiene la forma
F (n) ∼ nζ
(3.19)
El procedimiento del DFA consiste de tres pasos. Primero se determina el perfil
Y (t) =
t
X
i=1
de la serie de longitud N .
f
X
i
t = 1, 2, ..., N
El segundo paso consiste en dividir el perfil Y (t) en Nn = N/n segmentos de
longitud n para cada uno de los cuales se determina una función de tendencia g(t),
generalmente lineal y luego se calculan los residuos
ε(t) = Y (t) − g(t)
Finalmente, se obtiene F (n) como la media cuadrática de los residuos de la serie
temporal
v
u
N
u1 X
F (n) = t
ε(t)2
(3.20)
N i=1
Cuando ζ < 1 la serie temporal resulta estacionaria y ζ = H donde H es el
exponente de Hurst.
32
3.6.
CAPÍTULO 3. CONCEPTOS Y DEFINICIONES
Ley de Zipf
Cuando la probabilidad de medir un valor particular de alguna cantidad varía inversamente como potencia de ese mismo valor, se dice que la cantidad en cuestión sigue
una ley de potencias o una distribución libre de escala, también conocida como Ley de
Zipf o distribución de Pareto. La frecuencia de uso de palabras en múltiples lenguas[29],
las tormentas solares[16] y las ciudades más extensas[30] pueden ser descriptos en términos de la Ley de Zipf, la cual captura la relación entre la frecuencia de un set de
objetos o eventos y su tamaño. En todos estos ejemplos mencionados el exponente de
la distribución resulta cercano a 2, esto es, siguen una ley de potencias x−2 , donde x
es el tamaño[10].
En el caso de una distribución de “tamaños” x dada por P (x) ∼ x−γ , un objeto de
tamaño x posee rank r = N P≥ (x) ∼ x−γ+1 , donde N es el número total de cuidades,
palabras, etc. estudiadas. Una ley de Zipf con exponente arbitrario −α corresponde a
1
lo cual se reduce a α = 1
x ∼ r−α . Combinando resultados puede verse que α = γ−1
para γ = 2.
En la Figura 3.2 se muestra, a modo de ejemplo, el histograma de tamaños de las
ciudades estadounidenses[30]; en el mismo se observa la existencia de un gran número
de ciudades relativamente pequeñas, y un número reducido de ciudades cuya población
supera considerablemente a la media. Resulta notable al estudiar el lado derecho de
la Figura 3.2 como al graficar el histograma en escala logarítmica su aspecto general
resulta similar a una función lineal. Denotando por p(x)dx a la fracción de ciudades con
población entre x y x + dx, resulta ln p(x) = −α lnx + c, donde α y c son constantes,
lo que es equivalente a
p(x) = Cx−α
(3.21)
con exponente α = 2,3.
La identificación del comportamiento de ley de potencia de sistemas naturales o artificiales es complicada. La estategía estándar utilizada[30] es la mostrada en el ejemplo
anterior y consiste en obtener un histograma de una cantidad que al ser graficada en
escala logarítmica es muy cercana a una recta. Esta no es la mejor forma de proceder,
ya que generalmente se observa ruido en la cola de la distribución a causa de que los
eventos en dicha zona son menos frecuentes (Figura 3.3), lo que significa que cada
intervalo (“bin”) posee muy pocas mediciones. Una de las soluciones a este problema
consiste en variar el ancho de los intervalos del histograma. Al realizar esto se debe
normalizar, es decir, el número de elementos en un intervalo ∆x debe ser dividido por
3.6. LEY DE ZIPF
33
Figura 3.2: Izquierda: histograma de la población de las ciudades estadounidenses cuya
población supera 10000 habitantes. Derecha: histograma del mismo conjunto de datos en
escalas logarítmicas. Fuente: Newmann[30]
Figura 3.3: Datos artificiales que consta de números reales aleatorios extraídos de una distribución de probabilidad de ley de potencias según la Ec. (3.21) para α = 2,5. Fuente:
Newmann[30]
34
CAPÍTULO 3. CONCEPTOS Y DEFINICIONES
la longitud ∆x, a fin de que el conteo normalizado de la muestra resulte independiente
de la longitud del intervalo. La elección más usual es crear los intervalos tal que cada uno
sea un múltiplo fijo más ancho que el anterior. Esto es conocido como bin logarítmico.
Existen múltiples mecanismos los cuales generan distribuciones con comportamiento
de leyes de potencias, entre los cuales se pueden mencionar la combinación de exponenciales, cantidades inversas, caminatas aleatorias, proceso de Yule, toleracia altamente
optimizada, ruido coherente y modelos multiplicativos modificados[30, 17]. Cada sistema particular debe ser adecuado a un tipo de modelo que depende del mecanismo que
le da origen.
3.6.1.
La Ley de Zipf en el Ajedrez
Las partidas de Ajedrez pueden describirse como las ramas de un grafo o árbol cuya
raíz es la posición inicial del juego. Cada link de dicho árbol representa una movida
legalmente permitida por las reglas del juego, y cada nodo una de las posibles posiciones. De este modo, una partida en particular puede representarse por una secuencia
de nodos σ0 , σ1 , σ2 , ..., σd o equivalentmente por una secuencia de links l1 , l2 , ..., ld en
el árbol. La raíz del árbol σ0 está presente en todas las partidas posibles. El árbol de
partidas posee aproximadamente 10120 nodos (número de Shannon[31]), correspondiendo a un factor de ramificación promedio igual a 30 ramas por nodo y a una longitud
promedio de las partidas en 40 movidas. Sin embargo, a pesar de la complejidad del
árbol de partidas posibles tan sólo una pequeña fracción de las partidas son ejecutadas
en la práctica. Esta observación es de crucial importancia para entender la naturaleza
de los fenómenos de tomas de decisiones.
En el trabajo de Blasius y Tönjes[1] se estudia una base de datos de partidas de
Ajedrez entre humanos (SCIDBASE [32]) encontrando que la popularidad de las diferentes líneas de juego satisface la ley de Zipf. Este hallazgo se relaciona a la existencia
de líneas de juego que son corrientes y que los jugadores tienden a elegir. Además,
es importante ya que conecta los procesos de tomas de decisiones con un espectro de
procesos complejos caracterizados por la ley de Zipf. Más precisamente, el estudio de
Blasius y Tönjes se enfoca una versión pesada del árbol de partidas (Figura 3.4). Cada
nodo σ en el árbol tiene asociado un número de partidas nσ , y cada link l una fracción
rl de partidas que continúa por la correspondiente línea de juego. De este modo, si l es
el link que va desde la posición σ hasta la posición σ ′ , luego se satisface nσ rl = nσ′ . La
raíz tiene un número nσ0 de partidas que es igual al número N de partidas en la base
3.6. LEY DE ZIPF
35
de datos estudiada. En términos de los procesos de tomas de decisiones, nσ denota la
popularidad con la cuál es jugada la correspondiente apertura o línea de juego.
De acuerdo con Blasius and Tönjes, la fracción de partidas con popularidad n
satisface una ley de potencias (Figura 3.5(A))
S(n) ∼ n−α
con exponente α = 2, lo cuál corresponde a la ley de Zipf [30]. Al estudiar el fenómeno
en más detalle, se encuentra que las frecuencias Sd (n) de los juegos correspondientes a
los primeros d movimientos son consistentes con un comportamiento de ley de potencias
(Figura 3.5.(B))
Sd (n) ∼ n−αd
en donde los exponentes αd no son universales sino que aumentan linealmente con d.
Las leyes de potencias con exponentes no universales pueden explicarse utilizando
caminatas aleatorias multiplicativas[33, 34]. La propuesta de Blasius y Tönjes consiste
en un modelo basado en este tipo de procesos que explica con gran precisión las distribuciones observadas. Más precisamente, el número nd de partidas tras d movimientos
viene dado por la ecuación,
nd = N
d
Y
ri ,
n0 = N.
(3.22)
i=1
En el trabajo de Blasius y Tönjes se asume que el árbol de partidas de la Figura 3.4 es
autosimilar de manera que cada factor de ramificación ri ∈ [0, 1] es una variable aleatoria correspondiente a una distribución de probabilidades q(r) que es independiente del
nodo σ en consideración. En particular q(r) es independiente del número de partidas
N , y de la profundidad d de la posición. La distribución q(r) fué medida por Blasius y
Tönjes y se encuentra que la misma está bien descripta por la expresión no paramétrica
(ver Figura 3.6(A))
2
q(r) = √
.
(3.23)
π 1 − r2
correspondiente a la distribucion arcoseno. Tal distribución q(r) es aproximadamente
constante para valores relativamente grandes de r y diverge como (1 − r)1/2 cuando
r → 1. En el trabajo de Blasius y Tönjes se menciona que la forma de la distribución
q(r) sugiere que en el caso del ajedrez no existe un proceso de crecimiento preferencial,
sino algún factor relacionado con el proceso de decisión durante la etapa de apertura
de las partidas de ajedrez[35].
36
CAPÍTULO 3. CONCEPTOS Y DEFINICIONES
Figura 3.4: (A) Representación del árbol de la base SCIDBASE. Las líneas sólidas representan las posibles continuaciones del juego junto con sus correspondientes probabilidades, y
las líneas de puntos, otras posibles continuaciones menos probables que no se muestran. (B)
Representación alternativa que destaca la segmentación sucesiva del conjunto de partidas.
Cada nodo σ esta representado por un recuadro cuyo tamaño es proporcional a su frecuencia
nσ . En la profundidad siguiente las partidas se dividen en sub-conjuntos de acuerdo con las
posibles continuaciones del juego. Fuente: Blasius et al.[1].
3.6. LEY DE ZIPF
37
Figura 3.5: (A) Histograma de la frecuencia pesos S(n) de las aperturas hasta una profundidad d = 40 con bin logarítmico. Una regresión lineal resulta en un exponente de α = 2,05.
(B) Número de aperturas Sd (n) de profundidad d con popularidad n para d = 16 e histogramas con bin logarítmico para d = 4, d = 16 y d = 22. Inset: pendiente αd en función de la
profundidad d y la estimación analítica (Ec. 3.26) utilizando N = 1,4 × 106 y β = 0. Fuente:
Blasius et al.[1].
38
CAPÍTULO 3. CONCEPTOS Y DEFINICIONES
A su vez el trabajo provee una derivación analítica de las distribuciones S(n) y
Sd (n) partiendo de una aproximación a la distribución q(r) dada por,
q(r) = (1 + β)rβ ,
(3.24)
0 ≤ r ≤ 1,
la cuál típicamente aparece en procesos de conexión preferencial2 [36] derivados de modelos de crecimiento preferencial[37]. Los cálculos determinan que
N
(1 + β)d
log
Sd (n) =
N (d − 1)!
n
d−1 N
n
1−β
.
(3.25)
Utilizando una expansión logarítmica en el rango 1 ≪ n ≪ N esta expresión exhibe
una comportamiento tipo ley de potencias con exponente −αd dado por
αd = (1 − β) +
1
(d − 1),
log N
(3.26)
de modo que αd crece linealmente con la profundidad d más una correción logarítmica
estando en buena concordancia con lo observado (Inset de la Figura 3.5(B)). Como
se muestra en la Figura 3.6 las simulaciones del proceso multiplicativo (Ec. 3.22) empleando la distribución arcoseno (Ec. 3.23) resultan una buena aproximación de las
frecuencias pesadas Sd (n) de la base de datos de ajedrez. Si las razones de ramificación
son aproximadas por una distribución uniforme q(r) = 1, los valores de Sd (n) resultan
sistematicamente pequeños, ya que esta distribución produce un mayor flujo hacia el
estado absorbente n∗ = 1 que el observado en la base de datos. Sin embargo, debido
al comportamiento asintótico de q(r) cuando r → 0, esta aproximación produce una
pendiente correcta en el gráfico log-log de forma tal que el exponente αd puede ser
estimado con la Ec. 3.26 y tomando β = 0. Posteriormente, en el trabajo de Blasius
y Tönjes mediante el uso de la teoría de los procesos de renovación,3 se muestra que
P
el comportamiento asintótico de S(n) = d Sd (n), en el rango n ≫ 1, puede derivarse
para un amplio espectro de distribuciones q(r) encontrándose que
lı́m S(n) =
(n/N )→0
N
,
µn2
donde µ = h− log ri, lo cuál está en excelente acuerdo con lo encontrado empíricamente
(Figura 3.5). Así, el proceso multiplicativo de la Ec. 3.22 siempre lleva un ‘scaling’
universal asintótico para n ≪ N , para cualquier distribución de ramificaciones q(r)
bien comportada. Este resultado es importante ya que muestra que los procesos que
2
3
Del inglés preferential attachment
Del inglés renewal processes.
3.6. LEY DE ZIPF
39
Figura 3.6: (A) Densidad de probabilidad q(r) de las razones de ramificación r medida utilizando la base de datos Scid con intervalos constantes ∆r = 0,01, y la distribución arcoseno
n
(Ec. 3.23). (B) Probabilidad Pd (n) = N
Sd (n) de que un nodo a una distancia d del nodo
raíz posea popularidad n para el caso d = 22 en la base de datos SCIDBASE (línea negra).
Comparativamente se muestran las curvas correspondientes a una simulación directa del proceso multiplicativo con la distribución q(r) original (Ec. 3.22, línea azul), y una distribución
q(r) uniforme (Ec. 3.24 con β = 0, línea roja). Resultados teóricos según la Ec. 3.25 (línea a
rayas). Fuente: Blasius et al.[1].
40
CAPÍTULO 3. CONCEPTOS Y DEFINICIONES
dan lugar a distribuciones Zipf del peso de los subárboles de un árbol autosimilar es
mucho más amplia que la clase de procesos basados en conexión preferencial o procesos
de crecimiento[38].
Una de las consecuencias de la teoría de Blasius y Tönjes es que en un proceso de
d decisiones mutuamente excluyentes, la distribución de las secuencias de decisiones, o
estrategias, que toman lugar n veces, Sd (n) ∼ n−αd , pone en evidencia una transición
desde exponentes αd ≤ 2, donde existen unas pocas estrategias que son muy comunes,
a exponentes elevados αd > 2, donde todas las estrategias resultan uniformemente
dominantes4 . Esta transición es causada por la divergencia del primer momento en
leyes de potencias con exponentes mayores a −2 [30]. El número crítico de decisiones
dcr para el cual ocurre la transición es calculado a partir de la Ec. 3.26,
dcr = 1 + (1 + β)log N.
Para el caso de SCIDBASE en donde N = 1,4 × 106 , se tiene que dcr = 15. Esto
separa a la base en dos regímenes diferentes: en la fase inicial (d < dcr ) la mayor parte
de las partidas de ajedrez están distribuídas entre un pequeño número de aperturas
populares, mientras que más allá de la profundidad de juego crítica las secuencias
raramente utilizadas son las dominantes de modo que al considerarlas todas juntas
comprenden la mayoría de las partidas. Es importante resaltar que este resultado es
un efecto de la estadística y no indican un cambio de comportamiento de los jugadores
al incrementarse la profundidad del juego.
4
Cualquier estrategia presenta una popularidad n bien aproximada por la media hni
4. Resultados
En esta sección se presentan los resultados obtenidos del estudio general de la base
de datos, la reproducción de algunos resultados de Blasius y Tönjes y la generación de
la serie temporal a partir de la base de datos de partidas de ajedrez con el consecuente
estudio de la misma mediante los métodos de R/S y DF A. Para implemetar estos
análisis se desarrollaron programas utilizando el lenguaje de programación FORTRAN
90.
4.1.
Base de Datos
La base de datos utilizada, SCIDBASE[32], cuenta con más de 3,5 × 106 partidas
de ajedrez, desde el año 206 dC al 2007, y fué convertida al formato PGN (portable
game notation) utilizando una variación de la SCIDBASE llamada Scid vs Pc[39].
El formato en el cual se encuentran registradas las partidas es el siguiente: #(indicando una nueva partida), número de partida (orden en la base), año, día, mes, jugador
de las blancas, jugador de las negras, elo de las blancas, elo de las negras, resultado del
partido, evento (por ejemplo si la partida fué jugada en un torneo) ; luego se encuentran
registrados los movimientos realizados en dos columnas, la primera correspondiente a
los movimientos de las blancas y la segunda a los movimientos de las negras.
Como fué explicado anteriormente, el Elo es una calificación dinámica que cambia
luego de que un jugador juega una partida, a pesar de esto, en la base de datos, los Elos
de los jugadores son aproximados y permanecen constantes a través del tiempo. Además, como el sistema de puntuación Elo fué implementado en 1970, para los partidos
que tomaron lugar antes de 1970, los Elos de los jugadores son una estimación.
Del total de las partidas registradas solo 1,5 × 106 posee todos los datos completos,
en particular en muchas de ellas los datos temporales se encuentran incompletos o los
41
42
CAPÍTULO 4. RESULTADOS
Elos de los jugadores están ausentes. Es por esto que en la mayor parte del trabajo estas
partidas con “datos corruptos” son filtradas y se trabaja solamente con las partidas
cuyos datos están completos.
4.2.
Estudio General de la Base de Datos
El Ajedrez ha capturado el interés de la humanidad por siglos. Dentro de este
marco es de esperar que tanto los procesos sociales como los avances tecnológicos hayan
ejercido una influencia notable en elementos como la cantidad de partidas registradas
o las puntuaciones Elo de los jugadores.
Como se mencionó previamente, la base de datos cuenta con partidas registradas a
partir del año 206 Dc, sin embargo la cantidad de juegos hasta 1837 es muy pequeña
y no es tomada en cuenta para el estudio general de la base. Con el fin de analizar la
distribución de partidas por año se utilizó una base la cual consta de 1,5 × 106 partidas,
resultante del filtrado de los elementos con datos corruptos y los correspondientes a
años anteriores a 1837. En la Figura 4.1 se muestra la cantidad de partidas registradas
en la base de datos por año utilizando escala logarítmica en el eje y.
De forma general la cantidad de partidos registrados han ido aumentando con los
años, sin embargo es posible distiguir tres períodos temporales que presentan diferentes
tendencias de crecimiento. El más evidente de estos períodos es el que tiene lugar
a partir del año 1997 y coincide con la generalización del acceso a Internet de la
población mundial, esto permitió un gran aumento de registro de los partidos jugados,
en parte debido al surgimiento de diversos servidores web de ajedrez los que vinieron
a reemplazar los partidos por correspondencia escrita. Los otros dos períodos resultan
más difíciles de identificar a simple vista y son los comprendidos entre los años 18371959 y 1960-1997. De 1960 a 1997 la distribución de partidas por año tiende a ser
relativamente estable. Entre los años 1837 y 1959 se observan aumentos y disminuciones
abruptas en la distribución, provocadas por diversos hechos, por un lado, en el mundo
del ajedrez, comienzan a formarse las federaciones de ajedrez como la británica y a
organizarse torneos internacionales, por otro lado es un período de grandes cambios
tecnológicos y conflictos mundiales, en particular resulta evidente la disminución de las
partidas registradas durante la segunda guerra mundial (1939-1945).
Debido al incremento de la cantidad de partidas registradas, y al aumento del acceso
de los jugadores a las mismas a través de diferentes medios de comunicación como libros,
4.2. ESTUDIO GENERAL DE LA BASE DE DATOS
43
Distribución de partidas por año
7
10
1837−1959
1960−1997
1998−2007
cantidad de partidas (escala logarítmica)
106
105
104
103
102
101
100
1820
1840
1860
1880
1900
1920
1940
1960
1980
2000
año
Figura 4.1: Cantidad de Partidas por año desde 1837 con un total de N = 1,5 × 106 partidas
y el perfil correspondiente . Escala logarítmica en el eje y.
2020
44
CAPÍTULO 4. RESULTADOS
Elo promedio de los Grand Masters
2450
2400
Elo promedio
2350
2300
2250
2200
2150
2100
1820
1840
1860
1880
1900
1920
1940
1960
1980
2000
año
Figura 4.2: Número promedio de Elo Grand Masters (Elo mayor a 2000) por año sobre
N = 1,3 × 106 partidas.
2020
4.2. ESTUDIO GENERAL DE LA BASE DE DATOS
45
revistas, etc., resulta natural suponer que la habilidad de los jugadores más expertos,
llamados Grand Masters (jugadores que superan los 2000 Elo), también ha aumentado
a través del tiempo[9]. Partiendo de la base de datos constituída por 1,5 × 106 partidas
y filtrando las partidas en las cuales el Elo mayor de los dos jugadores es menor a 2000,
se calculó el promedio de los Elos máximos por año (Figura 4.2). Se observa como el
Elo promedio oscila alrededor de un valor relativamente constante hasta el año 1970, a
no ser por una disminución abrupta en 1917, donde el promedio en este período resulta
2239 Elo. En el año 1970 el Elo promedio sufre un salto significativo, que coincide
con la racha ganadora de 20 partidas consecutivas de Bobby Fischer (1970-1971) y
su consagración como campeón mundial al derrotar a Boris Spassky(1972). Luego de
dicho salto, el Elo promedio oscila alrededor de 2341 Elo, valor que resulta cercano al
promedio de Elo de un torneo olímpico (2300 Elo[9]).
Resulta interesante también estudiar la distribución de partidas por Elo máximo, es
decir la cantidad de partidas en los cuales el Elo máximo de los dos jugadores toma un
cierto valor. Ya que la fracción de la base de datos con Elo máximo menor a 500 Elo es
prácticamente despreciable, en la Figura 4.3 se grafica la distribución correspondiente
a Elos superiores a este valor. La distribución fué calculada considerando los Elos
máximos de cada partida en intervalos de 10 Elo. Se observa como la distribución de
partidos se asemeja a la de una distribución normal, por lo tanto se realizó un ajuste de
2
el cual arrojó un valor de µ = 2303 Elo
los datos con una función f (x) = c exp − (x−µ)
2σ 2
para la media de la distribución y σ = 208 Elo para la desviación estándar. Nuevamente
el valor calculado para µ coincide con el promedio de Elo de un torneo olímpico, y el
valor obtenido para la dispersión σ es similar a la esperada en el caso de la distribución
de rendimientos de un jugador.
46
CAPÍTULO 4. RESULTADOS
Distribución de partidas por Elo máximo
30000
σ=208 Elo, µ=2303 Elo
cantidad de partidas
25000
20000
15000
10000
5000
0
500
1000
1500
2000
2500
Elo
Figura 4.3: Líneas rojas: cantidad de partidos por intervalo de 10 Elo, tomando el Elo máximo
de cada partida, apartir de 500 sobre N = 1,5 × 106 partidas. Línea negra: Ajuste empleando
una distribución normal con σ = 208 y media µ = 2303 Elo.
3000
4.3. DISTRIBUCIONES LIBRES DE ESCALA
4.3.
47
Distribuciones Libres de Escala
En el capítulo 3.6.1 se explica como Blasius y Tönjes[1] observaron un comportamiento de leyes de potencias al calcular la frecuencia de las partidas con popularidad n
(cantidad de apariciones en la base de datos) Sd (n), a una profundidad fija d. Es decir,
dada una profundida d se tiene que
Sd (n) ∼ n−αd ,
donde el exponente αd crece al aumentar el parámetro d (Figura 4.5).
Empleando la SCIDBASE[32] se propuso reproducir estos resultados tomando los
valores d = 2, d = 4 y d = 8 por cuestiones de tiempo de cálculo. Se utilizó un
total de 1,4 × 106 partidos posteriores a 1998 obtenidos luego de filtrar las partidas
con datos corruptos de la base de datos original. A fin de obtener el histograma de
frecuencias se calculó la popularidad n de cada apertura, esto es, la cantidad de veces
que aparece en la base de datos, y luego la cantidad de aperturas Sd (n) con popularidad
n en intervalos constantes para los valores de d antes mencionados. Asimismo, con el
objetivo de calcular el exponente αd se utilizó un bin logarítmico donde cada intervalo es
dos veces el anterior, es decir, los intervalos están definidos como [2i , 2i+1 ] i = 0, 1, 2, ....
Los gráficos obtenidos se muestran en la Figura 4.4.
Los valores de αd fueron calculados realizando una regresión lineal de las distribuciones obtenidas con un bin logarítmico resultando en:
d
αd
2
4
8
1,28 ± 0,05 1,53 ± 0,03 1,9 ± 0,1
Observando la Figura 4.5 es posible concluir que los resultados obtenidos son equivalentes a aquellos calculados por Blasius y Tönjes.
48
CAPÍTULO 4. RESULTADOS
106
d=8 histograma
d=8 logbin
d=4 logbin
d=2 logbin
5
10
104
103
frecuencia Sd(n)
102
101
100
10−1
10−2
10−3
10−4
10−5 0
10
1
10
2
3
10
10
4
10
popularidad n
Figura 4.4: Gráfico log-log de la cantidad de aperturas Sd (n) a una dada profundidad d con
una dada popularidad n para d = 8 e histogramas calculados con bin logarítmico para d = 2,
d = 4 y d = 8.
5
10
4.3. DISTRIBUCIONES LIBRES DE ESCALA
49
Figura 4.5: Puntos rojos: exponente α obtenido por Blasius y Tönjes para diferentes valores
de d (Inset Figura 3.5 (B)).
50
CAPÍTULO 4. RESULTADOS
4.4.
Análisis de Correlaciones
Una vez obtenido el árbol de jugadas con las correspondientes razones de ramificación ri , Blasius y Tönjes proponen la reproducción de las partidas de la base de datos
mediante un proceso multiplicativo (Ec. 3.22). Sin embargo, como menciona Sigman [8],
la experiencia de un jugador se refleja en la combinación de su habilidad para calcular
variaciones (búsqueda) y su habilidad para reconocer y recordar patrones significativos en el tablero. Por lo tanto resulta natural suponer que el ajedrez es un juego con
memoria al menos a nivel de cada jugador. Por lo tanto, es de esperar que al estudiar
una secuencia de partidas existan correlaciones no nulas entre ellas. Este aspecto no
se ve reflejado en partidas generadas por un proceso multiplicativo. Es por esto que se
propuso explorar la existencia de memoria de largo alcance en el conjunto de partidas
de ajedrez empleando métodos de análisis de series temporales.
Análogamente a los estudios realizados en cuerpos literarios[19, 2], las partidas de
la base de datos se tradujeron a una serie temporal discreta, esto se realizó ordenando
los elementos de la base cronológicamente, y definiendo a los elementos de la serie como
X(t) =
t−1
X
C(t, t′ ),
(4.1)
t′ =t−τ
donde C(t, t′ ) es una medida de similitud entre partidas definida por la cantidad de
coincidencias consecutivas en los movimientos entre las partidas a tiempos t y t′ ; en
principio se tomó τ = 1. A su vez, a cada elemento de la serie temporal X(t) le fué
asignado los datos correspondientes a los jugadores, Elos y resultados de la partida a
tiempo t. Cabe mencionar que debido a que el registo de las partidas no es contínuo
en el tiempo; es posible establecer el orden cronológico de las partidas, no así la escala
temporal.
El siguiente ejemplo muestra cómo se calcula X(t) para τ = 3. Dadas las siguientes
secuencias de movimientos de cuatro partidas consecutivas:
t − 3: e4 - d5 - exd5 - Qxd5 - Nc3 - Qa5 - d4 - Nf6 - Nf3 - c6 - Ne5 - Bf5 - g4 - Be4
t − 2: e4 - e5 - Nf3 - Nc6 - Bc4 - Bc5 - c3 - Nf6 - d3 - d6 - Bb3 - O-O - Nbd2 - Be6
t − 1: e4 - d5 - exd5 - Qxd5 - Nc3 - Qa5 - d4 - e6 - Nf3 - c6 - Bd3 - Nf6 - O-O - Be7
t: e4 - e5 - Nf3 - Nc6 - Bb5 - a6 - Ba4 - Nf6 - O-O - Be7 - Re1 - b5 - Bb3 - d6
se desea calcular la cantidad de coincidencias C(t, t′ ) entre la secuencia a tiempo t
y las tres secuencias anteriores. En este ejemplo, C(t, t − 1) = 1, C(t, t − 2) = 4
4.4. ANÁLISIS DE CORRELACIONES
51
y C(t, t − 3) = 1. Finalmente se suman estas coincidencias dando como resultado
X(t) = 6.
Para el análisis de la serie temporal se utilizaron dos métodos, rango reescalado
R/S y DFA, y se utilizó un total de 1,4 × 106 partidas posteriores a 1998.
Tomando cada valor obtenido para los elementos de la serie temporal y calculando
la cantidad de repeticiones que posee el mismo es posible realizar un histograma de
frecuencias de coincidencias, el cual se muestra en la Figura 4.6. Se observa que la
misma decae en forma exponencial con exponente α = −0,49, por lo tanto guarda
cierta similitud con la frecuencia de apariciones de aperturas en la base S(n) (Figura
4.4) en el sentido que existen pocos pares de partidas que exhiben gran número de
coincidencias consecutivas, mientras que la mayoría de los pares de partidas poseen
escasas coincidencias. Más allá de X = 24 la cantidad de elementos de la serie son
practicamente inexistentes, por lo tanto éstos no fueron tomados en cuenta para el
cálculo de la frecuencia.
Observando las Figuras 4.7 y 4.8, donde se muestran la serie temporal X(t) con
2000 puntos y el perfil Y(t) total calculado, se presume que la misma posee memoria
ya que se advierten oscilaciones las cuales parecen tener un período largo, lo que indica
que la serie no es equivalente a una caminata aleatoria a diferencia de la serie en la que
se ha introducido shuffling aleatorio de los datos (Figura 4.9). Para comprobar esto se
calculó el exponente de Hurst empleando las metodogías antes mencionadas.
Tanto para la estadística R/S como para el DFA se dividió la serie temporal en
series de menos longitud n = N, N/2, N/4, ..., N/29 . Para el método de rango reescalado
la dispersión de cada punto fué estimada tomando los valores máximo y mínimo de
R/S para cada n; sin embargo, el error correspondiente a n = N no fué incuído debido
a que en este caso la serie se “divide” en un solo intervalo y por lo tanto, se dispone de
una única muestra. En el caso del método DF A no fué posible definir el error para cada
punto, por ende no fueron incluídos. Los gráficos obtenidos para E[R(n)/S(n)] y F (n)
se muestran en las Figuras 4.10 y 4.11, respectivamente. El exponente calculado con el
método DFA resulta ζ < 1, por lo tanto la serie temporal es estacionaria y ζ = H.
52
CAPÍTULO 4. RESULTADOS
frecuencia (escala logarítmica)
Histograma de coincidencias
10
6
10
5
10
4
10
3
10
2
10
1
10
0
0
5
10
15
20
25
X
Figura 4.6: Gráfico de la cantidad de repeticiones de coincidencias a un dado valor de X.
Escala logarítmica en el eje y.
X(t)
Serie Temporal
16
14
12
10
8
6
4
2
0
0
200
400
600
800
1000
1200
orden temporal (t)
1400
1600
Figura 4.7: Serie temporal X(t) hasta 2000 puntos.
1800
2000
4.4. ANÁLISIS DE CORRELACIONES
53
Perfil
Y(t)
0
−1*10
3
−2*10
3
−3*10
3
−4*10
3
−5*10
3
−6*10
3
−7*10
3
0
2.0*10
5
4.0*10
5
5
6.0*10
8.0*10
orden temporal (t)
Figura 4.8: Perfil Y (t) =
Pt
5
i=1 (X(i)
1.0*10
6
1.2*10
6
− m).
Perfil con shuffling
Y(t)
2
2.0*10
0
2
−2.0*10
2
−4.0*10
2
−6.0*10
2
−8.0*10
3
−1.0*10
3
−1.2*10
3
−1.4*10
0
2.0*10
5
Figura 4.9: Perfil Y (t) =
motrada en la Figura 4.7.
4.0*10
Pt
5
5
5
6.0*10
8.0*10
orden temporal (t)
i=1 (X(i) − m)
1.0*10
6
1.2*10
6
1.4*10
6
una vez realizado el shuffling de la serie temporal
54
CAPÍTULO 4. RESULTADOS
Hurst: rango reescalado
4
10
3
E[R(n)/S(n)]
10
2
10
R/S
puntos extremos de R/S
1
10
3
10
4
5
10
Figura 4.10: Gráfico log-log de E
10
n
h
R(n)
S(n)
i
6
10
vs. n. La regresión lineal devuelve una pendiente
H = 0,68 ± 0,01. Las cruces indican los valores extremos que toma R(n)/S(n) en cada
conjunto de muestras.
7
10
4.4. ANÁLISIS DE CORRELACIONES
55
Hurst: DFA
4
10
3
F(n)
10
2
10
1
10
3
10
4
10
5
10
n
6
10
Figura 4.11: Gráfico log-log de F (n) vs. n. La regresión lineal devuelve una pendiente H =
0,67 ± 0,01.
7
10
56
CAPÍTULO 4. RESULTADOS
Los exponentes de Hurst resultantes son indistinguibles entre si y mayores a 1/2,
por lo tanto se puede inferir que la serie temporal de partidas de ajedrez tiene memoria
de largo alcance.
Como se mencionó antes, la base de datos cuenta con partidas tanto de jugadores
expertos como de jugadores principiantes categorizados por su puntaje de Elo. Este
hecho permitió el estudio de la memoria de las partidas de jugadores en diferentes
categorías.
Tomando el Elo mayor asignado a cada elemento X(t), se dividió la serie temporal
en tres categorías, jugadores inexpertos cuyo Elo fuera menor a 999 con un total de
N = 5,5 × 103 partidas, jugadores de experiencia intermedia con Elos entre 1000 y 1999
con un total de N = 1,8 × 105 partidas, y por último jugadores expertos, los llamados
Grand Masters, con Elos mayores a 2000 con un total de N = 1,1 × 106 partidas.
En las Figuras 4.12 y 4.13 se muestran las series temporales X(t) hasta t = 2000
y los perfiles Y(t) correspondientes a los tres intervalos de Elo. La diferencia entre las
tres series temporales es sutil, aún así es posible observar pequeñas tendencias locales
para Elos entre 2000 y 2900 (Figura 4.12 (A)), así como también para Elos entre 1000
y 1999 (Figura 4.12 (B)), aunque en menor medida; en cambio, en el caso de jugadores
inexpertos (Figura 4.12 (C)) no se observa practicamente ninguna tendencia local. Por
lo tanto, se esperaría obtener un exponente de Hurst H > 1/2 para Elos mayores a
1000 y cercano a 1/2 para Elos menores.
En el caso de los jugadores inexpertos, debido al número reducido de partidas
disponibles en estas categorías, al calcular H mediante R/S y DF A se utilizaron nueve
muestras en lugar de diez. Los resultados obtenidos mediante los métodos de rango
reescalado y DFA se presentan en las Figuras 4.14 y 4.15.
Los dos métodos producen resultados muy similares y se muestran a continuación:
R/S
DFA
Elo=1-999
Elo=1000-1999 Elo=2000-2900
H = 0,52 ± 0,04 H = 0,61 ± 0,03 H = 0,68 ± 0,01
H = 0,48 ± 0,03 H = 0,57 ± 0,04 H = 0,68 ± 0,01
4.4. ANÁLISIS DE CORRELACIONES
57
(A) Elo=2000-2900
16
14
12
10
8
6
4
2
0
0
200
400
600
800
1000
1200
1400
1600
1800
2000
1800
2000
1800
2000
(B) Elo=1000-1999
X(t)
16
14
12
10
8
6
4
2
0
0
200
400
600
800
1000
1200
1400
1600
(C) Elo=1-999
16
14
12
10
8
6
4
2
0
0
200
400
600
800
1000
1200
1400
1600
orden temporal (t)
Figura 4.12: Serie temporal X(t) hasta 2000 puntos. (A) Jugadores expertos con Elos mayores
a 2000. (B) Jugadores de experiencia intermedia con Elos entre 1000 y 1999. (C) Jugadores
inexpertos con Elos menores a 999.
58
CAPÍTULO 4. RESULTADOS
(A) Elo=2000-2900
0
-2*10
3
-4*10
3
-6*10
3
0
2*10
5
4*10
5
6*10
5
8*10
5
1*10
6
(B) Elo=1000-1999
2*10
2
Y(t)
0
-2*10
2
-4*10
2
-6*10
2
0
2*10
4
4*10
4
6*10
4
8*10
4
1*10
5
5
1.2*10
5
1.4*10
5
5
1.6*10
1.8*10
(C) Elo= 1-999
0
-2*10
1
-4*10
1
-6*10
1
-8*10
1
0
1*10
3
2*10
3
3*10
3
4*10
3
5*10
3
orden temporal (t)
Figura 4.13: Perfil Y (t) =
Pt
i=1 (X(i)
− m). (A) Jugadores expertos con Elos mayores a
2000. (B) Jugadores de esperiencia intermedia con Elos entre 1000 y 1999. (C) Jugadores
inexpertos con Elos menores a 999.
4.4. ANÁLISIS DE CORRELACIONES
59
(A) Elo=2000-2900
10
4
10
3
10
2
10
1
10
3
10
4
10
5
10
6
10
7
10
6
10
4
E[R(n)/S(n)]
(B) Elo=1000-1999
10
4
10
3
10
2
10
1
10
2
10
3
10
4
10
5
(C) Elo=1-999
10
2
10
1
10
0
10
1
10
2
10
3
n
Figura
i4.14: Cálculo de H mediante el método de Rango Reescalado: Gráfico log-log de
h
E R(n)
S(n) vs. n por intervalo de Elo donde los puntos grises representan los valores extremos
de R/S. Las regresiones lineales devuelven una pendiente H = 0,52 ± 0,02 para Elo=1-999
(línea roja), H = 0,61 ± 0,03 para Elo=1000-1999 (línea verde) y H = 0,68 ± 0,01 para
Elo=2000-2900 (línea azul).
60
CAPÍTULO 4. RESULTADOS
(A) Elo=2000-2900
4
10
3
10
2
10
1
10
3
4
10
5
10
6
10
10
7
10
(B) Elo=1000-1999
3
10
F(n)
2
10
1
10
0
10
2
10
3
4
10
5
10
10
6
10
(C) Elo=1-999
2
10
1
10
0
10
1
10
2
3
10
10
n
Figura 4.15: Cálculo de H mediante el método DF A: Gráfico log-log de F (n) vs. n por
intervalo de Elo. Las regresiones lineales devuelven una pendiente H = 0,48 ± 0,03 para
Elo=1-999 (línea roja), H = 0,57 ± 0,04 para Elo=1000-1999 (línea verde) y H = 0,68 ± 0,01
para Elo=2000-2900 (línea azul).
4
10
4.4. ANÁLISIS DE CORRELACIONES
61
Nuevamente los resultados generados por el método de DF A son menores a 1, por lo
que las series temporales correspondientes a los tres intervalos de Elo son estacionarias.
Por un lado, para los jugadores expertos los exponentes de Hurst resultan iguales a
0,68, lo que indica que las partidas están auto-correlacionadas y la presencia de memoria
de largo alcance, esto era de esperarse ya que los jugadores de categorías superiores
son los que disponen de un conocimiento más amplio del juego. En el caso de los
jugadores de experiencia intermedia H ∼ 0,60, por lo tanto, se observa nuevamente
memoria de largo alcance, estos jugadores tienen memoria de las partidas pasadas
aunque, como lo indica la leve disminución en el coeficiente, no en la misma medida
que los jugadores de categorias superiores. Por último, para los jugadores inexpertos,
ambos coeficientes obtenidos son aproximadamente 1/2, lo que significa que para las
categorías menores las partidas no están correlacionadas, estos jugadores no poseen
aún el nivel de conocimiento tal que se refleje en su comportamiento en la toma de
decisiones.
A su vez es notable la similitud del exponente de Hurst calculado para jugadores
expertos con aquel calculado sin discriminación por Elo. Esto se debe a que los jugadores de categorías superiores son dominantes en cantidad (86 % del total de partidas
registradas) y por lo tanto determinan el valor de H.
A fin de poner en evidencia la importancia del orden temporal a la hora de generar
la serie X(t) se realizó un shuffling aleatorio de los elementos de la serie y se procedió
a calcular el exponente de Hurst nuevamente utilizando el método R/S de rango reescalado para los tres intervalos de Elo. Los valores obtenidos se muestran en la siguiente
tabla:
Elo=1-999
Elo=1000-1999
Elo=2000-2900
H = 0,48 ± 0,02 H = 0,47 ± 0,04 H = 0,497 ± 0,006
En la Figura 4.16 las pendientes de las tres rectas son practicamente indistinguibles,
de hecho, los valores obtenidos son todos cercanos a 1/2. Es decir, al realizar un shuffling
aleatorio la serie temporal resulta no correlacionada y por lo tanto no posee memoria
de largo alcance. Esto indica que la elección para la asignación de la serie temporal
(Ec. 4.1) no intorduce correlaciones espurias.
Los resultados anteriores corresponden a series temporales X(t) igual a la cantidad
de coincidencias entre dos partidas consecutivas, es decir, τ = 1 en la Ec. (4.1). Si se
define ahora a X(t) como la suma de las coincidencias de la partida a tiempo t con
62
CAPÍTULO 4. RESULTADOS
(A) Elo=2000−2900
4
10
3
10
2
10
1
10
3
4
10
5
10
6
10
10
7
10
(B) Elo=1000−1999
3
E[R(n)/S(n)]
10
2
10
1
10
2
10
3
4
10
5
10
10
6
10
(C) Elo=1−999
2
10
1
10
0
10
1
10
2
3
10
10
n
Figura
i4.16: Cálculo de H mediante el método de Rango Reescalado: Gráfico log-log de
h
E R(n)
S(n) vs. n por intervalo de Elo una vez realizado el shuffling de la serie temporal. Las
regresiones lineales devuelven una pendiente H = 0,48 ± 0,02 para Elo=1-999 (línea roja),
H = 0,47 ± 0,04 para Elo=1000-1999 (línea verde) y H = 0,497 ± 0,006 para Elo=2000-2900
(línea azul).
4
10
4.4. ANÁLISIS DE CORRELACIONES
63
las diez partidas anteriores, tomando τ = 10, se obtiene una nueva serie temporal.
Se calculó el coeficiente de Hurst con el método R/S para esta nueva serie temporal
realizando las mismas divisiones en intervalos de Elo (Figura 4.17) a fin de observar la
influencia del parámetro τ empleado para la generación de la serie temporal a la hora
de determinar la presencia memoria de largo alcance. El método produjo los siguientes
valores:
Elo=1-999
Elo=1000-1999 Elo=2000-2900
H = 0,54 ± 0,02 H = 0,60 ± 0,02 H = 0,67 ± 0,01
Dada la similitud de los exponentes a los calculados con la serie generada con
τ = 1, es posible establecer que, independientemente de la elección de τ , la serie
temporal generada a partir de la base de datos de partidas de ajedrez mediante 4.1
posee memoria de largo alcance en los casos de los jugadores cuyos Elos superan los
1000 Elo, y no así para los jugadores más inexpertos con Elos menores a 999 Elo cuyas
partidas resultan no correlacionadas.
Todos los resultados antes expuestos fueron obtenidos tomando la porción de la
base de datos posterior a 1998. Con el fin de estudiar el comportamiento del exponente
de Hurst en diferentes períodos temporales se utilizó una base de datos extendida que
cuenta con 3,5 × 106 partidas entre 1878 y 1997, este conjunto fue dividido en nueve
sub-conjuntos tomando en cuenta eventos significativos de la historia tanto mundial
como particular del ajedrez. Como fué mencionado anteriormente, las reglas del ajedrez
sufrieron cambios a medida que pasaban los años, en especial la regla de limitación del
tiempo de juego, por lo tanto se tuvo especial cuidado de no mezclar partidas que
fueron jugadas con reglas diferentes en el mismo sub-conjunto de datos.
En la Figura 4.18 se muestran los coeficientes de Hurst H obtenidos, donde el último
valor corresponde al resultado previamente expuesto obtenido para el período temporal
posterior a 1998. Los mismos fueron calculados utilizando series temporales generadas
a partir de las partidas que tomaron lugar en los diferentes períodos indicados en la
Figura 4.18 y tomando τ = 1.
Se observa como H, y por lo tanto la auto-similitud, crece con el tiempo. Esto
implica que las partidas de la actualidad poseen correlaciones más persistentes que
en períodos temporales anteriores. Este comportamiento puede estar relacionado al
hecho de que en la actualidad resulta más fácil acceder a bases de datos de partidas
registradas.
64
CAPÍTULO 4. RESULTADOS
(A) Elo=2000−2900
4
10
3
10
2
10
1
10
3
4
10
5
10
6
10
10
7
10
(B) Elo=1000−1999
4
E[R(n)/S(n)]
10
3
10
2
10
1
10
2
10
3
4
10
5
10
10
6
10
(C) Elo=1−999
3
10
2
10
1
10
0
10
1
10
2
3
10
10
n
Figura
i4.17: Cálculo de H mediante el método de Rango Reescalado:Gráfico log-log de
h
E R(n)
S(n) vs. n por intervalo de Elo correspondiente a la serie temporal calculada con τ = 10.
Las regresiones lineales devuelven una pendiente H = 0,54±0,02 para Elo=1-999 (línea roja),
H = 0,60 ± 0,02 para Elo=1000-1999 (línea verde) y H = 0,67 ± 0,01 para Elo=2000-2900
(línea azul).
4
10
4.4. ANÁLISIS DE CORRELACIONES
65
Exponente de Hurst por intervalo de tiempo
0.7
0.65
H
0.6
0.55
0.5
0.45
0.4
7
el punto rojo representan el valor obtenido utilizando la base desde 1998.
00
7
99
9
Figura 4.18: Coeficiente de Hurst en diferentes períodos temporales. La línea roja tanto como
-2
98
19
-1
98
9
97
-1
90
19
80
19
9
96
-1
70
19
9
95
-1
60
19
9
94
-1
50
19
-1
38
19
7
93
-1
20
19
9
91
-1
00
19
9
89
-1
78
18
intervalo de tiempo
5. Conclusiones
Los resultados obtenidos en este trabajo se pueden resumir como sigue:
Se reprodujeron los resultados de Blasius y Tönjes, lo que da consistencia al
trabajo realizado.
Las series temporales generadas a partir de la base de datos de ajedrez, independientemente de la elección del parámetro τ , no poseen correlaciones espurias,
son estacionarias y muestran correlaciones de largo alcance, similarmente a los
resultados obtenidos en el análisis de cuerpos literarios llevados a cabo por Montemurro y Pury[2].
La presencia de correlaciones de largo alcance está relacionada al nivel de los
jugadores. Los jugadores de niveles superiores exhiben correlaciones significativas,
mientras que en jugadores débiles no se observan correlaciones.
Las correlaciones de largo alcance muestran una tendencia de crecimiento en el
tiempo.
Posibles continuaciones:
Actualmente se está trabajando en un modelo para generar partidas, basado
en un mecanismo de conexión preferencial, que produzca series temporales con
correlaciones de largo alcance y posea una distribución de Zipf.
Realizar el estudio de las correlaciones de largo alcance generando la serie temporal asignandolé a cada elemento de la misma la popularidad de las partidas a una
profundidad definida, similarmente a la asignación realizada por Montemurro y
Pury en el estudio de cuerpos literarios.
67
68
CAPÍTULO 5. CONCLUSIONES
Estudiar la aplicación de la ley de Heaps[40] a las aperturas de la base de datos
de ajedrez con el fin de observar la forma en la que crece el número de partidas
nuevas en función del número total de las mismas.
A. Apéndice
A.0.1.
Implementación del Método de Rango Reescalado
!Implementación del método R/S a una serie temporal con n_tot=1382894 elementos
! tomando num=10 muestras.
program rs
implicit none
integer(16),parameter
integer(16)
integer(8),dimension(n_tot,10)
real(8),dimension(num)
real(16),dimension(:),allocatable
real(8)
::n_tot=1382894,num=10
::i,k,j,n,l,p,t,c,k_max,q
::x
::e_tot
::y,y2,z,r,s,e,w
::m
open(unit=1,file=’serie-temporal.txt’,action=’read’)
open(unit=2,file=’rs.txt’)
do i=1,n_tot
read(1,*)x(i,:)
end do
!Se indica el número máximo de intervalos en los que se divide la serie
!y se inicializan los valores de k (número de intervalos) y el contador c.
k_max=2**num
k=1
c=1
do while(k .lt. k_max)
69
70
APÉNDICE A. APÉNDICE
allocate(e(k))
allocate(r(k))
allocate(s(k))
!Se determina la cantidad de puntos de cada intervalo.
if((n_tot-int(n_tot/float(k))) .le. 0.5)then
n=int(n_tot/float(k))
else
n=int(n_tot/float(k))+1
end if
allocate(y(n))
allocate(y2(n))
allocate(z(n))
!Para cada intervalo:
do j=0,k-1
m=0.
!Se calcula la media
do p=j*n+1,(j+1)*n
m=m+x(p,2)
end do
m=m/float(n)
y=0.
y2=0.
!Se calcula una serie centrada en la media
do q=j*n+1,(j+1)*n
y(q-j*n)=x(q,2)-m
y2(q-j*n)=(y(q-j*n))**2
end do
!Se calcula la desviación estándar
s(j+1)=sqrt((1/float(n))*sum(y2))
z(1)=y(1)
!Se calcula el perfil integrado
do t=1,n-1
z(t+1)=z(t)+y(t+1)
71
end do
!Se calcula el rango R y el cociente R/S
r(j+1)=maxval(z)-minval(z)
e(j+1)=r(j+1)/s(j+1)
end do
!Se promedia sobre todos los valores de R/S otenidos para cada intervalo
e_tot(c)=(1/float(k))*sum(e)
write(2,*)n,e_tot(c)
c=c+1
k=k*2
deallocate(y)
deallocate(y2)
deallocate(z)
deallocate(e)
deallocate(r)
deallocate(s)
end do
close(1)
close(2)
end program
A.0.2.
Implementación del Método de DF A
!Implementación del método DFA a una serie temporal con n_tot=1382894 elementos
!tomando num=10 muestras.
program dfa
implicit none
integer(16),parameter
integer(16)
::n_tot=1382894,num=10
::i, j, p, q, r, t,c
72
integer(16)
integer(8),dimension(n_tot,7)
real(16),dimension(:),allocatable
real(16), dimension(n_tot)
real(16)
APÉNDICE A. APÉNDICE
::k_max, k, n
::x
::w, e
::y,z
::m, a, b, e2, f
open(unit=1,file=’serie-temporal.txt’,action=’read’)
open(unit=2,file=’dfa.txt’)
do i=1,n_tot
read(1,*)x(i,:)
end do
do p=1,n_tot
m=m+x(p,2)
end do
m=m/float(n_tot)
do q=1,n_tot
y(q)=x(q,2)-m
end do
!Una vez obtenida la serie centrada en la media se calcula el perfil
!integrado de toda la serie
z(1)=y(1)
do r=1,n_tot-1
z(r+1)=z(r)+y(r+1)
end do
!Se indica el número máximo de intervalos en los que se divide la serie
!y se inicializan los valores de k (número de intervalos).
k_max=2**num
k=1
do while(k .lt. k_max)
73
!Se determina la cantidad de puntos de cada intervalo.
if((n_tot-int(n_tot/float(k))) .le. 0.5)then
n=int(n_tot/float(k))
else
n=int(n_tot/float(k))+1
end if
allocate(e(n))
allocate(w(n))
e=0.
e2=0.
!Para cada intervalo:
c=0
do j=0,k-1
!Se extrae el sub-conjunto de datos de la serie temporal
!correspondiente a cada intervalo tomado
do i=j*n+1,(j+1)*n
w(i-j*n)=z(i)
end do
write(*,*)k,c
c=c+1
!Se realiza una regresión lineal para cada sub-conjunto de datos
call regresion_lineal(w,n,a,b)
!Se calculan los residuos
do t=1,n
e(t)=w(t)-(a*t+b)
e2=(e(t))**2 +e2
end do
end do
!Se calcula la media cuadrática de los residuos de la serie
f=sqrt(e2/float(n_tot))
write(4,*)n, (minval(e))**2, f-((minval(e))**2-f)
write(2,*)n,f
74
APÉNDICE A. APÉNDICE
k=k*2
deallocate(w)
deallocate(e)
end do
close(1)
close(2)
contains
subroutine regresion_lineal(w,n,a,b)
implicit none
integer(16), intent(in)
integer(16)
real(16)
real(16), intent(out)
real(16),dimension(n), intent(in)
sx=0.
sy=0.
sxy=0.
sxx=0.
do t=1,n
sx=t+sx
sy=w(t)+sy
sxy=t*(w(t))+sxy
sxx=t**2+sxx
end do
a=(sy*sx-n*sxy)/(sx**2-n*sxx)
b=(sxy-a*sxx)/sx
end subroutine
end program
::n
::t
::sx,sy,sxy,sxx
::a,b
::w
Bibliografía
[1] Bernd Blasius and Ralf Tönjes. Zipf’s Law in the Popularity Distribution of Chess
Openings. Phys. Rev. Lett., 103:218701, Nov 2009.
[2] Marcelo A. Montemurro and Pedro A. Pury. Long-range fractal correlations in
literary corpora. Fractals, 10(04):451–461, 2002.
[3] Santo Fortunato and Claudio Castellano. Scaling and universality in proportional
elections. Phys. Rev. Lett., 99:138701, Sep 2007.
[4] Jacob Ratkiewicz, Santo Fortunato, Alessandro Flammini, Filippo Menczer, and
Alessandro Vespignani. Characterizing and modeling the dynamics of online popularity. Phys. Rev. Lett., 105:158701, Oct 2010.
[5] Alejandro F. Rozenfeld, Sophie Arnaud-Haond, Emilio Hernández-García, Víctor M. Eguíluz, Ester A. Serrão, and Carlos M. Duarte. Network analysis identifies
weak and strong links in a metapopulation system. Proceedings of the National
Academy of Sciences, 105(48):18824–18829, 2008.
[6] William Bialek, Andrea Cavagna, Irene Giardina, Thierry Mora, Edmondo Silvestri, Massimiliano Viale, and Aleksandra M. Walczak. Statistical mechanics
for natural flocks of birds. Proceedings of the National Academy of Sciences,
109(13):4786–4791, 2012.
[7] Fernando Peruani, Jörn Starruß, Vladimir Jakovljevic, Lotte Søgaard-Andersen,
Andreas Deutsch, and Markus Bär. Collective motion and nonequilibrium cluster
formation in colonies of gliding bacteria. Phys. Rev. Lett., 108:098102, Feb 2012.
[8] Mariano Sigman, Pablo Etchemendy, Diego Fernandez Slezak, and Guillermo A
Cecchi. Response time distributions in rapid chess: A large-scale decision making
experiment. Frontiers in Neuroscience, 4(60), 2010.
75
76
BIBLIOGRAFÍA
[9] Haroldo V. Ribeiro, Renio S. Mendes, Ervin K. Lenzi, Marcelo del Castillo-Mussot,
and Luís A. N. Amaral. Move-by-move dynamics of the advantage in chess matches
reveals population-level learning of the game. PLoS ONE, 8(1):e54165, 01 2013.
[10] Sergei Maslov. Viewpoint: Power laws in chess. Physics, 2:97, Nov 2009.
[11] Statistical physics: Chess obeys the law. Nature, 462(7273):546–546, December
2009.
[12] Marcelo A. Montemurro. Beyond the zipf-mandelbrot law in quantitative lingüistics. Physica A: Statistical Mechanics and its Applications, 300(3¿4):567 – 578,
2001.
[13] Marcelo A. Montemurro and D. Zanette. New perspectives on zipf’s law in liguistics: form single texts to large corpora. Glottometrics, 4:87–99, 2002.
[14] Alexander M. Petersen, Joel N. Tenenbaum, Shlomo Havlin, H. Eugene Stanley,
and Matjaz Perc. Languages cool as they expand: Allometric scaling and the
decreasing need for new words. Scientific Reports, 2:–, 2012.
[15] Matthieu Cristelli, Michael Batty, and Luciano Pietronero. There is more than a
power law in zipf. Sci. Rep., 2, November 2012.
[16] Edward T. Lu and Russell J. Hamilton. Avalanches and the distribution of solar
flares. The Astrophysical Journal, 380:L89, October 1991.
[17] Michael Mitzenmacher. A brief history of generative models for power law and
lognormal distributions. Internet Mathematics, 1(2):226–251, 2003.
[18] Wentian Li. Random texts exhibit zipf’s-law-like word frequency distribution.
IEEE Transactions on Information Theory, pages 1842–1845, 1992.
[19] Eduardo G. Altmann and Giampaolo Cristadoro. On the origin of long-range
correlations in texts. Proceedings of the National Academy of Sciences, 2012.
[20] C.-K. Peng, S. V. Buldyrev, A. L. Goldberger, S. Havlin, F. Sciortino, M. Simons, and H. E. Stanley. Long-range correlations in nucleotide sequences. Nature,
356(6365):168–170, March 1992.
[21] http://www.fide.com/component/handbook/?id=124&view=article.
[22] C. Padrón Sancho. Juego de Reyes. Historia y Vida, vol. 494, May 2009.
BIBLIOGRAFÍA
77
[23] Mark E. Glickman. Chess rating systems. American Chess Journal, 3:59–102,
1995.
[24] Hal Stern. Are all linear paired comparison models empirically equivalent? Mathematical Social Sciences, 23(1):103 – 117, 1992.
[25] Jan Beran. Statistics for Long-Memory Processes. Chapman-Hall, 1st edition,
1994.
[26] Richard G. Clegg. A practical guide to measuring the Hurst parameter. 21st
UK Performance Engineering Workshop, School of Computing Science Technical
Report Series, CSTR-916, University of Newcastle, pages 43–55, 2006.
[27] Jan W Kantelhardt, Eva Koscielny-Bunde, Henio H.A Rego, Shlomo Havlin, and
Armin Bunde. Detecting long-range correlations with detrended fluctuation analysis. Physica A: Statistical Mechanics and its Applications, 295(3):441–454, 2001.
[28] Y. Shao, G. Gu, Z. Jiang, W. Zhou, and D. Sornette. Comparing the performance
of FA, DFA and DMA using different synthetic long-range correlated time series.
Scientific Reports, 2:835, Nov 2012/online.
[29] Zipf, George K. Human behavior and the principle of least effort. Cambridge,
(Mass.): Addison-Wesley, 1949, pp. 573. Journal of Clinical Psychology, 6(3):306–
306, 1950.
[30] M. E. J. Newman. Power laws, Pareto distributions and Zipf’s law. Contemporary
Physics, 46(5):323–351, May 2005.
[31] Claude E. Shannon. Programming a computer for playing chess. Philosophical
Magazine, 41:256–275, 1950.
[32] http://scid.sourceforge.net/.
[33] Didier Sornette. Multiplicative processes and power laws. Physical Review E,
57(4):4811, 1998.
[34] Didier Sornette and Rama Cont. Convergent multiplicative processes repelled from
zero: power laws and truncated power laws. Journal de Physique I, 7(3):431–444,
1997.
[35] Mark Levene and Judit Bar-Ilan. Comparing typical opening move choices made
by humans and chess engines. The Computer Journal, 50(5):567–573, 2007.
78
BIBLIOGRAFÍA
[36] Réka Albert and Albert-László Barabási. Statistical mechanics of complex networks. Reviews of modern physics, 74(1).
[37] Herbert A Simon. On a class of skew distribution functions. Biometrika, pages
425–440, 1955.
[38] Konstantin Klemm, Víctor M Eguíluz, and Maxi San Miguel. Scaling in the structure of directory trees in a computer cluster. Physical review letters, 95(12):128701,
2005.
[39] http://scidvspc.sourceforge.net/.
[40] Linyuan Lü, Zi-Ke Zhang, and Tao Zhou. Zipf’s law leads to heaps’ law: Analyzing
their relation in finite-size systems. PLoS ONE, 5(12):e14139, 12 2010.