sistemas multiagente en ingeniería de organización
Transcripción
sistemas multiagente en ingeniería de organización
III Jornadas de Ingeniería de Organización Barcelona, 16-17 de septiembre de 1999 SISTEMAS MULTIAGENTE EN INGENIERÍA DE ORGANIZACIÓN Hernández, C.; López, A. Departamento de Organización y Gestión de Empresas Universidad de Valladolid emails: [email protected]; [email protected] RESUMEN AIt is evident that the rational thing to do is to be irrational and work with simpler rules@. (F. Knight, 1921) Los Sistemas Multiagentes y la Inteligencia Artificial Distribuida, son áreas de activa investigación, con aplicaciones muy satisfactorias en la ingeniería y en las ciencias sociales. Ambas tratan de dotar de inteligencia y capacidad decisoria a los A0bjetos@ convirtiéndolos en AAgentes@ y desdibujando así la barrera entre sistemas físicos y sociales. De aquí su importancia como metodología común al amplio campo de Ingeniería de Organización: el arte de acoplar eficientemente Ingeniería y Organización. En este trabajo mostramos cómo los MAS pueden ser utilizados para resolver y simular el comportamiento de instituciones de mercado, acomodando agentes con racionalidad limitada y con interacciones complejas. Mejorando nuestro conocimiento de las Instituciones de Mercado podremos sentar las bases de una Economía de la Organización más realista. PALABRAS CLAVE: Simulación de Instituciones de Mercado. Sistemas Multiagente. Economía de la Organización. Racionalidad Limitada y Complejidad. INTRODUCCIÓN. El propósito de esta comunicación, es ilustrar la aplicabilidad de los Sistemas Multiagentes [MAS] en el modelado y simulación de Instituciones de Mercado, dando satisfactoria respuesta a la necesidad de reconocer la racionalidad limitada de los agentes participantes y la complejidad del velo institucional. Mejorar nuestro conocimiento de las instituciones de intercambio para entender la Economía de las Organizaciones [E.O.] (Simon, 1991). Desde los años setenta, las aplicaciones de la Teoría del Control Optimo y la Teoría de Juegos han permitido avances muy significativos en el Modelado Econométrico y en la Economía Industrial [E.I.]. Desde esas aproximaciones se ha tratado de prolongar la potencia del modelo del Aagente racional@ económico. Causalidad y cointegración, la revolución de las expectativas racionales y la nueva economía institucional, son algunos de estos logros. Pero de todos modos, para un observador imparcial, resulta patente que los métodos económicos son incapaces de alcanzar la propia evolución de la realidad económica e institucional. Pensemos en las teorías explicativas del crecimiento económico. El residuo de Solow supone un hueco demasiado ancho entre el crecimiento real y el explicable. Ciclos de vida cada vez mas cortos, ganancias de flexibilidad y externalidades están presentes en todas las actividades económicas y exigen modelos altamente no lineales. De modo que sería más apropiado considerar el residuo de Solow como una medida de nuestra ignorancia en la explicación del crecimiento. Alan Greenspan desde el Fed, advierte intermitentemente de un posible repunte de la inflación y del final del ciclo expansivo de la economía americana. Pero los hechos no parecen discurrir así. Mas bien ocurre que aquellas externalidades y flexibilidad están originando tremendas ganancias en valor añadido, de forma que la OA se mueve a la derecha, ocultando el intercambio entre inflación y desempleo. Menos éxito tiene aun, la Teoría Económica de la Organización en su explicación del funcionamiento de las instituciones de mercado, bajo el supuesto de individuos maximizadores y algún tipo de restricción forzada que asegure el ajuste (clearing) del mercado. Las extensiones de la Economía Institucional desde los costes de transacción vuelven a caer en el mismo reduccionismo-minimización de un hipotético coste de oportunidad. Tal vez sea ya oportuno abrir la Acaja de Pandora@ y reconocer que la pobreza explicativa de los modelos económicos proviene de la racionalidad limitada de los agentes y sobre todo de la complejidad de sus relaciones sociales, como señalara F.Knight (op. cit.). Estas dos dimensiones de la Economía: racionalidad limitada y complejidad social demandan una aproximación científica alternativa a la actual Teoría Económica, que tal vez podríamos describir como La Nueva Economía Radical (NER): i) La Economía debe referirse a lo que los individuos hacen. No queremos señalar como irrelevantes niveles agregados de análisis, pero este debe incorporar el comportamiento individual y la singularidad de cada agente. ii) Los individuos son egoístas y oportunistas. iii) Son inteligentes: no dejan escapar oportunidades de satisfacer su propio interés. iv) Tienen racionalidad limitada: capacidades limitadas para procesar la información en el tiempo de deliberación de que disponen y utilizan Areglas de pulgar@, por lo demás bien acreditadas desde la experiencia. v) La esencia de la Economía, el intercambio, supone la existencia de interacciones entre los agentes. vi) El velo institucional introduce información imperfecta e incluso contradictoria, verdadera incertidumbre. vii) Finalmente los individuos tienen y manifiestan emociones, la dimensión mas olvidada por la Teoría Económica. A continuación argumentaremos que es posible acomodar esas dimensiones en el modelado económico, lo que además constituye una investigación fascinante. BOUNDED RATIONALITY AND EXPERIMENTAL ECONOMICS. La aproximación ortodoxa dentro de la teoría económica ha evitado el asunto central de las limitadas capacidades cognitivas del individuo, introduciendo costes de transacción y la hipótesis de información imperfecta, institucionalistas o aprendizajes heurísticos, normas y otras ideas importadas de disciplinas relacionadas: economía evolucionista. De este modo se trata de extender el modelo bajo la óptica positiva del Acomo si@. Amplia evidencia experimental, Kahneman et al. (1998), indica que los agentes son proclives a errores sistemáticos poco compatibles con la teoría de la utilidad esperada. Estos errores tienen su origen en costes de deliberación, incentivos, emociones y experiencia en el aprendizaje. Alentados por esta evidencia ha surgido una literatura muy significativa agrupada bajo el nombre de Economía Experimental [E.E.] que trata de desentrañar y recuperar desde la simulación con agentes reales, pautas estables de comportamiento económico. )Por qué no un paso más y sustituir los agentes reales por artificiales, en los experimentos correspondientes? Utilizaremos el término racionalidad limitada, para designar la elección consistente que tiene en cuenta las limitaciones cognitivas del decisor: limitaciones del conocimiento, conocimiento parcial de las decisiones de los demás agentes y limitada capacidad de proceso. En vez de asumir un conjunto fijo de alternativas entre las que elegir, postulamos un proceso de generación de esas alternativas. En vez de asumir loterías para los resultados, proponemos alternativas para acomodar la incertidumbre que no suponen la definición de un espacio de probabilidad. Satisfacción de los agentes, sustituye a maximización. La búsqueda de soluciones o pautas estables se hace desde protocolos de agenda y no desde Aoptimizaciones@ de menú. Este último extremo supone dotar al agente del doble mecanismo de aprendizaje: procedural(sustantivo) y declarativo que se reconoce como característico en las arquitecturas cognitivas. El siguiente ejemplo, que utilizamos en clase, Pindyck et al. (1995) aclara la distinción propuesta desde hace tiempo por Simon. Tres tiradores A, B y C disparan en orden aleatorio a alguno de sendos globos A, B y C. Si un globo es alcanzado, el correspondiente tirador queda eliminado. Gana el globo que queda sin romper. Las probabilidades de dar a un globo son: 1 para A; 0.9 para B y 0.8 para C. )Que globo tiene mas posibilidades de quedar sin romper o equivalentemente a qué tirador apostaría usted?. Si sólo se les deja 15 minutos para contestar, la mayoría de los alumnos contestan que el A y sólo algunos correctamente que el C. El argumento intuitivo de estos (eficiente en términos cognitivos sustantivos) es que Acomo en la vida misma el hecho observado es que los mediocres son los que triunfan@. En este caso, por supuesto, el conocimiento declarativo conduciría a la misma respuesta correcta calculando las probabilidades correspondientes (con el tiempo suficiente). Una cuestión final relevante es si la E.E. y por tanto la aproximación MAS, puede considerarse una metodología econométrica. Mantenemos desde hace tiempo, Hernández et al. (1981), que si la teoría necesita la experimentación como Marshack señalase, la experimentación necesita de teoría (respuesta de Frisch en el debate de los inicios de la Cowles Commission). Esa interacción constituye el círculo virtuoso del progreso científico. La aproximación MAS intenta dejar que los datos del experimento revelen pautas estables, después de precisar los protocolos de comunicación y las dimensiones de los agentes. La riqueza experimental desde MAS complementa los datos reales, con costes despreciables, cuando estos están disponibles y resulta imprescindible como campo experimental cuando no se dispone de aquellos, caso frecuente en decisiones estratégicas de Economía Industrial. AGENTES INTELIGENTES PARA INGENIERIA DE ORGANIZACION. Antes de presentar nuestro modelo concreto de mercado y el software utilizado, conviene hacer algunas precisiones, que permitan entender sus limitaciones y posibilidades. Qué entendemos por agente inteligente? Qué tipo de arquitectura utiliza nuestra plataforma? Qué tipo de lenguaje? Qué características tiene nuestro agente?. Ver López et al. (1998). Agentes y objetos son diferentes conceptos y consecuentemente lenguajes orientados a objetos son insuficientes para nuestro propósito. i) En el caso de objetos, la decisión reside en el objeto que invoca el método. En el agente, la decisión reside en el agente que recibe la petición de otro. En términos gráficos: Aobjects do it for free; agents for money@. ii)Los agentes deben estar dotados de capacidad de comportamiento: reactivo, proactivo y social. iii) El agente es inherentemente dependiente de los protocolos institucionales y tiene control sobre al menos parte de esa norma social. Metáforas de control: menú o agenda. Esta es una distinción de capital importancia para apreciar las posibilidades de nuestra aproximación en el modelado de sistemas complejos y por tanto en Ingeniería de Organización, y en general la aportación de las técnicas de aprendizaje y decisión en I.A. Hacemos un resumen heroico de Moss (1995). La optimización (y consecuentemente la inferencia estadística) y decisión económica tienen como base común un menú. Se explicitan unos invariantes canónicos para fijar ese menú (sea regresión de una variable, dimensión del filtro de Kalman, etc) y unas variables exógenas de antemano (etapa de identificación). Si el menú no es el apropiado la elección será errónea. Optimizamos con respecto a algún menú. Todo el aprendizaje bajo la hipótesis de expectativas racionales es de tipo menú. Por el contrario los modelos basados en agenda crean tareas, generan un orden y protocolo para realizar las tareas y eliminar de la agenda las que se han completado. En el contexto del análisis económico, se vienen utilizando dos tipos de algoritmos de agenda: algoritmos genéticos y sistemas de producción por reglas definidos inicialmente por Newell y Simon (1972). Reglas con conjuntos de condiciones y acciones. Cuando se satisfacen las condiciones, se materializan las decisiones. Las condiciones se satisfacen cuando se encuentran Astatements@ en la base de datos que cumplen con todos los elementos del conjunto de condiciones. Las acciones envían y extraen statements de la base. Los cambios en la base implican cambios en el entorno (institucional) y por tanto en el conjunto de reglas con condiciones que pueden ser satisfechas. Los sistemas de producción con base en agenda, sustituyen con ventaja al modelado econométrico y la optmización con restricciones en presencia de complejidad en la interrelación sistémica de los agentes. En vez de suponer que los agentes eligen la mejor decisión posible de un menú apropiado, se supone que el agente tiene un conjunto de reglas que determinan su comportamiento en circunstancias alternativas. Un ejemplo ilustrativo sería la curva de reacción de un duopolista a la Bertrand (Moss, op. cit.): Pi (t) = 0.5 + 0.25 Pj (t-1). Su representación por una regla sería: Antecedentes a) date ?today b) greater ?today 0 c) difference ?yesterday ?today 1 d) firmName ?thisFirm e) productOf ?ownProduct ?thisFirm f) productOf ?otherProduct ?otherFirm g) not equal ?otherFirm ?thisFirm h) price ?otherProduct ?yesterday ?lastOtherPrice i) multiply ?uninterceptedNewPrice 0.25 ?lastOtherPrice j) sum ?newPrice 0.5 ?uninterceptedNewPrice Consecuentes decideFor. >?ownProduct= decisionVariable: #price setNewValueTo: ?newPrice Por supuesto es una forma más prolija de simular ese comportamiento, que en Fortran, Pascal u otro lenguaje procedural, pero compite si hay suficiente número de agentes distintos con interacciones complejas. Tipo de arquitectura. La arquitectura de nuestros agentes es híbrida, con capas reactivas y capas deliberativas. De esta forma se acomoda el modelo cognitivo de Anserson (1993) ACT-R, quien establece como fundamental la distinción declarativo vs procedural. La lógica empleada en SDML (Strictly Declarative Modelling Language) para el disparo de reglas permite desarrollar modelos consistentes y fuertemente fundados mediante la extensión de la lógica KD45 (lógica autoepistémica, no monotónica). El programa permite definir en un sistema MAS, agentes con las siguientes características: Incertidumbre (información imperfecta sobre el entorno y las instituciones); Limitada capacidad cognoscitiva (no puede evaluar todas las alternativas); Tiempo (debe decidir sobre qué razonar, cuando y por cuanto tiempo); Memoria finita (existe un factor de olvido, como procesador de información); Aprendizaje (procedural y declarativo); Canales de comunicación y protocolos (el velo institucional); Comportamiento social (emociones; es solitario, parásito, egoísta o altruista). ILUSTRACIÓN: MERCADO TIPO POSTED OFFER. Tratamos de simular el comportamiento de un mercado tipo Aposted offer@(piénsese en la compra de billetes de avión por particulares dos semanas antes del vuelo). Los compradores, 300, compran secuencialmente, enviando sus peticiones a un único vendedor. No hay mas comunicación entre el comprador y el vendedor que la petición y respuesta. No hay negociación. Las ofertas son enviadas simultáneamente. Los vendedores responden y esperan por las peticiones o el compromiso de compra. Los vendedores procesan las peticiones según su disponibilidad. Hemos simulado dos situaciones: experimento 1 (e-1) y experimento 2 (e-2). En el e-1 no hay reputación de los vendedores ni emociones de los compradores. El precio de reserva de los vendedores se adjudica aleatoriamente. Idem las preferencias iniciales (calidad). Buscan el mejor precio para un nivel de calidad. La estrategia de compra es, compra cuanto antes. La búsqueda de precios es ciega. Tienen limitado acceso a los vendedores (costes de tiempo de búsqueda). El número de peticiones por día varia aleatoriamente entre compradores. Se simula el comportamiento durante dos semanas de compra(diez días) por ronda. Total de rondas 30. En cada ronda pueden comprar hasta 300 compradores, de 15 vendedores. La unidad es el día. Los vendedores fijan tres precios de acuerdo con un criterio de Amark-up@, y en función de la calidad. Con el mas bajo cubren costes fijos, con el intermedio la rentabilidad requerida (elegida aleatoriamente), y con el alto, una rentabilidad superior. La capacidad total también se fija aleatoriamente. Seleccionan así cantidades y precios en cada categoría. Estos valores permanecen constantes. En el e-2 se permite que los compradores de cada ronda hereden la información sobre los vendedores de los anteriores compradores: reputación. Esta información se refiere a precios, ventas totales y excelencia de la compañía. La elección inicial de los compradores depende de sus precios de reserva, la calidad y su nivel emocional inicial. Este depende del tiempo que queda para terminar la ronda (ansiedad) de la calidad y del precio (satisfacción por la compra). El resto es como en el e-1. PRINCIPALES RESULTADOS Y CONCLUSIONES. Los métodos basados en MAS son muy apropiados para la resolución de situaciones complejas, particularmente cuando existen problemas de información, incertidumbre no probabilizable y necesidad de coordinación. Por ello serán muy útiles en el amplio campo de Ingeniería de Organización, el arte de unir Ingeniería (sistemas físicos) y Organización (sistemas sociales). El SDML trabaja con producción por reglas, por agenda, como alternativa a la aproximación matemática a la optimización, que lo hace desde menús. De este modo se mitiga el problema de identificación (especificación) agudo en los métodos econométricos. En MAS se trata de que los datos revelen pautas estables, que a modo de bootstrap pueden reutilizarse para rediseñar el modelo: algo parecido al análisis bayesiano, pero sin necesidad de reducir la complejidad a información probabilista a la Kolmogorov. Los límites de la E.O., incluidas las extensiones evolucionistas, institucionalistas y de teoría de juegos, están en la hipótesis controvertida de la racionalidad de los agentes y en la complejidad de sus interacciones. Los sistemas MAS están diseñados precisamente para acomodar esas dos características: racionalidad limitada y complejidad de las interacciones. No es aventurado afirmar que la E.O. de la próxima década estará fuertemente basada en sistemas MAS, salvo arquetipos elementales y supone una formalización radicalmente distinta de la actual E.I. El ejemplo ilustrativo, siendo la mas simple de las instituciones de mercado, ha sido enriquecido mucho mas allá de los modelos que encontramos en E.I., para recoger la dimensión emocional y la complejidad de los protocolos de intercambio. Los resultados de la simulación exhiben pautas estables de comportamiento y son acordes con lo observado, en E.E. En el mercado e-1, se realizan menos transacciones. Las compras son muy uniformes, en los diferentes días. Incluso los peores vendedores venden, aunque menores cantidades. La longitud del conjunto de precios va de 16 a 25. En el mercado e-2, aumenta el número de transacciones por día, es decir la reputación e información mejoran la eficiencia del mercado. Las compras diarias tienden a concentrarse al principio del período de cinco días, y para no quedarse sin comprar, se vuelven a acumular las compras el último día. Se produce así un ciclo emocional. Los vendedores menos eficientes no realizan transacciones y en este modelo sin negociación se quedan fuera del mercado. Los precios están mas agrupados. AGRADECIMIENTOS. Nuestro sincero agradecimiento a los miembros del Centre for Policy Modelling de la Manchester Metropolitan University: S.Moss, B. Edmonds y S. Wallis, por su ayuda y estímulo y por habernos facilitado el SDML. REFERENCIAS ANDERSON, J.R. (1993). Rules of the Mind. Lawrence Erlbaum Associates. HERNÁNDEZ, C. Y HERNÁNDEZ, F. (1981). Causality and the Independence Phenomenon: The Case of the Demand for Money. Journal of Econometrics, Vol 15. KAHNEMAN, D., SLOVIC, P. y TVERSKY, A. (1998). Judgement under Uncertainty: Heuristics and biases. Cambridge U.P. KNIGHT, F.H. (1921). Risk, uncertainty and profit. Boston. LÓPEZ, A. Y OLMO, R. DEL (1998). The Social Dimension of Economics. Proceedings Socially Situated Intelligence. Fifth International Conference on Simulation of Adaptive Behaviour. Zürich. MOSS, S. (1995). Control Metaphors in the Modelling of Economic Learning and Decision-Making Behaviour. Computational Economics, vol 8, n1 4. MOSS, S., H. GAYLARD, S. WALLIS Y B. EDMONDS (1998). SDML: A MultiAgent Language for Organizational Modelling. Computational and Mathematical Organization Theory. (http://www.cpm.mmu.ac.uk/cpmrep.html) PINDYCK, R. & D. L. RUBINFELD (1995), Microeconomics. Prentice Hall. SIMON, H.A. (1991).- Organizations and Markets. Journal of Economic Perspectives. Vol5,n12.pag 25-44. FIGURAS Number of transactions per round Daily average transactions 200 70 150 60 100 50 market 1 market 2 50 40 time 25 22 19 16 13 10 7 4 0 1 30 20 10 0 market 1 market 2