INTRODUCCIÓN
Transcripción
INTRODUCCIÓN
02 Modelos de datos.qxp:04 1 ANABAD 4_2012 1as 8/11/13 11:13 Página 1 Boletín ANABAD. LXIII (2013), NÚM. 3, JULIO-SEPTIEMBRE. MADRID. ISSN: 0210-4164 INTRODUCCIÓN Los modelos de datos en la perspectiva de Europeana, la DPLA y RDA ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- XAVIER AGENJO Fundación Ignacio Larramendi [email protected] FRANCISCA HERNÁNDEZ DIGIBÍS: Producciones digitales [email protected] RESUMEN: Se describen los distintos modelos de datos que han ido respaldando la creación y desarrollo de Europeana y la influencia que ésta ejerce en la normalización e interoperabilidad de los archivos, bibliotecas y museos europeos. Se analiza Europeana Data Model como una norma de facto para archivos, bibliotecas y museos en el marco de Linked Open Data, especialmente a partir de su adopción por la Digital Public Library of America. Se examinan las ventajas de integrar en un mismo proceso descriptivo los modelos de datos propios del ámbito bibliotecario, RDA y su codificación MARC 21, con las diferentes clases y propiedades de Europeana Data Model, y la conveniencia de que el software, comercial o abierto, de archivos, bibliotecas y museos responda adecuadamente para mantener un crecimiento sostenido de las colecciones digitales. PALABRAS CLAVE: Europeana, Modelo de Datos de Europeana, Datos Abiertos Vinculados, Modelos de datos de archivos, bibliotecas y museos, Recursos Descripción y Acceso, Bibliotecas digitales. ABSTRACT: The paper describes the different data models that have supported the creation and development of Europeana and its influence on standardization and interoperability of archives, libraries and museums in Europe. Europeana Data Model is analyzed as a de facto standard for archives, libraries and museums in the 02 Modelos de datos.qxp:04 1 ANABAD 4_2012 1as 18 8/11/13 11:13 Página 2 XAVIER AGENJO Y FRANCISCA HERNÁNDEZ context of Linked Open Data, especially since its adoption by the Digital Public Library of America. It discusses the advantages of integrating, in the same descriptive process, models specific to library data field, RDA and MARC 21 encoding, with the different classes and properties of Europeana Data Model, and the convenience that software, either commercial or open source, for archives, libraries and museums respond properly in order to maintain a sustained growth of digital collections. KEY WORDS: Europeana, Europeana Data Model, Linked Open Data, Data models for Archives, libraries and museums, Resource Description and Access, Digital libraries. INTRODUCCIÓN Con toda seguridad, una de las combinaciones más productivas en las últimas décadas ha sido el modelo de datos Dublin Core (DC) y el protocolo de recolección de metadatos OAI-PMH1. Tres ejemplos serán suficientes. En junio de 2002 OAIster abrió sus puertas con 274.062 registros que ya en 2006 se habían transformado en 8.857.208 de registros de 680 instituciones; y en 2009 en 20.220.634 de registros de 1.082 proveedores. Un crecimiento anual de casi 2,9 millones de registros2. En octubre de 2013 OCLC informa de que OAIster tiene más de 30 millones de registros de más de 1.500 instituciones. En marzo de 2006, el recolector Hispana3 inició su andadura con 119.014 registros de objetos digitales procedentes de 25 repositorios OAI-PMH; justamente 7 años más tarde, Hispana ofrece 4.700.082 objetos digitales de 202 repositorios. Hispana es también un directorio de colecciones digitales, que pueden disponer o no de repositorios OAI. En 2006 el número de colecciones era de 55 (el 45,45 % eran repositorios OAI), mientras que en 2013 es de 602 (el 33,55 % son repositorios OAI). Estas cifras arrojan un crecimiento anual de más de 670.000 registros. En noviembre de 2008 se inauguró el portal de la Biblioteca Digital Europea denominado Europeana4 con 2 millones de objetos digitales. En octubre de 2013 ofrece ya 29.637.274 de objetos, procedentes de 2.200 instituciones de 36 países. Un crecimiento anual de más de 5,9 millones de registros. Estas cifras muestran con claridad cómo la combinación OAI-PMH y DC ha hecho aflorar millones de objetos digitales en una década. Y desde luego la implantación del dúo OAI+DC ha producido considerables efectos tanto en los —————— 1 http://www.openarchives.org/ 2 Datos obtenidos a través de Wayback Machine a partir de las páginas archivadas de OAIster, http://web.archive.org/web/20030217130938/http://www.oaister.org/o/oaister/reports.html y http://web.archive.org/web/20090302120345/http://www.oaister.org/ 3 http://hispana.mcu.es 4 http://web.archive.org/web/20081111134916/http://dev.europeana.eu/ Boletín ANABAD. LXIII (2013), NÚM. 3, JULIO-SEPTIEMBRE. MADRID. ISSN: 0210-4164 02 Modelos de datos.qxp:04 1 ANABAD 4_2012 1as 8/11/13 11:13 LOS MODELOS DE DATOS EN LA PERSPECTIVA Página 3 19 proveedores de datos como en los servicios de recolección que analizaremos a continuación. Nunca estaremos suficientemente agradecidos al trabajo de Herbert Van de Sompel5, uno de los creadores del protocolo OAI, o al de Jeff Young de la OCLC6, que desarrolló OAICat, software open source para la implantación de repositorios OAI. LA FASE RECOLECTORA Parafraseando las fases de evolución de las sociedades humanas, podemos hablar de una primera fase de aplicación de OAI+DC basada en la recolección de registros con el esquema DC básico de 15 elementos7. En esta primera fase se ha realizado un gran esfuerzo por implantar el protocolo y exponer los repositorios creados de este modo. Así dicho pudiera parecer poco, pero en la realidad ha supuesto que trabajen en una dirección común archivos, bibliotecas y museos. Ésta es una de las mayores ventajas de DC: su capacidad para reunir metadatos de cualquier tipo de recurso, sea un objeto físico o electrónico, de archivos, bibliotecas o de museos. Seguramente, la construcción de Europeana no habría sido posible, por la dificultad de su gestión, si no hubiera sido gracias a esta sinergia. La misma posibilidad de reunir registros de archivos, bibliotecas y museos ha dado lugar a que los propios proveedores consideren sus datos de una forma más abierta. Formar parte de Europeana es bastante más que una cuestión de prestigio institucional; constituye el procedimiento para acrecentar la potencia informativa de los datos por el simple hecho de conformar un punto único de consulta. Hay que tener en cuenta que mediante OAI+DC se pueden agregar no sólo objetos digitales correspondientes a la digitalización de los objetos culturales patrimoniales, sino también las publicaciones científicas que estudian esos objetos. Los repositorios de publicaciones científicas no son tan ajenos a las bases de datos de recursos de patrimonio cultural como a veces pudiera parecer o se quiere hacer creer; hay muchos puntos en común que afectan sobre todo al área de las humanidades y ciencias sociales, pero también a muchas otras áreas de las ciencias. Quizá sea necesario recordar los análisis físico-químicos aplicados a la datación de los objetos arqueológicos o a la conservación de sitios y piezas artísticas o documentales. En ocasiones la separación entre publicaciones científicas (academic research) y recursos de patrimonio cultural se deriva más de la diferenciación de entornos profesionales que de la lógica de la información, sobre todo siendo factible, como es, la aplicación de una normativa sencilla que permita su interrelación. La Deutsche Digitale Bibliothek o Hispana son algunas muestras de que se puede combinar sin problema ambos tipos de información. —————— 5 http://en.wikipedia.org/wiki/Herbert_Van_de_Sompel 6 http://pubserv.oclc.org/oaicat/jars/docs/ 7 http://dublincore.org/documents/dcmi-terms/#H3 Boletín ANABAD. LXIII (2013), NÚM. 3, JULIO-SEPTIEMBRE. MADRID. ISSN: 0210-4164 02 Modelos de datos.qxp:04 1 ANABAD 4_2012 1as 20 8/11/13 11:13 Página 4 XAVIER AGENJO Y FRANCISCA HERNÁNDEZ La transformación de información en conocimiento requiere de un modelo de datos adecuado para la visualización de las interrelaciones entre los recursos, de modo que los límites del entorno profesional no sean una barrera para que los usuarios sigan el camino que les parezca más apropiado en ese mar de interrelaciones. Evidentemente, manejar decenas de millones de registros en una interfaz de búsqueda y mantener la pertinencia de los resultados es un arduo problema que se solventa a menudo con la aplicación de filtros y facetas a los resultados para que sean más manejables por los usuarios. Así, las necesidades del portal Europeana llevaron a la ampliación del modelo de datos de DC sin cualificar al Europeana Semantic Elements (ESE)8 (versión 3.2 de fecha de agosto de 2009), que no era sino una combinación de un subconjunto de DCMI Metadata Terms9 (22 elementos) junto con 13 nuevos elementos propios de Europeana. De hecho, la aplicación de ESE en el portal de Europeana se realizó internamente antes de que fuera un requisito técnico para los proveedores de datos, al igual que ha ocurrido con el Europeana Data Model. Se cumplían así dos objetivos, conservar la complejidad de los registros que los proveedores de datos podían aportar, y mejorar la presentación y acceso a los mismos en el portal de Europeana. De la experiencia de Europeana podemos extraer algunas conclusiones. En primer lugar, ha ampliado rápidamente los elementos Dublin Core, desde 15 a 37 elementos, y ha añadido nuevos elementos propios para resaltar adecuadamente las aportaciones de los proveedores e identificar claramente aspectos como el idioma, el país de origen, los derechos y otros elementos complementarios relacionados con la administración y gestión de las agregaciones. En segundo lugar, Europeana ha tenido la virtualidad de contribuir a la normalización de los sistemas de información de archivos, bibliotecas y museos europeos de un modo nunca visto anteriormente. Efectivamente, el todo se ha convertido en mucho más que la suma de las partes. El esfuerzo normalizador se ha producido no solo en un entorno, digamos fácil, para DC como son las bibliotecas, también ha tenido un efecto similar en museos, aunque mucho menor en archivos10. En 2010 Vangelis Banos publicó un plug-in11 para que los repositorios basados en DSpace12 pudieran ser recolectados por Europeana, es decir según el esquema de metadatos ESE. Los repositorios OAI de las bibliotecas virtuales y digitales basadas en el ILS DIGIBIB13 permitían la recolección de metadatos ESE desde el mismo año 2009. Incluso, DIGIBÍS publicó una serie de instrucciones14 complementarias que solventaban algunos problemas de instalación del mencionado plug-in en DSpace. Son sólo dos ejemplos de —————— 18 http://pro.europeana.eu/technical-requirements 19 http://dublincore.org/documents/2012/06/14/dcmi-terms/ 10 Véase Technical Report: Archival Digital Object Ingestion into Europeana (ESE-EAD harmonization) Version 1.0, 07/08/2009 [http://goo.gl/TRto3] 11 http://vbanos.gr/blog/2010/02/11/dspace-plugin-for-europeana-semantic-elements/ 12 http://www.dspace.org/ 13 http://www.digibis.com/bibliotecas-virtuales.html 14 http://www.digibis.com/images/PDF/20101221_instalar_soporte_ese_en_dspace.pdf Boletín ANABAD. LXIII (2013), NÚM. 3, JULIO-SEPTIEMBRE. MADRID. ISSN: 0210-4164 02 Modelos de datos.qxp:04 1 ANABAD 4_2012 1as 8/11/13 LOS MODELOS DE DATOS EN LA PERSPECTIVA… 11:13 Página 5 21 cómo el software comercial y el software open-source se han acomodado a los requisitos de Europeana. Y esto sólo se ha producido por el interés de los proveedores de datos en formar parte de la biblioteca digital europea. Evidentemente, para que los elementos de ESE puedan ser transmitidos es necesario que estén presentes en el repositorio del proveedor de datos. Ya veremos que esto es especialmente importante en el caso del Europeana Data Model15. Sin embargo, este esfuerzo se ha realizado también en numerosas ocasiones con un coste adicional como ha sido la duplicación de tareas, creándose ecosistemas de datos desconectados dentro de las organizaciones de los proveedores de datos. Así, se podría hablar del entorno propio de la biblioteca tradicional con sistemas de gestión bibliotecaria (en su mayoría comerciales) incapaces de gestionar adecuadamente objetos digitales y del entorno propio de los repositorios digitales no aptos para gestionar la circulación de ejemplares o con dificultades para introducir procesos como el control de autoridades. Esta impermeabilidad puede tener peores efectos en el marco de Linked Open Data. Bien sea por la lentitud en la respuesta de algunos programas comerciales o por la urgencia en dar visibilidad a los objetos digitales (digitalizados o nacidos digitalmente), el resultado ha sido una creciente y costosa complejización de la gestión de las bibliotecas. Quizá ésta sea la explicación de por qué el tamaño medio de los repositorios digitales es tan pequeño16, ya que mantener una gestión paralela para objetos físicos y para objetos digitales es difícil, del mismo modo que es difícil mantenerse actualizado tecnológicamente. Por ejemplo, la contribución de Hispana a Europeana podría tener más de 2,5 millones de objetos más si la totalidad de los 202 repositorios que recolecta fueran conformes con ESE. Obviamente, y por distintos motivos, no todos los repositorios tienen como objetivo participar en Europeana, pero parece que también el desfase tecnológico tiene su influencia. En este sentido, es fácil comprobar que los mayores proveedores de datos a Europeana son agregadores nacionales o transversales que han incorporado el mecanismo de recolección de una manera prácticamente automática, lo cual redunda en la visibilidad de las colecciones. El Plan Estratégico de Europeana 2011-2015 marca como objetivo que exista un agregador nacional en cada uno de los países miembro de la Unión Europea para 201517. EUROPEANA DATA MODEL Desde la publicación en 2010 de Stefan Gradmann Knowledge = Information in Context: on the Importance of Semantic Contextualisation in Europeana18 los esfuer—————— 15 http://pro.europeana.eu/web/guest/edm-documentation 16 Agenjo, Xavier. 2011, un gran año para las bibliotecas virtuales. Anuario ThinkEPI 2012 17 Véase p. 13. http://www.pro.europeana.eu/c/document_library/get_file?uuid=c4f194647504-44db-ac1e-3ddb78c922d7&groupId=10602 18 http://pro.europeana.eu/c/document_library/get_file?uuid=cb417911-1ee0-473b-8840bd7c6e9c93ae&groupId=10602 Boletín ANABAD. LXIII (2013), NÚM. 3, JULIO-SEPTIEMBRE. MADRID. ISSN: 0210-4164 02 Modelos de datos.qxp:04 1 ANABAD 4_2012 1as 22 8/11/13 11:13 Página 6 XAVIER AGENJO Y FRANCISCA HERNÁNDEZ zos de Europeana han ido dirigidos a rehacer su modelo de datos para adecuarlo a las tecnologías de la Web Semántica y, como primera medida, de Linked Open Data. Los objetivos claramente expuestos son los de proporcionar una búsqueda multilingüe en la que el usuario pueda obtener respuestas sobre Who, What, Where, When19, y unos resultados interrelacionados que le permitan seguir el camino que prefiera. Indudablemente el primer requisito de nuevo modelo era mantener la compatibilidad con Europeana Semantic Elements. La primera versión pública de Europeana Data Model fue la 5.2.220 de fecha 31 de mayo de 2011. Además de los namespaces de RDF, RDFS, SKOS y OAI-ORE, Europeana reutiliza The Dublin Core namespaces for elements (http://purl.org/dc/elements/1.1/), terms (http://purl.org/dc/terms/) y types (http://purl.org/dc/dcmitype/). Medio año después, el 24 de febrero de 2012 se publicó la versión 5.2.3 y en julio de 2013 la 5.2.421 tras la transformación de la base de datos desde ESE a EDM que se realizó en el mismo mes. Aunque se pueda criticar la calidad de algunos registros de Europeana, lo cierto es que se ha partido de una situación muy heterogénea. En primer lugar, se han aportado registros de archivos, bibliotecas y museos; en segundo lugar se ha partido de diferentes estructuras de datos, como registros de la familia MARC no muy homogéneos (UNIMARC, IBERMARC, MARC 21 según distintas actualizaciones, etc.) y con toda seguridad ha sido necesario tratar multitud de estructuras de datos propietarias. En todos los casos Dublin Core ha actuado como modelo de datos común haciendo viable la homogeneización de los datos. Y si bien es cierto que no todos son de la misma calidad, sí lo es en cambio que los campos más relevantes (autor, contributor, título, materias, fechas y lugares) permiten gestionar con notable rendimiento el altísimo volumen de datos en la búsqueda e identificación. Y además estos elementos son los más importantes para cualquier tipo de usuario, puesto que otros datos como la extensión o las notas descriptivas se suplen con ventaja con la consulta de los propios objetos digitales. Gran parte del esfuerzo de normalización de archivos, bibliotecas y museos se ha realizado en el marco de grandes proyectos europeos financiados parcialmente por la Comisión Europea como ATHENA, APENET, EUSCREEN, etc. Sin embargo, para todos ellos los WorkProgramme de los diferentes mecanismos de financiación (p.e., ICT Policy Support Programme) han tenido una influencia fundamental. Así, se ha establecido a nivel europeo, mediante la consiguiente financiación, la dirección estratégica de los objetivos y con ello se ha potenciado no sólo los tipos de documentos (p.e., impulsar un tipo de material como los archivos sonoros, fílmicos, etc.), los tipos de proveedores (p.e. editores), el uso de tecnologías emergentes (linked data o cloud computing) y, por supuesto, el requisito fundamental siempre ha sido que los resultados de cualquier proyecto sean visibles en Europeana. —————— 19 Son exactamente las etiquetas de búsqueda de Europeana 20 http://pro.europeana.eu/documents/866205/13001/EDM_v5.2.2.pdf 21 http://pro.europeana.eu/documents/900548/0d0f6ec3-1905-4c4f-96c8-1d817c03123c Boletín ANABAD. LXIII (2013), NÚM. 3, JULIO-SEPTIEMBRE. MADRID. ISSN: 0210-4164 02 Modelos de datos.qxp:04 1 ANABAD 4_2012 1as 8/11/13 LOS MODELOS DE DATOS EN LA PERSPECTIVA… 11:13 Página 7 23 Por su parte los organismos que sustentan Europeana, la Europeana Foundation y la Europeana Network, han alentado la participación de los proveedores de contenido en diferentes tareas de coordinación relacionadas con los aspectos más problemáticos de la biblioteca digital europea. En este trabajo no se entrará en las cuestiones relacionadas con los derechos de propiedad intelectual, la sostenibilidad y otras que han contado con diferentes Task Forces22. Estos grupos de trabajo y de interés analizan, durante un periodo de tiempo definido, un problema candente y proponen soluciones. Así las Tasks Force sobre Hierarchical Object, sobre FRBRoo o sobre identificadores persistentes han analizado sus respectivas cuestiones. Los proveedores de contenido pueden participar en estas tareas, independientemente de su participación en proyectos europeos y/o al mismo tiempo. De este modo la normalización en archivos, bibliotecas y museos europeos ha avanzado enormemente, si se compara con la situación inicial, en un brevísimo espacio de tiempo y ha consistido en la elaboración de una normativa orientada hacia un fin, Europeana. Quizá a muchos lectores les sorprenderá saber que hasta el nacimiento de Europeana, y la asunción por parte de la Agenda Digital para Europa (2010)23 de la biblioteca digital europea, la interoperabilidad de los archivos, bibliotecas y museos europeos ha sido muy fragmentaria y circunscrita a los proyectos desarrollados en el marco de los programas ICT, e-ContentPlus u otros. Con demasiada frecuencia el fruto del trabajo de estos proyectos se desvanecía tras el final del mismo, y los esfuerzos de normalización de las grandes organizaciones no gubernamentales del sector como IFLA, ICA e ICOM, tenían unos efectos mínimos. Es significativo que en el entorno de las publicaciones académicas y científicas no se haya producido este hecho y a pesar de los esfuerzos de proyectos como DRIVER24, COAR25 u OpenAire26, no ha llegado a consolidarse un portal similar a Europeana que proporcione continuidad a las tentativas de normalización. Es esperable y deseable que la normalización e interoperabilidad continúe, la puesta en funcionamiento de las Task Forces de Europeana así lo hace prever, puesto que es mucha la cantidad de información que ha aflorado y mucha más la que tiene que aflorar. El proyecto ENUMERATE27, una Thematic Network financiada por la Comisión Europea dentro del programa ICT-PSP para los años 2011-2013 tiene como cometido proporcionar datos fidedignos sobre el estado de la digitalización en Europa, sobre sus costes, su acceso y preservación. La primera encuesta28 arroja como cifra general que cerca del 20% de las colecciones que se necesitan digitalizar se encuentra ya digitalizada, por lo que se puede ver que Europeana no ha hecho más que empezar. —————— 22 http://pro.europeana.eu/network/task-forces/overview 23 http://ec.europa.eu/digital-agenda/ 24 http://www.driver-repository.eu/ 25 http://www.coar-repositories.org/ 26 http://www.openaire.eu/ 27 http://enumerate.eu/ 28 En el momento de redactar este texto se ha lanzado la segunda encuesta general de ENUMERATE que sin duda modificará en algo esta cifra. Boletín ANABAD. LXIII (2013), NÚM. 3, JULIO-SEPTIEMBRE. MADRID. ISSN: 0210-4164 02 Modelos de datos.qxp:04 1 ANABAD 4_2012 1as 24 8/11/13 11:13 Página 8 XAVIER AGENJO Y FRANCISCA HERNÁNDEZ Sin embargo, se puede apreciar que aún persisten escollos para lograr una continuidad en la aportación normalizada de objetos digitales. En la medida que las colecciones digitales y sus metadatos no estén incorporadas a la rutina habitual de los archivos, bibliotecas y museos, incluso formando parte de los mismos programas comerciales de gestión, las aportaciones de los proveedores crecerán durante la duración de un proyecto y se estancarán a la finalización del mismo. A pesar de las grandes promesas del software libre, lo cierto es que éste requiere de profesionales especializados para su implantación y mantenimiento y que en muchas ocasiones supone la instalación de un conjunto de piezas complejo para distintas operaciones no integradas, lo que añade aún más complejidad. Por su parte, el software comercial, al menos en la experiencia española, y es fácil ver que en muchos otros países, no responde con agilidad a las necesidades de las bibliotecas, archivos y museos digitales. Prueba de ello es que el Business Plan de 201329 marca como objetivo que 14 países miembros de la UE aumenten su contribución. LA DIGITAL PUBLIC LIBRARY OF AMERICA Y SU PERFIL DE APLICACIÓN DE METADATOS En abril de 2013 se lanzó oficialmente la Digital Public Library of America30 que tras siete meses ofrece más de 4,5 millones de registros de bibliotecas, archivos y museos. Ya en la Europeana Tech Conference, celebrada en Viena en 2011, Maura Marx hizo una exposición sobre la DPLA31 y quedó claro para todos los asistentes que su modelo iba a ser muy similar al de Europeana32. La experiencia (y éxito) de Europeana ha tenido una gran influencia en la DPLA. Ambos proyectos partían de situaciones muy parecidas en cuanto a los objetivos, pero muy diferentes en cuanto al estado de la normalización y la interoperabilidad; el multilingüismo europeo planteaba además una complejidad añadida. Ambos proyectos convergían en situar a Linked Open Data como una tecnología factible para gestionar un enorme volumen de datos y extraer su potencia informativa. El 25 de octubre de 2011 el W3C Library Linked Data Incubator Group33 publicó su informe final. Al día siguiente se publicaron el Europeana Data Model Primer34, el Europeana Data Model Mapping Guidelines versión 1.0.1, actualmente en la versión 2.035, y The Europeana Data Model for Cultural Heritage, que ha sido sustituido por General EDM factsheet and Presentation36. El importante documento —————— 29 http://pro.europeana.eu/documents/858566/9d4632d3-3f6d-4162-ba29-27a9a739946d 30 http://dp.la 31 http://www.europeanaconnect.eu/europeanatech/index.php?section=programme& page=programme 32 Véase el texto de la DPLA en este mismo boletín: La colaboración multiplica el valor: el modelo de asociación internacional de la DPLA y Europeana / Amy Rudersdorf, Emily Gore. 33 http://www.w3.org/2005/Incubator/lld/ 34 http://pro.europeana.eu/documents/900548/770bdb58-c60e-4beb-a687-874639312ba5 35 http://pro.europeana.eu/documents/900548/60777b88-35ed-4bae-8248-19c3696b81fb 36 http://pro.europeana.eu/documents/900548/2f66c73a-f5c9-49cc-a8e1-4b3ed763bc63 Boletín ANABAD. LXIII (2013), NÚM. 3, JULIO-SEPTIEMBRE. MADRID. ISSN: 0210-4164 02 Modelos de datos.qxp:04 1 ANABAD 4_2012 1as 8/11/13 LOS MODELOS DE DATOS EN LA PERSPECTIVA… 11:13 Página 9 25 D3.4 Final Technical & Logical Architecture and future work recommendations37 de Stefan Gradmann se publicó también ese mes. Es de suma importancia que la DPLA haya reutilizado en gran parte el modelo de datos de Europeana pues contribuirá a facilitar la colaboración entre ambos proyectos y entre los participantes en los mismos en otros ámbitos. Además, con toda seguridad centrará el amplio panorama de los esquemas y ontologías en uso, o en desarrollo, en el mundo de los Library Linked Data, que no ha hecho más que crecer en los últimos años. No deja de recordar a la explosión de formatos MARC de los años 80 y 90 que se alivió un tanto con la armonización de los formatos CANMARC, UKMARC y USMARC en 1997 y que dio lugar al formato MARC21. Esperemos que ocurra lo mismo que entonces. La publicación del DPLA Metadata Application Profile v338 ha puesto de manifiesto hasta qué punto el modelo de datos de Europeana ha sido útil para la DPLA. De hecho, en los grupos de trabajo de Europeana Network ya ha surgido alguna voz promoviendo que EDM se convierta en un estándar internacional, idea que indudablemente se habrá visto muy fortalecida con la publicación del DPLA Metadata Application Profile. Su primera frase no puede ser más significativa “This version is designed to build on the experience of the Europeana Data Model (EDM). In addition, it incorporates feedback from the DPLA community and digital hub pilot participants to create a balanced framework that allows us to accommodate existing and emerging data models for library, archive, and museum resources”. Es una muestra de la capacidad descriptiva del Europeana Data Model para representar los Cultural Heritage Objects, para utilizar la propia definición del modelo, y sus objetos digitales. Es muy probable que se produzcan modificaciones en este perfil de aplicación de metadatos, pero también es previsible que todo ello se haga de forma coordinada con Europeana. De hecho, esto se menciona explícitamente en el Business Plan de 201339 en el que se cita la necesidad de trabajar coordinadamente con otras instituciones: Promote knowledge-sharing on R&D activities in the various Europeana-related projects. Support appropriate R&D project proposals and continue to actively engage with R&D activities from relevant projects and other initiatives (e.g. Digital Public Library of America (DPLA), the World Wide Web Consortium (W3C), Dublin Core) and the private sector. Las Task Forces40 de Europeana, que proponen recomendaciones para el conjunto de la red, han dado lugar ya a algunas propuestas de modificación. El 28 de marzo de 2013 la Hierarchical Objects Task Force publicó Recommendations for the representation of hierarchical objects in Europeana41 que se han incluido en la —————— 37 http://pro.europeana.eu/documents/10602/370691/D3.4+final.pdf 38 Digital Public Library of America. Metadata Application Profile, Version 3. Release date: 2013-02-08. Document URI: http://dp.la/about/map 39 http://pro.europeana.eu/documents/858566/9d4632d3-3f6d-4162-ba29-27a9a739946d 40 http://pro.europeana.eu/network/task-forces/overview#EuropeanaTech 41 http://pro.europeana.eu/web/network/europeana-tech/-/wiki/Main/Taskforce+on +hierarchical+objects Boletín ANABAD. LXIII (2013), NÚM. 3, JULIO-SEPTIEMBRE. MADRID. ISSN: 0210-4164 02 Modelos de datos.qxp:04 1 ANABAD 4_2012 1as 26 8/11/13 11:13 Página 10 XAVIER AGENJO Y FRANCISCA HERNÁNDEZ última versión de EDM (5.2.4). Lo más significativo es que se trata de recomendaciones tanto para los proveedores de contenido como para la propia Europeana. También han publicado sus conclusiones las task forces sobre Persistent Identifiers (PIDs) y EDM - FRBRoo Application Profile. Uno de los aspectos más interesantes de las recomendaciones de la Hierarchical Objects Task Force es su relación con los datos de los archivos, hasta ahora muy insuficientemente representados en Europeana (de forma conjunta 43%, Bibliotecas 40%, Museos 10%, Audiovisuales 6%, y Archivos 1%)42. Por el contrario, parece que los archivos sí van a estar fuertemente representados en la DPLA como puede verse en la información aportada por los National Archives and Records Administration (NARA)43. En este sentido resulta muy importante el hecho de que los NARA hayan anunciado su intención de utilizar de forma sistemática tanto Encoded Archival Description como Encoded Archival Context. Además está anunciada una nueva versión de EAD tras más de 10 años desde la última versión (2002)44. Los autores de este trabajo han realizado un mapeo entre MARC 21 y EAC, todavía inédito, para su aplicación en los programas DIGIBIB y DIGIARCH que ha desarrollado DIGIBÍS. Ambos programas disponen de repositorios OAI recolectables por Europeana, tanto en ESE como en EDM. Es muy revelador el caso del archivo familiar Montiano45 que comparte el fichero de autoridades en MARC 21/RDA de la Biblioteca Virtual de Polígrafos46 y que transmite datos en EDM. El Archivo Montiano ha sido uno de los casos de estudio de la Task Force de Hierarchical Objects. La situación de los museos está más avanzada. El proyecto ATHENA (Access to Cultural Heritage Networks Across Europe)47 aportó a Europeana 2.543.302 registros y desencadenó un esfuerzo de normalización de los museos europeos que contribuiría finalmente al surgimiento del esquema LIDO - Lightweight Information Describing Objects Version 1.0 (LIDO) del ICOM-CIDOC Working Group Data Harvesting and Interchange48. El proyecto MIMO Musical Instruments Museum Online49 ha aportado a su vez 46.483 registros en EDM, generados a partir de LIDO. Dado que la Smithsonian Institution forma parte de la DPLA será muy interesante ver cuáles serán los mapeos que se utilicen para adaptarse al DPLA Metadata Application Profile. Indudablemente, el trabajo realizado en ATHENA (que continuará en ATHENA Plus50), en MIMO y en otros proyectos será de —————— 42 D3.7: Content Strategy Update. MS11: Content Acquisition & Development Plan Merged and renamed to: Collections and Data Analysis, Strategy and Plan. Project Acronym: Europeana v2 [Project Acronym: Europeana v2]. 43 http://www.archives.gov/ 44 http://www2.archivists.org/groups/technical-subcommittee-on-encoded-archivaldescription-ead/ead-revision 45 http://pro.europeana.eu/documents/468623/09602a17-0f79-4145-9012-46adf7125585 46 http://pro.europeana.eu/polymath-edm 47 http://www.athenaeurope.org/ 48 http://network.icom.museum/cidoc/working-groups/data-harvesting-and-interchange/ what-is-lido/ 49 http://www.mimo-international.com/ 50 http://www.athenaplus.eu/ Boletín ANABAD. LXIII (2013), NÚM. 3, JULIO-SEPTIEMBRE. MADRID. ISSN: 0210-4164 02 Modelos de datos.qxp:04 1 ANABAD 4_2012 1as 8/11/13 LOS MODELOS DE DATOS EN LA PERSPECTIVA… 11:13 Página 11 27 gran utilidad y pronto se verá el uso concreto de EDM para representar los objetos museísticos. RESOURCE DESCRIPTION AND ACCESS (RDA)51 Hemos visto cómo los avances en la creación de grandes bibliotecas digitales, o puntos únicos de consulta a los diferentes tipos de objetos del patrimonio cultural, han supuesto una extensión de la normalización a la que los proveedores de contenidos han respondido por su interés en mantener esos sistemas de consulta. Pero hemos de considerar también los cambios en las normas que se están produciendo en sectores específicos, como el bibliotecario, y los efectos que tendrá en la normativa de los grandes proyectos como Europeana o la DPLA. El acontecimiento de mayor importancia ha sido la adopción por parte de un amplio conjunto de bibliotecas nacionales de los Resource Description and Access (RDA)52. Los datos creados conforme a las reglas RDA y su codificación en MARC21 van a constituir una de las fuentes de información fundamentales para datos sobre personas e instituciones. Uno de los cambios sustanciales de EDM sobre ESE es la introducción de las clases contextuales (Agent, Place, TimeSpan, Concept, ConceptScheme, Event, Physical Thing), del mismo modo que es un gran cambio la introducción de los campos 046, 368 y 37X53, de fuerte contenido semántico, en los registros MARC. Como ejemplo, los registros de autoridad de nombres de personas deben incluir información propia de la persona, lugares de nacimiento y muerte, fechas de nacimiento y muerte, ocupación y profesión, género, etc. Todos los elementos codificables según RDA Group 2 Elements (rdaGr2)54 están recogidos, de una u otra manera, en las propiedades de la clase Agent. EDM ha reutilizado las propiedades de rdaGr2, pero subsiste alguna incertidumbre con respecto a la perdurabilidad del namespace RDA pues como se dice en Open Metadata Registry: “This is the provisional registration of the RDA Group 2 Element Vocabulary, managed by the DCMI/RDA Task Group“55, lo cual resulta muy importante para los desarrollos de software que se realicen, ya que introduce una duda sobre el hecho del mantenimiento del vocabulario. Por el contrario, la existencia de Europeana como organización y de sus Task Forces suponen una garantía de mantenimiento y continuidad, como puede verse en la última propuesta Europeana Collection Profile de octubre de 201356. No es difícil entender por qué la Library of Congress ha optado por desarrollar la Bibliographic Framework Transition Initiative (BIBFRAME)57 en lugar de reutilizar ontologías de dudosa perdurabilidad. —————— 51 http://www.niso.org/news/events/2013/dcmi/rda/ 52 http://www.loc.gov/aba/rda/ 53 http://www.loc.gov/marc/RDAinMARC.html 54 http://metadataregistry.org/schema/show/id/15.html 55 El subrayado es nuestro 56 http://pro.europeana.eu/documents/900548/90890f64-777b-40d6-af78-593864a41072 57 http://bibframe.org Boletín ANABAD. LXIII (2013), NÚM. 3, JULIO-SEPTIEMBRE. MADRID. ISSN: 0210-4164 02 Modelos de datos.qxp:04 1 ANABAD 4_2012 1as 28 8/11/13 11:13 Página 12 XAVIER AGENJO Y FRANCISCA HERNÁNDEZ Por otro lado, RDA introduce un amplio conjunto de valores para la codificación de las funciones que una persona (o entidad) puede realizar en relación con una obra, que se trasladan a Dublin Core como las propiedades genéricas dc:creator y dc:contributor. Se perderá, por tanto, precisión en las conversiones de MARC a Dublin Core y, en consecuencia, se ve la necesidad de refinar estas propiedades para poder acomodar la lista de funciones establecida en el $e de los X0058, aunque sea de una forma simplificada. Otra pregunta que surge es hasta qué punto será necesario crear nuevas clases en el modelo de datos Dublin Core o si es más conveniente reutilizar las clases contextuales de EDM (y DPLA), como parece lógico. Todo ello nos lleva nuevamente a que EDM, o la conjunción de EDM y DPLA Metadata Application Profile se conviertan en una norma oficial. Europeana viene ejerciendo esta función desde la primera versión de Europeana Data Model, pero parece necesario un mayor compromiso institucional, al menos para quienes tienen que tomar las decisiones de implantar el software necesario para cumplir el modelo de datos. Desde el punto de vista de los autores de este trabajo resulta trascendental que el modelo de datos permita recoger toda la nueva información RDA/MARC 2159. Éste es, sin duda, el objetivo de la última Task Force de Europeana que se ha constituido EDM mappings refinements and extensions60. Es obvio que para los proveedores de datos disponer del software que les permita realizar las operaciones habituales en archivos, bibliotecas y museos y al mismo tiempo transmitir sus datos conforme a la normativa de Europeana o DPLA de una forma integrada es lo más ventajoso. Y también lo es para estos grandes proyectos, pues los datos fluirán regularmente y no a trompicones. Dicho brevemente, la situación ideal es la de un sistema de gestión que convierta automáticamente, y de forma transparente al usuario, los datos catalogados al modelo de datos propio de Europeana y de la DPLA (o ambos) y que al mismo tiempo comparta las reglas del universo bibliotecario, archivístico o museístico. De otro modo, no será sostenible económicamente el proceso. Este es el planteamiento de desarrollo de los productos de software de DIGIBÍS y que se manifiesta en que el 62 % de los objetos digitales españoles en Europeana proceden de En busca de esa normativa internacional para el intercambio de información sobre el patrimonio cultural hemos de mencionar al CIDOC Conceptual Reference Model (CIDOC-CRM)61, que es norma ISO desde 200662 y que actual—————— 58 http://www.loc.gov/marc/relators/relaterm.html 59 Xavier Agenjo, Francisca Hernández and Andrés Viedma. Data Aggregation and Dissemination of Authority Records through Linked Open Data in a European Context. Cataloging & Classification Quarterly, Volume 50, no. 8, 2012 60 http://pro.europeana.eu/web/network/europeana-tech/-/wiki/Main/Task+force+on+ EDM+mappings+refinements+and+extensions 61 La última versión es la 5.1 de noviembre de 2012. http://www.cidoc-crm.org/ 62 ISO 21127:2006. Information and documentation -- A reference ontology for the interchange of cultural heritage information. Boletín ANABAD. LXIII (2013), NÚM. 3, JULIO-SEPTIEMBRE. MADRID. ISSN: 0210-4164 02 Modelos de datos.qxp:04 1 ANABAD 4_2012 1as 8/11/13 LOS MODELOS DE DATOS EN LA PERSPECTIVA… 11:13 Página 13 29 mente está en fase de revisión. A pesar de la temprana existencia de esta norma, su utilización en Europeana se ha concretado en la reutilización de algunas clases (o en la definición de equivalencias entre algunas clases y propiedades de EDM a CIDOC-CRM y no del modelo completo. De hecho, tanto EDM como el Metadata Application Profile de la DPLA parecen estar llamados a cumplir las funciones de CRM. Una de las primeras decisiones de Europeana Data Model63 fue la posibilidad de adoptar tanto una visión centrada en los objetos como en los eventos. Mientras que la visión centrada en objetos es la utilizada en bibliotecas, los eventos son más propios del ámbito museístico, sobre todo después de la publicación de LIDO. El propio CRM permite ‘atajos’ para abreviar el modelado de la realidad por medio de eventos. Indudablemente, desde el punto de vista de un catalogador es más fácil decir que ‘X es el ilustrador de la obra Y’, que decir, ‘un determinado evento de creación (E65 Creation), llevado a cabo (P14 carried out by) por un (E39 Actor) ha creado (P94 has created) una (E38 Image)’. Tanto Europeana como la DPLA deben estar preparadas para admitir ambos tipos de representaciones. La implementación sistemática de la RDA se inició en los Estados Unidos el 31 de marzo de 2013, y paulatinamente se han incorporado las bibliotecas nacionales de Canadá, Reino Unido, Alemania y Australia, y pronto lo hará Francia. Alemania no sólo ha tenido que modificar sus antiguas reglas de catalogación RAK (Regeln fur die Alphabetische Katalogisierung), sino también su modelo de datos para el intercambio de información bibliográfica MAB (Maschinelles Austauschformat für Bibliotheken) por, como es lógico, MARC21. Además, no hace muchos meses que se puso en producción quizá el mayor proyecto de objetos digitales en Europa como es la Deutsche Digitale Bibliothek (DDB)64. Por otra parte, el modelo del Bibliographic Framework Transition Initiative (BIBFRAME) está en una fase preliminar, aunque ya se pueden ver los primeros borradores de definiciones. Así, en el caso de la clase Agent65 aún no se han creado las propiedades que recojan la información contenida en los campos 37X de MARC/RDA. La experiencia de la Biblioteca Virtual de Polígrafos66 muestra hasta qué punto son útiles desde un punto de vista semántico los campos 37X. Parece que la multiplicidad de modelizaciones de la clase Agent (o Person) dentro de los modelos de datos EDM, RDA, MADS, BIBFRAME, por no mencionar FOAF, está reclamando un sistema simple al modo de SKOS67, un mínimo denominador común que no pierda los valores semánticos establecidos por RDA y que tan útiles van a ser en la contextualización, en la búsqueda y en la navegación de los grandes bases de datos de patrimonio cultural y científico. Para la Biblioteca Virtual de Polígrafos los registros de autoridad de nombres —————— 63 Europeana Data Model Primer. http://goo.gl/AY8QJ 64 https://www.deutsche-digitale-bibliothek.de/ 65 http://bibframe.org/vocab/Agent.html 66 http://goo.gl/x3jOz4 67 http://www.w3.org/2004/02/skos/ Boletín ANABAD. LXIII (2013), NÚM. 3, JULIO-SEPTIEMBRE. MADRID. ISSN: 0210-4164 02 Modelos de datos.qxp:04 1 ANABAD 4_2012 1as 30 8/11/13 11:13 Página 14 XAVIER AGENJO Y FRANCISCA HERNÁNDEZ de persona, transformados en registros de persona por la aplicación de MARC/RDA se han convertido en un recurso informativo con carácter propio. La multiplicidad de modelos de datos también afecta a la reutilización de los mismos. Los modelos de datos de Europeana, ESE y sobre todo EDM, han supuesto una convergencia de los datos de archivos, bibliotecas y museos, pero también una unificación de las estructuras de datos en ámbitos concretos, por ejemplo en las bibliotecas. La panoplia de formatos MARC en toda Europa dificultó enormemente el intercambio de registros, muy parecidos, pero no exactamente iguales. Esta misma situación puede darse en la reutilización de datos Linked Open Data. REUTILIZACIÓN DE LOS DATOS Se pueden descargar68 20 millones de objetos digitales de Europeana en EDM a través del proyecto Europeana Linked Open Data (LOD)69. España participó en el proyecto inicial con los registro procedentes de la Biblioteca Virtual de Patrimonio Bibliográfico y los de la Biblioteca Virtual de Prensa Histórica. También se pueden explorar los datasets de Europeana a través de un SPARQL endpoint70, conforme con SPARQL 1.171, aunque su operatividad no parece estable. Las ventajas de SPARQL son innumerables para realizar búsquedas complejas, para obtener datos y para construir conversiones entre modelos de datos72, entre otras cosas. Sin embargo, no puede decirse que sea usable73 para la mayoría de los usuarios, incluidos archiveros, bibliotecarios y museólogos. Además de dominar el lenguaje, requiere conocer en profundidad el o los modelos de datos a consultar, y por lo tanto se ve la necesidad de desarrollar aplicaciones que permitan explotar convenientemente estos datos. De otro modo, el enorme desarrollo de Linked Open Data para que los datos sean tratados por máquinas redundará en una enorme brecha digital entre los humanos y las máquinas, o entre los humanos que manejan SPARQL y los que no pueden hacerlo. Tal vez uno de los mayores aciertos de Europeana haya sido desarrollar una API (Application Programming Interface)74 que permite ejecutar una consulta a su base de datos. Un ejemplo podría ser útil. Si se pregunta por Luis Vives en una biblioteca de digamos 100.000 registros puede que se obtengan 200 respuestas que se ajusten a nuestra petición; ahora bien si simultáneamente se ejecuta esa consulta en la base de datos de Europeana (30 millones de objetos digitales) —————— 68 http://data.europeana.eu/download/2.0/ 69 http://pro.europeana.eu/linked-open-data 70 http://europeana.ontotext.com/sparql 71 http://www.w3.org/TR/sparql11-query/ 72 Véase las SPARQL CONSTRUCT queries definidas en Dublin Core to PROV Mapping. W3C Working Draft 12 March 2013. http://www.w3.org/TR/prov-dc/ 73 http://www.bne.es/es/Inicio/Perfiles/Bibliotecarios/DatosEnlazados/index.html 74 http://pro.europeana.eu/api Boletín ANABAD. LXIII (2013), NÚM. 3, JULIO-SEPTIEMBRE. MADRID. ISSN: 0210-4164 02 Modelos de datos.qxp:04 1 ANABAD 4_2012 1as 8/11/13 11:13 LOS MODELOS DE DATOS EN LA PERSPECTIVA… Página 15 31 es sumamente probable que el número de respuestas sea mayor en uno o dos grados de magnitud. En la Biblioteca Virtual de Polígrafos de la Fundación Ignacio Larramendi se ha instalado la API de Europeana con el resultado descrito. Además es posible reutilizar los datos porque Europeana API permite obtener los registros completos en JSON (JavaScript Object Notation)75. Del mismo modo, la DPLA ha publicado su API76 con el mismo fin. La ventaja de construir aplicaciones usables sobre estas APIs77 puede verse en Europeana/DPLA Query78 desarrollada por DIGIBÍS para consultar en una misma pregunta ambas bases de datos. En esa misma línea conviene mencionar que también OCLC ha desarrollado una API79 para buscar, identificar y seleccionar los encabezamientos de materia formateados en SKOS y vinculados a LCSH y GeoNames en su servicio FAST (Faceted Application of Subject Terminology) 80. Parece que una integración de las APIs de FAST y de la DPLA obtendría magníficos resultados como ya se puede apreciar en la integración entre FAST y WorlCat. Igualmente los registros del Virtual International Authority File, de enorme utilidad, están accesibles a través de la correspondiente API81. La vinculación de datos que propone LOD es de enorme interés para la constante retroalimentación de un sistema, puesto que junto con los datos podemos utilizar también los URIs asociados por medio de las propiedades owl:sameAs82 o skos:closeMatch. Mediante la vinculación a vocabularios de valores o recursos comunes puede identificarse una misma cosa por medio de diferentes descripciones de la misma, y por supuesto con sus nombres en múltiples idiomas. Europeana está realizando este proceso de dos formas. Una, cruzando los datos con vocabularios como Semium Time83, GeoNames84, o el tesauro multilingüe GEMET85. Y otra, a través de la recomendación de determinados vocabularios de valores para cada una de las clases como puede verse en la clase edm:place86. Es decir, la reutilización de datos vinculados supone tanto la posibilidad de enriquecer los datos, mejorar la navegación y realizar búsquedas multilingües dentro de un sistema, como poder obtener las redes de vínculos establecidos por otros. Ahora, la pregunta es ¿estos procesos debe realizarlos sólo Europeana (o la DPLA) o el proveedor de contenidos debe contribuir a estos procesos? Desde —————— 75 http://es.wikipedia.org/wiki/JSON 76 http://dp.la/info/developers/codex/ 77 http://pro.europeana.eu/pro-blog/-/blogs/1558732 78 http://www.digibis.com/dpla-europeana/ 79 http://oclc.org/developer/services/fast-linked-data-api 80 http://www.oclc.org/research/activities/fast.html 81 http://www.oclc.org/developer/services/viaf 82 Véase http://sameas.org/ 83 http://semium.org/time/ 84 http://sws.geonames.org/ 85 http://www.eionet.europa.eu/gemet 86 http://europeanalabs.eu/wiki/EDMObjectTemplatesProviders Boletín ANABAD. LXIII (2013), NÚM. 3, JULIO-SEPTIEMBRE. MADRID. ISSN: 0210-4164 02 Modelos de datos.qxp:04 1 ANABAD 4_2012 1as 32 8/11/13 11:13 Página 16 XAVIER AGENJO Y FRANCISCA HERNÁNDEZ nuestro punto de vista debe ser el proveedor de datos el que ajuste los vínculos deseados y seleccione los recursos a los que vincularse para cumplir con sus objetivos informativos, independientemente de que Europeana o la DPLA realicen los enriquecimientos y vinculaciones que consideren necesarios para el funcionamiento informativo del sistema. Aún más, la verdadera visibilidad de los datos se consigue extremando el cuidado de los propios datos en su enriquecimiento semántico y en su vinculación con fuentes externas. Y para ello debe disponer de las herramientas, el conocimiento de los modelos de datos y de los recursos LOD disponibles. El medio más útil para hacerlo y participar plenamente en los sistemas de información del mundo LOD es la transformación de los ficheros de autoridad y la reutilización de los datos de autoridades, de todo tipo, disponibles en LOD. Es difícil pensar que sin la colaboración de los proveedores de contenido la aplicación de EDM y LOD en Europeana pueda realizarse únicamente por los medios de ésta. CONCLUSIONES El camino recorrido hasta llegar a Europeana ha requerido de un proyecto común con una organización y un soporte político y financiero por parte de la Comisión Europea, pero también de los esfuerzos individualizados de los proveedores de datos en torno a un conjunto de normas. La inauguración de la DPLA y el desarrollo de un modelo conjunto de datos entre Europeana y la DPLA va a conducir a que su uso se extienda mundialmente. Corea del Sur y Nueva Zelanda ya han firmado acuerdos de colaboración con Europeana y es previsible que toda América, como ya lo está haciendo Europeana, preste una especial atención a la DPLA. Luego, el modelo de datos que se construya es de un enorme interés mundial. Estamos seguros que aún transcurrirá algún tiempo para que BIBFRAME sea una realidad eficaz para englobar todo lo que supone tanto la catalogación MARC21/RDA como el decantado DC. Con toda seguridad, próximamente tendremos ocasión de contemplar modelos, programas, iniciativas y propuestas que busquen ese objetivo común, pues la capacidad de vincular no sólo los datos bibliotecarios sino también los archivísticos y los museológicos es sólo una pequeña parte de todo lo que permite y promete el modelo LOD. Una de las recomendaciones del WC3 LLD es justamente la de vincular y reutilizar los datasets de otras áreas que pueden interactuar con la información LOD-LAM (Linked Open Data in Libraries, Archives & Museums), y viceversa abrir sus datos a otras áreas. Esto es especialmente importante en ámbitos como el de la justicia, la salud o la administración electrónica, especialmente esta última, cuya importancia política a nadie se le escapa87. —————— 87 http://ec.europa.eu/digital-agenda/en/ict-enabled-public-sector-innovation-throughopen-government Boletín ANABAD. LXIII (2013), NÚM. 3, JULIO-SEPTIEMBRE. MADRID. ISSN: 0210-4164