Resumen— Las Bibliotecas Digitales (BiDi) se están convirtiendo
Transcripción
Resumen— Las Bibliotecas Digitales (BiDi) se están convirtiendo
BIBLIOTECA DIGITAL COLOMBIANA Edwin Montoya, Patricia Ospina, Malgorzata Lisowska y Blessed Ballesteros Resumen— Las Bibliotecas Digitales (BiDi) se están convirtiendo en el principal medio para dar visibilidad y acceso a la producción académica y científica de nuestras instituciones; afrontando muchos inconvenientes para que sus colecciones digitales sean visibles en Internet. Factores tecnológicos (protocolos, formatos, ancho de banda entre otros) así como el desarrollo dispar de los recursos humano, económico y social de las instituciones colombianas conducen a un aislamiento y falta de integración de iniciativas institucionales, regionales y nacionales. La Biblioteca Digital Colombiana (BDCOL) es una iniciativa que pretende conformar una red de Repositorios y Bibliotecas Digitales en Colombia, que permita dar visibilidad a la producción científica, académica y cultural, de Universidades, Centros de Investigación, Bibliotecas Públicas y Privadas y demás entidades comprometidas con el progreso del país. BDCOL pretende fomentar la creación de repositorios institucionales mediante acciones de capacitación, asesoría y transferencia tecnológica, de tal manera que permita posicionar a Colombia como un país líder en la región en la conformación de redes de información. El proyecto fue en su primera fase desarrollado por 13 universidades y continuará en su segunda fase, la cual pretende aumentar significativamente el número de repositorios y de documentos digitales, a la vez que se interconecta a iniciativas internacionales. BDCOL puede accederse desde el portal en Internet http://www.bdcol.org donde todo el contenido indexado allí es de acceso libre. I. INTRODUCCIÓN La búsqueda y recuperación de información digital en Internet ha sido ampliamente dominada por los buscadores como Google, pero éstos han estado centrados principalmente en la indexación de la Web sin tener en cuenta información semántica de los datos, por ejemplo organización por colecciones, tipologías documentales o Edwin Montoya, Investigador principal proyecto BDCOL. Universidad EAFIT (Medellín-Colombia); e-mail: [email protected]. Patricia Ospina, Investigadora proyecto BDCOL. Universidad EAFIT (Medellín-Colombia); e-mail: [email protected] Malgorzata Lisowska, Investigadora BDCOL. Universidad del Rosario (Bogotá-Colombia); e-mail: [email protected] Blessed Ballesteros, Investigador BDCOL. Universidad del Norte (Barranquilla-Colombia); e-mail: [email protected] . incorporación de metadatos objetivos planteados de la Web Semántica, pero todavía en desarrollo. Las Bibliotecas Digitales (BiDi) y Repositorios Digitales (ReDi) se están convirtiendo en el principal medio de acceso a la información digital dada su naturaleza de organización y estructuración. Es igualmente, el principal medio para que una institución, región o país tenga mayor visibilidad y reconocimiento de su producción académica y científica. Una BiDi o ReDi están compuestas por una o más colecciones organizadas y clasificadas por metadatos de documentos digitales que a través de un conjunto de servicios digitales, permite a los usuarios acceder a información relevante de acuerdo a su necesidad de información. Por lo tanto el primer reto para una institución es la conformación de un repositorio digital que permita almacenar y gestionar documentos digitales. Se encuentra acá la primera dificultad en Colombia, ya que son muy pocas las instituciones que han acometido procesos de conformación de estos proyectos, justificando este hecho en factores como desconocimiento del tema, poco contenido digital disponible, comprensión de conceptos como derechos de autor y propiedad intelectual y finalmente el desconocimiento de plataformas software. Los beneficios más impactantes de estos repositorios, se ven representados cuando estos se unen para conformar redes de bibliotecas y repositorios digitales, por diferentes intereses y coberturas. Desde redes regionales, nacionales e internacionales, hasta redes temáticas por algún tipo de tipología documental. El nivel de desarrollo a nivel internacional es importante, implementándose redes nacionales como la presente en México llamada “Red Abierta de Bibliotecas Digitales – RABID” [1], la de Brasil llamada “Biblioteca Digital Brasileira de Teses e Dissertações - BDTD” [2], en Europa con el proyecto DRIVER [3], España con el proyecto Recolecta [4] o la Red Mundial de Tesis y Disertaciones (NDLTD) [5]. Con la Biblioteca Digital Colombiana – BDCOL [6], comenzamos a resolver ambas dificultades; primero el fomento a la conformación de Repositorios y Bibliotecas Digitales en Colombia, a través de diferentes frentes como capacitación, asesoría y fomento al desarrollo de contenido digital en nuestras instituciones. Respecto a la capacitación se ha impartido un curso virtual sobre bibliotecas digitales, además de realizar algunos talleres de plataformas para repositorios digitales con la tecnología de software abierto (DSpace [7]). Respecto al segundo punto, en si misma BDCOL, tiene como objetivo principal conformar la red nacional de bibliotecas y repositorios digitales, que permita integrar en un solo portal, toda la producción científica, académica, cultural, patrimonial entre otros de las instituciones comprometidas con el desarrollo del país. Ambas líneas de acción serán detalladas en los numerales a continuación. II. POLÍTICAS BDCOL ha definido un conjunto de políticas que permitirá a los miembros o usuarios conocer las condiciones de ingreso a la red. A continuación se listan las principales: BDCOL se define como una Red de Bibliotecas y Repositorios Digitales, con el objetivo de dar visibilidad nacional e internacional a la producción académica, científica, cultural y social de Colombia. Pertenecen a BDCOL instituciones educativas, centros de investigación, centros de documentación, organismos gubernamentales y no gubernamentales, archivos y bibliotecas en general; fomentando el uso de la red RENATA. BDCOL se define como una red de acceso abierto, es decir, los usuarios pueden acceder libremente al contenido indexado por BDCOL. BDCOL pretende indexar todas las instituciones que posean al menos un repositorio abierto y que cumpla con las políticas y estándares definidas para la red. BDCOL buscará integrarse a redes internacionales que permitan no solo aumentar la visibilidad sino beneficiar a los usuarios de BDCOL con el aumento significativo de contenidos digitales al estar conectados a estas redes internacionales. BDCOL es de acceso abierto. Todo el contenido es de libre descarga para sus usuarios. Los usuarios de BDCOL, serán personas naturales, Instituciones o gremios colombianos o internacionales interesados en consultar los contenidos digitales recolectados vía Internet. • OAI-PMH: Open Archives Iniciative – Protocol for Metadata Harvester. Versión 2.0 • HTTP: Hipertexto Transfer Protocol. Versión 1.1 B. Colecciones BDCOL Se han definido las siguientes colecciones en BDCOL, las cuales principalmente siguen un modelo de tipología documental y representada por las siguientes categorías: Tesis y Disertaciones, Artículos, Revistas, Objetos y Recursos de Aprendizaje, Multimedia, Libros, Literatura Gris, Documentos Históricos, Patrimonial o Cultura, y finalmente General. C. Modelos de metadatos BDCOL ha adoptado la Iniciativa de Metadatos Dublin Core (Dublin Core Metadata Initiative – DCMI) [9]. Este modelo permite describir recursos digitales en Internet y es ampliamente utilizado en bibliotecas y repositorios digitales. Dublin Core – DC, en su estructura básica, propone dos conjuntos de elementos para metadatos: a) Dublin Core Metadata Element Set - DCMES, versión 1.1 [10] y b) DCMI Metadata Terms [11] Actualmente se han desarrollado estándares de metadatos para las colecciones: tesis (adaptado de ETD-MS [8] del proyecto NDLTD[5]), artículos, multimedia, monográficos y patrimonial. Para el caso de objetos de aprendizaje se ha adoptado el estándar LOM-CO definido por el Ministerio de Educación Nacional de Colombia. Colección BDCOL Tesis y Disertaciones Modelo de Metadatos ETD-MS Objetos de Aprendizaje LOM-CO Multimedia DC-MM Artículos DC-AR Revistas DC-RE Monográfico DC-MO Ponencias y Literatura Gris Histórico, Patrimonial y Cultural General DC-PL III. ESTÁNDARES Todo repositorio que se desee conectar a BDCOL deberá cumplir un conjunto de estándares que permiten los niveles mínimos de interoperabilidad. En la primera fase de BDCOL, se ha concentrado en definir un conjunto básico de protocolos de comunicaciones entre repositorios y un modelo de metadatos para la descripción de las diferentes tipologías documentales. A. Protocolos de comunicación Se han definido inicialmente dos (2) protocolos de comunicación que soportará el portal BDCOL bajo el modelo de Recolección. Cada uno de los repositorios se define como un “Proveedor de datos” en uno de los siguientes protocolos: DC-HI DC-GE Descripción Interoperability Metadata Standard for Electronic Theses and Dissertations version 1.00, revision 2. Estándar basado en Dublin Core. Learning Object Model – Colombia. Estándar IEEE para objetos de aprendizaje, que puede ser descrito en Dublin Core, y definido para Colombia (Adoptado de la propuesta del Ministerio de Educación Nacional de Colombia) Estándar basado en Dublin Core para Multimedia Estándar basado en Dublin Core para artículos Estándar basado en Dublin Core para Revistas Estándar basado en Dublin Core para material digital monográfico Estándar basado en Dublin Core para Ponencias y Literatura Gris. Estándar basado en Dublin Core para material histórico, patrimonial y cultural Documentos en general contenidos en repositorios Tabla 1. Metadatos definidos para BDCOL IV. ARQUITECTURA Y PLATAFORMA TECNOLÓGICA A. Arquitectura de Integración Básicamente existen dos modelos de integración de repositorios y bibliotecas digitales: 1) Por recolección: en el cual el servidor (Recolector) se conecta periódicamente a los repositorios (Proveedor de Datos) para acceder a los metadatos. Se utiliza un modelo basado en protocolos como OAI-PMH o HTTP. 2) Búsquedas en línea: en el cual, el servidor recibe las consultas por parte de sus usuarios, estas mismas consultas se aplican en cada uno de las bibliotecas digitales registradas. Se utilizan de amplia forma protocolos como Z39.50, SRU y SRW. En muchos contextos esta forma de integración se conoce como Metabuscadores. En la fase 1 de BDCOL, se adoptó un modelo por Recolección utilizando protocolos OAI-PMH y HTTP, y esquemas de codificación de metadatos OAI_DC y OAI_ETD para OAI y RDF_DC para HTTP. A continuación se presenta un esquema gráfico de la arquitectura de BDCOL: Fig. 1. Arquitectura de BDCOL B. Plataforma Tecnológica Como parte del proyecto BDCOL, se ha adaptado y desarrollado una plataforma software que permite cumple con las siguientes funcionalidades: Implementación del protocolo OAI-PMH tanto como Recolector y como Proveedor de datos hacia otras redes nacionales o internacionales en formato OAI con DC, ETD y LOM-CO • Implementación del protocolo HTTP como Recolector de metadatos en formato RDF_DC • Plataforma Multicolección, esto es permite recolectar diferentes colecciones o tipologías documentales. • Gestión de Repositorios. Permite crear, modificar, listar o borrar repositorios digitales de BDCOL. Permite especificar protocolos, modelos de metadatos, URLs. En la versión inicial de BDCOL, solo los administradores de BDCOL pueden registrar los repositorios, se espera que en fases posteriores, las mismas instituciones puedan registrar y probar el cumplimiento de los estándares de BDCOL. • Portal BDCOL. Permite a los usuarios realizar una serie de servicios como: o Búsqueda de información. Búsqueda básica por un término, búsquedas avanzadas por titulo, autor, temas, colecciones y repositorios. o Navegación por Colección/Repositorio. o Estadísticas de cantidad de documentos por colección y repositorios. o Tecnologías Web 2.0 como RSS, Comentarios, Tagging, Notificación, Personalización, entre otros. • El portal BDCOL se puede acceder desde la dirección: http://www.bdcol.org y presenta una interfaz de usuario similar a la mostrada en la figura 2. Fig. 2. Interfaz Web de consulta en BDCOL C. Proyecto Piloto Como resultado de la fase 1 de la red BDCOL, se han interconectado 10 de las 13 universidades pertenecientes al proyecto, adicional a otros repositorios como el de la Biblioteca Nacional de Colombia. En total se han integrado 16 repositorios (algunas instituciones poseen más de un repositorio). La fase 1 contiene cerca de 10.000 documentos digitales, pertenecientes a: Tesis (1200 documentos), Artículos(4000 documentos) y Colección General con 3700 documentos. Se espera integrar a BDCOL los nuevos repositorios institucionales, además de realizar la interconexión con el Banco Nacional de Objetos de Aprendizaje, gestionado por el Ministerio de Educación Nacional de Colombia, el cual contiene unos 1000 Objetos de Aprendizaje. V. ADMINISTRACIÓN Se está proponiendo la conformación de una comunidad u organización que realice diferentes funciones. Debe ser virtual, gestionada a través de la red, con algunas reuniones presenciales. A continuación se presenta la propuesta de organización para BDCOL: para participar activamente en proyectos de integración de redes internacionales en Latinoamérica, Europa y USA. BDCOL no solo soluciona el problema tecnológico de integración de repositorios, sino que pretende crear una comunidad de bibliotecas digitales en Colombia, que promueva el desarrollo de políticas, normas y estándares para el contenido digital. Este proyecto fue realizado por 13 universidades, las cuales han creído que parte del desarrollo de un país se encuentra en la democratización del conocimiento a través de este tipo de iniciativas. VIII. PARTICIPANTES Fig. 3. Organización en BDCOL VI. TRABAJO FUTURO En el corto plazo se prevé dos líneas futuras de trabajo. La primera línea representada por la presentación de la Fase 2 de BDCOL a la convocatoria Colciencias No 487 de 2009. La fase 2 para esta convocatoria tiene como objetivo general “Crear una plataforma integrada de Biblioteca Digital que ofrezca Servicios Avanzados e implemente los estándares definidos en BDCOL, de tal manera que facilite la conformación de los repositorios institucionales y permita consolidar la red nacional de repositorios y bibliotecas digitales, aumentando el número de instituciones y repositorios pertenecientes a la Biblioteca Digital Colombiana utilizando la red de alta velocidad RENATA.”, a grandes rasgos esta fase pretende aumentar el número de repositorios y contenidos digitales, a la vez buscar la integración a redes internacionales. VII. CONCLUSIONES La Biblioteca Digital Colombia, BDCOL, representa un gran esfuerzo para consolidar en Colombia los repositorios digitales, y por consiguiente la conformación de una red nacional de estos repositorios. Este esfuerzo permitirá a Colombia mejorar sus indicadores de visibilidad de toda la producción científica, académica, cultural y patrimonial entre otras que estará almacenada en los repositorios institucionales. BDCOL pretende ser una red abierta y participativa, en la cual en la medida que las instituciones vayan desarrollando sus repositorios, éstos puedan integrarse a BDCOL. También con este proyecto, Colombia queda a la vanguardia de iniciativas similares en la región y se habilita El proyecto BDCOL ha sido desarrollado por las siguientes Universidades: Universidad de la Sabana, Universidad de la Salle, Corporación Universitaria Minuto de Dios, Universidad del Rosario, Universidad Nacional de Colombia, Universidad del Norte, Universidad Autónoma del Caribe, Universidad ICESI, Universidad Santiago de Cali, Universidad Autónoma de Occidente, Universidad EAFIT, Universidad de Antioquia, Universidad de Medellín IX. AGRADECIMIENTOS El proyecto BDCOL ha sido financiado por el Ministerio de Educación Nacional y la Red Nacional de Tecnología Avanzada (RENATA), a través de la convocatoria Colciencias No 397 de 2007. REFERENCIAS [1] “Red Abierta de Bibliotecas Digitales” (RABID), México, en http://ict.udlap.mx/rabid/ [2] “Biblioteca Digital de Teses e Dissertações” (BDTD), Brasil, en http://bdtd2.ibict.br/ [3] “Digital Repository Infrastructure Vision for European Research” (DRIVER), en http://www.driverrepository.eu/ [4] “Recolector de Ciencia Abierta” (RECOLECTA), España, en http://www.recolecta.net [5] “Networked Digital Library of Theses and Dissertations” (NDLTD), en http://www.ndltd.org [6] “Biblioteca Digital Colombiana” (BDCOL), Colombia, en http://www.bdcol.org [7] “Plataforma Abierta de Repositorios Digitales”, DSpace, MIT & HP, en http://www.dspace.org [8] ETD-MS: an Interoperability Metadata Standard for Electronic Theses and Dissertations, en: http://www.ndltd.org/standards/metadata/etd-ms-v1.00rev2.html [9] Dublin Core Metadata Initiative (DCMI) en: http://dublincore.org/ [10] Dublin Core Metadata Element Set version 1.1, en: http://dublincore.org/documents/dces/ [11] DCMI Metadata Terms, en: http://dublincore.org/documents/dcmi-terms/