Linked Open Data y bibliotecas
Por un lado tenemos la necesidad de describir los ámbitos del conocimiento (con metadatos u ontologías , para construir la web semántica) pero por otro necesitamos que los datos disponibles en la red puedan relacionarse entre sí de una forma estructurada. Para ello necesitamos una red con datos abiertos con enlaces estructurados: Linked Open Data.
Para que esto sea posible los datos deben:
– Estar descritos con tripletas RDF que, con una estructura sujeto-predicado-objeto indican la relación entre datos.
–Los datos deben estar enlazados con una URI para que las máquinas (o personas) puedan acceder a la información enlazada. Estas URI apuntan a vocabularios externos, como por ejemplo DBPedia. Por ejemplo https://dbpedia.org/page/Getafe
Si queremos describir la relación entre un libro y su autor, por ejemplo, disponemos de un vocabulario que trata específicamente de autores (VIAF), otros de libros (OpenLibrary o WorldCat) y podemos establecer la relación entre ambos por ejemplo con Dublin Core.
Disponemos de directorios como Linked Open Vocabularies para localizar los vocabularios y buscadores de vocabularios compatibles, como Open Metadata Registry.
Cada vez son más los nodos que se van incorporando a la red de datos enlazados, Linked Open Data, que nació en 2007 con solo 12 nodos. Para que un catálogo de datos pueda permanecer a LOD tiene que estar diseñado de acuerdo al estándar DCAT del W3C (diseñado con RDF para describir los vocabularios o datasets).
Algunos de los Datasets más importantes son :
–DBPedia: Extrae información estructurada de Wikipedia para la descripción de personas, lugares, obras, organizaciones, especies y enfermedades. De gran potencia porque la información de Wikipedia está ya muy estructurada. Se puede hacer consultas a través de SPARQL.
–GeoNames: lugares geográficos, cada uno identificado con una URI
–GEMET: un tesauro para la definición de conceptos
–VIAF (Virtual International Authority File): registros de autoridad
En 2010 surgió la comunidad LODLAM (Linked Open Data in Libraries, Archives and Museums) y desde entones LOD es un tema central en la comunidad bibliotecaria.
–Del esfuerzo de varias bibliotecas nacionales alojado por OCLC nació VIAF
–ISNI es el número estándar global certificado ISO, bajo la Norma Internacional identificador de nombre (ISO 27729), para la identificación de los millones de contribuyentes a las obras de creación. Permite que una identidad se identifique con un número y, a su vez, con una URI.
–WorldCat, catálogo de OCLC ofrece también identificadores únicos utilizables para aplicaciones de datos enlazados. OCLC ha creado y publicado más de 150 millones de Entidades de WorldCat que contienen descripciones de obras creativas y personas.
–Classify (OCLC), un servicio de clasificación de materias construido a través de datos enlazados
–OpenLibray: proyecto abierto y colaborativo que permite identificar de forma abierta un libro. Lo desarrolla Internet Archive.
–BIBFRAME (Bibliographic Framework): surgió como una iniciativa de la Library of Congress para buscar un sustituto a MARC, con la aplicación del modelo conceptual FRBR y el estándar de catalogación RDA. Es un modelo entidad-relación basado en RDF enfocado hacia el Linked Open Data.
–La Lista de Encabezamientos para Bibliotecas Públicas ha sido también transformada en formato SKOS y ampliada con encabezamientos de materia de otros registros de autoridad (como el de la BNE). Tiene un buscador y un punto de consultas SPARQL.
–Portal de datos bibliográficos de la BNE: los datos, que provienen de registros bibliográficos y de autoridades de la BNE, se encuentran descritos mediante una ontología propia de la BNE y utiliza licencia Creative Commons Public Domain Dedication (CC0). También usa otros vocabularios externos de la LOD.
–Europeana: tiene unos dos millones de tripletas RDF con obras de arte, objetos, libros, videos y audios de instituciones culturales de Europa. Tiene su interfaz de consulta SPARQL y su propio modelo de datos, llamado EDM – Europeana Data Model.