El tesauro se define como una herramienta que proporciona un vocabulario controlado y sinónimos, permitiendo seleccionar los términos adecuados para realizar búsquedas de información eficientes en bases de datos.
- Descriptores o términos permitidos: Se refiere a una palabra o conjunto de palabras que representan un único concepto utilizado para el análisis y recuperación de documentos.
- No descriptores o términos no aceptados: Al optar por un único término, se eliminan las sinónimos del lenguaje natural, dejando fuera los términos que no son descriptores.
RELACIONES SEMÁNTICAS que se establecen entre los distintos términos del tesauro:
- Relaciones de equivalencia: Se refiere a la proximidad fonética o sémica entre descriptores y no descriptores (sinónimos, cuasi-sinónimos, etc.). Estas relaciones se representan mediante las siguientes referencias:
- USE: Reenvía del término no descriptor al término descriptor. Ejemplo: Revistas. USE Publicaciones periódicas
- UP (Usado por): Conecta el término descriptor con el no descriptor. Ejemplo: Publicaciones periódicas. UP Revistas
- Relaciones jerárquicas: Estas son relaciones asimétricas establecidas entre descriptores, donde un término es superior o genérico respecto a otro. Para representarlas, se utilizan siglas como T.G. (Término Genérico) y T.E. (Término Específico).
- Relaciones asociativas: Son relaciones asimétricas entre descriptores de distintas familias, diferentes a las jerárquicas o de equivalencia, que evocan conceptos mutuamente por asociación de ideas. Este tipo de relación se representa con las siglas T.R. (Término Relacionado). La mayoría de estas relaciones se establecen entre términos que comparten un lexema común o que tienen relaciones de hiperonimia o hiponimia.
Se trabajará sobre una lista inicial de alrededor de 15,000 términos, y las tareas a realizar serán las siguientes:
Los trabajos deberán seguir las directrices de la UNE 25964:2014 en relación a la normalización de términos. El tesauro deberá:
- Agrupar o determinar las principales áreas temáticas que organizarán el tesauro.
- Establecer la estructura jerárquica del mismo.
- Definir las relaciones de equivalencia o asociación entre los diferentes términos integrados.
- Entregables: El resultado de la elaboración deberá entregarse de forma informatizada, utilizando un software “libre” específico para la creación de tesauros, como iQvoc, Thmanager o similar. El resultado deberá ser compatible con el modelo SKOS (Simple Knowledge Organization System), garantizando la posibilidad de mantenimiento y actualización por parte de la biblioteca digital.
Gestión de vocabularios controlados con soporte SKOS
Para organizar (clasificar, describir, indexar) el conocimiento, se cuentan con varias herramientas documentales: vocabularios controlados, taxonomías, tesauros y ontologías.
El consorcio W3C ha desarrollado un modelo para representar la estructura básica y el contenido de estas herramientas: SKOS, que significa Simple Knowledge Organization System (Sistema Simple de Organización del Conocimiento). Al tratarse de un modelo basado en RDF (Resource Description Framework), SKOS permite la creación y publicación de conceptos en la web, así como su enlace a otros esquemas de conceptos o datos, facilitando su reutilización por terceros.