TESAUROS

9 - Octubre - 2023

- Lexicografía
Normalización, creación y estudio de las materias LTU

¿Cómo sabemos si nuestros datos son “buenos”?

  • ¿Están completos los datos? ¿Hay campos vacíos o con valores nulos tipo “N/C”?
  • ¿Son consistentes? ¿Hay conflictos entre los valores de distintos campos, por ejemplo, entre “Género” y “Título”? ¿Entre los valores de un campo en distintos conjuntos de datos? La consistencia se puede definir a distintos niveles.
  • ¿Son únicos? ¿Hay duplicidades en el conjunto de datos? En ocasiones resulta más sencillo manejar un cierto umbral de redundancia que garantizar la unicidad de los datos.
  • ¿Son conformes a los estándares o convenciones? ¿Se garantiza la privacidad de los datos según la legislación vigente? ¿Se monitorizan los accesos?
  • ¿Son precisos? ¿Cuántos decimales son precisos para los valores numéricos? ¿Qué redondeo o truncamiento se usa?
  • ¿Son razonables? ¿Tienen sentido los valores que aparecen reflejados? ¿Representan de forma correcta la realidad?

 Si hemos detectado la necesidad de mejora en el conjunto de datos tendremos que realizar una depuración (data cleaning o data scrubbing).

 ¿Necesitamos la prestación de un servicio de asistencia técnica para la revisión de la Lista de Términos Únicos?

Un tesauro es un vocabulario controlado y estructurado que debe mostrar y diferenciar claramente las relaciones básicas que conectan los términos que contiene. Debe de definir e ilustrar estas relaciones, semánticas y genéricas: de equivalencia, jerárquicas y asociativas.

Permite convertir el lenguaje natural de los documentos en un lenguaje controlado, ya que representa, de manera unívoca, el contenido de estos, con el fin de servir tanto para la indización, como para la recuperación de los documentos.

El tesauro incorporará todos esos términos en una base de datos y cada uno de ellos se convertirá en un punto de acceso para la recuperación del documento.

Por tanto, es un vocabulario, generalmente especializado, coherente y limitado de palabras, dotado de sus correspondencias semánticas, elegido de manera que pueda representar todas las nociones que figuran en un texto dado y así servir a la informática y al establecimiento de índices.

El tesauro multilingüe contiene descriptores equivalentes de más de dos lenguas relacionados entre sí de acuerdo con su uso en sus respectivos idiomas.

  • Norma UNE 50106-1990, Norma internacional ISO 2788:1986, vigente UNE-ISO 25964-1:2014, define un tesauro como «un vocabulario controlado y dinámico, compuesto por términos que tienen entre ellos relaciones semánticas y genéricas y que se aplica a un dominio particular del conocimiento».

https://www.une.org/encuentra-tu-norma/busca-tu-norma/norma/?c=norma-une-iso-25964-1-2014-n0053960

Gestión de vocabularios controlados con soporte SKOS

Para organizar (clasificar, describir, indexar) el conocimiento, existen varias herramientas documentales de organización: los vocabularios controlados, las taxonomías, los tesauros y las ontologías.

El consorcio W3C ha desarrollado un modelo para la representación de la estructura básica y el contenido de las mismas: SKOSSimple Knowledge Organization System (Sistema Simple de Organización del Conocimiento). Al tratarse de un modelo basado en RDF (Resource Description Framework), SKOS permite la creación y publicación de conceptos en la Web, así como enlazarlos con otros esquemas de conceptos o con otros datos o su reutilización por parte de terceros. https://www.w3.org/TR/swbp-skos-core-guide/

El vocabulario básico de SKOS es un conjunto de propiedades RDF y clases RDFS que se pueden utilizar para expresar el contenido y la estructura de un esquema conceptual como un gráfico RDF.https://skos.um.es/unescothes/

Qué debemos tener en cuenta en el momento de elaborar el Tesauro:

  • Tesauro de la Entidad
    1. La estructura se articulará en torno a grandes epígrafes temáticos, ordenados secuencialmente de forma CDU o similar, y dentro de epígrafes generales donde podemos encontrar otros más específicos y donde se establecen los diferentes documentos de indización.

https://vocabularies.unesco.org/browser/thesaurus/es/

https://digital.csic.es/handle/10261/24923

http://tesauros.mecd.es/tesauros/tesauros

  • Verificación del punto de acceso preferente
  • Creación de un punto de acceso preferente
  • Establecimiento de las referencias: una vez determinado el punto de acceso preferente, deben establecerse las relaciones equivalentes (USE/UP), jerárquicas (TG/TE) y asociativas (TR/TR).
  • Registro de puntos de acceso preferentes: una vez establecido el punto de acceso preferente, éste debe registrarse en la base de datos de la lista de puntos de acceso preferentes, según el formato correspondiente.

Mantenimiento de la lista de puntos de acceso preferentes: la lista requiere una permanente revisión, verificación y validación de altas, modificaciones y bajas, actualizando no solo los puntos de acceso preferentes, sino también las formas variantes y otras relaciones.

 https://youtu.be/7PxdUautzKg

Tal vez te pueda interesar

Aplicaciones de la Inteligencia Artificial en el sector de archivos y bibliotecas

La Inteligencia Artificial impulsa la modernización de archivos y bibliotecas con catalogación automática, mejores búsquedas, preservación digital y servicios personalizados para distintos perfiles de usuarios.

Proyectos que transforman archivos, bibliotecas y colecciones

Servijarama consolida en 2025 su labor en gestión documental, archivos, bibliotecas y patrimonio, con proyectos para administraciones públicas, museos e instituciones culturales que mejoran el acceso a la información y la preservación.

Lo que una caja de fotos puede contar… si sabemos cómo escucharla

Las fotografías archivadas con criterios técnicos y normativos se convierten en memoria accesible y protegida. La gestión documental adecuada rescata historias invisibles y conserva el patrimonio cultural para futuras generaciones.

Proyectos Destacados de 2024: Gestión Documental, Conservación Cultural

En 2024 se destacan proyectos de gestión documental y conservación cultural. Se han realizado avances en la digitalización y accesibilidad de archivos, mejorando la preservación del patrimonio histórico y cultural a través de diversas iniciativas clave.

La Importancia de la Gestión Documental del Inventario de los Bienes de la Iglesia

La gestión documental del inventario de los bienes de la Iglesia es fundamental para la protección y conservación del Patrimonio Histórico Español y cumple con los requisitos legales de la Ley 16/1985 de 25 de junio del Patrimonio Histórico Español.

SERVIJARAMA Servicios Documentales obtiene la certificación en ISO 9001 e ISO 14001

SERVIJARAMA Servicios Documentales ha logrado con éxito la certificación en ISO 9001 e ISO 14001, destacando nuestro compromiso con la excelencia en la calidad y el cuidado del medio ambiente en todos nuestros procesos y servicios

(c) 2026. Aviso Legal/Política de privacidadPolítica de cookies