Tesoro U.P. Tesauro y forma de uso documental. Según, Isidoro Gil Leiva, la palabra tesauro viene del griego thesaurus que significa tesoro. El primer tesoro elaborado con la idea de lo que es data de 1531 y lo realiza ESTIENNE, Robert que publicó su Thesaurus Linguae Latinae y lo que elaboró fue un diccionario de términos latinos contextualizados.
Un tesauro es un lenguaje documental de estructura combinatoria de carácter especializado y postcoordinado (se realiza a partir de los documentos). Es un diccionario donde se encuentran establecidas las equivalencias entre términos o expresiones del lenguaje natural y los que se seleccionan como normalizados como términos preferentes, así como las relaciones semánticas que existen. Este lenguaje documental añade las relaciones semánticas y jerárquicas que existe entre los términos.
La definición de Tesauro según la norma ISO 2778/1986 realiza una definición doble según su función y su estructura: según su función, es un instrumento de control terminológico que traduce a un lenguaje sistemático o documental el lenguaje natural empleado por los documentos y los usuarios. Según su estructura, se trata de un vocabulario controlado y dinámico porque puede estar ampliándose continuamente
El primer TESAURO que se confecciona surge en 1852 THESAUROS OF ENGLISH WORDS AND PHRASES,
Los tesauros no definen los términos que lo componen como el diccionario. No incluye todos los relativos a un dominio sino los que los usuarios podrían usar en las consultas. Los primeros tesauros que cumplen estas condiciones aparecen en la década de los 50. Los descriptores se asocian de la siguiente manera:
* Relaciones de equivalencia, (minúscula) USE y a continuación el descriptor en mayúscula. Descriptor U.P. (usado en lugar de)
* Relaciones alternativas, v/ véase. Ej. Pluma véase ave
* Relaciones jerárquicas, unen los términos genéricos con los específicos. Ej. T.G./T.E. (término específico)
* Relaciones asociativas, relacionan unos descriptores con otros. Ej. T.R. (termino relacionado) N.A. (nota de alcance)
¿Qué es un descriptor?
NZ 47-100 de diciembre de 1981, «Palabra o grupo de palabras incluidas en un tesauro o escogidas entre un conjunto de equivalentes para representar sin ambigüedad una noción contenida en un documento o en una petición de búsqueda documental. Ej. Conservación de la naturaleza.
Frente al término desriptor está el de no descriptor que es un sinónimo o cuasi sinónimo de un descriptor, no pueden ser utilizados para realizar documentos ni para consultas pero reenvía a uno o más descriptores y eso aumenta su precisión. Son puntos de acceso que facilitan el paso del lenguaje natural al controlado permitiendo la elección de los descriptores pertinentes. Ej. Protección de la naturaleza. USE: Conservación de la naturaleza
Hay tres clases de descriptores que pueden ser:
* Por su carga informativa, primarios que representan un concepto de manera unívoca. Ej. Energía, pan y secundarios que acompañan a los descriptores primarios y restringen la demanda. Ej. Información (descriptor primario) y recuperación de la (descriptor secundario)
* Por su cobertura, onomásticos (nombres de personas, instituciones, etc.) ; geográficos o territoriales (topónimos, nombres de países, montañas, etc.) ; de materia o temático (son los más importantes. Son los más difíciles de controlar y conseguir precisión. Ej. Anatomía) ; Cronológicos (indican fechas, periodos, movimientos culturales, históricos, etc. Ej. Barroco).
* Por su composición, simples o unitérminos. Ej. Anatomía, Animales o compuesto son sintagmas nominales con modificador indirecto. Ej. Animales salvajes
PRESENTACIÓN DE DESCRIPTORES
Un tesauro tiene que incluir dos presentaciones como mínimo para que sea válido. Se tiene que completar con un índice permutado donde se recogerán todos los descriptores.
Presentación alfabética, se presentan por orden alfabético único. Los descriptores y los no descriptores. Los no descriptores se acompañan de ese reenvio USE + DESCRIPTOR. A esta lista alfabética se le puede acompañar de información auxiliar, si quiero añadir información auxiliar a los términos alfabetizados:
* N.A. (nota de alcance o aplicación)
* U.P. (usado por / usado en lugar de). Ej. maestros de media jornada (no descriptor) ; USE Docentes de Jornada parcial (Descriptor)
* C.S. (campo semántico al que pertenece al indizador que he escogido)
* T.G. (término genérico) pueden tener distintos niveles de jerarquía. Ej. Dunas –> TG1 LITORAL –> TG2 GEOMORFOLOGÍA –> TG3 GEOGRAFÍA
* T.E. (término específico) lo concreto. Ej. ESPAÑA –> TE1 VALENCIA –> TE2 ALZIRA –> TE3 MOIXENT
T.R. (término relacionado) reenvía a algo que tiene relación con y que puedo completar con lo que estoy buscando. Ej. Botánica. T.R. JARDINES BOTÁNICOS.
Ejemplo de Tesauro
SISTEMAS ESCOLARES
U.P. Educación formal
N.A. Se refiere a los aspectos de estructura de la institución de educación formal
T.G. Organización de la educación
T.E.1 Sistemas de escuelas públicas
T.E. 2 Sistemas de escuelas rurales
T.R. Marco de referencia institucional
FORMAS DE LOS TÉRMINOS DE INDIZACIÓN
* Deben ser sustantivos o frases sustantivadas. Las frases sustantivadas son preferentes. Ej. Sustantivos: Imprenta, Informática. Ej. Preferentes: Pájaros marinos
* Frases preposicionales. Ej. Laboratorio de idiomas, Enseñanza en grupo
* Hay que evitar los adjetivos aislados como indizadores, así como los verbos salvo que recurramos a infinitivo, pero es preferible usar las formas sustantivas de ese verbo. Ej. Cocina
* Acrónimos y siglas, deben evitarse salvo que sean de uso muy extendido, salvo que el usuario sepa lo que significan esas siglas o acrónimos. Ej. ONU. La forma completa es la que debe utilizarse como término preferente. Ej. ONU (Úsase por ORGANIZACIÓN DE NACIONES UNIDAS)
ELECCIÓN ENTRE LAS FORMAS SINGULAR Y PLURAL
Los sutantivos que representan entes concretos se pueden dividir en contables e incontables
* Contables, se representan con forma de plural. Ej. Partidos Políticos, Pulmones, Ojos.
* Incontables, sustantivos que no se pueden contary que no pueden responder a la pregunta ¿Cuánta?. Ej. ¿Cuánta azúcar quieres? No se puede contar
* Nombres de conceptos abstractos, entidades abstractas, fenómenos, propiedades, sistemas de creencias, etc. debe expresarse en SINGULAR. Ej. Personalidad, invierno, temperatura, etc. Si es una categoría más general se puede poner en PLURAL. Ej. Ciencias biológicas. Si el sustantivo elegido tiene distinto significado en singular y en plural. Ej. PLÁTANO (árbol) y PLÁTANOS (fruto)
ORDEN DE LAS PALABRAS
Hay que seguir el orden del lenguaje natural. Hay que evitar los términos invertidos. Hay excepciones, si se habla de un término no preferente Ej. Presa y bajo se pone USE Aves de presa. Cuando se elabora un índice alfabético permutado.
Ej. DISPONIBILIDAD MONETARIA
M.T.2411 Economía monetaria
U.P. Disponibilidad líquida
U.P. Recurso financiero
T.G. 1 Masa monetaria
T.G. 2 Mercado monetario
HOMOGRAFÍA
Si hay una palabra polisémica. Ej. Plantas (pisos, edificios o vegetal) se le asocia otro descriptor del teusauro para precisar su significado. Ej. Árbol genealógico. T.R. Genealogía
SINONIMIA
Dos palabras significan lomismo pero su significado es distinto. La sinonimia es buena siempre que esté controlada al ofrecer todas las posibles entradas para efectuar la búsqueda. Ej. México, Méjico USE México ; Copyright USE Derechos de autor. Son ejemplos de sinonimia lingüística
SINONIMIA DOCUMENTAL
Se designan así a los de significado próximo pero que en el lenguaje natural no se consideran como sinónimos, son los cuasi-sinónimos. Si un descriptor se considera específico se sustituye por uno más general. Ej. Estaño, cobre, aluminio: son todo METALES
ELECCIÓN DE TÉRMINO DE INDIZACIÓN
* Ortografía, se asume que se escribe con mayúscula y los términos no preferentes con minúscula
* Extranjerismos y barbarismos, si los términos están bien establecidos se deben incorporar al tesauro. Cuando esté incorporado a la lengua se podrá añadir al tesauro. Ej. Software USE Programa de ordenador
* A la hora de transliterar como hay varias posibilidades conviene plantear las distintas formas de escribir que se encuentran. Ej. Tchekou / cekou
* Términos de jergas y argot, si el término argótico de ese grupo para él no se encuentra término alternativo aceptable de modo general se acepta el término argótico. Ej. Chat / Byte
* Entre la denominación común y la específica si hay diferencia se escoge el término específico. Ej. Ácido acetil salicítico USE Aspirina
* Entre las palabras coloquiales y científicas. Ej. Esfenisciformes USE Pingüinos (tesauro general) ; Pingüinos U.P. ESFENISCIFORMES (tesauro de especialista)
TOPÓNIMOS
En unos casos se trata de una diferencia entre la denominación oficial y popular. Ej. Holanda – Países Bajos. A veces coexisten los términos entre Donostia y San Sebastián. En el término van cooficiales y se pueden escribir de las dos formas.
NOMBRES PROPIOS DE PERSONAS O INSTITUCIONES
No se incluyen los nombres propios de personas o instituciones y se hace una lista aparte de identificadores. Si algo de esos nombres se van a incluir se debe tomar el nombre de la lengua original. Ej. AMERICAN MEDICAL ASSOCIATION U.P. Asociación médica americana. Si se incluyen nombres propios debe incluirse en su forma original. Ej. BENJAMIN FRANKLIN
TÉRMINOS COMPUESTOS
Deben representar conceptos simples, lo normal será intentar descomponer los términos compuestos en sus elementos más simples. La excepción es que si al descomponer el término compuesto se produce posibilidad de confusión, se mantiene el término compuesto. Existen dos técnicas:
* Funcionamiento semántico, Ej. Termómetro (temperatura + medición + instrumentos)
* Funcionamiento sintáctico y se aplica a términos compuestos que sean susceptibles de análisis morfológico. Ej. Hiladura de algodón (Hiladura + algodón)
Cuando se aplica el FUNCIONAMIENTO SINTÁCTICO a palabras de uso común que pueden servir al usuario para caminos de búsqueda el término compuesto debe introducirse como no preferente. Ej. Construcción de edificios (USE Edificios + Construcción).
Cuando el núcleo del sintagma nominal se refiera a una parte o propiedad y al modificar representa el conjunto. Ej. Ruedas de bicicletas.
Los términos no se deben fraccionar cuando el más compuesto resulta muy familiar en el uso común no se debe descomponer. Ej. Instalaciones deportivas. Cuando el fraccionamiento sintáctico pueda llevar a la ambigüedad. Ej. Giro postal. Términos que representan nombres propios. Ej. Médicos sin fronteras
Cuando el modificador ha perdido su significado original. Ej. Mesa redonda (referido a un grupo de personas en el que cada uno puede hablar, debatir, etc.)
Cuando el modificador sepuede relacionar falsamente con algo a lo que no se refiere al núcleo. Ej. Estructura arbórica
No se pueden descomponer términos compuestos que tienen sentido figurado. Ej. Economía sumergida (Economía que no es visible)
Cuando el modificador no corresponde a la especie o al tipo de núcleo. Ej. Pantera rosa, Oro negro
Cuando no se puede recurrir a un sustantivo extra (implícito en el compuesto). Ej. Salida de incendios, Motores de gasolina
Casos en que sí se puede fraccionar sintácticamente. Es difícil decidir en que casos puedo descomponer en compuestos separados e introducir sustantivos por libre.
* Cuando el núcleo se refiere a una parte o propiedad y el modificar representa al conjunto. Ej. Motores de avión. Excepción, no puede fraccionarse cuando el nombre del núcleo puede modificarse por su propiedad. Ej. Carreteras asfaltadas, Personal cualificado
* Cuando una acción transitiva del núcleo recaeen el modificador. Ej. Clasificación de documentos. Excepción, un término compuesto no se puede fraccionar cuando el nombre de un objeto o material puede codificarse por la acción desarrollada sobre él. Ej. Tejidos estampados, acero colado
* Cuando una acción intransitiva del núcleo recae en el modificador. Ej. Migración de las aves y se debe fraccionar por sus partes y se usan como palabras independientes. Ej. Plantas, crecimiento, aves, migración
ELABORACIÓN DE UN TESAURO
Existen paquetes de gestión de tesauros. Existen los de BEAT, elaborado por Josep Pau, otro elaborado por MULTITES, TCS que actualiza los índices que en él se incluyen. Estas herramientas pueden servir para elaborar un tesauro de 0. Cuando ya existe un tesauro en nuestra lengua o lengua extranjera lo primero que hay que plantearse son los parámetros. Hay que tener en cuenta los siguientes aspectos: Usuario, Financiar para pagar a las personas que van a elaborar el tesauro, Volumen y naturaleza de los documentos, ¿Cuál es el sistema de búsquedas, cuáles son las diferentes áreas específicas del temay plantearse qué estructura se le va a dar?
PLANTEAMIENTOS PREVIOS
* Profundidad y extensión del campo terminológico. Lo normal es acotar los márgenes. El nivel de profundidad va en relación con el usuario.
* Selección de la terminología. Si nos ceñimos al método analítico hay que extraer el vocabulario de indización.
* Índices de obras o de materias, de nomenclaturas o de letras diversas. Existe una síntesis de los dos que combina los dos anteriores (método mixto). A veces te puedes encontrar con una lista larga de palabras (hasta 15.000)
DETERMINACIÓN DE LOS CAMPOS SEMÁNTICOS Y LA DISTRIBUCIÓN DE LOS DESCRIPTORES DENTRO DE CADA CAMPO
Hay que separar en áreas temáticas la lista de descriptores que haya elaborado. A cada área se le puede dar un nombre (microtesauro) y una vez que he elegido los campos se agrupan dentro de cada campo los indicadores seleccionados. Es un trabajo semántico. Lo normal es que cada uno de estos campos se le dé un código numérico y cuando se haga el índice, los términos remitirán al número que le corresponde. Los pasos que hay que dar son los siguientes: listado de términos, áreas o campos, redacción de notas aclaratorias. Notas de aplicación o alcance. Ejercen una función de normalización porque restringe a uno solo el significado del término. A veces será conveniente redactar una nota de alcance para aclarar la sigla. A veces viene dada la nota de alcance porque viene en el diccionario. Tendré que decir cuales son las relaciones de equivalencia. Primero se agrupan los sinónimos para que no aparezcan simultáneamente en el tesauro. Hay que elegir uno como término representativo y los otros que quieran incluir se pone USE + DESCRIPTOR.
RELACIONES JERÁRQUICAS
Permiten reunir los descriptores mas generales y los más específicos. Si no hay ningún término superior ese es el que se considera cabeza de jerarquía. Dentro de un mismo nivel jerárquico, si hay varios se pueden organizar alfabéticamente. Ej. FRUTAS –> T.E. Manzanas, Peras, Piñas, Uvas
Si estoy en un tesauro de historia o de arte se pueden organizar cronológicamente. Ej. ESTILOS ROMÁNICOS –> T.E. Románico, Gótico.
Un tesauro de biología se elige el orden evolutivo para organizar los descriptores. En los tesauros de ciencias se puede recurrir a la ordenación por complejidad. Ej. GEOMETRÍA EUCLIDIANA
También se pueden organizar por dimensión. Ej. Tesauro de música (solo, duo, trio, etc.). Esta manera sirve también para geografía. Ej. País, Región, Provincia, Municipio.
Se pueden organizar los términos en función del uso que se suponga que los usuarios van a hacer del tesauro. Ej. Tesauro de religión en Alicante.
RELACIONES ASOCIATIVAS
Son las que no suponen sinónimos ni jerarquías. Existe una afinidad semántica, es el campo más subjetivo del tesauro y depende de los que realicen el tesauro. Los términos relacionados son descriptores que se conectan, miembros de una cadena jerárquica, ni conectan un descriptor con un solo descriptor.
* Disciplinas y objetos de estudio. Ej. Sismologia T.R. Terremoto
* Relaciones entre ocupaciones y personas. Ej. Deporte. T.R. Deportista
* Acciones con el efecto de la acción. Ej. Investigador. T.R. Descubrimiento
* Relaciones entre la acción con el sujeto paciente. Ej. Analisis documental. T.R. Documento
* Los objetos que se pueden relacionar con sus propiedades. Ej. Hielo. T.R. Frialdad.
* Relación del objeto con sus orígenes. Ej. Agua T.R. Manantial
* Relacionar los efectos con las causas. Ej. Erosión T.R. Viento
* Relacionar materias primas con sus productos. Ej. Madera T.R. Mueble
* Relacionar las acciones con las propiedades que se asocian a esa acción. Ej. Información T.R. Recuperación de la Información
Hay que elaborar una introducción al tesauro que se hace sobre la intencionalidad del tesauro, profundidad, el número de descriptores y no descriptores, el método que se ha seguido, la estructura que se ha elegido para el tesauro, si se ha consultado fuentes, los códigos también se explican, normas de uso, etc. Se comprueba si el tesauro es válido, los términos que se usan y los que no se usan a lo mejor se pueden eliminar cuando se ponga al día. Si se trata de un tesauro de nueva creación conviene actualizarlo cada seis meses. Si el tesauro lleva más tiempo usándose con actualizarlo cada dos o tres años es suficiente. Cuanto más especializado es el tesauro más pronto se hace obsoleto. Cuando cambia un término del tesauro seguramente hay que remover todo el tesauro.
Hola, probablemente parezca que estoy muy perdida. Estoy comenzando con esto del lenguaje documental. Trabajo en una revista científica del área de botánica y utilizamos palabras clave y key words y desde luego el título mismo funciona como palabra clave. Mi pregunta es: hay tesauros para cada disciplina o cada revista como es mi caso?, necesitaría yo hacer mis propios tesauros? hay una publicación con tesauros de cada área?
Gracias!
Hola Patricia, normalmente hay un tesauro general pero para tu caso en particular deberías crear uno nuevo, Un tesauro es una herramienta para el control del vocabulario. Orienta a los indizadores y a los usuarios sobre los términos que pueden utilizar y, así ayuda a mejorar la calidad de la recuperación.
Aunque existe algún tesauro general, de carácter enciclopédico, habitualmente un tesauro se diseña para la indización y búsqueda en un tema o área específicos. Ejemplos de temas cubiertos por los tesauros son educación, metalurgia, arte o arquitectura.
A ver si te puede ayudar un poquito más esta página,
http://pendientedemigracion.ucm.es/info/multidoc/prof/fvalle/tesauro.htm
Un saludo,
Eva