Del mismo modo que el resumen forma parte del análisis de contenidos de los documentos, la indización comparte el mismo objetivo del resumen. En ambas operaciones se trata de representar el contenido informativo con la finalidad de facilitar la recuperación de la información.

La diferencia esencial entre ambos se encuentra en el uso de los términos obtenidos en la indización.

Según definición de la UNESCO, indizar significa «Describir y caracterizar un documento con la ayuda de representaciones de los conceptos en dicho documento, para permitir una búsqueda eficaz de las informaciones contenidas en un fondo documental«.

Esta definición es del año 1975, y durante algunos años más se consideraba que la indización sólo se aplicaba a los conceptos presentes en los documentos.

Durante el proceso de tratamiento de los documentos se produce una primera operación de indización. De esta fase, los documentalistas reciben los documentos y proceden a analizar los conceptos de acuerdo con las recomendaciones de su centro de documentación y con los lenguajes documentales empleados.

El resultado de este análisis va a ser la selección de términos de indización, por ejemplo, los descriptores de un tesauro, que se incorporan al sistema de recuperación de la información dentro de los registros bibliográficos y dentro de los índices de sistema. El sistema actualiza su base de datos y almacena la información.

Cuando el usuario plantea una pregunta al bibliotecario referencista, también se produce una segunda operación de indización. En esta ocasión, la indización se realiza sobre los conceptos de la pregunta.

El bibliotecario necesita analizar los conceptos antes de convertirlos a términos de indización. La última etapa será la interrogación al sistema de recuperación de información que dará una respuesta de acuerdo con los términos de indización empleados.

Métodos de indización

Indización por unitérminos. Su autor, Mortimer Taube, expuso este método por primera vez en el año 1955. Este autor concebía los unitérminos como los vocablos más pequeños y simples seleccionados del documento, útiles para su identificación.

Para el registro físico de este sistema, Taube diseñó una ficha con una cabecera reservada al unitérmino correspondiente y el resto dividido en 10 columnas.

Cuando se hacía una búsqueda, por ejemplo, sobre «bosque de coníferas» se seleccionaban las fichas que contenían los unitérminos «bosque» y «coníferas» y se comprobaba qué números de registro coincidían en ambas fichas.

Para Van Dijk, este método suponía un importante progreso para la indización porque la lista de los términos del vocabulario documental puede ser reducida gracias al poder combinatorio de las palabras.

Indización por descriptores. Los descriptores son términos que representan o describen un concepto con más exactitud que el unitérmino, porque puede estar compuesto por expresiones complejas y más específicas. El descriptor sería «bosque de coníferas».

De esta manera, se reduce el problema que presentan los unitérminos a la hora de combinar los conceptos.

Indización por materias. Los encabezamientos de materia comienzan en 1876 con las Rules for a dictionary catalog de Charles A. Cutter. Este lenguaje documental es un lenguaje precoordinado, de estructura combinatoria y con control de vocabulario, todo ello regido por el principio de especificidad, lo cual indica que el término escogido debe describir una materia concreta y sólo una.

La función de este lenguaje es la de servir de ayuda en la recuperación de la información cuando un usuario necesita buscar documentos de un tema concreto. Los principios que estableció Cutter fueron dos: el principio de especificidad y el de entrada directa.

El principio de especificidad se refiere a la importancia de utilizar los conceptos bajo su nombre más específico y no englobarlo en uno más general. Otro principio es el de entrada directa y hace referencia a la conveniencia de usar los encabezamientos compuestos por más de una palabra en la forma en que se presentan en el lenguaje natural. Por ejemplo, debe utilizarse el encabezamiento «bosque mediterráneo» en lugar de «mediterráneo-bosques».

Indización automática

El objetivo de la indización automática consiste en aplicar métodos informáticos para que la indización sea una operación más eficiente. Gil Leiva distingue diferentes realizaciones que tienen que ver con la indización automática. Según este autor, existen los siguientes casos, en grado de menor a mayor automatización:

Asistida por ordenador, realizada por programas informáticos que ayudan al indizador humano en la operación intelectual de indización.

Semiautomática, realizada por programas que analizan los documentos y proponen términos que finalmente pasan por el indizador humano.

Automático, realizada por programas que analizan y asignan términos sin pasar por el control de un indizador humano.

Los métodos estadísticos utilizados para lograr la indización automática proceden de los estudios desarrollados en torno a las técnicas avanzadas de recuperación de información que han evolucionado especialmente desde los años 70.

Dentro del desarrollo de los motores de búsqueda tenemos que mencionar a Google, porque aportó una nueva técnica de indización al tener en cuenta no sólo el contenido de las páginas web sino también la cantidad de páginas que enlazan con cierta página.

Una vez expuesta la situación actual de la indización automática, podemos diferenciar entre diversos métodos de acuerdo con la American Society of Indixer:

Programas específicos de indización: se utilizan para generar listas de entradas que aparecen al final de los libros como índices de materias como, por ejemplo, CINDEXo SKY Index,

Indización incorporada. Es el método utilizado para insertar metadatos, en los recursos en línea con objeto de mejorar las respuestas de los motores de búsqueda.

 

La indización en los documentos
Comparte en:
Etiquetado en:                                    

4 pensamientos en “La indización en los documentos

Deja una respuesta

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

En calidad de Afiliado de Amazon, obtengo ingresos por las compras adscritas que cumplen los requisitos aplicables.
Editado en Alicante por Eva María Galán Sempere
Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos y para fines de afiliación y para mostrarte publicidad relacionada con sus preferencias en base a un perfil elaborado a partir de tus hábitos de navegación. Contiene enlaces a sitios web de terceros con políticas de privacidad ajenas que podrás aceptar o no cuando accedas a ellos. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos.
Privacidad
Una mirada al mundo de las bibliotecas