Vocabulario ISOC

Acceder a Vocabulario ISOC

Lenguajes controlados de la base de datos ISOC

 
La Unidad de Análisis Documental y Producción de Bases de Datos ISOC ha mantenido una línea de trabajo sobre terminología y lenguajes documentales, paralela al desarrollo y mantenimiento de la base de datos bibliográfica que recoge los artículos de revistas españolas de Ciencias Sociales y Humanidades desde 1975.
 
En la base de datos ISOC se utilizan lenguajes controlados en la indización por materias asignadas a cada registro por personal especializado. En algunas disciplinas se han elaborado Tesauros, algunos editados y otros que quedaron en proceso de elaboración. En otras áreas se cuenta con léxicos de indización. Sin embargo, la propia base de datos es un recurso de interés para el análisis de la terminología empleada en Ciencias Sociales y Humanidades, ya que incorpora campos específicos para el análisis de contenido: resumen, clasificación, descriptores, identificadores, topónimos, legislación, jurisprudencia, periodo histórico. Además, desde 2012 incorpora de forma interna las palabras clave empleadas por los propios autores.
 
VOCINDARIO Vocabulario de indización ISOC Humanidades - Patrimonio cultural
 
Proyecto en construcción que pretende ofrecer un recurso terminológico en las áreas de Antropología y Etnología, Arqueología y Prehistoria, Bellas Artes e Historia, a partir de los registros asignados a estas disciplinas en la base de datos ISOC.
 
Este recurso es un vocabulario que recoge los principales términos de indización utilizados en la base ISOC. Por tanto, es un léxico de uso básico y no un tesauro, aunque se presenta con una estructura jerárquica similar a este tipo de lenguajes, aprovechando la clasificación empleada en la base de datos para situar los términos en el contexto temático en el que han sido empleados.
 
El vocabulario está accesible de forma gratuita en la sede web del Centro de Ciencias Humanas y Sociales del CSIC, facilitando su utilización para:
 
  • Enriquecer u orientar la búsqueda temática en la base de datos ISOC, para las personas con acceso a la versión completa del producto por pertenecer a una entidad suscriptora de las Bases de datos documentales del CSIC.
  • Descargar, compartir o reutilizar datos de este vocabulario en condiciones de licencia Creative Commons Reconocimiento – No Comercial (by-nc).
 
Para la presentación del vocabulario se ha utilizado el programa TemaTres 1.6
 
Colaboradores en este proyecto: Charo Andrés Verdú, Luis Rodríguez Yunta y Nacho Vidal Liy.
 
Metodología utilizada
 
  • Como términos genéricos se ofrecen tres opciones de navegación: por disciplinas, por campos de la base de datos y por términos que incluyen aclaraciones útiles para la búsqueda. El vocabulario refleja todas las opciones de análisis documental de contenido empleadas en la base ISOC: clasificación, descriptores, identificadores, topónimos, periodos históricos y palabras clave de autor. Para los descriptores e identificadores, se parte de la estructura de las clasificaciones ISOC, agrupando algunos de sus epígrafes para obtener conjuntos con la mayor coherencia posible y que se correspondan con un mínimo de 100 documentos. En cada una de estas entradas se indica que se trata de clasificaciones y en nota de alcance se hace constar su correspondencia dentro de la base de datos.
  • Se insertan como términos específicos aquellos descriptores utilizados al menos en 10 registros en cada conjunto definido a partir de la clasificación. Para distinguir este tipo de entradas se utiliza la etiqueta de TEP “término específico partitivo” de la que dispone el programa TemaTres. En el caso de los identificadores se ha establecido como límite la presencia en al menos 5 registros en cada agrupación de la clasificación, y se distingue con la marca “TEI término específico instancia”. Para los topónimos se ha contemplado la frecuencia de 10 registros, pero se analiza su uso a nivel global para el conjunto de las disciplinas que abarca este vocabulario.
  •  Depuración de errores y duplicidades. Aunque se eliminan los duplicados aparecidos en diferentes familias, se utiliza un sistema de polijerarquía, de modo que un término puede estar presente como específico en más de un genérico.
  • El vocabulario se enriquece con relaciones de equivalencia, para recoger otras formas posibles o usuales de un concepto, no utilizadas en la indización de la base ISOC. Igualmente se especifican en las notas de alcance.
  • Se ha establecido la marca del asterisco (*) para distinguir las entradas añadidas para las agrupaciones de términos en la navegación por campos y disciplinas. Todas las entradas que comienzan por asterisco son no-descriptores.
  •  Las palabras clave de autor se reflejan en la base de datos ISOC solo desde 2012. En la medida de lo posible, cuando se vaya reuniendo suficiente información, se incorporarán los términos de uso utilizados en al menos 5 registros, marcando con asterisco aquellos que no están presentes en el vocabulario de indización de la base ISOC.
 
De acuerdo con esta metodología las relaciones utilizadas en el vocabulario son las siguientes:
 
USE/UP: Identifica los términos no utilizados o palabras clave de autor que pueden traspasarse a un término preferente sí utilizado, por ser sinónimo o cuasi-sinónimo o por ser variantes formales (por ejemplo siglas o acrónimos).

TGP/TEP: Relación genérico-específico entre clasificación y términos de indización utilizados en el campo de Descriptores.

TGI/TEI: Relación genérico-específico entre clasificación y términos de indización utilizados en el campo de Identificadores.

* No descriptor, agrupación artificial que no debe utilizarse en la indización