Skip to main content

Corpus Iberia

El corpus Iberia es una herramienta informática creada entre 2008 y 2009 en el seno del Consejo Superior de Investigaciones Científicas para los estudios sobre el español, lengua de la ciencia en la sociedad del conocimiento. Se trata de un corpus textual panhispánico sobre el discurso científico-técnico (1985-hoy). Los objetivos que persigue son los siguientes: (a) recopilar el mayor número posible de documentos científicos escritos en español, (b) actualizar permanentemente con la producción científica de última hora, (c) indexar los documentos incorporando la mayor cantidad de información lingüística posible y (d) crear una herramienta útil a través de una interfaz de consulta lo más versátil, potente y sencilla posible. En la actualidad contiene 66.584 documentos y 280 millones de palabras aproximadamente referidos al español científico-técnico del español de España entre 1985 y 2015.
Todas las palabras están analizadas lingüisticamente (con el lema, la clase de palabras y los rasgos morfológicos) e indexadas. A través de una interfaz de consulta es posible recuperar no solo los contextos de aparición de estas palabras, sino información sobre otras palabras con la que coaparecen y sobre como distribuyen las apariciones en los distintos ámbitos cientifico-técnicos.

 

 
Bibliografía
Ahumada, Ignacio (2010): «El corpus Iberia como recurso para la traducción especializada», en Hikna. Revista de Traducción/Translation Studies (Universidad de Córdoba), 9, pp. 9-24.
Ahumada, Ignacio/Porta Zamorano, Jordi/Rosal García, Emilio del (2011): «Design and development of Iberia: a corpus of scientific spanish», en Corpora (Edinburgh University Press), 6/2, pp. 145-158. 
Ahumada, Ignacio (2011): «El español de la ciencia: ¿la identidad en crisis?/Scientific Spanish: Identity in crisis», en Word for Word. The social, economic and political impact of Spanish and English/Palabra por palabra. El impacto social, económico y político del español y del inglés, Madrid, Santillana Español-British Council-Instituto Cervantes, pp, 309-328.