Conferencia de Directores y Decanos de Ingeniería Informática

Un software analiza la evolución de los discursos del Premio Cervantes

Un estudio realizado con la herramienta SimpleExtractor, de Dail Software, spin-off de la Universidad Politécnica de Madrid, ha analizado los tipos de sustantivos utilizados en los discursos de los ganadores del Premio Cervantes en dos etapas, su comienzo (1976-84) y un periodo reciente (2003-12). Las principales diferencias son que el segundo periodo se centró más en aspectos metalingüísticos que el primero, al tiempo que se eliminaban las referencias al comercio y el dinero.

En el primer subcorpus, además, se mencionaba la palabra ‘crisis’, no en el segundo, cuando ya era una realidad en la sociedad; en cambio, en el segundo período aparecen las palabras ‘muerte’, ‘pobreza’, ‘seriedad’, ‘trabajo’ y ‘guerra’.

La herramienta, informa la compañía en una nota de prensa, está en periodo de validación, y su uso con estos discursos es parte del proceso. Los investigadores extrajeron aquellos sustantivos que aparecían al menos 10 veces en total en todos los discursos de cada subcorpus, y los clasificaron en categorías semánticas, según un criterio habitual de la lengua inglesa.

El primer subcorpus consistió en los primeros 10 discursos impartidos entre 1976 y 1984 (hubo dos galardonados en 1979); y el segundo subcorpus constó de los últimos diez discursos, entre 2003 y 2012.

SimpleExtractor extrajo todas las palabras que aparecieran al menos 10 veces, y de forma manual se seleccionaron los sustantivos, “por ser las palabras que tienen mayor carga semántica”.

Se observa, señala el artículo de investigación, presentado en la conferencia AESLA (Asociación Española de Linguistica Aplicada), y publicado en la revista de la misma, un número similar de sustantivos utilizados en ambos subcorpus.

Atendiendo a la distribución de los términos, más del 60% de los sustantivos extraídos en ambos subcorpus se aglutinan en tres categorías: pensamiento y comunicación, lenguaje y gramática; espacio y tiempo; y nombres propios.

La diferencia más notable entre los dos periodos es que se centran más en el tema ‘pensamiento’ en el segundo periodo (35.80%) que en el primero (22.2%). Así, los discursos del segundo periodo parecen centrarse en aspectos metalingüísticos, dando gran importancia a la lengua, libros, novelas, cuentos, poesías, a la lectura, palabras y al escritor; sin embargo, en el primer periodo se reparten los ítems de manera similar entre tres categorías, ‘pensamiento’, ‘espacio y tiempo’ y ‘nombres propios’.

Por último, “resulta llamativo que en el segundo periodo se reduce totalmente la alusión a los ‘números, medidas, dinero y comercio’, es decir, que es un tema a evitar”.