Saltar Navegación

Una investigación de la UCR evidencia la riqueza del español para expresar emociones

El proyecto dio lugar a una taxonomía de emociones en español al comprobar que no es posible establecer una correspondencia exacta en otros idiomas para todas las expresiones.
9 feb 2026Artes y Letras
Mascarilla INIL

Mientras que, en el año 2018, la palabra mascarilla solía asociarse con temas estéticos, después de la pandemia del COVID-19 se evidencia un desplazamiento de su significado hacia términos médicos y emocionales. Foto: Archivo OCI. 

Cada vez que se traduce un texto se procura usar las palabras idóneas para transmitir el sentido original de lo que se está comunicando. Sin embargo, una investigación del Instituto de Investigaciones Lingüísticas (INIL), de la Universidad de Costa Rica (UCR), determinó que al expresar sentimientos y emociones en español se dificulta que haya una correspondencia exacta en otros idiomas.

Dicho estudio está a cargo de los docentes e investigadores Jorge Antonio Leoni de León y Edgar Casasola Murillo, quienes como resultado de su amplio trabajo académico detectaron la necesidad de crear una taxonomía de las emociones en español, pues las clasificaciones de este tipo que ya existen en idiomas como el inglés carecen de una “correspondencia uno a uno” para todas las expresiones.

“El español es famoso por su riqueza. Yo puedo decirle a una persona que la amo, pero también puedo decir que la quiero. Y traducir eso al inglés es complicado porque siempre sería to love. Cuando hilamos un poco más fino, nos damos cuenta de que es necesario tener una clasificación específica para cada lengua”, explicó Leoni, quien es especialista en lingüística computacional.

La inteligencia artificial al servicio del idioma

Los académicos utilizaron como base para su investigación un corpus obtenido del repositorio web Common Crawl. Está integrado por todo tipo de documentos colgados en internet, los cuales fueron filtrados con geolocalización en Costa Rica para que evidenciaran el uso del español en el país.

A partir de representaciones vectoriales (que es una técnica de inteligencia artificial que traduce las palabras a números o vectores), es posible determinar el significado de las diversas expresiones tomando en cuenta el contexto y la posición en el espacio en que se encuentran.

Casasola explicó que se dieron a la tarea de medir con fórmulas matemáticas la cercanía de las palabras que representan emociones respecto a sus raíces (amor, alegría, sorpresa, enojo, tristeza y miedo), pero también en relación con las emociones secundarias que giraban a su alrededor. 

Investigadores INIL

Los investigadores Jorge Antonio Leoni de León y Edgar Casasola Murillo están a cargo de esta iniciativa, la cual describen como “un grito por defender nuestra identidad lingüística, el español y la producción de herramientas tecnológicas para el español”. Foto: Laura Rodríguez.

“Cuando se toman en cuenta las subcategorías de emociones, nos damos cuenta de que muchas veces las traducciones no calzaban muy bien y que en algunos casos no debieron haber sido la traducción para esas palabras. Entonces determinamos la necesidad de hacer una taxonomía del español, para poder ser más precisos al hacer herramientas con palabras que se refieren a emociones”, mencionó Casasola.

Según el académico, al identificar los diferentes términos y expresiones asociadas a las emociones en un texto, es posible determinar la emoción que prevalece o que es dominante, lo cual no se puede determinar solo con inteligencia artificial porque su análisis se basa, meramente, en relaciones estadísticas dominantes.

Los textos analizados para el desarrollo de este estudio fueron sometidos a validación en tres modelos de lenguaje: ChatGPT, Gemini y Claude, que son sistemas de inteligencia artificial entrenados con grandes volúmenes de información para comprender y reproducir el lenguaje humano.

“La gente cree que los modelos de lenguaje no se equivocan, pero cuando yo tengo tres modelos de lenguaje diciéndome tres traducciones completamente diferentes para una palabra relacionada a una emoción, logramos demostrar que se equivocan y se evidencia la necesidad de decir desde el conocimiento lingüístico cuál es la palabra correcta para cada caso”, aclaró Casasola.

A la valoración realizada por los sistemas de inteligencia artificial se sumó un análisis de personas expertas para verificar si los términos realmente evocaban la emoción que se deseaba transmitir. Se contó con la revisión desde los campos de la psicología, la filología y, además, se consultó la traducción oficial de las palabras según un diccionario de inglés-español.

Leoni explicó que la investigación permitió determinar que “a nivel lingüístico no hay una equivalencia directa entre la traducción inmediata de una palabra respecto al uso que se le da”, pues su significado está limitado por las palabras que están en su entorno y su contexto.

“Analizamos que la palabra mascarilla antes de la pandemia se asociaba a cosméticos o con cosas que tienen que ver con belleza. Pero después de la pandemia se le vincula más bien con tristeza. Estos modelos nos permiten medir cómo las palabras se acercan o se alejan de lo que la gente está expresando y, de esta manera, es posible hablar del contenido emocional del texto”, indicó el experto.

El docente e investigador aseguró que los datos obtenidos por el estudio permiten constatar que la riqueza que ofrece el idioma español al momento de expresar sentimientos y emociones impide que las taxonomías en idiomas como el inglés correspondan por completo al realizar una clasificación léxica.

“Yo no puedo asumir que en todos los contextos donde yo digo ‘feliz’ en español, voy a poder decir happy en inglés. O, si tengo la palabra ‘regocijo’, necesito saber en cuántos textos viene ‘regocijo’ y cómo se aplica, porque en última instancia nos interesan más las palabras que están cerca que la propia palabra”, afirmó Leoni.

La academia comprometida con el conocimiento

Los resultados obtenidos con esta iniciativa son esenciales para dar paso a otras investigaciones que permitan comprender la expresión de las emociones por medio del lenguaje e, incluso, vincularse con la generación de conocimiento desde áreas como la psicología, donde un texto puede ayudar a comprender rasgos de personalidad en un ser humano.

Casasola enfatizó la importancia de impulsar la generación de conocimiento por medio de “resultados ajustados a nuestro contexto cultural, a nuestra realidad lingüística y que podamos utilizar de una manera más eficiente para responder a nuestras necesidades”.

“Como investigadores de la Universidad de Costa Rica nos sentimos en una obligación moral de hacer ese tipo de esfuerzos. Al momento en que una lengua se pierde, se pierde también la identidad de un grupo. Esto es un grito por defender nuestra identidad lingüística, el español y la producción de herramientas tecnológicas para el español”, concluyó el investigador y docente de la Escuela de Ciencias de la Computación e Informática (ECCI).

Infografía INIL

La investigación del INIL generó una taxonomía que permite determinar, mediante cálculos matemáticos, el desplazamiento emocional de las palabras en textos en español costarricense. Arte. Rafael Espinoza

Este estudio contó con el apoyo de Carlos Saborío Valverde, docente de la Escuela de Psicología e investigador del Instituto de Investigaciones Psicológicas (IIP), así como con el de Angie Solís Manzano y Luis Fernando Gómez Sánchez, vinculados a la ECCI.

Andrea Méndez Montero
Andrea Méndez Montero
Periodista Oficina de Comunicación Institucional
Áreas de Cobertura: Letras y Derecho
andrea.menwrfidezmontero  @ucrcemm.ac.cr

Comentarios:

0