Artificial Intelligence in Audio Description: Accessible Translation of Cultural Contents

Authors

Keywords:

Audio description, Translation, Inclusion, Human-Computer Interaction, Generative Artificial Intelligence, Audio description, Translation, Inclusion, Human-Computer Interaction, Generative Artificial Intelligence

Abstract

Introduction: The aim of this research is to reflect on the challenges and limitations arising from the use of artificial intelligence in the accessible translation of cultural objects, particularly sculptures, and in the production of audio descriptions for an audience with visual impairments.

Methods: Based on a semiotic analysis of the artworks, this research proposes, on one hand, a version created by the authors of this study following the guidelines of audio description, and on the other hand, a second version produced with the assistance of artificial intelligence. The obtained audio descriptions have been analyzed using a platform that has been trained for this purpose.

Results: The analysis of the audiodescriptions generated by the artificial intelligence systems UniDescription and Microsoft Copilot enabled the identification of relevant proposals in terms of textual organization and linguistic choices.

Conclusions: The study reveals that the combination of human experience and artificial intelligence assisted translation tools can effectively improve the quality and efficiency of accessible content creation services.

Downloads

Download data is not yet available.

Author Biographies

Silvia Dini, Universidad de Parma

(Urbino, Italia). Estudiante de doctorado en Learning Science & Digital Technologies en la Universidad de Parma (Italia), Departamento DUSIC (Discipline Umanistiche, Sociali e delle Imprese Culturali). Especializada en el área de semiótica y traducción para la inclusión, su proyecto de doctorado explora el campo de la sonificación y la inteligencia artificial aplicada a la descripción auditiva de las artes visuales para mejorar la accesibilidad en beneficio de públicos diversos. Tras graduarse en 2015 en Lenguas y Culturas Extranjeras en la Universidad de Urbino «Carlo Bo», cursó un máster en Lengua, Culturas y Comunicación en la Universidad de Módena y Reggio Emilia.

María Joaquina Valero Gisbert, Universidad de Parma

(España). Doctora en Lingüística por la Universidad de Valencia (España). Profesora Titular de Lingua e Traduzione Spagnola L-LIN/07 de la Universidad degli Studi di Parma, Departamento DUSIC (Discipline Umanistiche, Sociali e delle Imprese Culturali), Unità di Lingue e Letterature Straniere. Sus áreas de investigación son: Lexicografía, Fraseología Hispánica, Traducción Audiovisual y Audiodescripción. Dirige el Máster oficial en Traducción Audiovisual (MTAV)

Luca Andrea Ludovico, Universidad de Milán

(Milán, Italia). Máster en Ingeniería Informática obtenido en el Politécnico de Milán, Doctorado en Ciencias de la Computación obtenido en la Universidad de Milán. Categoría docente o de investigación: profesor titular, Universidad de Milán. El área de investigación es la computación sonora y musical. En particular, las actividades científicas se centran en la representación computacional de información musical, la musicología computacional, la educación musical asistida por ordenador y el patrimonio cultural inmaterial.

References

AENOR. Norma UNE: 153020. Audiodescripción para personas con discapacidad visual. Requisitos para la audiodescripción y elaboración de audioguías. Madrid: AENOR, 2005.

AUDIO DESCRIPTION COALITION (ADC). 2013. Standards for Audio Description and Code of Professional Conduct for Describers. https://audiodescriptionsolutions.com/the-standards/Lastaccessed:July21,2025.

BERGIN, D., & OPPEGAARD, B. (2024). Automating Media Accessibility: An Approach for Analyzing Audio Description Across Generative Artificial Intelligence Algorithms. Technical Communication Quarterly, 33(1), 1–16. https://doi.org/10.1080/10572252.2024.2372771.

CABEZAS GAY, N. (2017) Audiodescripción con apoyo táctil en contextos museísticos: evaluación de una nueva modalidad de traducción accesible. (Tesis doctoral). Universidad de Granada. https://digibug.ugr.es/handle/10481/48339.

DE COSTER, K., & LOOTS, G. (2004). Somewhere in between touch and vision: In search of a meaningful art education for blind individuals. International Journal of Art & Design Education, 23(3), 326–334. https://doi.org/10.1111/j.1476-8070.2004.00411.x

DONDIS, D. A. (1973). A Primer of Visual Literacy, The MIT. La sintaxis de la imagen. Introducción al alfabeto visual (J. G. Beramendi, trad.). Gustavo Gili. Press Cambridge (Mass.).

FINEMAN A. & COCK, M. (2022). Audio description in museums: A service provider perspective. En C. TAYLOR, & E. PEREGO (EDS.) The Routledge Handbook of Audio Description, Routledge, 1st ed., 266-283.

GARCÍA VIZCAÍNO, M. J. (2023). Audio Description in Abstract Art: Using Metaphors from a Functional Perspective. Journal of Audiovisual Translation, 6(1), 189–208. https://www.jatjournal.org/index.php/jat/article/view/263.

GONANT F., MORISSET L. (2008). La charte de l’audiodescription. Paris: Ministère des Affaires Sociales et de la Santé.

HELLER, M. A. & GENTAZ, E. (2014). Psychology of touch and blindness. Vol. 1. Psichology Press.

HRUSHOVSKI, B. (1979) The Structure of Semiotic Objects: A Three-Dimensional Model, Poetics Today, Special Issue: Literature, Interpretation, Communication, 1(1/2), 363-37. https://doi.org/10.2307/1772052

ITC (Independent Television Committee). ITC Guidance on Standards for Audio Description. Londres, 2000.

LUQUE COLMENERO, M. O. (2024) Metaphors to see: A methodology to analyse the use of metaphorical expressions in museum audio description. Cultus: The Journal of Intercultural Mediation and Communication, 17 (1), 10-36 https://www.cultusjournal.com/files/Archives/02_Luque_Colmenero_17.pdf

LUQUE COLMENERO, M. O. (2016). The embodiment of the metaphor: An analysis of the metaphors used to convey the human body in audio descriptive guides of museums for people with visual functional diversity. E-AESLA, Revista digital del Instituto Cervantes, 2, 326−334. https://cvc.cervantes.es/lengua/eaesla/pdf/02/31.pdf

LUQUE COLMENERO, M. O. (2019). La metáfora como herramienta de acceso al conocimiento en las guías audiodescriptivas de museos de arte contemporáneo para personas con discapacidad visual, Universidad de Granada, Tesis Doctorales. https://digibug.ugr.es/handle/10481/55493

LUQUE COLMENERO, M. O., & SOLER GALLEGO, S. (2020). Metaphor as creativity in audio descriptive tours for art museums: From description to practice. Journal of Audiovisual Translation, 3(2), 64– 78. https://www.jatjournal.org/index.php/jat/article/view/128

MORATO, E. F. (2013). Esboço de um plano de expressão para o texto escultórico. Estudos Semióticos, 9(1), 90-98. https://dialnet.unirioja.es/servlet/oaiart?codigo=5762324

PIETROFORTE, A. V. S. (2018) A semiótica da escultura. Estudos Semióticos, (edição especial). Editores convidados: Waldir Beividas e Eliane Soares de Lima. SãoPaulo, 14(1), 144–157. https://www.revistas.usp.br/esse/article/view/144318

REMAEL, A., REVIERS, N. & VERCAUTEREN, G. (2015) Pictures painted in words: ADLAB Audio description guidelines, Università di Trieste, EUT Edizioni.

SALZHAUER AXEL, E., HOOPER, V., KARDOULIAS, T., STEPHENSON KEYES, S. y ROSENBERG, F. (1996) Making Visual Art Accessible to People Who Are Blind and Visually Impaired. Art Education for the Blind.

SNYDER, J. (2010) ed. Guidelines for Audio Description Standards. American Council of the Blind.

SOLER GALLEGO, S. (2013) La traducción accesible en el espacio multimodal museográfico. (Tesis doctoral). Servicio de publicaciones de la Universidad de Córdoba. https://helvia.uco.es/bitstream/handle/10396/11512/2013000000865.pdf?sequence=1&isAllowed=y

TAYLOR, C., & PEREGO, E. (Eds.) (2022). The Routledge Handbook of Audio Description, 1st ed., Routledge. Routledge. https://doi.org/10.4324/9781003003052

VALERO-GISBERT, M.J. (2021). La Audiodescripción: de la imagen a la palabra. Traducción intersemiótica de un texto multimodal. Bologna, Clueb.

Published

2025-12-22

How to Cite

Dini, S., Valero Gisbert, M. J., & Ludovico, L. A. (2025). Artificial Intelligence in Audio Description: Accessible Translation of Cultural Contents. ISLAS, 67(212), e1609. Retrieved from https://islas.uclv.edu.cu/index.php/islas/article/view/1609

Similar Articles

1 2 3 4 5 6 7 8 9 10 > >> 

You may also start an advanced similarity search for this article.