Nota del editor: este artículo se publicó por primera vez el 15 de julio por Daniela Capistran y fue traducido al español por Daniela Capistran.
Un laboratorio de investigación en informática de UT trabajó en un sistema de inteligencia artificial que hace que los videos cortos sean accesibles para usuarios con discapacidad visual.
El sistema, llamado ShortScribe, crea una transcripción de audio que describe los vídeos en detalle. Los videos cortos, que se encuentran en TikTok o Instagram Reels, generalmente no son accesibles para usuarios con discapacidad visual porque la brevedad dificulta la creación de transcripciones de audio. Tess Van Daele, recién graduada en informática, fue la primera autora del artículo de investigación sobre el sistema. Dijo que espera que más personas investiguen cómo hacer esta forma de contenido más accesible.
“Con suerte, estas enormes plataformas de las que estamos hablando… verán estas investigaciones mías y de otros, y seguirán los consejos… y realmente los utilizarán en sus plataformas para mejorarlas para sus clientes”, dijo Van Daele.
Según Amy Pavel, profesora asistente de informática y coautora del artículo de investigación, el proceso de creación del sistema comienza segmentando el vídeo en tomas y luego usando AI para obtener una descripción visual del metraje.
El sistema de IA, Reconocimiento Óptico de Caracteres, se utiliza por primera vez para reconocer cualquier texto en el vídeo. Luego, la transmisión automática de voz se utiliza para transcribir en texto todo lo que se dice en el video.Se utiliza GPT-4, un programa OpenAI, para crear resúmenes del contenido y por ultimo, el contenido se convierte en audio para que el usuario acceda.
“Las descripciones de audio son realmente interesantes”, dijo Pavel. “No son una transcripción, son una narración del contenido visual de un vídeo. Están hechos para intercalarse entre el audio”.
La estudiante de doctorado Mina Huh trabajó junto a Pavel. Huh dijo que siempre será necesario hacer ajustes para los usuarios cuando siempre se presentan nuevas formas de medios.
“A medida que surgen nuevos medios, como los vídeos de formato corto, que no existían hasta hace cinco años, es como una nueva forma de medio”, dijo Huh. “A mucha gente le encantan los nuevos medios, pero los nuevos medios implican (más) desafíos de accesibilidad porque no hemos considerado cómo deberían ser accesibles estos nuevos medios”.