Análisis Comparativo entre un Sistema de Subtitulado por Reexpresión y un Sistema Automático sin Intervención Humana

5 min de lectura

La accesibilidad a la televisión en vivo para personas sordas o con dificultades auditivas es un desafío crucial. A pesar de los esfuerzos, la calidad y velocidad del subtitulado en tiempo real a menudo son insuficientes, especialmente en programas dinámicos como los informativos. Recientes avances buscan mejorar esta situación explorando sistemas que minimicen o eliminen la necesidad de intervención humana, prometiendo una entrega de información más rápida y precisa para una audiencia más amplia.

El Desafío de la Accesibilidad en Tiempo Real

Proporcionar subtítulos precisos y rápidos en transmisiones en vivo es fundamental para garantizar que la comunidad sorda y con discapacidad auditiva tenga pleno acceso a la información. Sin embargo, los métodos tradicionales y semi-automáticos, como la reexpresión (donde una persona repite el audio para un sistema de reconocimiento de voz), suelen presentar problemas de precisión y retraso. El objetivo es lograr subtítulos que no solo sean fieles al contenido original, sino que también aparezcan en pantalla casi al instante, permitiendo una lectura fluida y comprensiva.

Dos Caminos hacia el Subtitulado: Reexpresión vs. Automatización

Este análisis comparó dos enfoques principales para generar subtítulos en vivo en noticieros españoles. Por un lado, se evaluó un sistema semi-automático basado en la reexpresión, donde un "reespeakero" escucha el programa y lo repite a un sistema de reconocimiento de voz. Por otro lado, se probó un sistema completamente automático, desarrollado por los investigadores, que transcribe directamente el audio original del programa sin ninguna intervención humana adicional.

La evaluación se centró en tres pilares fundamentales:

  • Precisión: ¿Qué tan fiel es el subtítulo al contenido hablado, medido por la Tasa de Error de Palabras (WER)?

  • Latencia: ¿Cuánto tiempo tarda el subtítulo en aparecer en pantalla desde que se pronuncia la palabra?

  • Velocidad de Lectura: ¿A qué ritmo se muestran los subtítulos, expresado en palabras por minuto o caracteres por segundo?

Resultados que Marcan la Diferencia

Los hallazgos revelaron contrastes significativos entre ambos sistemas:

  • Precisión Sorprendente del Sistema Automático: El sistema automático sin intervención humana mostró una precisión notablemente superior, con una Tasa de Error de Palabras (WER) de entre 3.76% y 7.29%. Esto se considera una calidad "buena" a "excelente". En contraste, el sistema de reexpresión obtuvo una WER mucho más alta, entre 32.24% y 44.14%, clasificada como "pobre". Gran parte de los errores del sistema de reexpresión se debieron a la omisión de contenido completo o frases enteras, lo que dificulta la comprensión.

  • Menor Retraso con la Automatización: El sistema automático logró una latencia promedio de aproximadamente 4 segundos, cumpliendo con la normativa española que establece un máximo de 8 segundos. El sistema de reexpresión, sin embargo, presentó retrasos mucho mayores, con latencias de entre 6.9 y 12.2 segundos, superando en muchos casos el límite aceptable.

  • Velocidad de Lectura: El sistema automático generó subtítulos a una velocidad media de 190 palabras por minuto (aproximadamente 15.9 caracteres por segundo). Aunque esto es ligeramente superior a las 180 palabras por minuto recomendadas por la normativa española, sigue siendo un ritmo legible. El sistema de reexpresión se mantuvo en un promedio de 133 palabras por minuto, un ritmo más lento pero también legible.

Estos resultados demuestran el potencial de la inteligencia artificial para revolucionar la accesibilidad televisiva, ofreciendo subtítulos más precisos y con menor retraso que los métodos que dependen de la intervención humana, al menos en el contexto de los informativos españoles.

Ficha Técnica

  • Título original: Comparative analysis between a respeaking captioning system and a captioning system without human intervention

  • Revista: Universal Access in the Information Society

  • Año: 2024

  • DOI: 10.1007/s10209-022-00926-3

  • Autores: Adrian Ruiz-Arroyo, Angel Garcia-Crespo, Francisco Fuenmayor-Gonzalez, Roxana Rodriguez-Goncalves

Más de agctableta

Valora este artículo
0.0/(0 votos)
Difundir
¿Qué te ha parecido?

Comentarios (0)

?

Aún no hay comentarios

Sé el primero en compartir tu opinión sobre este artículo.

Asistente de Lectura AI

Respuestas basadas %100 en el artículo

Consultas de hoy:
100 restantes/ 100

¡Hola! Soy el asistente de IA de esta publicación. Puedes preguntarme cualquier cosa sobre el contenido de este artículo.