YouTube ha comenzado a implementar una nueva función llamada «Expressive Captions» (Subtítulos Expresivos) que representa una actualización significativa en la forma en que los subtítulos capturan y transmiten la emoción y el tono del contenido de video.
Esta nueva característica utiliza inteligencia artificial junto con la transcripción regular para revelar el significado detrás de las palabras. Actualmente está disponible para videos en inglés subidos después de octubre de 2025, y YouTube planea expandirla a más contenido próximamente.
A diferencia de los subtítulos tradicionales que simplemente transcriben texto plano, los Subtítulos Expresivos ahora muestran tono, énfasis, emoción e incluso señales ambientales como suspiros, aplausos o jadeos. Si alguien suspira o jadea, el subtítulo lo indicará. Los espectadores verán etiquetas como ‘[alegría]’ o ‘[tristeza]’ antes del texto, permitiendo captar sarcasmo o desconsuelo incluso sin poder escuchar el audio.

Esta función no surgió de la nada. Los Subtítulos Expresivos se lanzaron inicialmente en Android como una evolución de Live Caption, yendo más allá del sistema básico de transcripción palabra por palabra. La versión de Android no solo capturaba lo que se decía, sino también cómo se decía. Si alguien susurraba, el subtítulo lo reflejaba. Si gritaban, se mostraba esa intensidad. Si alguien alargaba una palabra para efecto dramático, el texto se estiraba con ellos.
Los subtítulos estándar siempre han sido funcionales, pero rara vez divertidos o expresivos. Cumplen su función si estás viendo con el sonido silenciado o tienes necesidades de accesibilidad auditiva, pero históricamente han despojado al video de su emoción y energía.
La nueva función forma parte de las actualizaciones de accesibilidad de Google, que incluyen otras mejoras del sistema operativo Android como soporte Fast Pair para audífonos, dictado por voz más fácil con TalkBack, y más.