Una de las principales novedades y que causó mucha sorpresa entre los usuarios, fue la aparición de NotebookLM, una herramienta de Google que además de hacer resúmenes de largos textos con IA, podía transformar texto o enlaces en podcasts hablados entre dos personas con extraordinaria fluidez.
Ahora, la compañía ElevenLabs está subiendo la apuesta, ya que con su función GenFM quiere hacer eso y más, ya que tiene soporte para 32 idiomas: incluidos inglés, hindi, portugués, chino, español, francés, alemán, japonés y otros.
Para usar GenFM, primero debes subir un video, texto o documento de YouTube. Luego, la aplicación selecciona dos voces automáticamente para crear un podcast. Hay más de una docena de voces disponibles, señala la compañía.
Una de las pantallas interesantes que puedes ver cuando la aplicación prepara un podcast generado por IA es «Rociar algunos umms» y «Agregar algunas pausas reflexivas», para sacar todos los errores.
«Debatimos sobre cuánto introducir ‘ums’, ‘ahs’, ‘mhmms’ / risa / respiración de rellenos o superposiciones de diálogos humanos similares: nuestro objetivo es lograr el equilibrio adecuado entre la conversación natural y humana y proporcionar utilidad al contenido», le dijo Jack McDermott, quien se encarga del crecimiento móvil en ElevenLabs, a TechCrunch.
«A medida que observamos los podcasts excepcionales de formato largo, encontramos [menos] interrupciones y un flujo de conversación más natural y perspicaz. Ese tipo de experiencia es, en última instancia, lo que buscamos al hacer que las narrativas de audio sean más accesibles a través de voces e idiomas», agregó el portavoz de ElevenLabs.