Skip to main content
  1. Casa
  2. Computación
  3. News

OpenAI necesita solo 15 segundos de audio para que su IA clone una voz

En los últimos años, el tiempo de escucha requerido por una pieza de IA para clonar la voz de alguien se ha ido acortando cada vez más. Antes eran minutos, ahora son solo segundos.

OpenAI, la compañía respaldada por Microsoft detrás del chatbot viral de IA generativa ChatGPT, reveló recientemente que su propia tecnología de clonación de voz requiere solo 15 segundos de material de audio para reproducir la voz de alguien.

Recommended Videos

En una publicación en su sitio web, OpenAI compartió una vista previa a pequeña escala de un modelo llamado Voice Engine, que ha estado desarrollando desde finales de 2022.

Voice Engine funciona alimentándolo con un mínimo de 15 segundos de material hablado. Luego, el usuario puede ingresar texto para crear lo que OpenAI describe como un discurso «emotivo y realista» que «se parece mucho al orador original».

OpenAI insiste en que está adoptando un «enfoque cauteloso e informado para un lanzamiento más amplio debido al potencial de uso indebido de la voz sintética», y agrega que quiere «iniciar un diálogo sobre el despliegue responsable de voces sintéticas y cómo la sociedad puede adaptarse a estas nuevas capacidades».

Y agregó: «Basándonos en estas conversaciones y los resultados de estas pruebas a pequeña escala, tomaremos una decisión más informada sobre si implementar esta tecnología a escala y cómo hacerlo».

Uno de los usos indebidos a los que se refiere OpenAI es una estafa que algunos delincuentes ya están llevando a cabo utilizando una tecnología similar que está disponible públicamente desde hace algún tiempo. Consiste en clonar una voz y luego llamar a un amigo o familiar de esa persona para engañarlo para que entregue dinero en efectivo a través de una transferencia bancaria. También hay temores sobre cómo podría usarse dicha tecnología en las próximas elecciones presidenciales, un problema destacado por un reciente incidente de alto perfil en el que una llamada automática con un clon de la voz del presidente Joe Biden le dijo a la gente que no votara en las primarias de New Hampshire de enero.

Otra preocupación es cómo la rápida mejora de la tecnología afectará a los medios de vida de los actores de doblaje, que temen que se les pida cada vez más que cedan los derechos de su voz para que la IA pueda utilizarse para crear una versión sintética, y es probable que la compensación por un contrato de este tipo sea mucho menor que si se le pidiera al actor que realizara el trabajo en persona.

En cuanto a las implementaciones más positivas de la tecnología, OpenAI sugiere que podría usarse para brindar asistencia de lectura a los no lectores y a los niños utilizando voces emotivas y de sonido natural «que representan una gama más amplia de hablantes de lo que es posible con voces preestablecidas», así como la traducción instantánea de videos y podcasts, algo que Spotify ya está probando.

También podría usarse para ayudar a los pacientes que están perdiendo gradualmente la voz a causa de la enfermedad a continuar comunicándose usando lo que suena como su propia voz.

OpenAI tiene algunos ejemplos del audio generado por IA y el audio de referencia en su sitio web, y estamos seguros de que estarás de acuerdo en que son bastante extraordinarios.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Topics
GPT-4o está de vuelta en ChatGPT; OpenAI tuvo que arrepentirse
Sam Altman

OpenAI, los creadores de ChatGPT, han dado un giro radical después de que los fanáticos se molestaran porque eliminó los modelos más antiguos para permitir que los usuarios solo usen el nuevo modelo GPT-5.

¿¿Qué pasó? El lanzamiento del nuevo modelo GPT causó mucha emoción cuando se anunció una transmisión en vivo el 6 de agosto.

Leer más
GPT-5: todo lo que necesitas saber sobre el nuevo modelo de OpenAI
OpenAI

Para los primeros días de agosto está previsto que OpenAI presente su próximo modelo de razonamiento de IA, GPT-5, que promete nuevas funcionalidades y capacidades de reacción más rápidas, con más precisión y menos fallas.

De acuerdo con un reporte del sitio The Information, las primeras pruebas de GPT-5 muestran un desempeño brutal en tareas de desarrollo de software. El modelo sobresale tanto en programación académica como en competitiva, incluyendo modernización de código heredado.

Leer más
OpenAI abre el cofre: adivina cuántos prompts diarios se hacen
ChatGPT

Desde su debut en noviembre de 2022, ChatGPT de OpenAI se ha convertido rápidamente en una de las aplicaciones de consumo de más rápido crecimiento, y está a la altura de empresas como Instagram y Threads en lo que respecta a los récords de crecimiento de usuarios. El primer lanzamiento público del chatbot impulsado por IA de la compañía despertó el interés mundial en la IA generativa, y desde entonces la herramienta no ha hecho más que ganar más impulso.

OpenAI reveló recientemente a Axios que su chatbot de IA ahora maneja más de 2.5 mil millones de prompts de usuarios por día en todo el mundo, un salto notable desde solo 1 mil millones de consultas diarias en diciembre de 2024. Y de esa cifra, alrededor de 330 millones de prompts provienen solo de usuarios con sede en EE. UU.

Leer más