Skip to main content

OpenAI necesita solo 15 segundos de audio para que su IA clone una voz

En los últimos años, el tiempo de escucha requerido por una pieza de IA para clonar la voz de alguien se ha ido acortando cada vez más. Antes eran minutos, ahora son solo segundos.

OpenAI, la compañía respaldada por Microsoft detrás del chatbot viral de IA generativa ChatGPT, reveló recientemente que su propia tecnología de clonación de voz requiere solo 15 segundos de material de audio para reproducir la voz de alguien.

En una publicación en su sitio web, OpenAI compartió una vista previa a pequeña escala de un modelo llamado Voice Engine, que ha estado desarrollando desde finales de 2022.

Voice Engine funciona alimentándolo con un mínimo de 15 segundos de material hablado. Luego, el usuario puede ingresar texto para crear lo que OpenAI describe como un discurso «emotivo y realista» que «se parece mucho al orador original».

OpenAI insiste en que está adoptando un «enfoque cauteloso e informado para un lanzamiento más amplio debido al potencial de uso indebido de la voz sintética», y agrega que quiere «iniciar un diálogo sobre el despliegue responsable de voces sintéticas y cómo la sociedad puede adaptarse a estas nuevas capacidades».

Y agregó: «Basándonos en estas conversaciones y los resultados de estas pruebas a pequeña escala, tomaremos una decisión más informada sobre si implementar esta tecnología a escala y cómo hacerlo».

Uno de los usos indebidos a los que se refiere OpenAI es una estafa que algunos delincuentes ya están llevando a cabo utilizando una tecnología similar que está disponible públicamente desde hace algún tiempo. Consiste en clonar una voz y luego llamar a un amigo o familiar de esa persona para engañarlo para que entregue dinero en efectivo a través de una transferencia bancaria. También hay temores sobre cómo podría usarse dicha tecnología en las próximas elecciones presidenciales, un problema destacado por un reciente incidente de alto perfil en el que una llamada automática con un clon de la voz del presidente Joe Biden le dijo a la gente que no votara en las primarias de New Hampshire de enero.

Otra preocupación es cómo la rápida mejora de la tecnología afectará a los medios de vida de los actores de doblaje, que temen que se les pida cada vez más que cedan los derechos de su voz para que la IA pueda utilizarse para crear una versión sintética, y es probable que la compensación por un contrato de este tipo sea mucho menor que si se le pidiera al actor que realizara el trabajo en persona.

En cuanto a las implementaciones más positivas de la tecnología, OpenAI sugiere que podría usarse para brindar asistencia de lectura a los no lectores y a los niños utilizando voces emotivas y de sonido natural «que representan una gama más amplia de hablantes de lo que es posible con voces preestablecidas», así como la traducción instantánea de videos y podcasts, algo que Spotify ya está probando.

También podría usarse para ayudar a los pacientes que están perdiendo gradualmente la voz a causa de la enfermedad a continuar comunicándose usando lo que suena como su propia voz.

OpenAI tiene algunos ejemplos del audio generado por IA y el audio de referencia en su sitio web, y estamos seguros de que estarás de acuerdo en que son bastante extraordinarios.

Topics
Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
8 chatbots de IA que deberías usar en lugar de ChatGPT
La imagen muestra una representación de un chatbot.

Microsoft
Cuando ChatGPT se lanzó a finales de 2022, fue una novedad. Sin embargo, no pasó mucho tiempo para que llegara la competencia.

Al principio, no había muchas alternativas de ChatGPT disponibles que no fueran internas, opciones basadas en la investigación o proyectos de código abierto en GitHub que requirieran algún tipo de conocimiento de codificación para configurarse y operar. Pero desde entonces, varias empresas han desarrollado productos de consumo con niveles gratuitos y de pago y una gran cantidad de opciones empresariales y para desarrolladores. Así que, si no estás satisfecho con ChatGPT por cualquier motivo, estas son las otras ocho opciones que puedes probar.
Copilot de Microsoft
Jon Martindale / DigitalTrends
Microsoft Copilot ha recorrido un largo camino desde que se lanzó su primera iteración de chatbot a principios de 2023. Fue uno de los primeros competidores comerciales de ChatGPT cuando la marca introdujo Bing AI Chat como una integración en su motor de búsqueda Bing y su navegador Edge. Desde entonces, la compañía ha cambiado el nombre de su chatbot a Microsoft Copilot en su navegador y también ha integrado su funcionalidad en varios servicios, incluida la suite de productividad Microsoft 365, Microsoft Designer y el sistema operativo Windows, entre otros. Microsoft también ofrece una opción de pago de Copilot Pro para usuarios avanzados.

Leer más
El curso gratis que ofrece OpenAI que te podría hacer ganar mucha plata
openai curso gratis inteligencia artificial

"ChatGPT Prompt Engineering for Developers"  es el nombre del curso que acaba de abrir OpenAI y viene a significar 'Prompt engineering / ingeniería de instrucciones de ChatGPT para desarrolladores'. Se trata de un plan de estudios gratis y lo ha hecho uniéndose a DeepLearning.AI, la compañía de Andrew Ng, también cofundador de la plataforma de cursos Coursera y antiguo máximo responsable de Google Brain y del departamento de IA de Baidu.

Este curso de 1,5 horas tiene como objetivo dotar a los desarrolladores de software con las habilidades necesarias para integrar los grandes modelos de lenguajes (LLMs, como GPT-3.5 y GPT-4) en la creación de aplicaciones.

Leer más
Así es la dura demanda de Elon Musk contra OpenAI: no beneficia a la humanidad
Elon Musk demanda

Una durísima demanda presentó este jueves 29 de febrero, Elon Musk en un tribunal de San Francisco, ante la empresa de la que fue accionista en su momento, OpenAI.

El dueño de Tesla y X dice que Sam Altman y compañía lo único que buscan son ganancias y que "abandonaron" su misión fundacional de desarrollar tecnología de inteligencia artificial que beneficie a la humanidad.
Musk alega que la asociación de OpenAI con Microsoft ha transformado a la organización "en una subsidiaria de facto de código cerrado" de Microsoft que se centra en maximizar las ganancias.
Según la demanda, tales acciones constituyen una violación del acuerdo fundacional entre Musk, quien cofundó OpenAI en 2015 pero ya no conserva una participación en la compañía.

Leer más