Skip to main content
  1. Home
  2. Computación
  3. News

OpenAI necesita solo 15 segundos de audio para que su IA clone una voz

Add as a preferred source on Google

En los últimos años, el tiempo de escucha requerido por una pieza de IA para clonar la voz de alguien se ha ido acortando cada vez más. Antes eran minutos, ahora son solo segundos.

OpenAI, la compañía respaldada por Microsoft detrás del chatbot viral de IA generativa ChatGPT, reveló recientemente que su propia tecnología de clonación de voz requiere solo 15 segundos de material de audio para reproducir la voz de alguien.

Recommended Videos

En una publicación en su sitio web, OpenAI compartió una vista previa a pequeña escala de un modelo llamado Voice Engine, que ha estado desarrollando desde finales de 2022.

Voice Engine funciona alimentándolo con un mínimo de 15 segundos de material hablado. Luego, el usuario puede ingresar texto para crear lo que OpenAI describe como un discurso «emotivo y realista» que «se parece mucho al orador original».

OpenAI insiste en que está adoptando un «enfoque cauteloso e informado para un lanzamiento más amplio debido al potencial de uso indebido de la voz sintética», y agrega que quiere «iniciar un diálogo sobre el despliegue responsable de voces sintéticas y cómo la sociedad puede adaptarse a estas nuevas capacidades».

Y agregó: «Basándonos en estas conversaciones y los resultados de estas pruebas a pequeña escala, tomaremos una decisión más informada sobre si implementar esta tecnología a escala y cómo hacerlo».

Uno de los usos indebidos a los que se refiere OpenAI es una estafa que algunos delincuentes ya están llevando a cabo utilizando una tecnología similar que está disponible públicamente desde hace algún tiempo. Consiste en clonar una voz y luego llamar a un amigo o familiar de esa persona para engañarlo para que entregue dinero en efectivo a través de una transferencia bancaria. También hay temores sobre cómo podría usarse dicha tecnología en las próximas elecciones presidenciales, un problema destacado por un reciente incidente de alto perfil en el que una llamada automática con un clon de la voz del presidente Joe Biden le dijo a la gente que no votara en las primarias de New Hampshire de enero.

Otra preocupación es cómo la rápida mejora de la tecnología afectará a los medios de vida de los actores de doblaje, que temen que se les pida cada vez más que cedan los derechos de su voz para que la IA pueda utilizarse para crear una versión sintética, y es probable que la compensación por un contrato de este tipo sea mucho menor que si se le pidiera al actor que realizara el trabajo en persona.

En cuanto a las implementaciones más positivas de la tecnología, OpenAI sugiere que podría usarse para brindar asistencia de lectura a los no lectores y a los niños utilizando voces emotivas y de sonido natural «que representan una gama más amplia de hablantes de lo que es posible con voces preestablecidas», así como la traducción instantánea de videos y podcasts, algo que Spotify ya está probando.

También podría usarse para ayudar a los pacientes que están perdiendo gradualmente la voz a causa de la enfermedad a continuar comunicándose usando lo que suena como su propia voz.

OpenAI tiene algunos ejemplos del audio generado por IA y el audio de referencia en su sitio web, y estamos seguros de que estarás de acuerdo en que son bastante extraordinarios.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Topics
Nvidia despliega su más poderosa arquitectura de procesamiento: Vera Rubin
Performer, Person, Solo Performance

Durante el inicio de CES 2026, el fabricante de chips estadounidense Nvidia dio a conocer la arquitectura Vera Rubin, descrita por su director ejecutivo, Jensen Huang, como la solución más avanzada disponible actualmente en hardware de inteligencia artificial. Este nuevo sistema ya se encuentra en producción a escala completa y espera expandir su capacidad de manufactura durante el segundo semestre del año.

Huang explicó que la arquitectura Rubin fue concebida para resolver uno de los desafíos más acuciantes de la industria: el extraordinario aumento en la demanda de poder computacional requerido por los modelos de inteligencia artificial contemporáneos. Con respecto a su disponibilidad, confirmó que esta tecnología ya se fabrica en volumen y seguirá incrementándose su producción.

Read more
AMD amplía su liderazgo en IA con nuevos Ryzen y AMD ROCm en CES 2026
Computer, Electronics, Pc

Durante el CES 2026, AMD presentó su última generación de procesadores móviles y de escritorio que redefinen la computación para clientes, trayendo capacidades de IA ampliadas, rendimiento de gaming premium y funciones listas para el entorno comercial. La empresa anunció una serie completa de soluciones que posicionan a AMD como líder en la era de las PC impulsadas por IA.

Los nuevos procesadores Ryzen AI Serie 400 y Ryzen AI PRO Serie 400 ofrecen hasta 60 TOPS de cómputo en la NPU, construidos sobre la avanzada arquitectura "Zen 5" y potenciados por NPUs AMD XDNA 2 de segunda generación. Estos procesadores están diseñados específicamente para PCs Copilot+ de consumo y comerciales, con hasta 12 núcleos de CPU de alto rendimiento, gráficos integrados AMD Radeon Serie 800M y velocidades de memoria más rápidas. La Ryzen AI PRO Serie 400 está diseñada específicamente para entornos empresariales con seguridad multicapa y gestión simplificada.

Read more
Intel Core Ultra Series 3 debuta como el primer procesador fabricado en 18A
Crowd, Person, Audience

Intel ha presentado en CES 2026 los procesadores Intel Core Ultra Serie 3, la primera plataforma de computación fabricada con la tecnología de proceso Intel 18A, el proceso de semiconductores más avanzado jamás desarrollado y fabricado en los Estados Unidos. Esta es la plataforma de PC con IA de más amplia adopción que Intel ha ofrecido jamás, impulsando más de 200 diseños de partners a nivel mundial.

Los nuevos procesadores Intel Core Ultra X9 y X7 están equipados con los gráficos integrados Intel Arc de más alto rendimiento. Están diseñados específicamente para usuarios multitarea que gestionan cargas de trabajo avanzadas como gaming, creación y productividad sobre la marcha. Los modelos de gama alta cuentan con hasta 16 núcleos de CPU, 12 núcleos Xe y 50 TOPS de NPU, ofreciendo hasta un 60% más de rendimiento multihilo comparado con Lunar Lake, así como un rendimiento más veloz en juegos con más de un 77% de desempeño mejorado.

Read more