Skip to main content
  1. Home
  2. Computación
  3. News

OpenAI necesita solo 15 segundos de audio para que su IA clone una voz

En los últimos años, el tiempo de escucha requerido por una pieza de IA para clonar la voz de alguien se ha ido acortando cada vez más. Antes eran minutos, ahora son solo segundos.

OpenAI, la compañía respaldada por Microsoft detrás del chatbot viral de IA generativa ChatGPT, reveló recientemente que su propia tecnología de clonación de voz requiere solo 15 segundos de material de audio para reproducir la voz de alguien.

Recommended Videos

En una publicación en su sitio web, OpenAI compartió una vista previa a pequeña escala de un modelo llamado Voice Engine, que ha estado desarrollando desde finales de 2022.

Voice Engine funciona alimentándolo con un mínimo de 15 segundos de material hablado. Luego, el usuario puede ingresar texto para crear lo que OpenAI describe como un discurso «emotivo y realista» que «se parece mucho al orador original».

OpenAI insiste en que está adoptando un «enfoque cauteloso e informado para un lanzamiento más amplio debido al potencial de uso indebido de la voz sintética», y agrega que quiere «iniciar un diálogo sobre el despliegue responsable de voces sintéticas y cómo la sociedad puede adaptarse a estas nuevas capacidades».

Y agregó: «Basándonos en estas conversaciones y los resultados de estas pruebas a pequeña escala, tomaremos una decisión más informada sobre si implementar esta tecnología a escala y cómo hacerlo».

Uno de los usos indebidos a los que se refiere OpenAI es una estafa que algunos delincuentes ya están llevando a cabo utilizando una tecnología similar que está disponible públicamente desde hace algún tiempo. Consiste en clonar una voz y luego llamar a un amigo o familiar de esa persona para engañarlo para que entregue dinero en efectivo a través de una transferencia bancaria. También hay temores sobre cómo podría usarse dicha tecnología en las próximas elecciones presidenciales, un problema destacado por un reciente incidente de alto perfil en el que una llamada automática con un clon de la voz del presidente Joe Biden le dijo a la gente que no votara en las primarias de New Hampshire de enero.

Otra preocupación es cómo la rápida mejora de la tecnología afectará a los medios de vida de los actores de doblaje, que temen que se les pida cada vez más que cedan los derechos de su voz para que la IA pueda utilizarse para crear una versión sintética, y es probable que la compensación por un contrato de este tipo sea mucho menor que si se le pidiera al actor que realizara el trabajo en persona.

En cuanto a las implementaciones más positivas de la tecnología, OpenAI sugiere que podría usarse para brindar asistencia de lectura a los no lectores y a los niños utilizando voces emotivas y de sonido natural «que representan una gama más amplia de hablantes de lo que es posible con voces preestablecidas», así como la traducción instantánea de videos y podcasts, algo que Spotify ya está probando.

También podría usarse para ayudar a los pacientes que están perdiendo gradualmente la voz a causa de la enfermedad a continuar comunicándose usando lo que suena como su propia voz.

OpenAI tiene algunos ejemplos del audio generado por IA y el audio de referencia en su sitio web, y estamos seguros de que estarás de acuerdo en que son bastante extraordinarios.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Topics
Adobe entrega una herramienta esencial para Youtube Shorts
Art, Collage, Animal

Adobe ha anunciado una estrategia ambiciosa para consolidarse en el mercado de la edición de video móvil, estrechando lazos con YouTube mediante el lanzamiento de un espacio dedicado dentro de Premiere Mobile para los creadores de Shorts. Esta iniciativa representa un movimiento táctico significativo en el panorama competitivo de las herramientas de creación de contenido, donde gigantes como CapCut y Meta Edits han ganado terreno acelerado en los últimos años.

El nuevo centro de creación "Create for YouTube" se presenta como una solución integral diseñada específicamente para quienes desean producir contenido viral optimizado para la plataforma de Google. Los usuarios tendrán acceso a plantillas exclusivas curadas por creadores de alto rendimiento, transiciones profesionales y efectos visuales preconfigurados, junto con la capacidad de publicar directamente en sus canales de YouTube sin necesidad de cambiar de aplicación. Este flujo de trabajo simplificado busca reducir la fricción que actualmente experimentan los creadores que utilizan herramientas alternativas.

Read more
OpenAI desmiente que la publicidad ya haya aparecido en ChatGPT
Computer, Electronics, Laptop

Nick Turley, líder de ChatGPT en OpenAI, respondió públicamente a crecientes especulaciones sobre la integración de anuncios dentro de la plataforma, proporcionando una aclaración que, paradójicamente, no resuelve completamente las dudas sobre la dirección futura de la compañía. En una publicación en X (anteriormente Twitter), Turley declaró categóricamente que "no hay pruebas en vivo de anuncios" y que "cualquier captura de pantalla que hayas visto no es real o no representa anuncios".

Esta declaración surgió después de que Benjamin De Kraker, un exempleado de xAI, compartiera una imagen mostrando una opción para comprar en Target directamente dentro de una conversación con ChatGPT. La captura generó considerable especulación en línea sobre un posible cambio de modelo comercial. Sin embargo, Daniel McAuley de OpenAI argumentó que se trataba simplemente de una integración de aplicaciones que la compañía había anunciado públicamente en octubre, no de publicidad tradicional. Más tarde, Mark Chen, Chief Research Officer de OpenAI, añadió un matiz importante: reconoció que en este caso específico "no cumplieron adecuadamente" y que "cualquier cosa que parezca un anuncio necesita ser manejada con cuidado".

Read more
Windows 11 gran actualización de diciembre: todo lo nuevo que llega
Windows 11

Este martes 9 de diciembre de 2025, se espera que Microsoft comience a lanzar la última actualización Patch Tuesday de 2025 para Windows 11, que introduce varias funciones significativas, mejoras y correcciones de errores.

En esta actualización, la empresa finalmente está corrigiendo las inconsistencias de diseño entre el menú de Inicio y la Búsqueda de Windows, y una versión actualizada del Explorador de Archivos aporta mejoras en el modo oscuro.

Read more