Skip to main content
  1. Home
  2. Computación
  3. News

OpenAI necesita solo 15 segundos de audio para que su IA clone una voz

En los últimos años, el tiempo de escucha requerido por una pieza de IA para clonar la voz de alguien se ha ido acortando cada vez más. Antes eran minutos, ahora son solo segundos.

OpenAI, la compañía respaldada por Microsoft detrás del chatbot viral de IA generativa ChatGPT, reveló recientemente que su propia tecnología de clonación de voz requiere solo 15 segundos de material de audio para reproducir la voz de alguien.

Recommended Videos

En una publicación en su sitio web, OpenAI compartió una vista previa a pequeña escala de un modelo llamado Voice Engine, que ha estado desarrollando desde finales de 2022.

Voice Engine funciona alimentándolo con un mínimo de 15 segundos de material hablado. Luego, el usuario puede ingresar texto para crear lo que OpenAI describe como un discurso «emotivo y realista» que «se parece mucho al orador original».

OpenAI insiste en que está adoptando un «enfoque cauteloso e informado para un lanzamiento más amplio debido al potencial de uso indebido de la voz sintética», y agrega que quiere «iniciar un diálogo sobre el despliegue responsable de voces sintéticas y cómo la sociedad puede adaptarse a estas nuevas capacidades».

Y agregó: «Basándonos en estas conversaciones y los resultados de estas pruebas a pequeña escala, tomaremos una decisión más informada sobre si implementar esta tecnología a escala y cómo hacerlo».

Uno de los usos indebidos a los que se refiere OpenAI es una estafa que algunos delincuentes ya están llevando a cabo utilizando una tecnología similar que está disponible públicamente desde hace algún tiempo. Consiste en clonar una voz y luego llamar a un amigo o familiar de esa persona para engañarlo para que entregue dinero en efectivo a través de una transferencia bancaria. También hay temores sobre cómo podría usarse dicha tecnología en las próximas elecciones presidenciales, un problema destacado por un reciente incidente de alto perfil en el que una llamada automática con un clon de la voz del presidente Joe Biden le dijo a la gente que no votara en las primarias de New Hampshire de enero.

Otra preocupación es cómo la rápida mejora de la tecnología afectará a los medios de vida de los actores de doblaje, que temen que se les pida cada vez más que cedan los derechos de su voz para que la IA pueda utilizarse para crear una versión sintética, y es probable que la compensación por un contrato de este tipo sea mucho menor que si se le pidiera al actor que realizara el trabajo en persona.

En cuanto a las implementaciones más positivas de la tecnología, OpenAI sugiere que podría usarse para brindar asistencia de lectura a los no lectores y a los niños utilizando voces emotivas y de sonido natural «que representan una gama más amplia de hablantes de lo que es posible con voces preestablecidas», así como la traducción instantánea de videos y podcasts, algo que Spotify ya está probando.

También podría usarse para ayudar a los pacientes que están perdiendo gradualmente la voz a causa de la enfermedad a continuar comunicándose usando lo que suena como su propia voz.

OpenAI tiene algunos ejemplos del audio generado por IA y el audio de referencia en su sitio web, y estamos seguros de que estarás de acuerdo en que son bastante extraordinarios.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Topics
Disco de Google: cómo es el nuevo navegador de IA
Sphere, Astronomy, Outer Space

La idea de Google de una experiencia de navegación impulsada por IA va más allá de simplemente añadir Gemini a Chrome, y su último experimento ofrece una visión clara de lo que viene después. Con Disco, un nuevo navegador de IA de Google Labs, Google planea "moldear el futuro de la navegación web", empezando por una innovadora función llamada GenTabs.

Google describe Disco como un "vehículo de descubrimiento para que Google Labs pruebe ideas para el futuro de la web." Al igual que Chrome, está construido sobre Chromium y tiene algunos elementos comunes. Sin embargo, lo que la distingue es su capacidad para crear "aplicaciones web interactivas" combinando información de varias pestañas para ayudar a los usuarios a completar tareas de forma más eficiente.

Read more
Este es el super computador de IA más pequeño del mundo 
Electronics, Mobile Phone, Phone

Tiiny AI ha desvelado lo que Guinness World Records ha verificado como el superordenador personal de IA más pequeño del mundo. Se llama Tiiny AI Pocket Lab y, a pesar de tener el tamaño de una batería externa, promete niveles de rendimiento que normalmente requieren hardware muy caro. Otros superordenadores pequeños como el Project Digits de NVIDIA, con un precio de alrededor de 3.000 dólares, y el DGX Spark, que se ofrece por 4.000 dólares, tienen precios que los hacen fuera del alcance de la mayoría de los usuarios cotidianos.

Tiiny AI sostiene que el verdadero cuello de botella actual de la IA no es la potencia de cálculo, sino nuestra dependencia de la nube. El director de GTM, Samar Bhoj, dice: "la inteligencia no debería pertenecer a los centros de datos, sino a las personas." Al ejecutar grandes modelos localmente, el Pocket Lab pretende reducir la dependencia de la nube, mejorar la privacidad y hacer que la IA avanzada se sienta personal en lugar de remota.

Read more
Tu chatbot de IA quiere que salves el planeta… comprando más cosas
Text, Credit Card, Computer

A medida que la inteligencia artificial se infiltra en todo, desde nuestros teléfonos hasta nuestros altavoces inteligentes, cada vez es más difícil ver dónde termina la tecnología y dónde empiezan nuestras decisiones. Y según un nuevo estudio de investigadores de la Universidad de Queensland y la UNSW, ese es precisamente el problema. Advierten que la "IA-ización" de la vida diaria está aumentando silenciosamente las emisiones globales, no solo quemando electricidad, sino formándonos para comprar más cosas.

Qué ocurrió – y el impacto ambiental oculto del consumo impulsado por IA

Read more