Skip to main content
  1. Home
  2. Computación
  3. Noticias
  4. News

La actualización de ChatGPT finalmente rompe la barrera del texto

Add as a preferred source on Google

OpenAI está implementando nuevas funcionalidades para ChatGPT que permitirán que las indicaciones se ejecuten con imágenes y directivas de voz además de texto.

La marca AI anunció el lunes que pondrá estas nuevas características a disposición de los usuarios de ChatGPT Plus y Enterprise durante las próximas dos semanas. La función de voz está disponible en iOS y Android en una capacidad opcional, mientras que la función de imágenes está disponible en todas las plataformas ChatGPT. OpenAI señala que planea expandir la disponibilidad de las imágenes y las funciones de voz más allá de los usuarios pagos después del lanzamiento escalonado.

Indicador de imagen OpenAI.
Twitter/X

El chat de voz funciona como una conversación auditiva entre el usuario y ChatGPT. Presionas el botón y dices tu pregunta. Después de procesar la información, el chatbot le da una respuesta en el habla auditiva en lugar de en el texto. El proceso es similar al uso de asistentes virtuales como Alexa o Google Assistant y podría ser el preámbulo de una renovación completa de los asistentes virtuales en su conjunto. El anuncio de OpenAI se produce pocos días después de que Amazon revelara una característica similar que llegará a Alexa.

Recommended Videos

Para implementar la comunicación de voz y audio con ChatGPT, OpenAI utiliza un nuevo modelo de texto a voz que puede generar «audio similar al humano a partir de solo texto y unos segundos de habla de muestra». Además, su modelo Whisper puede «transcribir sus palabras habladas en texto».

OpenAI dice que es consciente de los problemas que podrían surgir debido al poder detrás de esta característica, incluido «el potencial de que los actores maliciosos se hagan pasar por figuras públicas o cometan fraude».

Esta es una de las principales razones por las que la compañía planea limitar el uso de sus nuevas características a «casos de uso y asociaciones específicos». Incluso cuando las características estén más ampliamente disponibles, serán accesibles principalmente para usuarios más privilegiados, como los desarrolladores.

ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb

— OpenAI (@OpenAI) September 25, 2023

La función de imagen le permite capturar una imagen e ingresarla en ChatGPT con su pregunta o aviso. Puede usar la herramienta de dibujo con la aplicación para ayudar a aclarar su respuesta y tener una conversación de ida y vuelta con el chatbot hasta que se resuelva su problema. Esto es similar a la nueva función Copilot de Microsoft en Windows, que se basa en el modelo de OpenAI.

OpenAI también ha reconocido los desafíos de ChatGPT, como su problema de alucinación en curso. Cuando se alineó con la función de imagen, la marca decidió limitar ciertas funcionalidades, como la «capacidad del chatbot para analizar y hacer declaraciones directas sobre las personas».

ChatGPT se introdujo por primera vez como una herramienta de texto a voz a fines del año pasado; sin embargo, OpenAI ha expandido rápidamente su destreza. El chatbot original basado en el modelo de lenguaje GPT-3 se ha actualizado a GPT-3.5 y ahora GPT-4, que es el modelo que recibe la nueva característica.

Cuando GPT-4 se lanzó por primera vez en marzo, OpenAI anunció varias colaboraciones empresariales, como Duolingo, que utilizó el modelo de IA para mejorar la precisión de las lecciones basadas en la escucha y el habla en la aplicación de aprendizaje de idiomas. OpenAI ha colaborado con Spotify para traducir podcasts a otros idiomas mientras preserva el sonido de la voz del podcaster. La compañía también habló de su trabajo con la aplicación móvil, Be My Eyes, que trabaja para ayudar a las personas ciegas y con baja visión. Muchas de estas aplicaciones y servicios estaban disponibles antes de la actualización de imágenes y voz.

Diego Bastarrica
Diego Bastarrica es Senior Editor y Head of Content en Digital Trends en Español, donde lidera la estrategia editorial, SEO…
Micron dispara sus ventas un 346% y silencia a los escépticos de la IA
Droplet, Car, Transportation

Por varios meses, Wall Street tuvo sus dudas. ¿Era el boom de la inteligencia artificial una ilusión colectiva disfrazada de promesa tecnológica? ¿Estaban los gigantes tecnológicos gastando fortunas en infraestructura que nunca rendiría los retornos prometidos? Micron Technology acaba de responder esas preguntas con una contundencia que pocas veces se ve en el mundo corporativo: ingresos récord de 41.460 millones de dólares en un solo trimestre, un 346% más que en el mismo periodo del año anterior, y una ganancia neta de 28.243 millones de dólares que multiplica por 15 el resultado de 2025.

Los inversores no esperaron al día siguiente para reaccionar. En las operaciones fuera de hora tras el reporte, las acciones de Micron se dispararon más de un 17%, alcanzando máximos históricos por encima de los 1.200 dólares, elevando su capitalización de mercado a 1,39 billones de dólares y colocando a la empresa entre las 14 compañías más valiosas del planeta, por encima de Berkshire Hathaway y Walmart.

Read more
IBM rompe la barrera del nanómetro con un chip de 0,7 nm
Electronics, Hardware, Computer Hardware

IBM acaba de escribir un nuevo capítulo en la historia de los semiconductores. La compañía presentó oficialmente la que afirma ser la primera tecnología de chips del mundo con dimensiones inferiores a un nanómetro, específicamente una arquitectura de transistores a escala de 0,7 nanómetros, equivalente a 7 ángstroms. Con este anuncio, el gigante azul no solo desafía los límites convencionales de la miniaturización, sino que también reposiciona su posición en la industria frente a fabricantes como TSMC e Intel.

Para dimensionar la escala del logro, basta con una comparación: un cabello humano tiene un grosor de aproximadamente 80.000 nanómetros. En ese mismo contexto, un chip de 0,7 nanómetros ya no puede medirse con la misma escala que usamos en la vida cotidiana; sus transistores se acercan al tamaño de los átomos individuales. A modo de referencia, IBM en 2021 presentó un chip de 2 nanómetros capaz de albergar 50.000 millones de transistores; el nuevo modelo de 0,7 nm logra integrar casi 100.000 millones de transistores en una superficie del tamaño de una uña, prácticamente doblando esa densidad.

Read more
¿Cuál es el problema de los Microsoft Surface más baratos? Ojo con esto
Surface

El ejercicio de equilibrio favorito de la industria tecnológica se está volviendo cada vez más difícil cada mes. Los precios de los componentes están subiendo, los costes de memoria se niegan a estabilizarse y los fabricantes de portátiles se esfuerzan por controlar el shock por pegatinas. La última actualización de Microsoft para Surface parece una respuesta directa a ese problema.

La compañía ha presentado nuevas versiones de entrada de su portátil Surface Pro de 12 pulgadas y Surface de 13 pulgadas, ofreciendo precios iniciales más bajos sin cambiar el procesador ni el almacenamiento. A simple vista, eso suena a buenas noticias para compradores que tienen presupuesto limitado. Sin embargo, si profundizas un poco más, encontrarás un compromiso oculto a plena vista.

Read more