Skip to main content
  1. Home
  2. Computación
  3. Noticias
  4. News

La actualización de ChatGPT finalmente rompe la barrera del texto

OpenAI está implementando nuevas funcionalidades para ChatGPT que permitirán que las indicaciones se ejecuten con imágenes y directivas de voz además de texto.

La marca AI anunció el lunes que pondrá estas nuevas características a disposición de los usuarios de ChatGPT Plus y Enterprise durante las próximas dos semanas. La función de voz está disponible en iOS y Android en una capacidad opcional, mientras que la función de imágenes está disponible en todas las plataformas ChatGPT. OpenAI señala que planea expandir la disponibilidad de las imágenes y las funciones de voz más allá de los usuarios pagos después del lanzamiento escalonado.

Indicador de imagen OpenAI.
Twitter/X

El chat de voz funciona como una conversación auditiva entre el usuario y ChatGPT. Presionas el botón y dices tu pregunta. Después de procesar la información, el chatbot le da una respuesta en el habla auditiva en lugar de en el texto. El proceso es similar al uso de asistentes virtuales como Alexa o Google Assistant y podría ser el preámbulo de una renovación completa de los asistentes virtuales en su conjunto. El anuncio de OpenAI se produce pocos días después de que Amazon revelara una característica similar que llegará a Alexa.

Recommended Videos

Para implementar la comunicación de voz y audio con ChatGPT, OpenAI utiliza un nuevo modelo de texto a voz que puede generar «audio similar al humano a partir de solo texto y unos segundos de habla de muestra». Además, su modelo Whisper puede «transcribir sus palabras habladas en texto».

OpenAI dice que es consciente de los problemas que podrían surgir debido al poder detrás de esta característica, incluido «el potencial de que los actores maliciosos se hagan pasar por figuras públicas o cometan fraude».

Esta es una de las principales razones por las que la compañía planea limitar el uso de sus nuevas características a «casos de uso y asociaciones específicos». Incluso cuando las características estén más ampliamente disponibles, serán accesibles principalmente para usuarios más privilegiados, como los desarrolladores.

ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb

— OpenAI (@OpenAI) September 25, 2023

La función de imagen le permite capturar una imagen e ingresarla en ChatGPT con su pregunta o aviso. Puede usar la herramienta de dibujo con la aplicación para ayudar a aclarar su respuesta y tener una conversación de ida y vuelta con el chatbot hasta que se resuelva su problema. Esto es similar a la nueva función Copilot de Microsoft en Windows, que se basa en el modelo de OpenAI.

OpenAI también ha reconocido los desafíos de ChatGPT, como su problema de alucinación en curso. Cuando se alineó con la función de imagen, la marca decidió limitar ciertas funcionalidades, como la «capacidad del chatbot para analizar y hacer declaraciones directas sobre las personas».

ChatGPT se introdujo por primera vez como una herramienta de texto a voz a fines del año pasado; sin embargo, OpenAI ha expandido rápidamente su destreza. El chatbot original basado en el modelo de lenguaje GPT-3 se ha actualizado a GPT-3.5 y ahora GPT-4, que es el modelo que recibe la nueva característica.

Cuando GPT-4 se lanzó por primera vez en marzo, OpenAI anunció varias colaboraciones empresariales, como Duolingo, que utilizó el modelo de IA para mejorar la precisión de las lecciones basadas en la escucha y el habla en la aplicación de aprendizaje de idiomas. OpenAI ha colaborado con Spotify para traducir podcasts a otros idiomas mientras preserva el sonido de la voz del podcaster. La compañía también habló de su trabajo con la aplicación móvil, Be My Eyes, que trabaja para ayudar a las personas ciegas y con baja visión. Muchas de estas aplicaciones y servicios estaban disponibles antes de la actualización de imágenes y voz.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
El Padrino de la IA dice que Google superará con creces a OpenAI
Geoffrey Hinton

Geoffrey Hinton, investigador legendario considerado uno de los pioneros fundamentales en el desarrollo de la inteligencia artificial moderna, ha realizado una declaración que genera reverberaciones significativas dentro de la industria tecnológica: sostiene que Google está en proceso de superar a OpenAI en la competición por liderar la próxima generación de sistemas de IA. Esta evaluación proviene de una figura cuya trayectoria científica incluye contribuciones decisivas a los campos del aprendizaje profundo y las redes neuronales, galardones que le permitieron obtener el Premio Nobel de Física en 2024.​

Durante una entrevista concedida a Business Insider, Hinton reflexionó sobre la ironía histórica de esta situación. Recordó que Google fue pionera en tecnología de transformadores desde 2017, cuando sus investigadores publicaron el revolucionario artículo "Attention Is All You Need" que transformaría radicalmente el panorama de la IA. Además, Google desarrolló chatbots avanzados antes que cualquier otra organización, pero una postura excesivamente cautelosa limitó su velocidad en la comercialización de estas tecnologías. Hinton atribuyó esta prudencia a la preocupación corporativa por proteger la reputación global de Google tras observar los desastres de imagen que enfrentó Microsoft con su fallido chatbot Tay en 2016, cuando la herramienta generó contenido ofensivo en redes sociales.

Read more
¿Quién es el nuevo amo y señor del Mundial de Excel?
Mundial Excel

Diarmuid Early, un consultor financiero irlandés con experiencia especializada en modelado financiero avanzado, se ha coronado como campeón del Microsoft Excel World Championship 2025, consolidando su posición como la máxima autoridad global en el dominio de la aplicación de hojas de cálculo mediante un desempeño que dejó un margen de superioridad abrumador sobre sus competidores.

Early completó exitosamente todos los desafíos presentados en la final en vivo realizada en la HyperX Arena de Las Vegas, terminando su caso ganador con una ventaja de más de cinco minutos sobre sus rivales más cercanos en tiempo de ejecución.​

Read more
Tu próximo PC Dell o Lenovo podría costar más muy pronto
Computer, Computer Hardware, Computer Keyboard

¿Qué ha pasado? La crisis de oferta en DRAM y NAND flash, impulsada inicialmente por el aumento de la demanda de los centros de datos de IA, ha afectado por fin duramente al hardware de consumo. Según informes recientes del sector a través de TrendForce, las principales marcas están reaccionando: según se informa, Dell y Lenovo están preparando aumentos significativos de precios en sus líneas de PC y servidores para absorber el aumento vertiginoso de los costes de los componentes. Esto ocurre después de que HP ya advirtiera de subidas de precios en su gama de PCs y portátiles, mientras que AMD también advirtió sobre un aumento en los precios de sus GPU.

Según se informa, Dell planea un aumento del 15–20% en muchos de sus servidores y PC tan pronto como a mediados de diciembre.

Read more