Skip to main content

La actualización de ChatGPT finalmente rompe la barrera del texto

OpenAI está implementando nuevas funcionalidades para ChatGPT que permitirán que las indicaciones se ejecuten con imágenes y directivas de voz además de texto.

La marca AI anunció el lunes que pondrá estas nuevas características a disposición de los usuarios de ChatGPT Plus y Enterprise durante las próximas dos semanas. La función de voz está disponible en iOS y Android en una capacidad opcional, mientras que la función de imágenes está disponible en todas las plataformas ChatGPT. OpenAI señala que planea expandir la disponibilidad de las imágenes y las funciones de voz más allá de los usuarios pagos después del lanzamiento escalonado.

Indicador de imagen OpenAI.
Twitter/X

El chat de voz funciona como una conversación auditiva entre el usuario y ChatGPT. Presionas el botón y dices tu pregunta. Después de procesar la información, el chatbot le da una respuesta en el habla auditiva en lugar de en el texto. El proceso es similar al uso de asistentes virtuales como Alexa o Google Assistant y podría ser el preámbulo de una renovación completa de los asistentes virtuales en su conjunto. El anuncio de OpenAI se produce pocos días después de que Amazon revelara una característica similar que llegará a Alexa.

Recommended Videos

Para implementar la comunicación de voz y audio con ChatGPT, OpenAI utiliza un nuevo modelo de texto a voz que puede generar «audio similar al humano a partir de solo texto y unos segundos de habla de muestra». Además, su modelo Whisper puede «transcribir sus palabras habladas en texto».

OpenAI dice que es consciente de los problemas que podrían surgir debido al poder detrás de esta característica, incluido «el potencial de que los actores maliciosos se hagan pasar por figuras públicas o cometan fraude».

Esta es una de las principales razones por las que la compañía planea limitar el uso de sus nuevas características a «casos de uso y asociaciones específicos». Incluso cuando las características estén más ampliamente disponibles, serán accesibles principalmente para usuarios más privilegiados, como los desarrolladores.

ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb

— OpenAI (@OpenAI) September 25, 2023

La función de imagen le permite capturar una imagen e ingresarla en ChatGPT con su pregunta o aviso. Puede usar la herramienta de dibujo con la aplicación para ayudar a aclarar su respuesta y tener una conversación de ida y vuelta con el chatbot hasta que se resuelva su problema. Esto es similar a la nueva función Copilot de Microsoft en Windows, que se basa en el modelo de OpenAI.

OpenAI también ha reconocido los desafíos de ChatGPT, como su problema de alucinación en curso. Cuando se alineó con la función de imagen, la marca decidió limitar ciertas funcionalidades, como la «capacidad del chatbot para analizar y hacer declaraciones directas sobre las personas».

ChatGPT se introdujo por primera vez como una herramienta de texto a voz a fines del año pasado; sin embargo, OpenAI ha expandido rápidamente su destreza. El chatbot original basado en el modelo de lenguaje GPT-3 se ha actualizado a GPT-3.5 y ahora GPT-4, que es el modelo que recibe la nueva característica.

Cuando GPT-4 se lanzó por primera vez en marzo, OpenAI anunció varias colaboraciones empresariales, como Duolingo, que utilizó el modelo de IA para mejorar la precisión de las lecciones basadas en la escucha y el habla en la aplicación de aprendizaje de idiomas. OpenAI ha colaborado con Spotify para traducir podcasts a otros idiomas mientras preserva el sonido de la voz del podcaster. La compañía también habló de su trabajo con la aplicación móvil, Be My Eyes, que trabaja para ayudar a las personas ciegas y con baja visión. Muchas de estas aplicaciones y servicios estaban disponibles antes de la actualización de imágenes y voz.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Sam Altman admite una derrota con ChatGPT Pro: «pensé que ganaríamos dinero»
Sam Altman

El CEO de OpenAI, Sam Altman, está un poco arrepentido con una de sus decisiones sobre ChatGPT, ya que la plataforma Pro que cuesta 200 dólares al mes para entregar mejores resultados de conversación y búsqueda y resolución, no ha sido lo esperado en ganancias para la compañía.
"Personalmente, elegí el precio", escribió Altman en una serie de publicaciones en X, "y pensé que ganaríamos algo de dinero".
ChatGPT Pro, lanzado a fines del año pasado, otorga acceso a una versión mejorada del modelo de IA de "razonamiento" o1 de OpenAI, el modo o1 pro, y elimina los límites de velocidad en varias de las otras herramientas de la compañía, incluido su generador de video Sora.
Incluso, en una entrevista reciente con Bloomberg, Altman dijo que el plan premium original para el chatbot impulsado por IA de OpenAI, ChatGPT, no tenía un estudio de precios.
"Creo que probamos dos precios, 20 y 42 dólares", dijo a la publicación. "La gente pensaba que 42 dólares era demasiado. Estaban felices de pagar 20 dólares. Elegimos $20. Probablemente fue a finales de diciembre de 2022 o principios de enero. No se trataba de un riguroso 'contrata a alguien y haz un estudio de precios'".
Aún así OpenAI proyecta con optimismo que sus ingresos alcanzarán los 11.600 millones de dólares este año y los 100.000 millones de dólares en 2029, igualando las ventas anuales actuales de Nestlé.

Leer más
ChatGPT Search puede engañar a los usuarios e instalar malware
ChatGPT buscador

Una minuciosa investigación del medio The Guardian, ha establecido peligros inminentes en la utilización de ChatGPT Search, lo que puede inducir a engaños y entrega de código malicioso a los usuarios.

La función de búsqueda de ChatGPT está destinada a hacer que la navegación sea más rápida al hacer cosas como resumir las reseñas de productos de una página web. Pero The Guardian descubrió que podía hacer que ChatGPT ignorara las críticas negativas y generara resúmenes "completamente positivos" insertando texto oculto en los sitios web que creaba. ChatGPT Search también podría hacer que escupiera código malicioso utilizando este método.

Leer más
Sí, es real: ChatGPT tiene su propio número 800
chatgpt numero 800

El día 10 de su evento de medios "12 Days of OpenAI", la compañía anunció que ha establecido un número 800 (1-800-ChatGPT, por supuesto) donde cualquier persona en los EE. UU. con una línea telefónica puede marcar y hablar con la IA a través del modo de voz avanzado. Porque, ¿por qué no?

"[El objetivo de] OpenAI es hacer que la inteligencia artificial general sea beneficiosa para toda la humanidad, y parte de eso es hacerla lo más accesible posible para tantas personas como podamos", dijo el director de producto de la compañía, Kevin Weil, durante la transmisión en vivo del miércoles. "Hoy, estamos dando el siguiente paso y llevando ChatGPT a su teléfono".

Leer más