En Meta Connect 2024 el miércoles, el CEO Mark Zuckerberg subió al escenario para discutir los últimos avances de su compañía en inteligencia artificial. En lo que describe como «probablemente la mayor noticia de IA que tenemos», Zuckerberg dio a conocer Natural Voice Interactions, un competidor directo de Gemini Live de Google y Advanced Voice Mode de OpenAI.
«Creo que la voz va a ser una forma mucho más natural de interactuar con la IA que el texto», comentó Zuckerberg. «Creo que tiene el potencial de ser una de las formas, si no la más frecuente, en que todos interactuamos con la IA». Zuckerberg también anunció que la nueva función comenzará a implementarse para los usuarios hoy en todas las principales aplicaciones de Meta, incluidas Instagram, WhatsApp, Messenger y Facebook.
«Meta AI se diferencia en esta categoría no solo por ofrecer modelos de IA de última generación, sino también por el acceso ilimitado a esos modelos para una integración gratuita y fácil en nuestros diferentes productos y aplicaciones», dijo Zuckerberg. «Meta AI está en camino de ser el asistente de IA más utilizado en el mundo. Estamos casi en 500 millones de activos mensuales y aún no hemos lanzado en algunos de los países más grandes».
Al igual que con Gemini Live y el modo de voz avanzado, las interacciones de voz natural permiten a los usuarios renunciar a las indicaciones de texto y hablar directamente con el chatbot. Los usuarios pueden tartamudear, corregirse a sí mismos, interrumpir la IA y, en general, hablar como lo harían con otro humano y aún así hacer que el chatbot siga la conversación. La nueva función también permitirá a los usuarios elegir la voz de la IA y pueden elegir entre una variedad de celebridades, incluidas John Cena, Dame Judy Dench, Kristen Bell, Keegan Michael Key y Awkwfina. Es posible que recuerdes esa alineación de la incursión anterior de Meta en el chat en lenguaje natural, que se cerró en agosto porque los usuarios encontraron que las interacciones eran «espeluznantes» y «surrealistas».
Zuckerberg proporcionó una demostración en vivo de la función en el escenario, haciendo al chatbot una serie de preguntas de softbol que la IA respondió satisfactoriamente. Su cadencia de habla parecía un poco forzada y menos conversacional que lo que hemos visto en el modo de voz avanzado, pero aún así era mucho mejor que las entonaciones monótonas que obtendría de una respuesta de Siri.