Skip to main content

Boston Dynamics y ChatGPT crean un robot guía turístico

Making Chat (ro)Bots

El robot Spot de Boston Dynamics ya nos ha impresionado con su asombrosa agilidad, pero ahora también puede ser un buen guía turístico.

Recommended Videos

Deseosos de explorar cómo se pueden utilizar herramientas de IA generativa como el chatbot ChatGPT de OpenAI con su perro robot, los inteligentes ingenieros de la compañía decidieron recientemente crear una guía turística utilizando la tecnología.

Un video (arriba) que demuestra el esfuerzo revela algunos resultados muy impresionantes. Luciendo un sombrero, ojos de plástico y cejas postizas, y abriendo y cerrando su pinza robótica mientras «habla», Spot nos lleva en un entretenido recorrido por partes de las instalaciones de Boston Dynamics en Massachusetts.

«Estábamos interesados en ver cómo se podían usar tecnologías como estas para la robótica», dice Matt Klingensmith, ingeniero de software principal de Boston Dynamics, en el video.

Como parte de los preparativos, el equipo le dio a Spot un breve guión nombrando cada habitación que iba a visitar, junto con una sola oración que explicara el propósito de la habitación. Luego, Spot combina esos datos con imágenes de sus cámaras incorporadas antes de pasarlos por lo que se conoce como un «modelo visual de respuesta a preguntas» para tratar de obtener más información sobre lo que está mirando para poder ofrecer una respuesta hablada más elaborada.

La mejor parte es cómo se comporta Spot cuando se le indica que adopte diferentes personalidades. Echa un vistazo a la guía del mayordomo británico al comienzo del video, por ejemplo, y a la guía sarcástica a los pocos minutos. El actor de Shakespeare también es muy impresionante.

«Se le ocurrían estas personalidades locas», dice Klingensmith. «Incorporaba su historia de fondo a lo que estaba viendo, reinterpretaba las cosas que estaba viendo. Fue bastante increíble».

El ingeniero de software dijo que también estaba sorprendido por algunas de las respuestas. Por ejemplo, cuando le pidió a Spot que le mostrara a sus padres, el robot lo llevó a una versión temprana de Spot entre la exhibición de robots de Boston Dynamics.

Klingensmith dice que la IA podría hacer posible que los robots «no solo sigan nuestras órdenes, sino que en cierto sentido entiendan las acciones que pueden realizar en el contexto del mundo que los rodea», y agrega que podría ser útil para aplicaciones que «aún no hemos imaginado».

Sin embargo, los guías turísticos humanos no deben preocuparse todavía, ya que Klingensmith dijo que los chatbots de IA todavía tienen una tendencia a inventar cosas (conocidas como «alucinaciones»), que es definitivamente lo que no quieres que suceda dentro de un lugar como un museo.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
ChatGPT ya habla, ahora también podrá verte
chatgpt ahora podra verte vision

IA abierta
El modo de voz avanzado de ChatGPT, que permite a los usuarios conversar con el chatbot en tiempo real, pronto podría obtener el don de la vista, según el código descubierto en la última versión beta de la plataforma. Si bien OpenAI aún no ha confirmado el lanzamiento específico de la nueva función, el código de la versión beta de ChatGPT v1.2024.317 detectado por Android Authority sugiere que la llamada "cámara en vivo" podría estar inminente.

OpenAI había mostrado por primera vez las capacidades de visión del modo de voz avanzado para ChatGPT en mayo, cuando la función se lanzó por primera vez en alfa. Durante una demostración publicada en ese momento, el sistema pudo identificar que estaba mirando a un perro a través de la alimentación de la cámara del teléfono, identificar al perro en función de interacciones pasadas, reconocer la pelota del perro y asociar la relación del perro con la pelota (es decir, jugar a buscar).

Leer más
El ChatGPT francés de código abierto se pone los pantalones
La imagen muestra una representación de un chatbot.

Andrés Tarantola / Mistral
La startup francesa de IA Mistral anunció el lunes que está incorporando media docena de nuevas características y capacidades en su asistente de trabajo gratuito de IA generativa, apodado le Chat (francés para "el gato"), que pondrán al chatbot de código abierto a la par con los principales modelos fronterizos de OpenAI y Anthropic.

Le Chat ahora puede buscar en la web y proporcionar fuentes citadas, de manera similar a lo que ofrecen Perplexity y SearchGPT. El chatbot de Mistral ahora también ofrece una función de lienzo similar a Claude's Artifacts, donde los usuarios pueden modificar y editar contenido y código. Además, le Chat ahora puede generar imágenes gracias a una integración con Flux Pro de Black Forest Labs, el mismo generador de imágenes que impulsa las capacidades de Grok-2.

Leer más
Esta actualización masiva de ChatGPT llegará en enero, y no es GPT-5
ChatGPT

OpenAI lanzará un nuevo agente de IA en enero, con el nombre en clave Operator, que permitirá a ChatGPT actuar en nombre del usuario. Es posible que nunca más tenga que reservar sus propios vuelos.

El liderazgo de la compañía hizo el anuncio durante una reunión de personal el miércoles, informa Bloomberg. La compañía planea implementar la nueva función como una vista previa de la investigación a través de la API para desarrolladores de la compañía.

Leer más