Skip to main content

Cómo es un perro Spot de Boston Dynamics con ChatGPT

Boston Dynamics ya consiguió cambiar el paradigma de la robótica con la aparición de Spot, su clásico perro androide, que puede hacer labores automatizadas y que ya está incursionando en empresas.

Ahora un grupo de desarrolladores ha querido ir un paso más allá: acaban de equiparlo con ChatGPT de OpenAI y la modulación de voz Text-to-Speech de Google, lo que le permite literalmente hablar con ellos y responder a sus preguntas.

Recommended Videos

En un video publicado en Twitter, el ingeniero de aprendizaje automático Santiago Valdarrama mostró cómo él y un colega programaron un perro robot Spot para responder verbalmente preguntas del sistema con la ayuda de la herramienta extremadamente popular de OpenAI.

«Estos robots ejecutan misiones automatizadas todos los días», explicó Valdarrama en su hilo de Twitter, señalando que cada misión incluye «archivos de configuración de millas de largo y difíciles de entender» que solo los ingenieros pueden entender.

We integrated ChatGPT with our robots.

We had a ton of fun building this!

Read on for the details: pic.twitter.com/DRC2AOF0eU

— Santiago (@svpino) April 25, 2023

«Ahí es donde entra ChatGPT», continuó. «Le mostramos los archivos de configuración y los resultados de la misión. Luego hacemos preguntas usando ese contexto. ¡Ponga eso junto con una interfaz habilitada para voz, y tenemos una forma increíble de consultar nuestros datos!»

También, Spot responde con gestos a ciertas instrucciones precisas de Valderrama.

«Creemos que nuestro trabajo es solo el comienzo de un cambio en la forma en que desarrollamos sistemas robóticos», dice el anuncio de la compañía, «y esperamos inspirar a otros investigadores a saltar a este emocionante campo».

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
ChatGPT ya habla, ahora también podrá verte
chatgpt ahora podra verte vision

IA abierta
El modo de voz avanzado de ChatGPT, que permite a los usuarios conversar con el chatbot en tiempo real, pronto podría obtener el don de la vista, según el código descubierto en la última versión beta de la plataforma. Si bien OpenAI aún no ha confirmado el lanzamiento específico de la nueva función, el código de la versión beta de ChatGPT v1.2024.317 detectado por Android Authority sugiere que la llamada "cámara en vivo" podría estar inminente.

OpenAI había mostrado por primera vez las capacidades de visión del modo de voz avanzado para ChatGPT en mayo, cuando la función se lanzó por primera vez en alfa. Durante una demostración publicada en ese momento, el sistema pudo identificar que estaba mirando a un perro a través de la alimentación de la cámara del teléfono, identificar al perro en función de interacciones pasadas, reconocer la pelota del perro y asociar la relación del perro con la pelota (es decir, jugar a buscar).

Leer más
El ChatGPT francés de código abierto se pone los pantalones
La imagen muestra una representación de un chatbot.

Andrés Tarantola / Mistral
La startup francesa de IA Mistral anunció el lunes que está incorporando media docena de nuevas características y capacidades en su asistente de trabajo gratuito de IA generativa, apodado le Chat (francés para "el gato"), que pondrán al chatbot de código abierto a la par con los principales modelos fronterizos de OpenAI y Anthropic.

Le Chat ahora puede buscar en la web y proporcionar fuentes citadas, de manera similar a lo que ofrecen Perplexity y SearchGPT. El chatbot de Mistral ahora también ofrece una función de lienzo similar a Claude's Artifacts, donde los usuarios pueden modificar y editar contenido y código. Además, le Chat ahora puede generar imágenes gracias a una integración con Flux Pro de Black Forest Labs, el mismo generador de imágenes que impulsa las capacidades de Grok-2.

Leer más
Esta actualización masiva de ChatGPT llegará en enero, y no es GPT-5
ChatGPT

OpenAI lanzará un nuevo agente de IA en enero, con el nombre en clave Operator, que permitirá a ChatGPT actuar en nombre del usuario. Es posible que nunca más tenga que reservar sus propios vuelos.

El liderazgo de la compañía hizo el anuncio durante una reunión de personal el miércoles, informa Bloomberg. La compañía planea implementar la nueva función como una vista previa de la investigación a través de la API para desarrolladores de la compañía.

Leer más