Un nuevo paso a la consolidación de los modelos de IA dio OpenAI, que este jueves 17 de julio presentó Agente ChatGPT, una nueva funcionalidad que transforma ChatGPT en un asistente verdaderamente autónomo, capaz no solo de conversar sino también de actuar en la web por ti.
Imagina que ChatGPT tiene su propio “ordenador virtual”: ahora puede navegar sitios web, rellenar formularios, ejecutar código, seleccionar herramientas según el contexto y generar entregables como presentaciones o informes — todo siguiendo tus instrucciones.
El agente de ChatGPT combina la capacidad de Operator para interactuar con sitios web, la fortaleza de la investigación avanzada para sintetizar información de la web y las habilidades conversacionales de ChatGPT en un sistema unificado y autónomo. Esto significa que ahora puedes ampliar tus ideas y preguntas pasando directamente a la acción, ya sea realizando una investigación financiera en profundidad, rellenando formularios en línea o creando presentaciones pulidas. Siguiendo tus instrucciones, ChatGPT se encarga del trabajo por ti para ayudarte a ser más productivo, liberando tiempo para que puedas centrarte en otras tareas del día.
Ejemplos de lo que puede hacer el Agente ChatGPT
Pídele a ChatGPT que gestione solicitudes como:
«Consulta mi calendario y prepárame un resumen para las próximas reuniones con clientes basadas en las últimas noticias» o «Analiza a tres competidores y crea una presentación». Navegará por sitios web de forma inteligente, seleccionará fechas, filtrará resultados, te pedirá iniciar sesión de forma segura, ejecutará código y generará entregables pulidos y editables, como presentaciones y hojas de cálculo que resuman las conclusiones.
Algunas tareas concretas que puede hacer:
- Investigar competidores y preparar presentaciones
- Actualizar hojas de cálculo con datos financieros
- Organizar citas o reservar viajes en línea
- Crear modelos financieros o análisis complejos desde cero
- Rellenar formularios en webs que requieren autenticación
Antes, ChatGPT podía ayudarte a pensar, pero no actuar directamente. Este agente combina lo mejor de Operator (una herramienta que navegaba sitios web) y la investigación en profundidad (razonamiento y síntesis avanzada).
Ahora puede elegir la mejor herramienta según cada tarea, ya sea interactuar visualmente con una web, usar API para datos específicos o redactar documentos completos.
El agente ChatGPT tiene acceso con un navegador visual que interactúa con la web mediante una interfaz gráfica de usuario, un navegador basado en texto para consultas web basadas en razonamiento y acceso directo a API.
Todo esto se realiza desde el propio ordenador de ChatGPT, donde el contexto relevante se comparte a lo largo de la tarea, independientemente de la combinación de herramientas utilizada. El modelo está entrenado específicamente para identificar y aprovechar las herramientas más eficaces para cada paso de la tarea, evaluando los resultados en lugar de seguir un único método fijo.
El agente de ChatGPT está diseñado para flujos de trabajo colaborativos e iterativos: mucho más interactivos y flexibles que los de modelos anteriores. Mientras ChatGPT trabaja, puedes interrumpir en cualquier momento para aclarar instrucciones, redirigir la tarea o ajustar el objetivo final. Retomará la tarea donde la dejó, ahora con la nueva información, pero sin perder el progreso anterior.
Del mismo modo, el propio ChatGPT solicita activamente más detalles cuando es necesario, para asegurarse de que la tarea siga alineada con tus objetivos. Si una tarea lleva más tiempo del previsto o se queda atascada, puedes pausarla, pedir un resumen del progreso o detenerla por completo y recibir resultados parciales.
Cómo activar Agente ChatGPT y disponibilidad
Puedes activar las nuevas capacidades del agente de ChatGPT directamente desde el menú de herramientas del editor, seleccionando el «modo agente» en cualquier momento de la conversación. Solo tienes que describir la tarea que quieres realizar, ya sea realizar una investigación en profundidad, crear una presentación o enviar gastos. Mientras realiza la tarea, una narración en pantalla muestra exactamente qué está haciendo ChatGPT. Puedes interrumpir y tomar el control del navegador cuando lo necesites, asegurando que las tareas sigan alineadas con tus objetivos.
Además, puedes programar que las tareas completadas se repitan automáticamente, por ejemplo, generando un informe semanal de métricas cada lunes por la mañana.
Desde julio de 2025, está disponible para usuarios de ChatGPT Pro, Plus, Team, Enterprise y Education. Los usuarios gratuitos aún no tienen acceso completo a estas capacidades.
El agente de ChatGPT puede acceder a tus conectores, lo que le permite integrarse con tus flujos de trabajo y acceder de forma segura a información relevante y procesable. Una vez autenticados, estos conectores de solo lectura permiten a ChatGPT ver información como tu bandeja de entrada del día o tus franjas horarias disponibles para reuniones. Para actuar con estos sitios, se te pedirá iniciar sesión mediante el navegador controlado por el agente.
OJO eso sí con una advertencia
El agente de ChatGPT aún está en una fase inicial: puede encargarse de tareas complejas, pero todavía puede cometer errores.
«Aunque vemos un gran potencial para generar presentaciones, esta función está en fase beta. De momento, el resultado puede parecer básico en cuanto a formato y estilo, especialmente si se parte desde cero. Las primeras funciones del modelo están centradas en generar presentaciones que organicen la información de forma estructurada, con elementos como texto, gráficos o imágenes vectoriales fácilmente editables para favorecer la flexibilidad. Actualmente puedes subir una hoja de cálculo para que ChatGPT la edite o use como plantilla, pero esta función aún no está disponible para presentaciones», sostiene OpenAI.