«Hola Alexa, enciende las luces de la cocina». «Hey Google, recuérdame a las 4 que recoja la ropa». Los consumidores han estado hablando con asistentes y haciendo el trabajo durante años. Ahora, Microsoft se está sumando a la mezcla, y este cambio podría cambiar para siempre la forma en que interactuamos con las computadoras. Saluda al nuevo lenguaje de las PC con Windows 11: «Hey Copilot«.
¿Qué está cambiando?
Microsoft ha anunciado hoy que está convirtiendo cada PC con Windows 11 en una PC con IA, y en el centro de esas ambiciones está el asistente Copilot AI. La compañía ha anunciado que está implementando el acceso a Copilot Vision y Copilot Voice a todos los usuarios. Estas dos capacidades multimodales permitirán a los usuarios interactuar con su PC mediante comandos de voz, una vez que hayan habilitado la función de conversación en la aplicación Copilot.

Estas dos características aprovechan una idea mucho más ambiciosa: Copilot Actions, un sistema que se implementará primero como una vista previa. Piense en ello como un agente que puede trabajar en su nombre. Hasta ahora, las acciones de Copilot se han limitado a actividades basadas en la web. Ahora, la IA puede manejar tareas localmente accediendo a los archivos almacenados en su computadora.
Con un simple comando de voz, Copilot puede realizar acciones en todos los archivos, como extraer información de un archivo PDF, abrir una aplicación para realizar la tarea deseada o encontrar imágenes. Todo esto sucede de forma autónoma y en segundo plano, para que pueda concentrarse en otras tareas. Es como interactuar con los agentes de Copilot en las aplicaciones de Office, la herramienta de operador de OpenAI, o usar Claude de Anthropic para crear y manejar ediciones de archivos con comandos de lenguaje natural, sin siquiera tener que abrir esos archivos.

«Creemos que este cambio a la entrada conversacional será tan transformador como el mouse y el teclado en términos de desbloquear nuevas capacidades en la PC para el conjunto más amplio de personas», compartió la compañía en material de prensa. Microsoft asegura que cuando Copilot funciona de forma autónoma, los usuarios pueden intervenir en cualquier etapa y tomar el control. «Cuando se trata de acciones sensibles o decisiones importantes, Copilot Actions puede solicitar la aprobación adicional del usuario para tomar esas medidas», dice la compañía.
¿Qué puede hacer Copilot?
Con Copilot Vision, el asistente de IA está al tanto de lo que parpadea en su pantalla. Eso significa que puede responder a tus preguntas, dar consejos o incluso con orientación en el juego. Esto se relaciona con la función «Destacados» que guiará a los usuarios a través de cualquier tarea que necesiten. Desde ayudar con la edición de fotos hasta hacer planes de viaje, evaluará el contenido en pantalla y ofrecerá las sugerencias necesarias paso a paso.

La comprensión es más profunda que las imágenes dentro de las aplicaciones de Microsoft, como Excel, PowerPoint y Word. En estas aplicaciones, Copilot Vision puede analizar una hoja de datos o un documento completo y realizar el trabajo. Para los usuarios que están en el grupo de pruebas de Insider, también podrán participar en conversaciones basadas en texto con Copilot Vision, en lugar de solo hablar y escuchar.
La nueva herramienta Ask Copilot en la barra de tareas de Windows 11 permitirá a los usuarios invocar Copilot Vision o Voice con un solo clic. Microsoft también está expandiendo Copilot Connectors, que permite a los usuarios acceder al asistente de IA a través de servicios como OneDrive y Outlook, así como servicios de terceros como Google Drive, Gmail y Contactos. La idea es similar a los conectores de ChatGPT y una implementación similar dentro del navegador Comet de Perplexity. En pocas palabras, Copilot accederá a todos los datos almacenados en estos servicios y realizará el trabajo, desde brindar una descripción general de los horarios de reuniones hasta encontrar documentos almacenados en una unidad en la nube.