¿Qué ha pasado? En octubre, Microsoft AI había presentado su sistema interno de texto a imagen, llamado MAI-Image-1. Bueno, como anunció el CEO de Microsoft AI, Mustafa Suleyman, en X, el modelo de generación de imágenes ahora está disponible dentro de Copilot. Promocionado como una «mejora importante» con respecto al sistema anterior, puede comenzar a usar el modelo de inmediato, sin largas listas de espera, sin banderas experimentales. Simplemente abra Copilot en la web o en el escritorio y comience a generar.
- MAI-Image-1 está diseñado para resultados fotorrealistas, abordando detalles históricamente desordenados, especialmente las manos, con mucha más precisión.
- El modelo admite la generación de mensajes de texto y la edición de imágenes, ofreciendo herramientas de refinamiento similares a las que encontraría en DALL-E.
- Los usuarios ya lo están probando públicamente y las primeras impresiones son bastante positivas.
Por qué esto es importante: MAI-Image-1 marca un momento importante para Microsoft porque es el primer generador de imágenes serio y totalmente interno de la compañía, lo que significa que ya no se apoya en modelos de terceros como DALL-E de OpenAI. Eso significa que Microsoft ahora puede iterar más rápido, adaptar la herramienta más estrechamente a Copilot y servir mejor a las regiones donde los modelos de la competencia (como Gemini de Google) tienen disponibilidad limitada.

Los primeros probadores ya lo llaman una «gran mejora», apuntando a un fotorrealismo notablemente mejor, más iluminación natural y, lo más importante, una solución importante a uno de los defectos más notorios del arte de IA: dedos extraños. Algunos desarrolladores que probaron el modelo dicen que están impresionados con lo consistente y receptivo que se siente, incluso lo elogian como «muy bueno» por su trabajo conceptual detallado.
Esto también indica hacia dónde se dirige Copilot: hacia convertirse en una plataforma creativa más completa en lugar de solo un asistente de texto. Las muestras fotorrealistas compartidas en línea, como primeros planos de manos en diferentes entornos o una taza de café realista con vapor visible, sugieren que Microsoft está cerrando la brecha con las herramientas de arte de IA establecidas. Eso aumenta las apuestas en un mercado cada vez más concurrido, donde Meta, Google, Grok y OpenAI están compitiendo para ofrecer las mejores imágenes generativas de su clase. Si Microsoft mantiene este ritmo, Copilot podría convertirse en un espacio de referencia para la creación de imágenes, no solo para indicaciones casuales.

¿Por qué debería importarme? Si ya usa Copilot, su experiencia de generación de imágenes acaba de mejorar automáticamente, sin necesidad de actualización. Simplemente cambie al nuevo modelo y debería estar listo para comenzar. Ya sea que esté creando tableros de estado de ánimo, conceptos de productos, miniaturas, ilustraciones o simplemente un caos de memes, MAI-Image-1 está lo suficientemente pulido como para hacer que el proceso sea más fácil y divertido. Y como está integrado directamente en Copilot, no necesita hacer malabarismos con herramientas externas: todo vive donde ya está escribiendo indicaciones.
Bien, entonces, ¿qué sigue? MAI-Image-1 ya está disponible dentro de las herramientas de IA para consumidores de Microsoft, como Copilot y Bing Image Creator, actualmente disponibles en la mayoría de los principales mercados, incluidos EE. UU., Reino Unido, Canadá, Australia y otros países donde Copilot admite indicaciones de texto. Sin embargo, Mustafa aclaró que el modelo «llegará pronto» a la UE. Para probarlo, simplemente inicie sesión con su cuenta de Microsoft, abra Copilot (o Bing Image Creator) e ingrese un mensaje para crear o editar una imagen. Debido a que el modelo está integrado en las herramientas existentes en lugar de un sitio independiente, se siente como una actualización natural en lugar de una aplicación separada para aprender.

De cara al futuro, Microsoft planea expandir aún más el lanzamiento, incluidas regiones, idiomas e integraciones de plataforma adicionales. Las primeras reacciones de los usuarios sugieren que la fortaleza del modelo radica en los detalles fotorrealistas, la iluminación refinada y la anatomía más natural, así que espere que Microsoft refine los flujos de trabajo de edición, agregue más controles de estilo y posiblemente abra opciones de elección de modelos. En otras palabras, este lanzamiento no es la línea de meta, es el inicio del reclamo de Microsoft para la generación de imágenes, y cada nueva iteración podría desbloquear flujos de trabajo creativos más ricos dentro de Copilot.