A pesar de que MidJourney se propuso ser uno de los modelos de generación de imágenes más prometedores en los primeros días de la IA, parece haberse quedado atrás de herramientas más accesibles, fáciles de usar y gratuitas como Gemini, ChatGPT y Bing. A sus problemas se suma la última actualización del modelo GPT-4o de OpenAI, que permite una generación de imágenes excepcionalmente buena con la capacidad de recrear fotos reales y producir texto inmaculado. Entonces, para mantenerse relevante, o tal vez atrapar el tren del hype que está siendo desviado por la ola de arte de IA inspirado en Studio Ghibli que inunda Internet, MidJourney está lanzando un modelo actualizado con varias mejoras.
El CEO David Holz anunció los detalles del nuevo modelo V7 en el servidor oficial de Discord de MidJourney y a través de una publicación de blog. Dijeron que el nuevo modelo es «más inteligente con las indicaciones de texto» y produce imágenes con una calidad «notablemente superior» y «texturas hermosas».
El modelo también es capaz de generar imágenes en un santiamén, aproximadamente 10 veces más rápido que el modelo actual, dice Holz, ya que el modo está diseñado para la lluvia de ideas y las iteraciones frecuentes. Puede cambiar al modo conversacional (solo en la web) y recrear parte de la imagen sin tener que reescribir el mensaje por completo o usar el modo de edición. Las imágenes son de menor calidad y cuestan la mitad de lo que cuestan las imágenes normales.
El modo conversacional se sustituye por un modo de voz cuando usa la aplicación Discord en su computadora o dispositivo móvil. Holz dice que te permite «pensar en voz alta y dejar que las imágenes fluyan debajo de ti como sueños líquidos». Esta función también forma parte del modo Borrador recientemente introducido.
Además, MidJourney V7 se puede ejecutar en los modos Relax y Turbo para imágenes de alta resolución (que el modo Borrador), y el uso de este último le costará el doble de créditos a cambio de una producción de imágenes más rápida.
El nuevo modelo V7 actualmente carece de algunas funcionalidades y los flujos de trabajo volverán de forma predeterminada a la V6.1 anterior para las tareas que necesitan escalado, pintura y retexturización. Por último, el modelo también habilita la personalización, donde puede guardar preferencias sobre cómo le gustan sus imágenes y esperar que el modelo produzca resultados en consecuencia. Esto requeriría una configuración de cinco minutos, que lo lleva a través de una serie de 200 imágenes que puede elegir para ajustar sus preferencias.

MidJourney está llevando a cabo una prueba alfa impulsada por la comunidad para el modelo y promete características adicionales en los próximos 60 días. Puede probarlo escribiendo en el cuadro de chat en Discord o en la plataforma web, enviar el mensaje y cambiar el modelo predeterminado a V7 desde la configuración que surja. /settings