Stable Diffusion quiere solucionar su problema con los dedos

Las iteraciones futuras del arte generado por IA serán más realistas gracias a una próxima versión de Stable Diffusion que aborda específicamente el problema de representar dedos y manos.

Según un informe reciente de Bloomberg, la compañía Stability AI, que desarrolla el generador de imágenes Stable Diffusion AI, tiene planes de lanzar un nuevo modelo SDXL 0.9 que impulsará las capacidades de Stable Diffusion.

Una nueva muestra del modelo Stable Diffusion SDXL 0.9 de Stability AI.

Stability AI compartió una publicación de blog el jueves, que desde entonces ha sido eliminada, detallando las especificaciones y los detalles de lanzamiento del modelo SDXL 0.9. Esto deja preguntas sobre exactamente qué Stability AI ha planeado para la actualización.

Recommended Videos

Sin embargo, por lo que reveló la publicación, el nuevo modelo sucede a la versión Stable Diffusion XL que se lanzó en abril y se centrará en mejorar la generación de manos y el «detalle general de imagen y composición», según Bloomberg.

La publicación del blog incluye imágenes de muestra generadas a partir de las mismas indicaciones para mostrar la mejora en la calidad entre la beta de Stable Diffusion XL y SDXL 0.9, y la marca dice que el nuevo modelo se erige como «un salto en los casos de uso creativos para imágenes generativas de IA». Algunas de las indicaciones incluyen extraterrestres, un lobo y una persona que sostiene una taza de café.

La próxima actualización SDXL 0.9 también sigue al lanzamiento de Midjourney v5 lanzado en marzo, que también se centró en mejorar la generación manual. Midjourney AI desarrolla sus propios modelos patentados y tiene un problema similar en el que los modelos anteriores a menudo se generaban con un número incorrecto de dígitos en las manos, desde cuatro hasta entre siete y 10 en sujetos humanos.

La compatibilidad de PC con SDXL 0.9 incluye un mínimo de 16 GB de RAM y una tarjeta gráfica GeForce RTX 20 (o superior) con 8 GB de VRAM, además de un sistema operativo Windows 11, Windows 10 o Linux. Se espera que el modelo funcione a través de la herramienta web Clipdrop de Stability AI y también se agregará a la aplicación DreamStudio de la compañía. Según la publicación de blog eliminada, también habrá una versión SDXL 1.0 de código abierto. Dijo que esta versión se lanzaría a mediados de julio, pero ahora esta fecha es incierta.

Stable Diffusion es también el código fuente detrás de muchos generadores de imágenes de IA populares, incluidos Starry AI y Night Cafe. Una vez que la actualización SDXL 0.9 esté disponible, es probable que también beneficie a los otros generadores asociados.

Recomendaciones del editor