Skip to main content

DT en Español podría recibir una comisión si compras un producto desde el sitio

Stable Diffusion quiere solucionar su problema con los dedos

Las iteraciones futuras del arte generado por IA serán más realistas gracias a una próxima versión de Stable Diffusion que aborda específicamente el problema de representar dedos y manos.

Según un informe reciente de Bloomberg, la compañía Stability AI, que desarrolla el generador de imágenes Stable Diffusion AI, tiene planes de lanzar un nuevo modelo SDXL 0.9 que impulsará las capacidades de Stable Diffusion.

Una nueva muestra del modelo Stable Diffusion SDXL 0.9 de Stability AI.

Stability AI compartió una publicación de blog el jueves, que desde entonces ha sido eliminada, detallando las especificaciones y los detalles de lanzamiento del modelo SDXL 0.9. Esto deja preguntas sobre exactamente qué Stability AI ha planeado para la actualización.

Sin embargo, por lo que reveló la publicación, el nuevo modelo sucede a la versión Stable Diffusion XL que se lanzó en abril y se centrará en mejorar la generación de manos y el «detalle general de imagen y composición», según Bloomberg.

La publicación del blog incluye imágenes de muestra generadas a partir de las mismas indicaciones para mostrar la mejora en la calidad entre la beta de Stable Diffusion XL y SDXL 0.9, y la marca dice que el nuevo modelo se erige como «un salto en los casos de uso creativos para imágenes generativas de IA». Algunas de las indicaciones incluyen extraterrestres, un lobo y una persona que sostiene una taza de café.

La próxima actualización SDXL 0.9 también sigue al lanzamiento de Midjourney v5 lanzado en marzo, que también se centró en mejorar la generación manual. Midjourney AI desarrolla sus propios modelos patentados y tiene un problema similar en el que los modelos anteriores a menudo se generaban con un número incorrecto de dígitos en las manos, desde cuatro hasta entre siete y 10 en sujetos humanos.

La compatibilidad de PC con SDXL 0.9 incluye un mínimo de 16 GB de RAM y una tarjeta gráfica GeForce RTX 20 (o superior) con 8 GB de VRAM, además de un sistema operativo Windows 11, Windows 10 o Linux. Se espera que el modelo funcione a través de la herramienta web Clipdrop de Stability AI y también se agregará a la aplicación DreamStudio de la compañía. Según la publicación de blog eliminada, también habrá una versión SDXL 1.0 de código abierto. Dijo que esta versión se lanzaría a mediados de julio, pero ahora esta fecha es incierta.

Stable Diffusion es también el código fuente detrás de muchos generadores de imágenes de IA populares, incluidos Starry AI y Night Cafe. Una vez que la actualización SDXL 0.9 esté disponible, es probable que también beneficie a los otros generadores asociados.

Recomendaciones del editor

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Meta debuta con Code Llama: su herramienta de escritura de código IA
Crea presentaciones usando la IA con estas 3 herramientas.

Siguiendo con su incursión en IA, Meta presentó su Code Llama, su nueva herramienta de escritura de código. Utilizará la misma licencia comunitaria que Llama 2 y es gratuito para investigación y uso comercial.
Code Llama, dijo Meta, puede crear cadenas de código a partir de mensajes o completar y depurar código cuando se apunta a una cadena de código específica. Además del modelo base de Code Llama, Meta lanzó una versión especializada en Python llamada Code Llama-Python y otra versión llamada Code Llama-Instrct, que puede entender instrucciones en lenguaje natural. Según Meta, cada versión específica de Code Llama no es intercambiable, y la compañía no recomienda el Code Llama base o Code Llama-Python para instrucciones en lenguaje natural.

"Los programadores ya están utilizando LLM para ayudar en una variedad de tareas, que van desde escribir nuevo software hasta depurar el código existente", dijo Meta en una publicación de blog. "El objetivo es hacer que los flujos de trabajo de los desarrolladores sean más eficientes para que puedan centrarse en los aspectos más centrados en el ser humano de sus trabajos".
La compañía dijo que Code Llama obtuvo un 53,7 por ciento en el punto de referencia de código HumanEval y pudo escribir con precisión código basado en una descripción de texto.
Meta lanzará tres tamaños de Code Llama y dijo que su tamaño más pequeño cabe en una sola GPU para proyectos de baja latencia.

Leer más
Meta lanza su traductor con IA: SeamlessM4T que trabaja hasta con 100 idiomas
meta lanza traductor con ia seamlessm4t

Este martes 22 de agosto Mark Zuckerberg anunció que Meta está lanzando para sus productos el traductor hecho con IA, SeamlessM4T, que trabaja con más de 100 idiomas, y permite no solo la traducción, sino que además transformación en audio y transcripción.

Disponible en código abierto junto con SeamlessAlign, un nuevo conjunto de datos de traducción, Meta afirma que SeamlessM4T representa un "avance significativo" en el campo de la conversión de voz a voz y voz a texto impulsadas por IA.

Leer más
Meta quiere regalar su chatbot de IA LLaMA 2
5 herramientas de IA que te ayudan a resumir contenido.

Meta anunció que está abriendo su modelo de lenguaje grande LLaMA 2, haciéndolo gratuito para uso comercial y de investigación y enfrentándose cara a cara con el GPT-4 gratuito de OpenAI.

Meta anunció la medida como parte del evento Inspire de Microsoft, señalando su apoyo a Azure y Windows y una asociación "creciente" entre las dos compañías.

Leer más