Skip to main content

DT en Español podría recibir una comisión si compras un producto desde el sitio

El nuevo modelo de IA de Meta puede convertir texto en imágenes 3D en menos de un minuto

una matriz de imágenes generadas en 3D creadas por Meta 3D Gen
Meta

La última incursión de Meta en la generación de imágenes de IA es rápida. La compañía presentó su nuevo modelo «3D Gen» el martes, un «canal rápido y de última generación» para transformar el texto de entrada en imágenes 3D de alta fidelidad que pueden generarlas en menos de un minuto.

Además, según se informa, el sistema es capaz de aplicar nuevas texturas y máscaras tanto a las imágenes generadas como a las producidas por los artistas mediante indicaciones de texto.

Recommended Videos

Según un estudio reciente del equipo de investigación de IA de Meta Gen, 3D Gen no solo ofrecerá texturas de alta resolución y mapas de materiales, sino que también admitirá capacidades de renderizado basado en la física (PBR) y retexturizado generativo.

📣 New research from GenAI at Meta, introducing Meta 3D Gen: A new system for end-to-end generation of 3D assets from text in <1min.

Meta 3D Gen is a new combined AI system that can generate high-quality 3D assets, with both high-resolution textures and material maps end-to-end,… pic.twitter.com/rDD5GzNinY

— AI at Meta (@AIatMeta) July 2, 2024

El equipo estima un tiempo medio de inferencia de sólo 30 segundos en la creación del modelo 3D inicial utilizando el modelo 3D AssetGen de Meta. Luego, los usuarios pueden volver atrás y refinar la textura del modelo existente o reemplazarla con algo nuevo, ambos a través de indicaciones de texto, utilizando Meta 3D TextureGen, un proceso que la compañía calcula que no debería tomar más de 20 segundos adicionales de tiempo de inferencia.

«Al combinar sus fortalezas», escribió el equipo en su resumen del estudio, «3DGen representa objetos 3D simultáneamente de tres maneras: en el espacio de vista, en el espacio volumétrico y en el espacio UV (o textura)». El equipo de Meta estableció su modelo de generación 3D con una serie de líneas de base de la industria y lo comparó con una variedad de factores, incluida la fidelidad del mensaje de texto, la calidad visual, los detalles de las texturas y los artefactos. Al combinar las funciones de ambos modelos, las imágenes generadas por el proceso integrado de dos etapas fueron seleccionadas por los anotadores en lugar de sus contrapartes de una sola etapa el 68% de las veces.

Por supuesto, el sistema discutido en este documento aún está en desarrollo y aún no está listo para el uso público, pero los avances técnicos que ilustra este estudio podrían resultar transformadores en una serie de disciplinas creativas, desde efectos de juegos y películas hasta aplicaciones de realidad virtual.

Dar a los usuarios la capacidad no solo de crear, sino también de editar contenido generado en 3D, de forma rápida e intuitiva, podría reducir drásticamente la barrera de entrada para tales actividades.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Por qué Llama 3 lo está cambiando todo en el mundo de la IA
llama 3 lo esta cambiando todo mundo ia 82370dfd 9a3f 4b19 9665 0ca2736a02fb

En el mundo de la IA, sin duda has oído hablar de lo que OpenAI y Google han estado haciendo. Y ahora, el LLM (modelo de lenguaje grande) Llama de Meta se está convirtiendo en un jugador cada vez más importante en el juego, especialmente con su naturaleza de código abierto. Meta recientemente causó un gran revuelo con el lanzamiento de su modelo de IA Llama 3, y ha sacudido el campo dramáticamente.

Las razones son múltiples y variadas. Es de uso gratuito, tiene una amplia base de usuarios y, sí, es de código abierto, por nombrar solo algunos. He aquí por qué Llama 3 está arrasando en la industria de la IA y puede dar forma a su futuro durante algún tiempo.
Llama 3 es realmente bueno
Podemos debatir hasta que las vacas vuelvan a casa sobre lo útiles que son las IA como ChatGPT y Llama 3 en el mundo real, no son malas para enseñarte las reglas de los juegos de mesa, pero los pocos puntos de referencia que tenemos sobre la capacidad de estas IA le dan a Llama 3 una clara ventaja.

Leer más
Imprimió un Macintosh Plus de Steve Jobs en 3D y dejó el paso a paso
Macintosh Plus

Un verdadero fanático de Apple, inspirado por su ídolo Steve Jobs, logró imprimir en 3D un Macintosh Plus, con lujo de detalles, arranca (y expulsa) un disquete, y el monitor permanece apagado hasta que el emulador de Mac se ejecuta y muestra el icono sonriente de Mac.

Kevin Noki, el autor, realmente quería un Macintosh Plus que funcionara y así lo describe el sitio ArsTechnica.

Leer más
El monitor 3D sin gafas de Lenovo llegó y se ve increíble
lenovo thinkvision 27 3d

Lenovo / Lenovo
Lenovo tiene un nuevo monitor 4K de 27 pulgadas que puede renderizar contenido 3D sin necesidad de gafas. Presentado por primera vez en IFA 2023, el ThinkVision 27 3D emplea tecnología patentada de hardware y software que proyecta imágenes separadas en cada ojo, creando un efecto 3D que parece dar vida a las imágenes.

La pantalla incluye una lente lenticular conmutable y tecnología de seguimiento ocular en tiempo real junto con el software que la acompaña, conocido como 3D Explorer, que cuenta con un reproductor 3D y un kit de desarrollo de software (SDK) para crear aplicaciones 3D. Esencialmente, el monitor está dirigido a creadores de contenido, incluidos diseñadores gráficos y desarrolladores 3D.
Lenovo / Lenovo
La ThinkVision cuenta con una resolución 3D de 1920 x 2160, mientras que la lente lenticular conmutable permite a los usuarios realizar una transición sin problemas a la visualización 2D normal con una resolución de 3840 x 2160.

Leer más