Skip to main content

DT en Español podría recibir una comisión si compras un producto desde el sitio

El nuevo modelo de IA de Meta puede convertir texto en imágenes 3D en menos de un minuto

una matriz de imágenes generadas en 3D creadas por Meta 3D Gen
Meta

La última incursión de Meta en la generación de imágenes de IA es rápida. La compañía presentó su nuevo modelo «3D Gen» el martes, un «canal rápido y de última generación» para transformar el texto de entrada en imágenes 3D de alta fidelidad que pueden generarlas en menos de un minuto.

Además, según se informa, el sistema es capaz de aplicar nuevas texturas y máscaras tanto a las imágenes generadas como a las producidas por los artistas mediante indicaciones de texto.

Recommended Videos

Según un estudio reciente del equipo de investigación de IA de Meta Gen, 3D Gen no solo ofrecerá texturas de alta resolución y mapas de materiales, sino que también admitirá capacidades de renderizado basado en la física (PBR) y retexturizado generativo.

📣 New research from GenAI at Meta, introducing Meta 3D Gen: A new system for end-to-end generation of 3D assets from text in <1min.

Meta 3D Gen is a new combined AI system that can generate high-quality 3D assets, with both high-resolution textures and material maps end-to-end,… pic.twitter.com/rDD5GzNinY

— AI at Meta (@AIatMeta) July 2, 2024

El equipo estima un tiempo medio de inferencia de sólo 30 segundos en la creación del modelo 3D inicial utilizando el modelo 3D AssetGen de Meta. Luego, los usuarios pueden volver atrás y refinar la textura del modelo existente o reemplazarla con algo nuevo, ambos a través de indicaciones de texto, utilizando Meta 3D TextureGen, un proceso que la compañía calcula que no debería tomar más de 20 segundos adicionales de tiempo de inferencia.

«Al combinar sus fortalezas», escribió el equipo en su resumen del estudio, «3DGen representa objetos 3D simultáneamente de tres maneras: en el espacio de vista, en el espacio volumétrico y en el espacio UV (o textura)». El equipo de Meta estableció su modelo de generación 3D con una serie de líneas de base de la industria y lo comparó con una variedad de factores, incluida la fidelidad del mensaje de texto, la calidad visual, los detalles de las texturas y los artefactos. Al combinar las funciones de ambos modelos, las imágenes generadas por el proceso integrado de dos etapas fueron seleccionadas por los anotadores en lugar de sus contrapartes de una sola etapa el 68% de las veces.

Por supuesto, el sistema discutido en este documento aún está en desarrollo y aún no está listo para el uso público, pero los avances técnicos que ilustra este estudio podrían resultar transformadores en una serie de disciplinas creativas, desde efectos de juegos y películas hasta aplicaciones de realidad virtual.

Dar a los usuarios la capacidad no solo de crear, sino también de editar contenido generado en 3D, de forma rápida e intuitiva, podría reducir drásticamente la barrera de entrada para tales actividades.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
La cámara 3D de Acer transmite directamente en YouTube o en Zoom
camara 3d acer transmite directamente youtube zoom c  mara

Acer ha anunciado su primera cámara 3D, la SpatialLabs Eyes Stereo, justo antes de Computex 2024 la próxima semana. La cámara puede hacer fotos y videos en 3D, que luego se pueden ver dentro de la propia cámara, en un casco de realidad virtual o en una pantalla 3D.

Es posible que se pregunte qué está haciendo una empresa de PC vendiendo una cámara 3D, pero Acer ha estado a la vanguardia de la tecnología 3D durante años, centrándose principalmente en pantallas estereoscópicas en monitores externos y computadoras portátiles. Pero ahora, la compañía tiene una cámara adecuada para la captura de contenido.

Leer más
El nuevo avatar 3D de Google para Meet es más realista
ChatDirector

Meta, FaceTime de Apple y Microsoft Teams ya tienen sus avatares 3D para videollamadas, los que reemplazan tu rostro por una representación animada de tu persona.

Sin embargo, Google quiere cambiar un poco la fantasía por realidad y entregar avatares 3D con tu cara para Google Meet.

Leer más
Por qué Llama 3 lo está cambiando todo en el mundo de la IA
llama 3 lo esta cambiando todo mundo ia 82370dfd 9a3f 4b19 9665 0ca2736a02fb

En el mundo de la IA, sin duda has oído hablar de lo que OpenAI y Google han estado haciendo. Y ahora, el LLM (modelo de lenguaje grande) Llama de Meta se está convirtiendo en un jugador cada vez más importante en el juego, especialmente con su naturaleza de código abierto. Meta recientemente causó un gran revuelo con el lanzamiento de su modelo de IA Llama 3, y ha sacudido el campo dramáticamente.

Las razones son múltiples y variadas. Es de uso gratuito, tiene una amplia base de usuarios y, sí, es de código abierto, por nombrar solo algunos. He aquí por qué Llama 3 está arrasando en la industria de la IA y puede dar forma a su futuro durante algún tiempo.
Llama 3 es realmente bueno
Podemos debatir hasta que las vacas vuelvan a casa sobre lo útiles que son las IA como ChatGPT y Llama 3 en el mundo real, no son malas para enseñarte las reglas de los juegos de mesa, pero los pocos puntos de referencia que tenemos sobre la capacidad de estas IA le dan a Llama 3 una clara ventaja.

Leer más