La startup Minimax, respaldada por Alibaba y Tencent, uno de los «tigres de IA» de China, ha lanzado su modelo de texto a video Video-01, que puede generar representaciones altamente precisas de humanos, hasta los movimientos de sus manos. Minimax dio a conocer la nueva herramienta el sábado en su conferencia inaugural de desarrolladores en Shanghai.
Another Chinese 'Sora': A new AI video tool launched today by Minimax, backed by major investors Alibaba Group and Tencent. 🎞️
Check out their official AI film Magic Coin🪙, created entirely with text-to-video .
🥁Try it for free now: https://t.co/Kl1avPXkFL pic.twitter.com/df14ZVq1Es— Junie Lau (@JunieLauX) August 31, 2024
Video-01 permite a los usuarios crear videos de 6 segundos con una resolución de 1280 x 720 a 25 cuadros por segundo (fps) utilizando indicaciones de texto, según se informa, en aproximadamente 2 minutos. En la conferencia, el CEO de Minimax, Yan Junjie, señaló que esta es solo la primera iteración del modelo y que las futuras actualizaciones incluirán la capacidad de generar video a partir de imágenes y editar esos videos generados, según el South China Morning Post «De hecho, hemos logrado un progreso significativo en la generación de modelos de video y, según las evaluaciones y puntajes internos, nuestro rendimiento es mejor que el de Runway en la generación de videos», dijo a los periodistas.
Para probar Video-01 por ti mismo, dirígete al sitio web de Video-01. Mientras escribía este artículo, el sitio estaba inundado de usuarios, por lo que el proceso de generación de video tomó cerca de 5 minutos, pero no requirió que ingresara un número de teléfono móvil o iniciara sesión para usarlo. Al igual que con otras IA de video líderes como Kling y Runway, puede dictar los movimientos cinematográficos de la cámara en su mensaje de texto. La calidad de video resultante fue bastante buena, sorprendentemente realista, y no presentó ninguna alucinación visual significativa que se encuentra comúnmente en herramientas de IA gratuitas similares. El video también se puede descargar como un archivo .MP4.
Video-01 se une a un mercado de generación de video cada vez más concurrido, incluso sin la muy esperada llegada de Sora de OpenAI. Otros dos «Tigres», Shengshu AI y Zhipu AI (ambos valorados en más de 1.000 millones de dólares), lanzaron sus propias herramientas de texto a video en julio, al igual que Kaishou Industries con Kling.AI. Byte Dance también lanzó recientemente su aplicación de texto a video Jimeng en las tiendas de aplicaciones de Apple y Android, aunque solo está disponible para usuarios en China. En Estados Unidos, Minimax tendrá que lidiar con Dream Machine de Luma Labs y Gen-3 de Runway.