Skip to main content

DT en Español podría recibir una comisión si compras un producto desde el sitio

Amazon presenta su nueva familia de modelos fundacionales Nova

Ciudad de la Pasta
AWS (Estados Unidos)

El CEO de Amazon, Andy Jassy, subió al escenario en la conferencia re:Invent de la compañía el martes para mostrar seis nuevos modelos de generación de texto, imagen y video que llama Amazon Nova.

Esta nueva familia de IA generativas multimodales incluye Nova Micro, un modelo de solo texto creado para respuestas de bajo costo y baja latencia; Nova Lite, un modelo multimodal de bajo costo para procesar entradas de imagen, video y texto; y Nova Pro, su modelo multimodal de propósito general que combina «precisión, velocidad y costo para una amplia gama de tareas», según la publicación del anuncio de la compañía. Nova Premier es el «… modelos multimodales para tareas de razonamiento complejas», mientras que Nova Canvas es un motor dedicado de texto a imagen y Nova Reel está diseñado específicamente para generar video.

Recommended Videos

Los modelos basados en texto se han optimizado en 15 idiomas diferentes. Micro ofrece una ventana de contexto de 128,000 tokens, mientras que tanto Lite como Pro pueden manejar hasta 300,000 tokens (alrededor de 225,000 palabras o 30 minutos de video). La compañía planea expandir las ventanas de contexto de sus modelos más grandes hasta 2 millones de tokens a principios del próximo año. 

Canvas permite a los usuarios generar y editar imágenes utilizando indicaciones en lenguaje natural. Los Reels, que competirán con Gen-3 Alpha, Kling y Dall-E 3, pueden generar clips de hasta seis segundos de duración tanto a partir de indicaciones de texto como de imágenes de referencia. El generador de video también ofrece control de movimiento de la cámara, incluidos paneos y zooms.

Pasta City, created with Amazon Nova Reel by Amazon Ads

«Hemos continuado trabajando en nuestros propios modelos de frontera», dijo Jassy a la multitud reunida, «y esos modelos de frontera han hecho una enorme cantidad de progreso en los últimos cuatro o cinco meses. Y nos dimos cuenta de que, si estábamos encontrando valor en ellos, probablemente encontrarías valor en ellos».

Jassy también dice que estos modelos se encuentran entre los menos costosos de operar y los más rápidos de su clase, aunque la compañía aún no ha publicado datos de referencia que respalden esas afirmaciones. «Hemos optimizado estos modelos para que funcionen con sistemas y API propietarios, de modo que se puedan realizar múltiples pasos automáticos orquestados (comportamiento del agente) mucho más fácilmente con estos modelos», dijo. «Así que creo que son muy convincentes».

Los modelos Micro, Lite y Pro (así como Canvas y Reels) están disponibles actualmente para los clientes de AWS. El estreno está previsto para el primer trimestre de 2025.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
La pantalla de bloqueo del Galaxy S25 tendrá su propio asistente de IA
samsung galaxy s25 pantalla bloqueo asistente ia s24 ultra

Samsung nos ha dado un primer vistazo a una de las grandes características de software que podemos esperar en la serie Galaxy S25. Se llama Now Bar, y Samsung compartió algunos detalles sobre ella cuando lanzó la versión beta de One UI 7. Ahora, tenemos muchos más detalles y una mejor idea de cómo encaja con la gran visión de IA de Samsung.

La Now Bar vivirá en la pantalla de bloqueo y mostrará datos personalizados sobre su día y actividades. Samsung afirma que es donde "controlará su entretenimiento, cronometrará su próximo mejor entrenamiento personal, obtendrá direcciones para su próxima reunión o comenzará a comunicarse en otros idiomas". No dice específicamente que Now Bar sea un asistente de IA, pero cuando entra en más detalles sobre lo que puede hacer, ciertamente comienza a sonar como uno.

Leer más
Gemini 2.0: Google presenta su IA más avanzada hasta la fecha
gemini 20 nuevo modelo ia google 2 0

Google presentó este miércoles 11 de diciembre Gemini 2.0, el último modelo de IA de la compañía y el más capaz hasta el momento, diseñado en la era de los agentes autónomos de IA. Los nuevos avances multimodales permiten construir agentes que pueden pensar, recordar y tomar acciones guiados por las personas.
Basados en todos los adelantos de Gemini 1.0 -lanzado hace un año-, Gemini 2.0 mejora su rendimiento, e incluye nuevas capacidades, como la generación nativa de imágenes y audio multilingüe y el uso nativo de herramientas inteligentes, que se conectan directamente a productos de Google como el Buscador y hasta puede ejecutar código. Estas funciones hacen posible construir agentes que pueden pensar, recordar, planificar e incluso tomar acciones.
De esta forma, Gemini 2.0 impulsará nuevas experiencias de IA en todos los productos de Google, haciéndolos más útiles e intuitivos para todos y todas.

Gemini 2.0 trae estas nuevas características

Leer más
Reddit tendrá su propio buscador de IA para rivalizar con Google
Los mejores subreddits que puedes encontrar en Reddit.

La IA está haciendo que la brecha de las búsquedas se acorte muchísimo y por eso ahora Reddit comenzará a implementar una nueva herramienta de búsqueda impulsada por IA llamada Reddit Answers.

Esta herramienta, al igual que otros productos de búsqueda de IA, responde a las consultas generando respuestas bien formateadas y mostrando enlaces a sus fuentes.

Leer más