Skip to main content
  1. Home
  2. Android
  3. Noticias
  4. Telefonía celular
  5. News

Qualcomm quiere agregar estas locas herramientas de IA a su teléfono

Add as a preferred source on Google
cinco telefonos que deberias comprar en lugar samsung galaxy s24 ultra mwc logo
Toda la cobertura del MWC 2024 de Barcelona

En el Mobile World Congress 2024, Qualcomm añade más a su cartera de trucos de IA en el teléfono facilitados por el silicio de la serie Snapdragon para teléfonos Android. El fabricante de chips ya ha mostrado algunas capacidades de IA impresionantes para el buque insignia Snapdragon 8 Gen 3, como la edición de medios activada por voz, la generación de imágenes en el dispositivo mediante Stable Diffusion y un asistente virtual más inteligente construido sobre grandes modelos de lenguaje de empresas como Meta.

Hoy, la compañía está agregando más fuerza a esos superpoderes de IA. La primera es la capacidad de ejecutar un Large Language and Vision Assistant (LLaVa) en un teléfono inteligente. Piense en ello como un chatbot como ChatGPT al que se le han otorgado capacidades de Google Lens. Como tal, la solución de Qualcomm no solo puede aceptar entradas de texto, sino también procesar imágenes.

Recommended Videos

Por ejemplo, puede insertar una imagen que represente una tabla de embutidos y hacer preguntas basadas en ella. El asistente de IA, basado en un gran modelo multimodal (LMM) que puede procesar más de 7 mil millones de parámetros, le dirá todos los tipos de frutas, quesos, carnes y nueces en el tablero que se muestra en la imagen de entrada que se ve a continuación.

Demostración de Qualcomm del asistente de IA más inteligente en el teléfono.
Qualcomm

También puede manejar consultas de seguimiento, para que pueda llevar a cabo una conversación fluida de ida y vuelta. Ahora, empresas como ChatGPT también han adquirido capacidades multimodales, lo que significa que la herramienta de OpenAI también puede procesar entradas de imágenes. Sin embargo, hay una diferencia crucial.

Productos como ChatGPT y Copilot todavía están muy atados a una arquitectura basada en la nube, lo que significa que sus datos se manejan en servidores remotos. El impulso de Qualcomm va en la dirección del procesamiento en el dispositivo. Todo sucede en su teléfono, lo que significa que todo el proceso es más rápido y hay poco riesgo de intrusión en la privacidad.

«Este LMM se ejecuta a una tasa de token receptivo en el dispositivo, lo que da como resultado una mayor privacidad, confiabilidad, personalización y costos», dice Qualcomm. Aún no se ha confirmado oficialmente si el asistente virtual basado en LLaVa prometido por Qualcomm llegará como una aplicación independiente o si tendrá una tarifa.

El próximo anuncio de Qualcomm se sumerge en el dominio creativo de la generación y manipulación de imágenes. No hace mucho tiempo, Qualcomm hizo una demostración de la generación de texto a imagen más rápida del mundo en un teléfono utilizando la tecnología Stable Diffusion. Hoy, la compañía está dando un primer vistazo a la generación de imágenes impulsada por LoRA.

Escaparate de Qualcomm de la generación de imágenes de IA en el teléfono.
Qualcomm

LoRA adopta un enfoque diferente para la generación de imágenes que una herramienta de IA generativa normal como Dall.E. LoRA, abreviatura de Low-Rank Adaptation, es una técnica desarrollada por Microsoft. El entrenamiento de un modelo de IA puede tener un costo prohibitivo, una latencia alta y ser particularmente exigente desde una perspectiva de hardware.

Lo que hace LoRA es reducir drásticamente el peso del modelo, un objetivo que se logra centrándose solo en segmentos específicos del modelo y reduciendo el número de parámetros con fines de entrenamiento. Al hacerlo, los requisitos de memoria disminuyen, el proceso se vuelve más rápido y la cantidad de tiempo y esfuerzo que se necesita para adaptar un modelo de texto a imagen también se reduce drásticamente.

Con el tiempo, la técnica de destilación LoRA se ha aplicado al modelo de difusión estable para generar imágenes a partir de indicaciones de texto. Debido a las ganancias en eficiencia y la adaptabilidad más fácil de los modelos basados en LoRA, se considera una ruta hecha a medida para los teléfonos inteligentes. Qualcomm ciertamente cree que sí, e incluso su rival MediaTek ha adoptado la misma solución para trucos de IA generativa en su chip insignia Dimensity 9300.

Qualcomm también está mostrando algunos otros trucos de IA en el MWC 2024, algunos de los cuales ya han aparecido en el Samsung Galaxy S24 Ultra. Entre ellos se encuentra la capacidad de expandir el lienzo de una imagen utilizando el relleno generativo de IA y la generación de video impulsada por IA. Esto último es bastante ambicioso, especialmente después de ver lo que OpenAI ha logrado con Sora. Sería interesante ver cómo Qualcomm se las arregla para portarlo a los teléfonos inteligentes.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Google Translate finalmente entiende a qué te referías
Electronics, Mobile Phone, Phone

Google está lanzando una importante actualización de Translate, utilizando sus modelos de IA Gemini para ofrecer traducciones de texto más naturales, traducción de voz en tiempo real mediante auriculares y herramientas ampliadas para el aprendizaje de idiomas. Los cambios buscan ayudar a los usuarios a comprender no solo las palabras, sino también la intención, el tono y los matices culturales.

Qué pasó: Google Translate recibe traducción de texto y voz en vivo impulsada por Gemini

Read more
Google Health Connect ahora te controla tu consumo de alcohol
Electronics, Screen, Computer Hardware

Google está sentando discretamente las bases para convertir Health Connect en un centro de salud mucho más completo para Android, yendo mucho más allá del seguimiento básico de fitness. Nuevos descubrimientos en versiones recientes de Android muestran cambios en la interfaz, controles de permisos más inteligentes y señales tempranas de soporte para el seguimiento del consumo de alcohol y síntomas médicos.

Health Connect se vuelve más inteligente y centralizado en Android

Read more
Google cerrará su portal mágico hacia la Dark Web
Computer, Electronics, Laptop

Google ha anunciado el cierre de su función de reportes de dark web, la herramienta que alertaba a usuarios cuando sus datos personales aparecían en foros clandestinos donde se comercializa información robada. La compañía comunicó a través de correo electrónico que suspenderá el monitoreo de nuevos resultados el 15 de enero de 2026, y borrará completamente todos los datos almacenados el 16 de febrero.

Lanzada inicialmente en marzo de 2023 exclusivamente para suscriptores de Google One, la herramienta fue democratizada a todos los usuarios en julio de 2024. Sin embargo, menos de dos años después, Google ha determinado que la función no proporciona suficiente valor.

Read more