Skip to main content
  1. Home
  2. Android
  3. Noticias
  4. Telefonía celular
  5. News

Qualcomm quiere agregar estas locas herramientas de IA a su teléfono

Add as a preferred source on Google
cinco telefonos que deberias comprar en lugar samsung galaxy s24 ultra mwc logo
Toda la cobertura del MWC 2024 de Barcelona

En el Mobile World Congress 2024, Qualcomm añade más a su cartera de trucos de IA en el teléfono facilitados por el silicio de la serie Snapdragon para teléfonos Android. El fabricante de chips ya ha mostrado algunas capacidades de IA impresionantes para el buque insignia Snapdragon 8 Gen 3, como la edición de medios activada por voz, la generación de imágenes en el dispositivo mediante Stable Diffusion y un asistente virtual más inteligente construido sobre grandes modelos de lenguaje de empresas como Meta.

Hoy, la compañía está agregando más fuerza a esos superpoderes de IA. La primera es la capacidad de ejecutar un Large Language and Vision Assistant (LLaVa) en un teléfono inteligente. Piense en ello como un chatbot como ChatGPT al que se le han otorgado capacidades de Google Lens. Como tal, la solución de Qualcomm no solo puede aceptar entradas de texto, sino también procesar imágenes.

Recommended Videos

Por ejemplo, puede insertar una imagen que represente una tabla de embutidos y hacer preguntas basadas en ella. El asistente de IA, basado en un gran modelo multimodal (LMM) que puede procesar más de 7 mil millones de parámetros, le dirá todos los tipos de frutas, quesos, carnes y nueces en el tablero que se muestra en la imagen de entrada que se ve a continuación.

Demostración de Qualcomm del asistente de IA más inteligente en el teléfono.
Qualcomm

También puede manejar consultas de seguimiento, para que pueda llevar a cabo una conversación fluida de ida y vuelta. Ahora, empresas como ChatGPT también han adquirido capacidades multimodales, lo que significa que la herramienta de OpenAI también puede procesar entradas de imágenes. Sin embargo, hay una diferencia crucial.

Productos como ChatGPT y Copilot todavía están muy atados a una arquitectura basada en la nube, lo que significa que sus datos se manejan en servidores remotos. El impulso de Qualcomm va en la dirección del procesamiento en el dispositivo. Todo sucede en su teléfono, lo que significa que todo el proceso es más rápido y hay poco riesgo de intrusión en la privacidad.

«Este LMM se ejecuta a una tasa de token receptivo en el dispositivo, lo que da como resultado una mayor privacidad, confiabilidad, personalización y costos», dice Qualcomm. Aún no se ha confirmado oficialmente si el asistente virtual basado en LLaVa prometido por Qualcomm llegará como una aplicación independiente o si tendrá una tarifa.

El próximo anuncio de Qualcomm se sumerge en el dominio creativo de la generación y manipulación de imágenes. No hace mucho tiempo, Qualcomm hizo una demostración de la generación de texto a imagen más rápida del mundo en un teléfono utilizando la tecnología Stable Diffusion. Hoy, la compañía está dando un primer vistazo a la generación de imágenes impulsada por LoRA.

Escaparate de Qualcomm de la generación de imágenes de IA en el teléfono.
Qualcomm

LoRA adopta un enfoque diferente para la generación de imágenes que una herramienta de IA generativa normal como Dall.E. LoRA, abreviatura de Low-Rank Adaptation, es una técnica desarrollada por Microsoft. El entrenamiento de un modelo de IA puede tener un costo prohibitivo, una latencia alta y ser particularmente exigente desde una perspectiva de hardware.

Lo que hace LoRA es reducir drásticamente el peso del modelo, un objetivo que se logra centrándose solo en segmentos específicos del modelo y reduciendo el número de parámetros con fines de entrenamiento. Al hacerlo, los requisitos de memoria disminuyen, el proceso se vuelve más rápido y la cantidad de tiempo y esfuerzo que se necesita para adaptar un modelo de texto a imagen también se reduce drásticamente.

Con el tiempo, la técnica de destilación LoRA se ha aplicado al modelo de difusión estable para generar imágenes a partir de indicaciones de texto. Debido a las ganancias en eficiencia y la adaptabilidad más fácil de los modelos basados en LoRA, se considera una ruta hecha a medida para los teléfonos inteligentes. Qualcomm ciertamente cree que sí, e incluso su rival MediaTek ha adoptado la misma solución para trucos de IA generativa en su chip insignia Dimensity 9300.

Qualcomm también está mostrando algunos otros trucos de IA en el MWC 2024, algunos de los cuales ya han aparecido en el Samsung Galaxy S24 Ultra. Entre ellos se encuentra la capacidad de expandir el lienzo de una imagen utilizando el relleno generativo de IA y la generación de video impulsada por IA. Esto último es bastante ambicioso, especialmente después de ver lo que OpenAI ha logrado con Sora. Sería interesante ver cómo Qualcomm se las arregla para portarlo a los teléfonos inteligentes.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
NotebookLM lleva sus resúmenes en video a Android e iOS
NotebookLM

Google está ampliando el alcance de NotebookLM, su herramienta de investigación y síntesis de contenidos, con la llegada de la función de “Video Overview” a las aplicaciones móviles de Android e iOS. Hasta ahora disponible en la versión web, esta característica permite generar videos explicativos que resumen documentos, páginas web u otras fuentes cargadas por el usuario, apoyándose en los modelos Gemini.

Con la última actualización, los usuarios pueden abrir la app de NotebookLM en su teléfono, ir a la lista de cuadernos y tocar el botón “Studio” —identificado con un ícono de varita mágica— para acceder al nuevo menú creativo. Desde allí es posible elegir la opción Video Overview y pedirle al sistema que produzca un video que condense el material seleccionado, ya sea para estudiar, preparar presentaciones o repasar información compleja de forma más amena.

Read more
Apple y Google App Stores están infestadas de apps de IA nudificantes
Head, Person, Face

Tendemos a pensar en la Apple App Store y Google Play Store como "jardines amurallados" digitales: espacios seguros y curados donde el contenido peligroso o turbio se filtra mucho antes de llegar a nuestras pantallas. Pero un nuevo análisis sombrío del Proyecto de Transparencia Tecnológica (TTP) sugiere que las paredes tienen grietas serias. El informe revela una realidad preocupante: ambos grandes escaparates están actualmente infestados de decenas de aplicaciones de "nudify" impulsadas por IA. No son herramientas oscuras ocultas en la dark web; Están ahí, a la vista, permitiendo que cualquiera haga una foto inocente de una persona y le quite la ropa digitalmente sin su consentimiento.

A principios de este año, la conversación sobre esta tecnología alcanzó su punto álgido cuando la IA de Elon Musk, Grok, fue sorprendida generando imágenes sexualizadas similares en la plataforma X. Pero mientras Grok se convirtió en el foco de la indignación pública, la investigación del TTP muestra que fue solo la punta del iceberg. Una simple búsqueda de términos como "desnudarse" o "nudify" en las tiendas de aplicaciones arroja una larga lista de programas diseñados específicamente para crear pornografía deepfake no consensuada.

Read more
Google Maps incorpora la IA de Gemini ahora para peatones y ciclistas
Google Maps

La compañía de Mountain View ha extendido las capacidades de su asistente de inteligencia artificial Gemini hacia nuevos contextos de movilidad urbana. Luego de la integración exitosa en navegación vehicular durante los últimos meses, Google Maps ahora permite que caminantes y ciclistas aprovechen la tecnología conversacional mientras se desplazan.

Esta expansión funcional ofrece a los usuarios la posibilidad de realizar consultas conversacionales en tiempo real sobre su entorno inmediato. Mediante comandos de voz o texto, es posible formular preguntas contextuales tales como: "¿Cuáles son los locales más valorados en esta zona?" o "¿En qué barrio me encuentro?". La inteligencia artificial proporciona recomendaciones personalizadas basadas en información de Maps y preferencias previas del usuario.

Read more