La tecnología de reconocimiento visual ha registrado grandes avances en los últimos años gracias a las redes neurales que permiten la identificación de objetos, rostros y puntos geográficos insignia, a veces con más detalle que el ojo humano. Ahora, más de esas características vendrán a los dispositivos móviles gracias MobileNets, una familia de modelos de visión computarizada de Google.
El gigante de Internet lanzó MobileNets como software de código abierto para que otros programadores la incorporen en sus aplicaciones. La plataforma está diseñada específicamente para que funcione en el hardware más pequeño de los dispositivos móviles, superando algunos de los mayores obstáculos para llevar el reconocimiento de imágenes a los teléfonos inteligentes. El programa no crea nuevas capacidades, pero lleva las imágenes computarizadas en un paquete lo suficientemente pequeño como para que funcionen en un dispositivo móvil sin necesidad de almacenar datos en la nube, lo que significa que las aplicaciones que utilizan la programación no necesitarían una conexión a Internet.
La herramienta de programación ofrece a los teléfonos inteligentes y tabletas la capacidad de reconocer objetos y personas o puntos geográficos populares. Google incluso menciona clasificaciones tan detalladas como la raza en particular de un perro entre los usos posibles para el programa.
Para los usuarios móviles, la liberación significa que las aplicaciones de terceros pronto podrán obtener nuevas o mejoradas funciones de generación de imágenes computacionales. Al ofrecer la plataforma en código abierto, Google la está dejando a disposición de potencialmente cualquier programador. La herramienta puede ampliarse para una serie de usos diferentes, desde búsquedas inversas de imágenes a realidad aumentada.
La capacidad de reconocer objetos y caras en una fotografía utilizando una red neuronal no es nueva, pero los MobileNets de Google son más eficientes, creando un programa más pequeño y más rápido para usar las funciones en dispositivos móviles, incluso cuando no hay una conexión a Internet disponible.
«Aunque muchas de estas tecnologías como el reconocimiento de objetos, marcas, logotipos y textos se proporcionan para los dispositivos conectados a Internet a través de la API Cloud Vision, creemos que el poder computacional de los dispositivos móviles puede permitir la entrega de estas tecnologías a las manos de nuestros usuarios, en cualquier momento, en cualquier lugar, independientemente de la conexión a Internet», escribieron en una entrada de blog Andrew Howard y Menglong Zhu, ambos ingenieros de software de Google.