Skip to main content

El nuevo kit AIY Vision de Google reconocerá las imágenes en tu proyecto

Google-AIY-Vision-Kit
Imagen utilizada con permiso del titular de los derechos de autor
Después del éxito obtenido con el AIY Voice Kit, un kit de desarrollo de AIY Projects ideado para que los creadores puedan integrar capacidades de reconocimiento de voz en sus proyectos, Google anunció un nuevo kit AIY Vision basado en el tablero Raspberry Pi Zero W, el cual proporciona los medios para que tu proyecto incluya el reconocimiento de imágenes sin la necesidad de una conexión con la nube.

Según Google, el kit incluye un software que admite tres modelos de redes neuronales independientes. Un modelo puede detectar personas, gatos y perros, mientras que otro se especializa en caras y sus expresiones. Por su parte, el tercer modelo es capaz de reconocer miles de objetos comunes. Lo mejor de todo, es que estos tipos de redes neuronales pueden ser entrenados por ti mismo a través de la herramienta basada en TensorFlow, la cual está integrada en el software.

«También ofrecemos una API de Python que te da la capacidad de cambiar los colores de los botones RGB, ajustar los sonidos del elemento piezoeléctrico y acceder a los cuatro pines GPIO», dijo Google.

Esta computadora autónoma además de estar formada por la placa Raspberry Pi Zero W de sólo $10 dólares, consta de un procesador de un solo núcleo, 512 MB de memoria, conectividad Wireless N, Bluetooth 4.1 y varios conectores. De igual forma, el panel de accesorios incluido «VisionBonnet» que incluye el chip de procesamiento de visión Movidius MA2450 de Intel se enlaza al conector de la cámara CSI de la Raspberry Pi mediante un cable flexible.

Las instrucciones de ensamblaje muestran que estas dos tablas están intercaladas mediante el cabezal de 40 pines del Raspberry Pi y aseguradas en su lugar mediante separadores de plástico. Asimismo, la cámara Raspberry Pi de $30 dólares, se conecta a una ranura especial en el marco de cartón interno del kit, y luego se adiciona al conector de la cámara CSI en la placa VisionBonnet a través de un cable flexible. Por supuesto, en algún momento, todo este dispositivo base debe incluirse en una carcasa de cartón adicional que contiene una luz LED, lente de cámara y montura de trípode.

Si quieres uno de estos kits, desde ya puedes pre ordenarlos a través de Micro Center por un precio de $45 dólares, aunque no podrás disfrutar de él hasta el 31 de diciembre. El único inconveniente es que el kit de Google no incluye la placa Raspberry Pi Zero W, la Raspberry Pi Camera 2, o la tarjeta Micro SD requerida.

Así que, si estás pensando en armar tu kit completo de Google, incluyendo el dispositivo completo de reconocimiento de imágenes para tu proyecto, necesitarás gastar aproximadamente $85 dólares. Si, por otro lado, quieres agregar el kit de voz AIY de Google para reconocer personas, animales, objetos y voces, tendrás que invertir otros $25 dólares, que no incluyen la placa requerida de $35 dólares Raspberry Pi 3, o la tarjeta SD necesaria para almacenar el sistema operativo y el software de reconocimiento de voz.

Pero la gran pregunta es: ¿Qué tantas cosas puedes hacer con el reconocimiento de imágenes? Según Google, con esta herramienta, el kit podrá ser capaz de detectar cuando tu perro se acerca a la puerta trasera, hacer sonar una alarma cuando tu hermano se arrastre a tu habitación y hasta ser testigo de las reacciones de tus vecinos cuando intentan escuchar lo que pasa en tu casa.

Definitivamente este kit parece bien divertido y útil, sin embargo ¿estarías dispuesto a invertir $85 dólares adicionales?

María Lopes
María Teresa nació en Falcón, Venezuela. Es comunicadora social de profesión y afición, especialista en Periodismo…
AMD acaba de lanzar una herramienta gratuita que todos los jugadores serios de PC deberían tener
amd lanza herramienta gratuita jugadores pc frame latency meter

AMD acaba de presentar Frame Latency Meter (FLM), una utilidad de Windows de código abierto diseñada para medir el tiempo de respuesta de los juegos en función de los movimientos del mouse. FLM mide el tiempo que tarda un movimiento del ratón en traducirse en un nuevo fotograma en la pantalla, lo que proporciona información sobre el rendimiento del sistema.

Esta herramienta está especialmente dirigida a jugadores avanzados, usuarios avanzados y desarrolladores de juegos que desean optimizar la latencia de todo el sistema o reducir el retraso de entrada. Si no estás familiarizado con las mediciones de latencia de fotogramas, normalmente se utilizan en línea para aproximar el retraso de entrada midiendo la latencia de botón a píxel.

Leer más
La Google Play Store cambia para siempre e integra la IA
google play store cambia para siempre e integra ia

There’s a new way to Play

Un paso a la era de 2024 está dando la Google Play Store, ya que este 24 de julio anunció cambios sustanciales e integración de personalización, colecciones y uso de IA para dar mayor vitalidad a las búsquedas.

Leer más
CrowdStrike ya tiene un culpable por el apagón y acá lo expone
crowdstrike culpable apagon

La gente de CrowdStrike todavía se siguen castigando por los errores que causaron la temida pantalla azul de la muerte de Windows y que acabó con un apagón mundial de varios sistemas de servicios esenciales como aeropuertos, supermercados y bancos.

Y ahora la compañía de seguridad acaba de descubrir dónde está el culpable de la falla de la interrupción masiva de BSOD:

Leer más