Skip to main content

¿Fotografía del futuro? Sony lanza sensores de imagen con IA

Hace mucho tiempo que diversas compañías vienen trabajando ese concepto de «revolucionar la fotografía» y volverla cada vez más real y predictiva, sin embargo, Sony ha dado un paso concreto en esa línea, luego de anunciar el próximo lanzamiento de dos modelos de sensores de visión inteligentes, que serán los primeros del mundo equipados con la funcionalidad de procesamiento con inteligencia artificial (IA).

Esta nueva función en el sensor de imagen en sí mismo permite el procesamiento de IA de alta velocidad y la extracción de solo los datos necesarios, lo que, cuando se utilizan servicios en la nube, reduce la latencia de transmisión de datos, aborda problemas de privacidad y reduce el consumo de energía y los costos de comunicación.

Sony promete que «estos productos amplían las oportunidades para desarrollar cámaras equipadas con IA, lo que permite una amplia gama de aplicaciones en las industrias de equipos minoristas e industriales y contribuye a construir sistemas óptimos que se vinculan con la nube».

Intelligent Vision Sensor

Los modelos de sensores son los siguientes:

  • IMX500 tipo 1 / 2.3 (7,857 mm diagonal) aprox. Sensor de visión inteligente de 12.3 megapíxeles efectivos (producto con chip desnudo).
  • IMX501 tipo 1 / 2.3 (7.857 mm diagonal) aprox. Sensor de visión inteligente de 12.3 megapíxeles efectivos (producto empaquetado).

Los nuevos productos de sensores presentan una configuración apilada que consiste en un chip de píxeles y un chip lógico. El sensor genera metadatos (información semántica que pertenece a los datos de la imagen) en lugar de información de la imagen, lo que reduce el volumen de datos y aborda las preocupaciones de privacidad. Además, la capacidad de IA permite ofrecer diversas funciones para aplicaciones versátiles, como el seguimiento de objetos en tiempo real con procesamiento de IA de alta velocidad.

Características de estos sensores

  • El chip de píxeles está retroiluminado y tiene aproximadamente 12,3 megapíxeles efectivos para capturar información en un amplio ángulo de visión. Además del circuito de operación del sensor de imagen convencional, el chip lógico está equipado con el DSP (Procesador de señal digital) original de Sony dedicado al procesamiento de señal IA. Esta configuración elimina la necesidad de procesadores de alto rendimiento o memoria externa, por lo que es ideal para sistemas de IA de última generación.
  • Las señales adquiridas por el chip de píxeles se ejecutan a través de un ISP (Procesador de señal de imagen) y el procesamiento de AI se realiza en la etapa de proceso en el chip lógico, y la información extraída se genera como metadatos, lo que reduce la cantidad de datos manejados.
  • Cuando se graba un video usando un sensor de imagen convencional, es necesario enviar datos para cada cuadro de imagen de salida individual para el procesamiento de IA, lo que resulta en una mayor transmisión de datos y dificulta el rendimiento en tiempo real.
  • Los usuarios pueden escribir los modelos de IA de su elección en la memoria integrada y pueden reescribirlos y actualizarlos de acuerdo con sus requisitos o las condiciones de la ubicación donde se utiliza el sistema. Por ejemplo, cuando se instalan varias cámaras que emplean este producto en una tienda minorista, se puede usar un solo tipo de cámara con versatilidad en diferentes ubicaciones, circunstancias, tiempos o propósitos.

Recomendaciones del editor

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Meta debuta con Code Llama: su herramienta de escritura de código IA
Crea presentaciones usando la IA con estas 3 herramientas.

Siguiendo con su incursión en IA, Meta presentó su Code Llama, su nueva herramienta de escritura de código. Utilizará la misma licencia comunitaria que Llama 2 y es gratuito para investigación y uso comercial.
Code Llama, dijo Meta, puede crear cadenas de código a partir de mensajes o completar y depurar código cuando se apunta a una cadena de código específica. Además del modelo base de Code Llama, Meta lanzó una versión especializada en Python llamada Code Llama-Python y otra versión llamada Code Llama-Instrct, que puede entender instrucciones en lenguaje natural. Según Meta, cada versión específica de Code Llama no es intercambiable, y la compañía no recomienda el Code Llama base o Code Llama-Python para instrucciones en lenguaje natural.

"Los programadores ya están utilizando LLM para ayudar en una variedad de tareas, que van desde escribir nuevo software hasta depurar el código existente", dijo Meta en una publicación de blog. "El objetivo es hacer que los flujos de trabajo de los desarrolladores sean más eficientes para que puedan centrarse en los aspectos más centrados en el ser humano de sus trabajos".
La compañía dijo que Code Llama obtuvo un 53,7 por ciento en el punto de referencia de código HumanEval y pudo escribir con precisión código basado en una descripción de texto.
Meta lanzará tres tamaños de Code Llama y dijo que su tamaño más pequeño cabe en una sola GPU para proyectos de baja latencia.

Leer más
Nuevo mod de Grand Theft Auto V tiene elenco de NPC con voz de IA
mod grand theft auto v elenco npc ia gta

Un nuevo mod de PC para Grand Theft Auto V añade una nueva misión con más de 30 NPCs cuyas respuestas y voces son generadas por IA.

El mod se llama Sentient Streets y fue creado por un modder que se llama Bloc. En él, los jugadores son un oficial de policía de Los Santos que investiga un culto llamado NihiAIists, que piensan que viven en un mundo de juego y adoran a un dios de la IA. Durante esta investigación, los jugadores pueden hablar con más de 30 NPC, pero estas conversaciones no están escritas, y Bloc no contrató actores de voz profesionales para interpretar a estos personajes. En cambio, Sentient Streets utiliza IA para crear tanto las respuestas de los NPC como sus voces. Para hacer este mod, Bloc utilizó el motor de personajes de Inworld y ElevenLabs, dos compañías tecnológicas que invirtieron fuertemente en IA.

Leer más
La IA ahora roba tus contraseñas con casi el 100% de precisión
Imagen típica de un hacker con una laptop para aprender a cómo saber si tu celular ha sido hackeado

DT
Investigadores de la Universidad de Cornell han descubierto una nueva forma en que las herramientas de IA roban sus datos: las pulsaciones de teclas. Un nuevo trabajo de investigación detalla un ataque impulsado por IA que puede robar contraseñas con hasta un 95% de precisión al escuchar lo que escribe en su teclado.

Los investigadores lograron esto entrenando un modelo de IA sobre el sonido de las pulsaciones de teclas y desplegándolo en un teléfono cercano. El micrófono integrado escuchó las pulsaciones de teclas en una MacBook Pro y pudo reproducirlas con una precisión del 95%, la precisión más alta que los investigadores han visto sin el uso de un modelo de lenguaje grande.

Leer más