Si alguna vez te ocurrió que, al ver la imagen de un delicioso platillo de comida se te hace agua la boca y decides prepararlo en casa, pero te das cuenta que es solo una fotografía y no tiene una lista con los ingredientes, tal vez te preguntes si podría haber una manera de averiguarlos simplemente analizando la imagen.
Eso es lo que los investigadores del Instituto de Tecnología de Massachusetts también se preguntaron cuando se propusieron crear un algoritmo de aprendizaje profundo que podría predecir una receta basada sólo en una foto utilizando inteligencia artificial. Y parece que lo lograron.
La investigación publicada dio como resultado un programa llamado Pic2Recipe, un juego de palabras en inglés que se podría traducir como “de la foto a la receta”, y que puede predecir con bastante precisión la receta de un plato, basándose en una fotografía.
Si te parece interesante, no tienes que esperar hasta que se convierta en una aplicación completa para probarla. Una versión en línea ya permite subir imágenes para determinar sus ingredientes.
Los intentos anteriores de convertir las fotos en recetas fueron limitados por la disponibilidad de conjuntos de datos más pequeños, aunque «pequeño» es un término relativo, considerando todas las posibles recetas disponibles. Por ejemplo, un estudio utilizó 65,000 recetas, pero sólo incluyó la cocina tradicional china, y otro sólo alcanzó alrededor de un 50 por ciento de precisión en las pruebas iniciales.
Debido a que los algoritmos de aprendizaje profundo «aprenden» a medida que son alimentados con grandes cantidades de datos, estos programas resultantes tenían grandes lagunas en los ingredientes potenciales, afectando la precisión del programa.
Para crear una base de datos más grande, los investigadores del Laboratorio de Informática e Inteligencia Artificial del MIT (CSAIL) sabían que el software tendría que basarse en un amplio conjunto de datos. Así que para resolver esa situación, el equipo utilizó grandes conjuntos de fotos y recetas que ya existen en los sitios web de alimentos y recetas. Compilando datos de lugares como Food.com y All Recipes, el equipo creó Recipe1M, un conjunto de datos de más de un millón de recetas.
Usando esas recetas y las imágenes asociadas, el equipo pudo entrenar el software para utilizar el reconocimiento de objetos, para así reconocer cuáles podrían ser los ingredientes de cada plato. Con una lista de ingredientes, el sistema seleccionó la receta que mejor se ajustaba a la lista. Pic2Recipe fue capaz de reconocer ingredientes como harina, huevos, azúcar y mantequilla, entre otros. Se reportó que la tasa de éxito es del 65 por ciento.
El programa realmente no identifica la receta exacta de la foto, sino que crea una lista de ingredientes. Con esa lista, el programa puede pasar a través de esa base de datos de un millón de recetas y elegir la que contenga ingredientes que coincidan con la lista de la imagen elegida.
«En la tecnología de visión por computadora, el área de la comida es mayormente descuidada porque no tenemos los conjuntos de datos a gran escala necesarios para hacer predicciones», dijo Yusuf Aytar, un asociado de post doctorado que co-escribió el documento, junto al profesor del MIT Antonio Torralba. «Pero las fotos aparentemente inútiles en las redes sociales pueden proporcionar información valiosa sobre los hábitos saludables y las preferencias dietéticas».
Aunque este programa contiene un conjunto de datos más amplio que los intentos anteriores, todavía tiene algunas brechas. Los investigadores dijeron que tiene problemas con platos que son un poco más ambiguos, como “shakes” o batidos, y rollos de sushi. Recetas similares con una serie de variaciones diferentes, como la lasaña, o algunos guisos típicos latinoamericanos, por ejemplo, también tendían a confundir los resultados.
El grupo planea continuar desarrollando el programa y ampliar la capacidad para reconocer ingredientes y determinar el tipo específico de ingrediente que se debería usar en alguna receta.
El software podría tener una serie de diferentes usos en el mundo real. Por ejemplo, podrías tomar una foto en el plato que te sirvieron en algún restaurante para aprender cómo hacerlo en casa, o también para rastrear tu nutrición personal.