Skip to main content

El fallo imperdonable de Google Gemini con la generación de imágenes

Un problema mayúsculo ha debido enfrentar Google en las últimas horas por causa de la generación de imágenes de su IA, Gemini.

Todo después que el generador pusiera imágenes de los soldados alemanes de la Segunda Guerra Mundial y a los vikingos como personas de color.

Digitaltrends Mediagroup

La compañía de tecnología dijo que dejaría de generar imágenes de personas con el modelo Gemini después de que los usuarios de las redes sociales publicaran ejemplos de imágenes generadas por la herramienta que representaban a algunas figuras históricas, incluidos los papas y los padres fundadores de Estados Unidos, en una variedad de etnias y géneros.

Imagen utilizada con permiso del titular de los derechos de autor

«Ya estamos trabajando para abordar los problemas recientes con la función de generación de imágenes de Gemini. Mientras hacemos esto, vamos a pausar la generación de imágenes de las personas y pronto volveremos a lanzar una versión mejorada», dijo Google en un comunicado.

Recommended Videos

Jack Krawczyk, director senior del equipo Gemini de Google, admitió el miércoles que el generador de imágenes del modelo necesitaba ajustes.

«Estamos trabajando para mejorar este tipo de representaciones de inmediato», dijo. «La generación de imágenes de IA de Gemini genera una amplia gama de personas. Y eso es generalmente algo bueno porque la gente de todo el mundo lo usa. Pero aquí no está dando en el blanco».

We're already working to address recent issues with Gemini's image generation feature. While we do this, we're going to pause the image generation of people and will re-release an improved version soon. https://t.co/SLxYPGoqOZ

— News from Google (@NewsFromGoogle) February 22, 2024

Krawczyk agregó en un comunicado en X que los principios de IA de Google comprometieron sus herramientas de generación de imágenes a «reflejar nuestra base global de usuarios». Agregó que Google continuaría haciendo esto para las solicitudes de imágenes «abiertas», como «una persona paseando a un perro», pero reconoció que las solicitudes de respuesta con un sesgo histórico necesitaban más trabajo.

«Los contextos históricos tienen más matices y los ajustaremos aún más para adaptarnos a eso», dijo.

https://twitter.com/JackK/status/1760334258722250785?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1760334258722250785%7Ctwgr%5E4b4c197edef2eed2593880900086bd11ceb687da%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fwww.theguardian.com%2Ftechnology%2F2024%2Ffeb%2F22%2Fgoogle-pauses-ai-generated-images-of-people-after-ethnicity-criticism

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Google contraataca ante Sora de OpenAI con Veo 2
google veo 2 rival sora openai

La división DeepMind de Google presentó el lunes su modelo de generación de video Veo de segunda generación, que puede crear clips de hasta dos minutos de duración y con resoluciones que alcanzan la calidad 4K, es decir, seis veces la duración y cuatro veces la resolución de los clips de 20 segundos / 1080p que Sora puede generar.

Por supuesto, esos son los límites superiores teóricos de Veo 2. Actualmente, el modelo solo está disponible en VideoFX, la plataforma experimental de generación de video de Google, y sus clips tienen un límite de ocho segundos y una resolución de 720p. VideoFX también está en lista de espera, por lo que no cualquiera puede iniciar sesión para probar Veo 2, aunque la compañía anunció que ampliará el acceso en las próximas semanas. Un portavoz de Google también señaló que Veo 2 estará disponible en la plataforma Vertex AI una vez que la compañía pueda escalar suficientemente las capacidades del modelo.

Leer más
Gemini 2.0: Google presenta su IA más avanzada hasta la fecha
gemini 20 nuevo modelo ia google 2 0

Google presentó este miércoles 11 de diciembre Gemini 2.0, el último modelo de IA de la compañía y el más capaz hasta el momento, diseñado en la era de los agentes autónomos de IA. Los nuevos avances multimodales permiten construir agentes que pueden pensar, recordar y tomar acciones guiados por las personas.
Basados en todos los adelantos de Gemini 1.0 -lanzado hace un año-, Gemini 2.0 mejora su rendimiento, e incluye nuevas capacidades, como la generación nativa de imágenes y audio multilingüe y el uso nativo de herramientas inteligentes, que se conectan directamente a productos de Google como el Buscador y hasta puede ejecutar código. Estas funciones hacen posible construir agentes que pueden pensar, recordar, planificar e incluso tomar acciones.
De esta forma, Gemini 2.0 impulsará nuevas experiencias de IA en todos los productos de Google, haciéndolos más útiles e intuitivos para todos y todas.

Gemini 2.0 trae estas nuevas características

Leer más
El Pixel Drop de diciembre 2024 de Google llega con nuevas funciones
pixel drop diciembre 2024 google

Es diciembre, y eso significa una gran actualización nueva para tu teléfono Android, así como aún más cosas si eres usuario de Google Pixel.

Google está lanzando oficialmente su Pixel Drop de diciembre de 2024, y hay mucho que repasar. Desde nuevas funciones para todos los usuarios de Android hasta algunas cosas exclusivas de Pixels, aquí está la verdad sobre las novedades.
Nuevas funciones para todos los usuarios de Android
Google (en inglés)
Una de las mayores novedades que ahora está disponible para todos los usuarios de Android son los subtítulos expresivos. Esta función captura automáticamente la intensidad y el tono emocional de cómo alguien está hablando, solo a partir del volumen, el tono y los sonidos en lugar de las palabras. Por ejemplo, estos subtítulos expresivos pueden describir algo como: "El susurro de un secreto jugoso, los vítores y aplausos de una gran victoria, y los gemidos después de una broma de papá". Los subtítulos expresivos estarán disponibles en todo el sistema en todas las aplicaciones.

Leer más