Skip to main content
  1. Home
  2. Android
  3. Noticias
  4. News

Gemini ahora transcribirá tus audios a la velocidad de la luz

Add as a preferred source on Google
Cómo grabar llamadas en un iPhone
fizkes/Getty Images / DTES

Una de las tareas más tediosas que tienen los periodistas es la transcripción de audios de las entrevistas. Escuchar una cinta o un archivo y extraer toda una conversación. Pero Gemini hará que esta labor se simplifique al máximo con IA, ya que está consiguiendo un soporte para archivos MP3, WAV, FLAC o M4A.

Josh Woodward, jefe de Google Labs y de la app de Gemini, publicó en X (Twitter) que el soporte para audios era la característica más pedida por el público. Así que si quieres probar la nueva herramienta, ya puedes hacerlo desde la web a través de gemini.google.com, o en las aplicaciones para iOS y Android.

Recommended Videos

De modo que a partir de ahora puedes cargar grabaciones de audio en tus chats con Gemini para que esta las resuma o transcriba a partir de una instrucción. 

Cómo cargar y transcribir audios a través de Gemini

Si usas Gemini desde el laptop a través de su web, puedes cargar un archivo de audio pulsando en el ícono «+» y tocando en Subir archivos. Allí solo tienes que seleccionar el elemento en cuestión y puedes añadir la instrucción que desees para que el chatbot la implemente. Así, si junto con la grabación le dices «Transcríbela», la inteligencia artificial se encargará de ofrecerte una versión en texto del contenido.

En las apps para Android o iPhone, el funcionamiento es prácticamente idéntico. Solo tienes que tocar en «+» y luego en Archivos. Allí debes localizar el audio a analizar, y el resto del proceso es el mismo. También puedes formular las instrucciones en formato de pregunta («¿Sobre qué trata este audio?», por ejemplo), o solicitarle que genere un resumen si se trata de un archivo muy extenso.

Otro punto a considerar es que si usas la versión gratuita de Gemini podrás procesar audios de hasta 10 minutos de duración. Si tienes alguna de las versiones de pago, como Google AI Pro o Google AI Ultra, la extensión total se expande hasta las 3 horas. Asimismo, los archivos pueden tener un peso máximo de 100 MB y los de Mountain View indican que se pueden cargar hasta 10 archivos en un mismo prompt. En el caso de que estén comprimidos, también se pueden subir hasta 10 archivos por ZIP.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Android Auto 16: capacidades de IA, nueva interfaz y todo lo que trae
Machine, Wheel, Transportation

Google ha desplegado oficialmente Android Auto 16, una actualización sustancial que redefine la manera en que los conductores interactúan con sus vehículos. Aunque la versión inicial no introduce transformaciones radicales, sí establece las bases para una evolución significativa del sistema de conducción conectado, modernizando la interfaz y preparando el terreno para funcionalidades de inteligencia artificial que llegarán en los próximos meses.

La actualización ya se encuentra disponible y ha comenzado su distribución gradual a usuarios de todo el mundo. Entre sus características inmediatas se destaca un rediseño integral del reproductor multimedia, que ahora presenta una interfaz considerablemente más limpia, intuitiva y accesible. Los controles se han reorganizado estratégicamente, aumentando su tamaño y mejorando su distribución espacial, lo que facilita significativamente la operación mientras se conduce.

Read more
Android 16 incorpora análisis forense para detectar cuando te hackean
Electronics, Phone, Mobile Phone

Google presentó Intrusion Logging, una función de seguridad revolucionaria diseñada para ayudar a usuarios de alto riesgo a detectar si sus dispositivos Android han sido comprometidos por atacantes sofisticados. La característica, que formará parte de Android 16, cifra y respalda registros de actividad en la nube de forma inviolable.

La función está orientada específicamente hacia profesionales expuestos a riesgos elevados: periodistas, funcionarios públicos, empresarios y trabajadores gubernamentales que manejan información sensible. Estos actores a menudo son blanco de campañas cibernéticas avanzadas que van más allá de intentos simples de phishing.

Read more
La particular historia del nombre Nano Banana: quién inspiró todo
Banana, Food, Fruit

En las coordenadas exactas donde convergen la creatividad y la urgencia laboral, nació "Nano Banana", el nombre más memorables de un modelo de inteligencia artificial en años recientes. Lo que comenzó como un proceso convencional de denominación técnica en Google DeepMind evolucionó hacia una identidad que conquistó las redes sociales y transformó la percepción pública sobre herramientas de edición de imágenes asistida por IA.

El origen del nombre posee un encanto particular. A las 2:30 de la madrugada, cuando el plazo de envío al portal LMArena resultaba inminente, Naina Raisinghani, gerente de producto, improvisó una solución basada en sus apodos personales: "Naina Banana" (como la llamaban algunos amigos) y "Nano" (término que sus colegas utilizaban refiriéndose a su estatura y su afinidad por la computación). La fusión de ambas denominaciones resultó en "Nano Banana", un acertijo semántico que contradecía toda lógica corporativa de branding, pero que capturó la esencia del producto: compacto, poderoso y sorprendentemente efectivo.

Read more