Skip to main content
  1. Home
  2. Android
  3. Noticias
  4. News

Gemini ahora transcribirá tus audios a la velocidad de la luz

Add as a preferred source on Google
Cómo grabar llamadas en un iPhone
fizkes/Getty Images / DTES

Una de las tareas más tediosas que tienen los periodistas es la transcripción de audios de las entrevistas. Escuchar una cinta o un archivo y extraer toda una conversación. Pero Gemini hará que esta labor se simplifique al máximo con IA, ya que está consiguiendo un soporte para archivos MP3, WAV, FLAC o M4A.

Josh Woodward, jefe de Google Labs y de la app de Gemini, publicó en X (Twitter) que el soporte para audios era la característica más pedida por el público. Así que si quieres probar la nueva herramienta, ya puedes hacerlo desde la web a través de gemini.google.com, o en las aplicaciones para iOS y Android.

Recommended Videos

De modo que a partir de ahora puedes cargar grabaciones de audio en tus chats con Gemini para que esta las resuma o transcriba a partir de una instrucción. 

Cómo cargar y transcribir audios a través de Gemini

Si usas Gemini desde el laptop a través de su web, puedes cargar un archivo de audio pulsando en el ícono «+» y tocando en Subir archivos. Allí solo tienes que seleccionar el elemento en cuestión y puedes añadir la instrucción que desees para que el chatbot la implemente. Así, si junto con la grabación le dices «Transcríbela», la inteligencia artificial se encargará de ofrecerte una versión en texto del contenido.

En las apps para Android o iPhone, el funcionamiento es prácticamente idéntico. Solo tienes que tocar en «+» y luego en Archivos. Allí debes localizar el audio a analizar, y el resto del proceso es el mismo. También puedes formular las instrucciones en formato de pregunta («¿Sobre qué trata este audio?», por ejemplo), o solicitarle que genere un resumen si se trata de un archivo muy extenso.

Otro punto a considerar es que si usas la versión gratuita de Gemini podrás procesar audios de hasta 10 minutos de duración. Si tienes alguna de las versiones de pago, como Google AI Pro o Google AI Ultra, la extensión total se expande hasta las 3 horas. Asimismo, los archivos pueden tener un peso máximo de 100 MB y los de Mountain View indican que se pueden cargar hasta 10 archivos en un mismo prompt. En el caso de que estén comprimidos, también se pueden subir hasta 10 archivos por ZIP.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
NotebookLM lleva sus resúmenes en video a Android e iOS
NotebookLM

Google está ampliando el alcance de NotebookLM, su herramienta de investigación y síntesis de contenidos, con la llegada de la función de “Video Overview” a las aplicaciones móviles de Android e iOS. Hasta ahora disponible en la versión web, esta característica permite generar videos explicativos que resumen documentos, páginas web u otras fuentes cargadas por el usuario, apoyándose en los modelos Gemini.

Con la última actualización, los usuarios pueden abrir la app de NotebookLM en su teléfono, ir a la lista de cuadernos y tocar el botón “Studio” —identificado con un ícono de varita mágica— para acceder al nuevo menú creativo. Desde allí es posible elegir la opción Video Overview y pedirle al sistema que produzca un video que condense el material seleccionado, ya sea para estudiar, preparar presentaciones o repasar información compleja de forma más amena.

Read more
Apple y Google App Stores están infestadas de apps de IA nudificantes
Head, Person, Face

Tendemos a pensar en la Apple App Store y Google Play Store como "jardines amurallados" digitales: espacios seguros y curados donde el contenido peligroso o turbio se filtra mucho antes de llegar a nuestras pantallas. Pero un nuevo análisis sombrío del Proyecto de Transparencia Tecnológica (TTP) sugiere que las paredes tienen grietas serias. El informe revela una realidad preocupante: ambos grandes escaparates están actualmente infestados de decenas de aplicaciones de "nudify" impulsadas por IA. No son herramientas oscuras ocultas en la dark web; Están ahí, a la vista, permitiendo que cualquiera haga una foto inocente de una persona y le quite la ropa digitalmente sin su consentimiento.

A principios de este año, la conversación sobre esta tecnología alcanzó su punto álgido cuando la IA de Elon Musk, Grok, fue sorprendida generando imágenes sexualizadas similares en la plataforma X. Pero mientras Grok se convirtió en el foco de la indignación pública, la investigación del TTP muestra que fue solo la punta del iceberg. Una simple búsqueda de términos como "desnudarse" o "nudify" en las tiendas de aplicaciones arroja una larga lista de programas diseñados específicamente para crear pornografía deepfake no consensuada.

Read more
Google Maps incorpora la IA de Gemini ahora para peatones y ciclistas
Google Maps

La compañía de Mountain View ha extendido las capacidades de su asistente de inteligencia artificial Gemini hacia nuevos contextos de movilidad urbana. Luego de la integración exitosa en navegación vehicular durante los últimos meses, Google Maps ahora permite que caminantes y ciclistas aprovechen la tecnología conversacional mientras se desplazan.

Esta expansión funcional ofrece a los usuarios la posibilidad de realizar consultas conversacionales en tiempo real sobre su entorno inmediato. Mediante comandos de voz o texto, es posible formular preguntas contextuales tales como: "¿Cuáles son los locales más valorados en esta zona?" o "¿En qué barrio me encuentro?". La inteligencia artificial proporciona recomendaciones personalizadas basadas en información de Maps y preferencias previas del usuario.

Read more