Skip to main content
  1. Home
  2. Computación
  3. Tendencias
  4. News

DT en Español podría recibir una comisión si compras un producto desde el sitio

Microsoft mejora en gran manera el reconocimiento de voz

Add as a preferred source on Google

No eres el único que se agobia porque los robots de servicio al cliente no entienden lo que dices. Por eso, Microsoft está trabajando en mejorar el oído de estas máquinas.

Los investigadores de este gigante de la tecnología, lograron disminuir la tasa de error de reconocimiento de voz a solo 6.3%, de acuerdo a una investigación publicada la semana pasada.

Recommended Videos

Relacionado: ¡Cuida tus palabras! Algoritmo podría ahora detectar el sarcasmo en Redes Sociales

La empresa espera que este hito ayude a refinar y personalizar su asistente Cortana y el traductor simultáneo de Skype.

De acuerdo a Xuedong Huang, el Director Científico de reconocimiento de voz de Microsoft, esta tasa de errores es la más baja de la industria.

IBM había mejorado su software hasta obtener solamente un 6.6% de tasa de errores, pero claramente Microsoft lo ha sobrepasado. El año pasado, la tasa de error de sicha empresa era del 8% y hace dos décadas, era de más del 43% según indica un blog de Microsoft.

Durante el desarrollo de la inteligencia artificial, los investigadores han buscado equiparar las habilidades de las máquinas con las de los seres humanos como lo son el habla, la visión y el oído.

A pesar de que el logro de Microsoft está solamente 0.3% por debajo del de IBM, cada mejora es vista como un gran paso para lograr llegar a la misma capacidad del ser humano.

La tasa de error de los seres humanos con respecto al reconocimiento del habla es de alrededor del 4%, según indica IBM.

“Este hito beneficia un gran rango de tecnologías desarrolladas por la comunidad de científicos dedicados a la inteligencia artificial de diferentes organizaciones durante los últimos 20 años”, afirma Huang.

Algunas de estas tecnologías incluyen sistemas inspirados en la biología como lo son las redes neurales, una técnica de entrenamiento conocida como aprendizaje profundo, y la adopción de unidades de procesamiento gráfico (GPU) para procesar algortimos.

Durante los últimos dos años, las redes neurales y el aprendizaje profundo han permitido a los investigadores en inteligencia artificial desarollar y entrenar sistemas en reconocimiento de voz avanzado, reconocimiento de imágenes y procesamente natural del lenguaje.

El año pasado, Microsoft creó un sistema de reconocimiento de imágenes que resultó ser mejor que el de los seres humanos.

Relacionado: Escribir por voz es más rápido que teclear

A pesar de que fue diseñado inicialmente para las gráficas de las computadoras, los GPU son ahora utilizados para procesar algoritmos complejos. Cortana puede proccesar 10 veces más información utilizando GPU que a través de los métodos utilizados anteriormente, de acuerdo a Microsoft.

Con estos avances, es muy seguro que repetirle una frase a un robot por teléfono será un asunto del pasado.

Juliana Jara
Former Digital Trends Contributor
Anthropic acusa a Alibaba de orquestar el mayor ataque de clonación a Claude
Text, Electronics, Mobile Phone

La empresa estadounidense de inteligencia artificial Anthropic ha encendido las alarmas en la industria tecnológica tras acusar al gigante chino Alibaba de haber ejecutado el mayor ataque de "destilación" jamás registrado contra su modelo Claude. Según una carta a la que Reuters tuvo acceso, la campaña se habría desarrollado entre el 22 de abril y el 5 de junio de 2026, generando más de 28,8 millones de interacciones a través de casi 25.000 cuentas fraudulentas.

La destilación, en el ámbito de la inteligencia artificial, es una técnica que consiste en entrenar un modelo menos avanzado utilizando los resultados de uno más potente. Cuando se realiza de manera legítima y con acuerdos explícitos, es una práctica reconocida. El problema surge cuando las respuestas del modelo objetivo se extraen de forma masiva y sin autorización, mediante cuentas falsas y métodos diseñados para eludir los límites contractuales de uso.

Read more
La Casa Blanca frena el lanzamiento de nuevo modelo de OpenAI por seguridad
Sam Altman en entrevista

El lanzamiento del nuevo modelo de inteligencia artificial de OpenAI, identificado como GPT 5.6, no seguirá el camino habitual de sus predecesores. Según reportó The Information, la administración del presidente Donald Trump presionó a la compañía para que, en lugar de una distribución pública masiva, el acceso inicial se limite a un grupo reducido de socios estratégicos.

En una reunión interna, el CEO Sam Altman explicó a sus empleados que el gobierno estaría "aprobando el acceso cliente por cliente" durante un período de vista previa. Altman también habría señalado que, si esta fase controlada transcurre sin contratiempos, el lanzamiento general podría ocurrir "un par de semanas después". Esta postura del gobierno contrasta con la retórica de manos libres que inicialmente caracterizó la posición de la administración Trump frente a la IA.

Read more
Tu PC con Windows 10 acaba de recibir un año extra de actualizaciones gratis
Computer, Electronics, Laptop

Si sigues usando Windows 10, Microsoft acaba de darte un poco de margen. La compañía ha ampliado discretamente su programa gratuito de Actualizaciones de Seguridad Extendidas para dispositivos de consumo por un año completo, posponiendo el nuevo límite hasta el 12 de octubre de 2027.

Lo sorprendente es que no hubo un gran anuncio. Microsoft simplemente actualizó su página de soporte de ESU y añadió una nota del editor en una entrada de blog de hace un año, y eso fue todo.

Read more