Skip to main content

DT en Español podría recibir una comisión si compras un producto desde el sitio

Microsoft mejora en gran manera el reconocimiento de voz

No eres el único que se agobia porque los robots de servicio al cliente no entienden lo que dices. Por eso, Microsoft está trabajando en mejorar el oído de estas máquinas.

Los investigadores de este gigante de la tecnología, lograron disminuir la tasa de error de reconocimiento de voz a solo 6.3%, de acuerdo a una investigación publicada la semana pasada.

Recommended Videos

Relacionado: ¡Cuida tus palabras! Algoritmo podría ahora detectar el sarcasmo en Redes Sociales

La empresa espera que este hito ayude a refinar y personalizar su asistente Cortana y el traductor simultáneo de Skype.

De acuerdo a Xuedong Huang, el Director Científico de reconocimiento de voz de Microsoft, esta tasa de errores es la más baja de la industria.

IBM había mejorado su software hasta obtener solamente un 6.6% de tasa de errores, pero claramente Microsoft lo ha sobrepasado. El año pasado, la tasa de error de sicha empresa era del 8% y hace dos décadas, era de más del 43% según indica un blog de Microsoft.

Durante el desarrollo de la inteligencia artificial, los investigadores han buscado equiparar las habilidades de las máquinas con las de los seres humanos como lo son el habla, la visión y el oído.

A pesar de que el logro de Microsoft está solamente 0.3% por debajo del de IBM, cada mejora es vista como un gran paso para lograr llegar a la misma capacidad del ser humano.

La tasa de error de los seres humanos con respecto al reconocimiento del habla es de alrededor del 4%, según indica IBM.

“Este hito beneficia un gran rango de tecnologías desarrolladas por la comunidad de científicos dedicados a la inteligencia artificial de diferentes organizaciones durante los últimos 20 años”, afirma Huang.

Algunas de estas tecnologías incluyen sistemas inspirados en la biología como lo son las redes neurales, una técnica de entrenamiento conocida como aprendizaje profundo, y la adopción de unidades de procesamiento gráfico (GPU) para procesar algortimos.

Durante los últimos dos años, las redes neurales y el aprendizaje profundo han permitido a los investigadores en inteligencia artificial desarollar y entrenar sistemas en reconocimiento de voz avanzado, reconocimiento de imágenes y procesamente natural del lenguaje.

El año pasado, Microsoft creó un sistema de reconocimiento de imágenes que resultó ser mejor que el de los seres humanos.

Relacionado: Escribir por voz es más rápido que teclear

A pesar de que fue diseñado inicialmente para las gráficas de las computadoras, los GPU son ahora utilizados para procesar algoritmos complejos. Cortana puede proccesar 10 veces más información utilizando GPU que a través de los métodos utilizados anteriormente, de acuerdo a Microsoft.

Con estos avances, es muy seguro que repetirle una frase a un robot por teléfono será un asunto del pasado.

Juliana Jara
Ex escritor de Digital Trends en Español
Juliana Jara es politóloga egresada de la Universidad ICESI de Cali, Colombia y decidió poco después estudiar una…
2 maneras de mejorar el rendimiento de los juegos en 75% en PCs viejos
El RTX 3060 instalado en una computadora.

Aunque su PC se está volviendo vieja, no tiene por qué significar que jugar a los juegos más nuevos esté fuera del pregunta. Mientras algunos características que mejoran del rendimiento fueron anteriormente reservada por personas que poseen una de las mejores GPU o uno de los mejores procesadores, los modders ahora han intervenido para cambiar esa narrativa.
Como resultado, un mod permite usar el DLSS 3 de Nvidia (o más bien, FSR 3 de AMD) en tarjetas gráficas mucho más viejo. ¿Confuso? No te preocupes, es mas fácil que parece y puedes usarlo para aumentar el rendimiento de los juegos de tu PC hasta de 75%.
DLSS es la revolucionaria tecnología de generación de fotogramas de Nvidia. Al menos en papel, está limitado a las tarjetas gráficas RTX serie 40. FSR 3 de AMD es la contraparte de DLSS 3 de Nvidia y es de código abierto, que significa que está disponible en muchas más tarjetas gráficas que la tecnología exclusiva de Nvidia. Al primera vista, se podría pensar que esto significaría que la generación de fotogramas debería estar disponible para una amplia gama de jugadores, pero no es así. Esto se debe que la adopción de FSR 3 ha sido muy lenta y, de hoy, sólo está disponible en cuatro juegos.
Básicamente, te permite ejecutar juegos con FSR 3 que de otro modo no podrían ejecutarse, no debido a limitaciones de la GPU, sino al hecho de que la función no está disponible en ese título en particular. ¿La parte divertida? Lo no funciona en GPU AMD.

Ejecutar el mod requiere inyectar archivos DLL en el directorio de un juego, editar el registro y, finalmente, habilitar la función en el juego. Todo eso hace que este FSR 3 disfrazado de DLSS 3 funcione y, según Digital Foundry, parece bastante brillante.
Probar el mod con varios juegos AAA, como Cyberpunk 2077, mostró un gran aumento de rendimiento en un RTX 3080. Con el mod en ejecución, el RTX 3080 pudo mantener más de 100 fotogramas por segundo (fps) a 1440p en el modo RT overdrive; sin él, alcanzó unos 60 a 70 fps menos impresionantes. Esto marca un aumento de hasta 67% a 1440p. El juego Spider-Man: Miles Morales obtuvo ganancias mayores, con un aumenta hasta 75%.
Desafortunadamente, usando esta combinación DLSS 3-slash-FSR 3 genera algunas desventajas, incluidos artefactos visuales y una mayor latencia. Estos problemas se han solucionado en su mayoría en juegos compatibles con FSR 3, pero que se trata solo de un mod, no es de raro que no sea perfecto. Mire el video de Digital Foundry si desea obtener más información sobre este mod y probarlo mismo.

Leer más
Cómo usar el asistente Amazon Alexa en tu teléfono
Cómo usar el asistente Amazon Alexa en tu teléfono.

La famosa Asistente Virtual de Amazon cada día puede hacer más y más cosas, y no es raro escuchar su voz en robots y aspiradoras, sin mencionar miles de aplicaciones de terceros que la usan para activarse con el reconocimiento de voz. Y aunque estas funciones de búsqueda por voz alguna vez se limitaron a unos pocos teléfonos, la aplicación de Alexa ahora habita en muchos dispositivos Android y iPhones. Si no sabes cómo activarla, en esta guía te lo explicamos.

También te podría interesar saber qué es Alexa y qué puede hacer por ti, cómo configurar un perfl de voz en Alexa o también algunas de las preguntas más raras y divertidas que le puedes haccer a Alexa.
Cómo configurar Alexa en Android o iPhone

Leer más
Microsoft hace un gran cambio en su teclado después de 30 años
microsoft tecla copilot teclado ken suarez 4ixpvkfgjgi unsplash

Uno de los cambios más grandes en su teclado tras 30 años está haciendo Microsoft y que va directamente de la mano de las nuevas directrices relacionadas con IA de Windows y la compañía.

Introducing a new Copilot key for Windows 11 PCs

Leer más