Dictarle a una computadora es ahora mucho mejor que hace una década. Pero, ¿qué tan mejor?
Ese es un cálculo que científicos de la Universidad de Stanford, de Washington y Baidu -el gigante chino de las búsquedas- deseaban conocer.
Relacionado: Escribe donde quieras, cuando quieras y sin necesidad de un teclado… Sólo con tus dedos
Por eso, crearon un experimento en el que como resultado final, los seres humanos terminaron siendo aplastados por las máquinas términos de velocidad y precisión.
El profesor de Ciencias Informáticas de la Universidad de Stanford, James Landay afirma que se le ocurrió hacer dicho estudio cuando estaba en un café con el profesor adjunto Andrew Ng., quien trabaja ahora en Baidu.
“Andrew mencionó que el reconocimiento de voz en Baidu estaba mejorando mucho pero que no conocían un experimento preciso para cuantificarlo”, afrma Landay a Digital Trends.
El software de reconocimiento de comandos de voz de Baidu llamado Deep Speech 2 está basado en una red neuronal de aprendizaje profundo. Es una máquina impresionante que es capaz de entrenarse a sí misma all analizar enormes bases de datos de comandos de voz.
“Antes, no teníamos los datos y las habilidades computacionales para construir estos modelos en los cuales la computadora pudiera reconocer diferentes acentos y patrones de habla”, afirma Landay.
Poco después, la conversación casual entre Landay y Ng se transformó en un experimento que funcionaba a toda marcha.
Los participantes hablaban en chino o en inglés. Todos los participantes habían crecido en un contexto donde es usual enviar mensajes de texto y todos estaban utilizando el teclado estándar de un iPhone.
Quienes hablaban inglés, utilizaban entonces el teclado QWERTY, mientras que los chinos utlizaban el teclado Pinyin de Apple.
En ambos casos, el reconocimiento de voz podía escribir tres veces más rápido que los seres humanos.
También, la tasa de error fue 20.4% más baja en inglés y 63.4% más baja para el mandarín.
“Mi expectativa era que los comandos de voz fueran más rápidos”, afirma Landay. “Sabemos esto porque uno puede hablar más rápido que escribir. El probema era que en el pasado los comandos de voz tenían muchos errores y generaban una demora (…) Lo que no esperaba era que fuera tres veces más rápido”, añade.
El teclado Flesky es el más rápido y batió récords al escribir una frase de 124 palabras en solo 18.44 segundos.
Relacionado: El nuevo teclado de Google es lo primero que vas a querer descargar en tu iPhone
En este caso, se utilizado el teclado de un iPhone porque daba una herramienta estándar y “la mayoría de gente no se toma el tiempo de aprender a manejar teclados alternativos”, afirma.
Lo siguientes progresos incluirán reconocimiento de nombres y mejor reconocimiento de vos en lugares ruidosos.