Skip to main content

Escribir por voz es más rápido que teclear

preguntas para Siri
Imagen utilizada con permiso del titular de los derechos de autor
Dictarle a una computadora es ahora mucho mejor que hace una década. Pero, ¿qué tan mejor?

Ese es un cálculo que científicos de la Universidad de Stanford, de Washington y Baidu -el gigante chino de las búsquedas- deseaban conocer.

Relacionado: Escribe donde quieras, cuando quieras y sin necesidad de un teclado… Sólo con tus dedos

Por eso, crearon un experimento en el que como resultado final, los seres humanos terminaron siendo aplastados por las máquinas términos de velocidad y precisión.

El profesor de Ciencias Informáticas de la Universidad de Stanford, James Landay afirma que se le ocurrió hacer dicho estudio cuando estaba en un café con el profesor adjunto Andrew Ng., quien trabaja ahora en Baidu.

“Andrew mencionó que el reconocimiento de voz en Baidu estaba mejorando mucho pero que no conocían un experimento preciso para cuantificarlo”, afrma Landay a Digital Trends.

El software de reconocimiento de comandos de voz de Baidu llamado Deep Speech 2 está basado en una red neuronal de aprendizaje profundo. Es una máquina impresionante que es capaz de entrenarse a sí misma all analizar enormes bases de datos de comandos de voz.

“Antes, no teníamos los datos y las habilidades computacionales para construir estos modelos en los cuales la computadora pudiera reconocer diferentes acentos y patrones de habla”, afirma Landay.

Poco después, la conversación casual entre Landay y Ng se transformó en un experimento que funcionaba a toda marcha.

Los participantes hablaban en chino o en inglés. Todos los participantes habían crecido en un contexto donde es usual enviar mensajes de texto y todos estaban utilizando el teclado estándar de un iPhone.

Quienes hablaban inglés, utilizaban entonces el teclado QWERTY, mientras que los chinos utlizaban el teclado Pinyin de Apple.

En ambos casos, el reconocimiento de voz podía escribir tres veces más rápido que los seres humanos.

También, la tasa de error fue 20.4% más baja en inglés y 63.4% más baja para el mandarín.

“Mi expectativa era que los comandos de voz fueran más rápidos”, afirma Landay. “Sabemos esto porque uno puede hablar más rápido que escribir. El probema era que en el pasado los comandos de voz tenían muchos errores y generaban una demora (…) Lo que no esperaba era que fuera tres veces más rápido”, añade.

El teclado Flesky es el más rápido y batió récords al escribir una frase de 124 palabras en solo 18.44 segundos.

Relacionado: El nuevo teclado de Google es lo primero que vas a querer descargar en tu iPhone

En este caso, se utilizado el teclado de un iPhone porque daba una herramienta estándar y “la mayoría de gente no se toma el tiempo de aprender a manejar teclados alternativos”, afirma.

Lo siguientes progresos incluirán reconocimiento de nombres y mejor reconocimiento de vos en lugares ruidosos.

Juliana Jara
Ex escritor de Digital Trends en Español
Juliana Jara es politóloga egresada de la Universidad ICESI de Cali, Colombia y decidió poco después estudiar una…
AMD acaba de lanzar una herramienta gratuita que todos los jugadores serios de PC deberían tener
amd lanza herramienta gratuita jugadores pc frame latency meter

AMD acaba de presentar Frame Latency Meter (FLM), una utilidad de Windows de código abierto diseñada para medir el tiempo de respuesta de los juegos en función de los movimientos del mouse. FLM mide el tiempo que tarda un movimiento del ratón en traducirse en un nuevo fotograma en la pantalla, lo que proporciona información sobre el rendimiento del sistema.

Esta herramienta está especialmente dirigida a jugadores avanzados, usuarios avanzados y desarrolladores de juegos que desean optimizar la latencia de todo el sistema o reducir el retraso de entrada. Si no estás familiarizado con las mediciones de latencia de fotogramas, normalmente se utilizan en línea para aproximar el retraso de entrada midiendo la latencia de botón a píxel.

Leer más
La Google Play Store cambia para siempre e integra la IA
google play store cambia para siempre e integra ia

There’s a new way to Play

Un paso a la era de 2024 está dando la Google Play Store, ya que este 24 de julio anunció cambios sustanciales e integración de personalización, colecciones y uso de IA para dar mayor vitalidad a las búsquedas.

Leer más
CrowdStrike ya tiene un culpable por el apagón y acá lo expone
crowdstrike culpable apagon

La gente de CrowdStrike todavía se siguen castigando por los errores que causaron la temida pantalla azul de la muerte de Windows y que acabó con un apagón mundial de varios sistemas de servicios esenciales como aeropuertos, supermercados y bancos.

Y ahora la compañía de seguridad acaba de descubrir dónde está el culpable de la falla de la interrupción masiva de BSOD:

Leer más