Skip to main content

Escribir por voz es más rápido que teclear

preguntas para Siri
Imagen utilizada con permiso del titular de los derechos de autor
Dictarle a una computadora es ahora mucho mejor que hace una década. Pero, ¿qué tan mejor?

Ese es un cálculo que científicos de la Universidad de Stanford, de Washington y Baidu -el gigante chino de las búsquedas- deseaban conocer.

Relacionado: Escribe donde quieras, cuando quieras y sin necesidad de un teclado… Sólo con tus dedos

Por eso, crearon un experimento en el que como resultado final, los seres humanos terminaron siendo aplastados por las máquinas términos de velocidad y precisión.

El profesor de Ciencias Informáticas de la Universidad de Stanford, James Landay afirma que se le ocurrió hacer dicho estudio cuando estaba en un café con el profesor adjunto Andrew Ng., quien trabaja ahora en Baidu.

“Andrew mencionó que el reconocimiento de voz en Baidu estaba mejorando mucho pero que no conocían un experimento preciso para cuantificarlo”, afrma Landay a Digital Trends.

El software de reconocimiento de comandos de voz de Baidu llamado Deep Speech 2 está basado en una red neuronal de aprendizaje profundo. Es una máquina impresionante que es capaz de entrenarse a sí misma all analizar enormes bases de datos de comandos de voz.

“Antes, no teníamos los datos y las habilidades computacionales para construir estos modelos en los cuales la computadora pudiera reconocer diferentes acentos y patrones de habla”, afirma Landay.

Poco después, la conversación casual entre Landay y Ng se transformó en un experimento que funcionaba a toda marcha.

Los participantes hablaban en chino o en inglés. Todos los participantes habían crecido en un contexto donde es usual enviar mensajes de texto y todos estaban utilizando el teclado estándar de un iPhone.

Quienes hablaban inglés, utilizaban entonces el teclado QWERTY, mientras que los chinos utlizaban el teclado Pinyin de Apple.

En ambos casos, el reconocimiento de voz podía escribir tres veces más rápido que los seres humanos.

También, la tasa de error fue 20.4% más baja en inglés y 63.4% más baja para el mandarín.

“Mi expectativa era que los comandos de voz fueran más rápidos”, afirma Landay. “Sabemos esto porque uno puede hablar más rápido que escribir. El probema era que en el pasado los comandos de voz tenían muchos errores y generaban una demora (…) Lo que no esperaba era que fuera tres veces más rápido”, añade.

El teclado Flesky es el más rápido y batió récords al escribir una frase de 124 palabras en solo 18.44 segundos.

Relacionado: El nuevo teclado de Google es lo primero que vas a querer descargar en tu iPhone

En este caso, se utilizado el teclado de un iPhone porque daba una herramienta estándar y “la mayoría de gente no se toma el tiempo de aprender a manejar teclados alternativos”, afirma.

Lo siguientes progresos incluirán reconocimiento de nombres y mejor reconocimiento de vos en lugares ruidosos.

Recomendaciones del editor

Juliana Jara
Ex escritor de Digital Trends en Español
Juliana Jara es politóloga egresada de la Universidad ICESI de Cali, Colombia y decidió poco después estudiar una…
AMD Zen 5: Todo lo que sabemos sobre las CPU de próxima generación de AMD
amd zen 5 todo lo que sabemos cpu

Jacob Roach / DT
AMD Zen 5 es la arquitectura de CPU Ryzen de próxima generación para Team Red y está programada para su lanzamiento en algún momento de 2024. Hemos estado escuchando rumores tentadores desde hace un tiempo y promesas de grandes saltos en el rendimiento. En resumen, Zen 5 podría ser muy emocionante.

No tenemos todos los detalles, pero lo que estamos escuchando es muy prometedor. Esto es lo que sabemos sobre Zen 5 hasta ahora.
Fecha de lanzamiento y disponibilidad de Zen 5
AMD confirmó en enero de 2024 que estaba en camino de lanzar Zen 5 en algún momento de la "segunda mitad del año". Teniendo en cuenta que el lanzamiento de Zen 4 fue en septiembre de 2022, esperaríamos ver el debut de los procesadores de escritorio Zen 5 en el mismo plazo, posiblemente con un anuncio en Computex.

Leer más
Meta presenta Llama 3: su IA para hacer más inteligente WhatsApp, Messenger e Instagram
meta llama 3 whatsapp messenger facebook instagram ai

Este jueves 18 de abril, Mark Zuckerberg y la gente de Meta anunciaron Llama 3, la nueva fase de IA de lenguaje de código abierto para sus plataformas.

Esta versión presenta modelos de lenguaje preentrenados y ajustados a la instrucción con parámetros 8B y 70B que pueden admitir una amplia gama de casos de uso. Esta nueva generación de Llama demuestra un rendimiento de vanguardia en una amplia gama de puntos de referencia de la industria y ofrece nuevas capacidades, incluido un razonamiento mejorado.

Leer más
HP lanza un nuevo portátil para juegos y accesorios HyperX
hp omen 17 hyper x

HP
HP continúa actualizando su línea de portátiles premium para juegos con el último Omen 17. Con los últimos chips móviles AMD Ryzen 8000 de la serie mejorados con IA, es el primer producto de Omen que viene con una clave Copilot dedicada para el último asistente de IA de Microsoft.

Además, la computadora portátil ofrece funciones de reunión mejoradas por IA, como mejorar la cámara web y el micrófono integrados para una experiencia de videollamada mejorada. Y con Otter.ai, los usuarios pueden transcribir reuniones y tener acceso a notas generadas por IA.

Leer más