Skip to main content
  1. Casa
  2. Computación
  3. Noticias
  4. Telefonía celular
  5. Tendencias
  6. Legacy Archives

Escribir por voz es más rápido que teclear

Dictarle a una computadora es ahora mucho mejor que hace una década. Pero, ¿qué tan mejor?

Ese es un cálculo que científicos de la Universidad de Stanford, de Washington y Baidu -el gigante chino de las búsquedas- deseaban conocer.

Recommended Videos

Relacionado: Escribe donde quieras, cuando quieras y sin necesidad de un teclado… Sólo con tus dedos

Por eso, crearon un experimento en el que como resultado final, los seres humanos terminaron siendo aplastados por las máquinas términos de velocidad y precisión.

El profesor de Ciencias Informáticas de la Universidad de Stanford, James Landay afirma que se le ocurrió hacer dicho estudio cuando estaba en un café con el profesor adjunto Andrew Ng., quien trabaja ahora en Baidu.

“Andrew mencionó que el reconocimiento de voz en Baidu estaba mejorando mucho pero que no conocían un experimento preciso para cuantificarlo”, afrma Landay a Digital Trends.

El software de reconocimiento de comandos de voz de Baidu llamado Deep Speech 2 está basado en una red neuronal de aprendizaje profundo. Es una máquina impresionante que es capaz de entrenarse a sí misma all analizar enormes bases de datos de comandos de voz.

“Antes, no teníamos los datos y las habilidades computacionales para construir estos modelos en los cuales la computadora pudiera reconocer diferentes acentos y patrones de habla”, afirma Landay.

Poco después, la conversación casual entre Landay y Ng se transformó en un experimento que funcionaba a toda marcha.

Los participantes hablaban en chino o en inglés. Todos los participantes habían crecido en un contexto donde es usual enviar mensajes de texto y todos estaban utilizando el teclado estándar de un iPhone.

Quienes hablaban inglés, utilizaban entonces el teclado QWERTY, mientras que los chinos utlizaban el teclado Pinyin de Apple.

En ambos casos, el reconocimiento de voz podía escribir tres veces más rápido que los seres humanos.

También, la tasa de error fue 20.4% más baja en inglés y 63.4% más baja para el mandarín.

“Mi expectativa era que los comandos de voz fueran más rápidos”, afirma Landay. “Sabemos esto porque uno puede hablar más rápido que escribir. El probema era que en el pasado los comandos de voz tenían muchos errores y generaban una demora (…) Lo que no esperaba era que fuera tres veces más rápido”, añade.

El teclado Flesky es el más rápido y batió récords al escribir una frase de 124 palabras en solo 18.44 segundos.

Relacionado: El nuevo teclado de Google es lo primero que vas a querer descargar en tu iPhone

En este caso, se utilizado el teclado de un iPhone porque daba una herramienta estándar y “la mayoría de gente no se toma el tiempo de aprender a manejar teclados alternativos”, afirma.

Lo siguientes progresos incluirán reconocimiento de nombres y mejor reconocimiento de vos en lugares ruidosos.

Juliana Jara
Ex escritor de Digital Trends en Español
El CEO de Nvidia furioso con sus directivos que piden usar menos IA
Jensen Huang

El CEO de Nvidia, Jensen Huang, es un convencido de que la inteligencia artificial es una herramienta fundamental para beneficio de la humanidad, por eso es que su compañía está tan obsesionada con construir chips y tecnología para la IA.

Huang, está diciendo a los empleados que se apoyen en la inteligencia artificial tanto como sea posible y que dejen de preocuparse de que hacerlo les quite el trabajo automáticamente.

Leer más
Ahora puedes crear vídeos divertidos de IA a partir de texto con Grok
Grok

¿Qué ha pasado? Si te encanta hacer vídeos creativos, ahora tienes otra plataforma con la que jugar. Grok Imagine, la herramienta de IA de xAI de Elon Musk, ahora soporta la función de texto a vídeo. La actualización fue anunciada en X por Elon Musk, trayendo la generación de vídeo directamente a la plataforma que quizá ya uses. Esto significa que puedes transformar una idea aleatoria en un vídeo corto escribiéndola en X tan fácilmente como compartiendo un tuit.

La nueva función Grok Imagine está desplegándose actualmente en la web, Android y la aplicación de iOS.

Leer más
Ahora por fin puedes hablar y escribir al mismo tiempo en ChatGPT
ChatGPT

Hasta ahora hablar con ChatGPT nunca se sintió muy natural y siempre había que ir necesariamente en otra ventana. Bueno, OpenAI acaba de arreglar eso. Está lanzando una actualización masiva que te permite chatear con tu voz justo dentro de la ventana normal de mensajes. Ya no hay burbujas azules ocupando tu pantalla.

Antes de esto, activar el modo voz significaba mirar ese círculo azul flotante. No podías ver tus mensajes antiguos, y si te faltabas una palabra, tenías que salir solo para leer la transcripción. Arruinó totalmente el ambiente. Con este rediseño, OpenAI finalmente trata la voz como una parte normal de la conversación, eliminando esa fricción.

Leer más