Skip to main content
  1. Home
  2. Computación
  3. Noticias
  4. Telefonía celular
  5. Tendencias
  6. Legacy Archives

Escribir por voz es más rápido que teclear

Add as a preferred source on Google

Dictarle a una computadora es ahora mucho mejor que hace una década. Pero, ¿qué tan mejor?

Ese es un cálculo que científicos de la Universidad de Stanford, de Washington y Baidu -el gigante chino de las búsquedas- deseaban conocer.

Recommended Videos

Relacionado: Escribe donde quieras, cuando quieras y sin necesidad de un teclado… Sólo con tus dedos

Por eso, crearon un experimento en el que como resultado final, los seres humanos terminaron siendo aplastados por las máquinas términos de velocidad y precisión.

El profesor de Ciencias Informáticas de la Universidad de Stanford, James Landay afirma que se le ocurrió hacer dicho estudio cuando estaba en un café con el profesor adjunto Andrew Ng., quien trabaja ahora en Baidu.

“Andrew mencionó que el reconocimiento de voz en Baidu estaba mejorando mucho pero que no conocían un experimento preciso para cuantificarlo”, afrma Landay a Digital Trends.

El software de reconocimiento de comandos de voz de Baidu llamado Deep Speech 2 está basado en una red neuronal de aprendizaje profundo. Es una máquina impresionante que es capaz de entrenarse a sí misma all analizar enormes bases de datos de comandos de voz.

“Antes, no teníamos los datos y las habilidades computacionales para construir estos modelos en los cuales la computadora pudiera reconocer diferentes acentos y patrones de habla”, afirma Landay.

Poco después, la conversación casual entre Landay y Ng se transformó en un experimento que funcionaba a toda marcha.

Los participantes hablaban en chino o en inglés. Todos los participantes habían crecido en un contexto donde es usual enviar mensajes de texto y todos estaban utilizando el teclado estándar de un iPhone.

Quienes hablaban inglés, utilizaban entonces el teclado QWERTY, mientras que los chinos utlizaban el teclado Pinyin de Apple.

En ambos casos, el reconocimiento de voz podía escribir tres veces más rápido que los seres humanos.

También, la tasa de error fue 20.4% más baja en inglés y 63.4% más baja para el mandarín.

“Mi expectativa era que los comandos de voz fueran más rápidos”, afirma Landay. “Sabemos esto porque uno puede hablar más rápido que escribir. El probema era que en el pasado los comandos de voz tenían muchos errores y generaban una demora (…) Lo que no esperaba era que fuera tres veces más rápido”, añade.

El teclado Flesky es el más rápido y batió récords al escribir una frase de 124 palabras en solo 18.44 segundos.

Relacionado: El nuevo teclado de Google es lo primero que vas a querer descargar en tu iPhone

En este caso, se utilizado el teclado de un iPhone porque daba una herramienta estándar y “la mayoría de gente no se toma el tiempo de aprender a manejar teclados alternativos”, afirma.

Lo siguientes progresos incluirán reconocimiento de nombres y mejor reconocimiento de vos en lugares ruidosos.

Juliana Jara
Former Digital Trends Contributor
ChatGPT da el tiro de gracia a GPT-4o, GPT-4.1, GPT-4.1 mini y o4-mini
ChatGPT

Una importante reducción de modelos hará desde el 13 de febrero la gente de OpenAI en ChatGPT, ya que el popular chatbot  pronto descontinuará varios de los modelos GPT.

En dos semanas OpenAI eliminará los modelos GPT-4o, GPT-4.1, GPT-4.1 mini y OpenAI o4-mini de ChatGPT. La retirada de estos modelos antiguos probablemente no afectará a la mayoría de los usuarios, ya que OpenAI afirma que la mayoría de los usuarios han pasado a GPT-5.2 (y que GPT-4o solo lo usa el 0,1 por ciento de los usuarios a diario).

Read more
Windows 11 sumaría una barra superior al estilo macOS gracias a PowerToys
Computer, Electronics, Pc

Microsoft está probando un cambio llamativo en la interfaz de Windows 11: una barra de menú superior opcional, similar a la de macOS o algunas distribuciones de Linux. La idea surge desde el equipo de PowerToys, la suite de herramientas avanzadas para usuarios de Windows, que trabaja en un nuevo componente llamado Command Palette Dock.

Según los primeros detalles publicados por la propia Microsoft y recogidos por medios especializados, el dock funcionaría como una franja permanente en el borde de la pantalla —por defecto, en la parte superior— que mostraría información del sistema y accesos directos a herramientas y comandos. La propuesta contempla también la posibilidad de ubicarla en los laterales o en la parte inferior, según prefiera cada usuario.

Read more
Anthropic enfrenta multimillonaria demanda por piratería musical
Pirata

La empresa de inteligencia artificial Anthropic, creadora del popular modelo de lenguaje Claude, se encuentra en el ojo del huracán tras una nueva demanda presentada por los principales sellos discográficos del mundo. Universal Music Publishing Group, Concord Music Group y ABKCO acusaron formalmente a la compañía de utilizar más de 20 mil canciones protegidas por derechos de autor sin autorización para entrenar sus modelos de IA.

Según el documento legal presentado el pasado 28 de enero ante los tribunales de California, Anthropic descargó intencionalmente millones de archivos mediante BitTorrent desde sitios de piratería como LibGen y PiLiMi, incluyendo composiciones musicales y partituras pertenecientes a artistas consagrados como The Rolling Stones, Neil Diamond, Elton John y Coldplay, entre muchos otros.

Read more