Skip to main content
  1. Home
  2. Computación
  3. Tendencias
  4. News

DT en Español podría recibir una comisión si compras un producto desde el sitio

Microsoft mejora en gran manera el reconocimiento de voz

Add as a preferred source on Google

No eres el único que se agobia porque los robots de servicio al cliente no entienden lo que dices. Por eso, Microsoft está trabajando en mejorar el oído de estas máquinas.

Los investigadores de este gigante de la tecnología, lograron disminuir la tasa de error de reconocimiento de voz a solo 6.3%, de acuerdo a una investigación publicada la semana pasada.

Recommended Videos

Relacionado: ¡Cuida tus palabras! Algoritmo podría ahora detectar el sarcasmo en Redes Sociales

La empresa espera que este hito ayude a refinar y personalizar su asistente Cortana y el traductor simultáneo de Skype.

De acuerdo a Xuedong Huang, el Director Científico de reconocimiento de voz de Microsoft, esta tasa de errores es la más baja de la industria.

IBM había mejorado su software hasta obtener solamente un 6.6% de tasa de errores, pero claramente Microsoft lo ha sobrepasado. El año pasado, la tasa de error de sicha empresa era del 8% y hace dos décadas, era de más del 43% según indica un blog de Microsoft.

Durante el desarrollo de la inteligencia artificial, los investigadores han buscado equiparar las habilidades de las máquinas con las de los seres humanos como lo son el habla, la visión y el oído.

A pesar de que el logro de Microsoft está solamente 0.3% por debajo del de IBM, cada mejora es vista como un gran paso para lograr llegar a la misma capacidad del ser humano.

La tasa de error de los seres humanos con respecto al reconocimiento del habla es de alrededor del 4%, según indica IBM.

“Este hito beneficia un gran rango de tecnologías desarrolladas por la comunidad de científicos dedicados a la inteligencia artificial de diferentes organizaciones durante los últimos 20 años”, afirma Huang.

Algunas de estas tecnologías incluyen sistemas inspirados en la biología como lo son las redes neurales, una técnica de entrenamiento conocida como aprendizaje profundo, y la adopción de unidades de procesamiento gráfico (GPU) para procesar algortimos.

Durante los últimos dos años, las redes neurales y el aprendizaje profundo han permitido a los investigadores en inteligencia artificial desarollar y entrenar sistemas en reconocimiento de voz avanzado, reconocimiento de imágenes y procesamente natural del lenguaje.

El año pasado, Microsoft creó un sistema de reconocimiento de imágenes que resultó ser mejor que el de los seres humanos.

Relacionado: Escribir por voz es más rápido que teclear

A pesar de que fue diseñado inicialmente para las gráficas de las computadoras, los GPU son ahora utilizados para procesar algoritmos complejos. Cortana puede proccesar 10 veces más información utilizando GPU que a través de los métodos utilizados anteriormente, de acuerdo a Microsoft.

Con estos avances, es muy seguro que repetirle una frase a un robot por teléfono será un asunto del pasado.

Juliana Jara
Former Digital Trends Contributor
Copilot de Microsoft enfrenta una batalla cuesta arriba
Copilot voz

A pesar de los esfuerzos intensivos de Microsoft por integrar su asistente de inteligencia artificial Copilot en prácticamente todos sus productos y servicios, el desempeño de la plataforma en términos de adopción global ha resultado considerablemente decepcionante. De acuerdo con un análisis reciente de SimilarWeb —especialista en medición de tráfico web—, la herramienta de Microsoft ocupa un lugar muy rezagado en la competencia del mercado de herramientas de IA generativa, capturando apenas entre el 1.2 por ciento y el 4.6 por ciento de la cuota de tráfico global, dependiendo de la métrica de medición utilizada.

Esta situación contrasta marcadamente con la posición abrumadora de ChatGPT de OpenAI, que continúa dominando el sector con cuotas que oscilan entre el 68 y el 84.8 por ciento. Google Gemini ha ganado terreno significativamente durante 2025, ascendiendo desde el 5.4 por ciento en enero hasta alcanzar el 18.2 por ciento en diciembre, demostrando un crecimiento explosivo. Entretanto, alternativas más especializadas como Perplexity —motor de búsqueda impulsado por IA— y Claude de Anthropic han establecido su presencia consolidada en segmentos de mercado particulares, dejando a Copilot en una posición incómoda entre los principales competidores.

Read more
ASUS nos revela el secreto que falta en los laptops AI
Computer, Electronics, Laptop

La presencia de ASUS en CES 2026 marcó un punto de inflexión en la industria tecnológica, con un showroom desbordante desde el primer día y un catálogo de productos que busca transformar la forma en que los usuarios interactúan con la inteligencia artificial. Para interiorizarnos más de lo que la marca taiwanesa tiene para este año, hablamos con Sascha Khron, Director of Technical Marketing de ASUS, "nunca habíamos tenido a todos los principales YouTubers y medios en el showroom el primer día. Fue increíble verlos a todos al mismo tiempo."

La empresa ha posicionado tres innovaciones clave: el Zenbook Duo, el Zephyrus Duo, y las nuevas gafas de realidad aumentada desarrolladas en asociación con Xreal. Pero más allá de los dispositivos hardware, la verdadera revolución radica en cómo ASUS aprovecha los NPU para entregar capacidades de IA sin comprometer la autonomía energética de los laptops.

Read more
Word ya no tiene ese problema TAN MOLESTO
Page, Text, Electronics

Microsoft está lanzando una forma nueva, más rápida y eficiente, de añadir hipervínculos en Word. En lugar de seleccionar texto, abrir el cuadro de diálogo Insertar enlace e insertar una URL, los usuarios ahora pueden seleccionar texto y pegar un enlace directamente sobre él; Word lo convierte automáticamente en un hipervínculo.

Tanto si usas el software en un PC/LAPTOP con Windows como en un MacBook, solo tienes que copiar el enlace correspondiente, resaltar una palabra o frase, pulsar Ctrl + V o Cmd + V, y Word se encarga del resto.

Read more