¿Tiene problemas para acceder a algunos de sus sitios web y servicios favoritos hoy? No está solo, ya que una gran franja de Internet ha estado experimentando problemas durante las primeras horas de este 20 de octubre de 2025, con interrupciones reportadas en numerosos sitios.
El servicio AWS de Amazon fue el culpable, ya que experimentó una interrupción severa, lo que tuvo un gran efecto dominó en cientos, si no miles, de servicios. Los propios servicios de Amazon, como Alexa, Ring y Prime Video, estaban experimentando problemas, así como grandes nombres de toda la web.
La buena noticia es que Amazon ha dicho que ha «identificado una posible causa raíz de las tasas de error» y está viendo «signos significativos de recuperación», lo que con suerte significa que se está implementando una solución.
Interrupción de Internet en AWS: la historia hasta ahora
- 05:10 a. m. PDT: Más acciones exitosas a medida que Amazon continúa trabajando en el proceso de recuperación.
- 04:48 a. m. PDT: Amazon confirma que muchos servicios aún se ven afectados mientras continúa solucionando el problema.
- 04:08 AM PDT: Amazon dice que «continúa trabajando para recuperarse por completo»
- 03:35 a. m. PDT: «El problema subyacente de DNS se ha mitigado por completo y la mayoría de las operaciones del servicio de AWS se están realizando con normalidad ahora»
- 03:03 a. m. PDT: Los servicios continúan recuperándose mientras Amazon continúa «trabajando para lograr una resolución completa»
- 02:27 a. m. PDT: «Estamos viendo signos significativos de recuperación», señala Amazon. Gracias a Dios.
- 02:22 a. m. PDT: Amazon dice que está «observando los primeros signos de recuperación de algunos servicios de AWS afectados»
- 02:01 AM PDT: Amazon dice que ha «identificado una posible causa raíz de las tasas de error»
- 01:26 a. m. PDT: Amazon dice que «puede confirmar tasas de error significativas para las solicitudes realizadas al punto de enlace de DynamoDB en la región US-EAST-1»
- 12:51 a. m. PDT: Amazon confirma «mayores tasas de error y latencias para múltiples servicios de AWS en la región US-EAST-1»
- 12:11 a. m. PDT: Amazon confirma que está «investigando el aumento de las tasas de error y las latencias para múltiples servicios de AWS en la región US-EAST-1»
Según Aras Nazarovas, investigador senior de seguridad de Cybernews, no se sospecha que el juego sucio sea la causa de la interrupción de AWS de hoy.
«Desde el informe inicial, no hay indicios de ninguna violación de seguridad, sin embargo, no mantener la información o los recursos disponibles para los clientes puede clasificarse como un incidente cibernético, incluso si no hubo un extraño malicioso o una intención maliciosa.
«Interrupciones similares ocurren casi todos los años, y pueden ser un recordatorio de cuán extensas se han vuelto las cadenas de suministro de software, mostrando cómo un simple problema en un puñado de centros de datos de Amazon causó miles de problemas a sus clientes».
Amazon continúa entregando actualizaciones en su página de Service Health a medida que avanza en la recuperación, y la interrupción sigue ocurriendo para algunos.
Una verificación rápida en Downdector muestra que los informes de problemas han disminuido significativamente, lo que sugiere que los servicios están funcionando nuevamente, pero todavía hay algunos valores atípicos.
La opinión de un experto
Emil Sayegh, director ejecutivo de CyberSheath, un proveedor líder de seguridad administrada y conformidad para la base industrial de defensa de EE. UU., habló con Digital Trends sobre el impacto de la interrupción de AWS de hoy.
La conclusión de Sayegh de la edición de hoy es un enfoque en el desarrollo de un enfoque híbrido para la nube. «Esto se restaurará y el sol saldrá mañana. La llamada de atención es arquitectónica. No confíe en una sola región o una sola nube. Ejecute híbrido donde tenga sentido, invierta en recuperación ante desastres y diseñe con una mentalidad N + 2 para rutas verdaderamente críticas. Así es como se protege a los clientes y, en el caso de la Base Industrial de Defensa, a la seguridad nacional».
¿Cómo sucedió esto? ¿Alguna especulación informada?
«Los primeros indicadores apuntan a un problema de plano de control en US-EAST-1 que surge como errores de API y problemas de resolución de DNS en torno a servicios centrales como DynamoDB. Cuando una dependencia fundamental en esa región tropieza, se observan síntomas en cascada en la autenticación, el acceso a los datos y las colas. La concentración de cargas de trabajo en US-EAST-1 magnifica el impacto, y eso es de especial preocupación para la seguridad nacional porque muchas cargas de trabajo de la Base Industrial de Defensa se anclan allí».
Primera interrupción importante en aproximadamente dos años. ¿Sorprendente o esperado?
«Dada la escala y las mejoras de AWS desde incidentes anteriores, no es sorprendente un largo período de silencio. El listón ha subido. Pero la complejidad de la hiperescala nunca alcanza el riesgo cero. Se reduce el radio de explosión y el tiempo medio de recuperación, pero no se eliminan los cisnes negros».
¿Impacto a largo plazo en la reputación y las finanzas de Amazon/AWS?
«A corto plazo, esto es ruido de reputación en lugar de un golpe estructural. Las empresas no eliminan y reemplazan en un solo evento. La presión surgirá en las revisiones de arquitectura y las conversaciones de la junta directiva que financian patrones de múltiples regiones, estrategias híbridas, portabilidad de cargas de trabajo y un lenguaje de tiempo de actividad más estricto. En última instancia, no se trata solo de lo que sucedió, sino de cómo responde AWS. Si reaccionan con transparencia y claridad, la industria es mucho más indulgente».
¿Se suponía que las salvaguardias evitarían esto, o necesitamos más detalles?
«AWS tiene salvaguardas sólidas, pero ninguna salvaguarda es absoluta. En este momento, debemos extender la gracia al equipo en primera línea y concentrarnos en que los sistemas vuelvan a funcionar limpiamente. La prioridad es un regreso tranquilo y sensato a través de los cambios recientes, probando cada paso y retrocediendo de manera segura. Habiendo ejecutado nubes a gran escala, solo puedo imaginar en qué están trabajando los ingenieros de AWS; A veces no hay una solución rápida y se restaura la estabilidad paso a paso. La responsabilidad viene después de la restauración, cuando se completa un análisis transparente y detallado de la causa raíz. Aconsejaría a AWS que publique un RCA claro y completo y las lecciones aprendidas. Esto es especialmente importante dada la concentración de cargas de trabajo en US-EAST-1 y las implicaciones para la Base Industrial de Defensa y la seguridad nacional».
¿Quién fue el más afectado? ¿Quién está en mayor riesgo?
«Las plataformas de consumo con interacciones en tiempo real, fintech, juegos y SaaS que centralizaron las funciones de control en US-EAST-1 se llevaron la peor parte. El grupo de mayor riesgo son los equipos optimizados para la velocidad y el costo y los patrones diferidos de varias regiones, disyuntores y drenaje de colas. Si tu servicio de inicio de sesión, configuración o marca de características se encuentra en una región, toda tu aplicación también se encuentra allí. Desde una perspectiva de seguridad nacional, la Base Industrial de Defensa también enfrenta un alto impacto debido a la concentración de cargas de trabajo en el este de los EE. UU. y la sensibilidad de las misiones que respaldan esos sistemas».