Hace apenas unos minutos a las 2:11 p.m. ET, la página de estado de Azure recibió esta actualización:
«Hemos iniciado la implementación de nuestra ‘última configuración buena conocida’. Se espera que esté completamente implementada en aproximadamente 30 minutos, después de lo cual los clientes comenzarán a ver signos iniciales de recuperación. Una vez que se complete, la siguiente etapa es comenzar a recuperar nodos mientras enrutamos el tráfico a través de estos nodos en buen estado».
Y ese es un comienzo de buenas noticias, ya que Azure está implementando su ‘última configuración buena conocida’ que debería llegar a la aduana en unos 30 minutos, y la recuperación podría comenzar en ese momento. Estamos atentos a nuevas actualizaciones del estado.
¿Aún necesitas una mano? Microsoft lo tiene cubierto…
«Aunque todavía no tenemos una ETA, los clientes pueden considerar implementar estrategias de conmutación por error con Azure Traffic Manager, para realizar la conmutación por error desde Azure Front Door hasta sus orígenes: https://learn.microsoft.com/azure/architecture/guide/networking/global-web-applications/overview «
Como prometió, Microsoft ahora dice que las cosas están empezando a recuperarse…
«Los clientes deberían poder acceder directamente al portal de administración de Azure, aunque todas las extensiones del portal funcionan correctamente, puede haber una pequeña cantidad de puntos finales que puedan tener problemas de carga (es decir, Marketplace)», dice la última actualización.
Han encontrado al culpable: Microsoft dice: «Sospechamos que un cambio de configuración inadvertido es el evento desencadenante de este problema».
¡Supongo que atribuyo eso a la experiencia!
Otra actualización de Microsoft y cree haber encontrado el problema.
«Sospechamos que un cambio de configuración inadvertido es el evento desencadenante de este problema. Estamos tomando dos acciones simultáneas en las que estamos bloqueando todos los cambios en los servicios de la AFD y deshabilitando una ruta problemática que encontramos relacionada con esto, y al mismo tiempo regresando a nuestro último buen estado conocido».
«Le hemos fallado al portal fuera de Azure Front Door (AFD) para mitigar los problemas de acceso al portal. Los clientes deberían poder acceder al portal de administración de Azure directamente».
«No tenemos una ETA sobre cuándo se completará la reversión, pero actualizaremos esta comunicación dentro de 30 minutos o cuando tengamos una actualización».
Los informes definitivamente están disminuyendo ahora, así que con suerte esto significa que el trabajo de Microsoft está dando sus frutos y todo volverá a funcionar pronto.
Microsoft ha publicado otra actualización y, al parecer, está trabajando arduamente en una solución.
«A partir de aproximadamente las 16:00 UTC, comenzamos a experimentar problemas de Azure Front Door, lo que resultó en una pérdida de disponibilidad de algunos servicios. Además, los clientes pueden experimentar problemas para acceder al Portal de Azure. Los clientes pueden intentar usar métodos programáticos (PowerShell, CLI, etc.) para acceder/utilizar recursos si no pueden acceder al portal directamente. Le hemos fallado al portal fuera de Azure Front Door (AFD) para intentar mitigar los problemas de acceso al portal y continuamos evaluando la situación».
«Estamos evaluando activamente las opciones de conmutación por error de los servicios internos de nuestra infraestructura de la AFD. Nuestra investigación sobre los factores contribuyentes y los flujos de trabajo de recuperación adicionales continúa. Se proporcionará más información dentro de 60 minutos o antes.
Afortunadamente, parece que los números están cayendo en todos los ámbitos: todavía hay informes de problemas en Microsoft 365 y en clientes como Starbucks, pero no son tan altos como hace unos minutos, por lo que tenemos la esperanza de que lo peor haya pasado.
Aunque todavía estamos esperando otra actualización de Microsoft…
Los informes parecen estar disminuyendo sobre problemas en Azure, y DownDetector muestra una disminución: ¿podría haber terminado ya la interrupción?
Dado el caos causado por la reciente interrupción de AWS, eso podría ser un gran alivio para todos…
(Crédito de la imagen: DownDetector)
Microsoft también publicó una actualización en la página oficial de estado de Azure y podría ser una buena noticia.
«A partir de aproximadamente las 16:00 UTC, comenzamos a experimentar problemas de DNS que resultaron en una degradación de la disponibilidad de algunos servicios. Los clientes pueden experimentar problemas para acceder al Portal de Azure. Hemos tomado medidas que se espera resuelvan los problemas de acceso al portal aquí en breve. Estamos investigando activamente el problema subyacente y acciones de mitigación adicionales. Se proporcionará más información dentro de 60 minutos o antes».
Los informes continúan llegando de los usuarios de Microsoft 365, y el pico de DownDetector es cada vez mayor.
Este es el comienzo de la jornada laboral para muchas personas en el centro y oeste de los Estados Unidos, por lo que tener todos estos usuarios iniciando sesión a la vez probablemente no ayude en absoluto al problema…
(Crédito de la imagen: DownDetector)
No son sólo las aplicaciones y los servicios los que se ven afectados: parece que incluso Microsoft Store también está inactivo.
¿O Microsoft simplemente está haciendo lo mismo que Apple y está a punto de lanzar por sorpresa una gran cantidad de teléfonos nuevos?
(Crédito de la imagen: DownDetector)
Lo preocupante es que parece que algunos de los principales clientes de Microsoft también podrían verse afectados, ya que DownDetector muestra picos de cortes en Starbucks, Kroger y Costco.
En caso de que necesite que se lo recuerde, Azure es la plataforma en la nube de Microsoft, por lo que constituye la columna vertebral no solo de los propios servicios de la empresa, sino también de muchos clientes.
Microsoft 365 es su tienda integral de software de oficina, que incluye herramientas populares como Word, Excel, Powerpoint, Teams y mucho más.
Básicamente, si alguno de estos tiene un problema, son malas noticias para todos…
DownDetector está mostrando picos importantes en los servicios de Microsoft a medida que esta interrupción se mantiene…
(Crédito de la imagen: DownDetector)
La página oficial de estado de Azure ahora dice que hay un problema y que se está investigando.
«Estamos investigando un problema con el Portal Azure donde los clientes pueden tener problemas para acceder al portal», dice el sitio, señalando que se proporcionará más información en breve.
Bienvenido a nuestra cobertura de esta interrupción: no hace mucho, vimos grandes picos en los informes en el rastreador de interrupciones DownDetector, con Microsoft Azure y Microsoft 365 afectados.