Службы Microsoft Azure и Microsoft 365 пострадали от сбоя в работе Azure в центральной части США, вызванного неудачным изменением конфигурации
Службы Microsoft Azure и Microsoft 365 пострадали от сбоя в работе Azure в центральной части США, который произошел 18 июля 2024 г. Изменение конфигурации в Azure привело к отключению кластеров хранения и серверов, что вызвало автоматическую перезагрузку, которая привела к отключению затронутых служб, включая Teams, OneDrive и Defender. На данный момент затронутыми остаются только Teams. Читатели могут отслеживать статус этого инцидента (Tracking Id: 1K80-N_8) на страницах статуса, ссылки на которые приведены ниже. Этот инцидент не связан с глобальным сбоем в работе CrowdStrike инцидента.
Microsoft Azure - это поставщик облачных услуг, предоставляющий как пространство для хранения данных, так и вычислительные мощности. Предприятия могут сэкономить на ИТ, используя для своих серверов Azure, а не собственные серверы, поскольку Microsoft отвечает за обслуживание, модернизацию и резервное копирование облачных серверов. Однако ошибки, допущенные сотрудниками Microsoft Azure, могут повлиять как на сервисы Microsoft Azure, так и на Microsoft 365.
Microsoft сообщает: "Мы определили, что рабочий процесс управления внутренним кластером развернул изменение конфигурации, в результате чего был заблокирован доступ к внутреннему кластеру между некоторыми кластерами Azure Storage и вычислительными ресурсами в Центральном регионе США. Это привело к тому, что вычислительные ресурсы автоматически перезапускались при потере связи с виртуальными дисками, размещенными на затронутых ресурсах хранения."
По сути, это означает, что серверы не могли получить доступ к данным, поэтому облачные компьютеры автоматически перезагружались, выводя из строя многие службы Microsoft.
В число затронутых служб вошли Microsoft Azure, Defender, Fabric, Intune, OneDrive for Business, PowerBI, SharePoint Online, Teams и Viva Engage. Только Microsoft Teams остается затронутой уже решенной проблемой отключения Azure в Центральных США, и пользователям Teams следует знать, что "организаторы собраний не могут добавить людей в форму планирования собраний, используя приложения Microsoft Teams для личного использования".
Корпоративные ИТ-специалисты, которые беспокоятся о том, что в будущем перебои в работе Azure могут вывести их компании из строя на несколько дней, могут обратить внимание на платформы для приложений на базе Kubernetes, такие как VMWare Tanzu и прочитать о них(в этой книге на Amazon), чтобы узнать, как развертывать приложения в нескольких облачных сервисах для резервирования.