Jul 20, 2024

CrowdStrikeに先立ってAzure, M365では・・・

Azure の状態の履歴

CrowdStrikeとは別原因。時間帯は一部被って予期せぬ再起動が発生した模様。
以下機械翻訳抜粋 ↓
何が起きたか?
07/19 06:56 JST ~ 同日 21:15 JST、米国中部地域の複数のAzureサービスにおいて、サービス管理業務や接続性、サービスの可用性に関する障害を含む問題が発生した .. 
ストレージインシデントが仮想マシンの可用性に影響を与え、仮想マシンが予期せず再起動した可能性もあります。
影響を受けた仮想マシンやストレージリソースに依存しているサービスにも影響が発生した可能性があります。

これまでに判明していること
私たちは、バックエンドのクラスタ管理ワークフローが、Azure Storageクラスタのサブセットと米国中部地域のコンピュートリソースとの間でバックエンドのアクセスをブロックする原因となる設定変更を導入したことを突き止めました。その結果、影響を受けたストレージリソース上でホストされている仮想ディスクへの接続が失われると、コンピュートリソースが自動的に再起動しました。
.. 』

「OneDrive同期できない」などMicrosoft 365で障害 トラフィック迂回で対処 (07/19)

『.. 「Microsoft 365」で、7月19日朝(日本時間)から障害が発生し、OneDriveのファイルが更新できなかったり、Teamsのステータスが変更できないなどの問題が出た。
..
 Microsoftは午前8時41分に障害を初めて報告。「OneDrive for Business」「Teams」「SharePoint Online」「Intune」「PowerBI」「Fabric」「Defender」「Defender for Endpoint」「Viva Engage」に影響が及んでいるという。

 当面の対応として、トラフィックを迂回して問題を解消しており、午前11時28分時点で、サービスは安定してきているという。根本原因へのアプローチも続けている。

※ 関連記事の類似事例にも興味をひかれる。
その後 ↓ 

「Microsoft 365」でアクセス障害 ~「Teams」「SharePoint」「OneDrive」などに影響【21時40分追記】

[2024年7月19日21時40分] 日本時間19時46分付けで同社のX(旧称Twitter)に投稿された情報によると、根本的な原因は解決されたものの、一部のアプリとサービスに影響が残っているとのこと。同社は追加の緩和策を実施して影響の軽減に努めているとしている。』

で根本原因は何だったのかは書かれていない。
『Azureの設定変更デプロイのブロックによる異常トラヒックがM365にも影響?』と妄想中。

No comments: