全2328文字
PR

 クラウドがまた落ちた。2020年6月10日、米IBMのクラウドサービス「IBM Cloud」で障害が発生。この影響で、みずほ銀行や住信SBIネット銀行が提供する一部サービスが利用しづらい状況に陥った。

 日本IBMによれば、障害の原因は「誤ったルート広告」の発生。IPパケットをどのような経路で送るかを決める経路情報に誤りがあり、それを伝播した結果としてネットワークの輻輳(ふくそう)が生じ、IBM Cloudを利用するインターネットのネットワークに障害を引き起こしたという。

 クラウドのパワーの源泉は、そのリソースの膨大さにある。大量のサーバーやストレージを世界各地のデータセンターに配し、それらをネットワークでつないで従量制でユーザーに貸し出す。リソースの共有により、低価格を実現しながらスケールアウトやフェールオーバーといった機能を提供している。

 一方でリソースの共有には、リソース不足や障害範囲の拡大といった懸念が潜在している。IBM Cloudの障害は、クラウドで得られるメリットが一定のリスクと背中合わせになっているのを改めて思い出させてくれる。

 クラウドは今や、システム構築を考えるうえで欠かせない選択肢だ。新型コロナウイルスの影響でテレワークが浸透し、クラウド活用の推進にはさらに拍車がかかる。障害による停止や遅延といったリスクをはらむクラウドとどう付き合っていけばよいのだろう。

「落ちることを前提に使ってほしい」

 IBM Cloudに限らず、クラウドでは一定の割合で障害が発生する。最大手のAWS(Amazon Web Services)の東京リージョンでは2020年4月に障害が発生。影響が「Amazon CloudWatch」「Amazon Simple Queue Service」「AWS CloudFormation」「AWS Lambda」の4サービスに及んだ。

 クラウドの障害は大小を含めて枚挙にいとまがない。あるSIベンダーは、クラウドを使いたいというユーザーの要望に対して「クラウドは落ちることを前提に使ってほしい」と必ず説明するという。クラウドの信頼性や可用性に対して過度の期待を持つユーザーもあるからだ。

 クラウドはどれぐらい落ちるのだろう。これを知らずに利用に踏み切るわけにはいかない。手掛かりになるのがクラウドのSLA(Service Level Agreement)である。