クラウドが大規模障害を起こしても6時間で復旧させる─。ベネッセは進研ゼミのネット教育サーバーでこの障害対策を成し遂げた。月額数万円のコスト増によって東日本・西日本の2拠点に冗長化した。
ベネッセコーポレーションは2020月3月20日、進研ゼミ中学講座のネット教育に使うサーバーを米マイクロソフトのクラウド「Microsoft Azure」に移行する。1日10万人ほどがアクセスする同サーバーの構築・運用を担う山崎能史デジタル開発部副部長は「クラウドの障害対策に力を入れた。サーバー単位の機能停止に加え、広域に及ぶ大規模障害の対策も講じる」と話す。
Azureへの移行は主にシステムの柔軟性向上を狙って、2017年から全社で進めてきた。中学講座のネット教育サーバーの移行はその一環だ。
従来のオンプレミス(自社所有)環境からAzureに移行することで「毎年春にアクセスが増え秋に減る」といった繁閑の差に合わせて柔軟にサーバーリソースを増減できるようになる。さらにクラウドであれば「冗長構成にしやすいので可用性(稼働率)を高められる」(山崎副部長)。
ベネッセはネット教育サーバーを中学講座(中ゼミ)と小学講座(小ゼミ)で分けて構築・運用している。中ゼミと小ゼミのどちらも、利用者は基本的に専用端末を使う。カスタマイズしたAndroidとアプリケーションを搭載したタブレット端末だ。この端末からインターネット経由でサーバーに接続することで全ての機能を利用できる。小ゼミのみ祖父母の家などインターネット接続環境のない場所でも大半の機能を使えるようにしている。そのためコンテンツを端末にキャッシュする仕組みなどが異なる。これが中ゼミと小ゼミでサーバーを分けている理由だ。
ベネッセはネット教育サーバーを段階的にクラウドへ移行してきた。移行は小ゼミのネット教育サーバーを先行させた。2018年10月にオンプレミス環境からAzureの東日本リージョン(広域データセンター群)へ移した。
その際、Azureの大規模障害を想定した「リージョンレベル」の対策を講じた。東日本にあるAzureのデータセンターが全て稼働しなくなっても、6時間後には西日本にあるAzureのデータセンターで復旧できるようにした。6時間の停止でも利用者は不便だが、進研ゼミの価格を上げずに済む範囲でバランスを取った対策だという。コスト増は月額数万円だ。
2019年4月にはサーバー単位の障害やメンテナンスに伴う機能停止を想定した「サーバーレベル」の対策を講じた。この2段構えの対策は中ゼミのサーバーにもAzure移行で導入する。