全日本空輸(ANA)が全社のデータ活用に向けて新たに構築したデータレイク「BlueLake」。新型コロナウイルス禍による苦境が続くなかで新規開発を決め、2021年12月のプロジェクト始動から半年強で本格稼働させた。クラウドサービスの活用やアジャイル開発の採用により、実質的には約4カ月ほどでつくりあげた。
航空事業向けだった既存DWH
ANAはこれまでも「Brain」と呼ぶデータウエアハウス(DWH)を運用してきた。ただ、自由にデータを分析・活用する、いわゆるデータの「民主化」に取り組むには力不足だった
「Brainを使うと会社のKPI(重要業績評価指標)となるような数字をきっちり出力できた。その点で不足はなかった」と。BlueLake開発プロジェクトに中核メンバーとして携わったANAの井岡大デジタル変革室イノベーション推進部データデザインチームマネジャーはこう振り返る。
そのうえで「決められたGUIを操作してExcelデータを出力するだけだった。Brain上で自由にSQL文を操作できないし、出力データをさらに分析しようにもExcelの範囲を超えられない。そうした点にもどかしさを感じていた」と続ける。
ANA本体だけでなく、グループ全体でデータ環境を整備する必要も出てきた。持ち株会社のANAホールディングスは2020年秋、コロナ禍の苦境を踏まえて航空事業へ過度に依存している構造を変革し、非航空事業の事業規模を倍増させるという目標を掲げたからだ。これに対しBrainはもともと航空事業向けのDWHとして開発されたもの。こうした背景から、Brainは特定用途で引き続き使用しつつ、新たな目標を達成するために非航空事業を含めたデータを集約・分析できるBlueLakeを構築すると決めたわけだ。