全4263文字

DXを進める上で、データを経営資産として管理・活用することは大切なポイントになる。データには様々な種類や形式があり、さらにデータベースなどに分散して保存されている。「欲しいデータを探す仕組み」であるデータカタログの構築が欠かせない。

 企業が持つデータを経営資産として管理し、最大限に活用することはデジタルトランスフォーメーション(DX)を進める上で最も大切なポイントです。しかし、現実にはデータの種類や形式が多様化していることに加え、データベース(DB)、データウエアハウス(DWH)、クラウドストレージなどにデータが分散して保存されています。一元的に管理して活用するのは困難な状況です。

 DX時代を生き抜くためには、全社的にデータ活用を促進するための環境整備が必要です。そこで登場するのがデータカタログです。データカタログとは一言で言えば「欲しいデータを探すための仕組み」です。データの活用方法を考えるためには大前提として、どこにどんなデータがあるのかをすぐに検索できる仕組みが必要です。データカタログとはデータの所在、データ内容に関する説明、作成日時など、データについての情報を蓄積して、容易に検索できるようにしているシステムのことです。

図 データカタログの概要
図 データカタログの概要
情報を蓄積して容易に検索
[画像のクリックで拡大表示]

 IT部門の担当者であれば、どこにどのようなデータがあるのか、設計書を見れば分かるかもしれません。しかし、新たに製品の開発や営業の手法を考える際、一般的に主体となって動くのは企画部門、マーケティング部門、営業部門といったITが専門ではない部門の担当者が出発点となります。DXを推進する企業においては、非IT部門に対して、どこにどのようなデータがあるのかを示す必要があります。

データカタログの4要件

 単純にデータの場所を示すといったことはExcelファイルでも実現できます。しかしながら、それでは使い物になりません。データカタログには4つの要件が挙げられます。

 1つは「使いやすさ」です。非IT部門にとっての使いやすさとは、欲しいデータが探しやすいかどうかということです。グラフィカルな画面でAND/OR検索ができたり、Webブラウザー上でドリルダウンしながらデータを検索できたり、関連するデータが一覧表示されるアシスト機能が備わっていたりしたほうがいいでしょう。

 2つ目は「自動化による運用負荷の低減」です。データカタログを運用するIT部門にとって、運用負荷が高いか低いかは大切なポイントです。データカタログの運用・管理が手動によるものだと果てしない運用負荷となってしまいます。なるべく自動化できる機能が豊富に備わっていたほうが望ましいといえます。

 3つ目は「変化への強さ」です。大企業では、日々システムが開発され、データ基盤が新たにつくられたり、変更が加えられたりと変化し続けます。データの保存先はリレーショナルデータベース管理システム(RDBMS)、DWH、ファイルサーバー、さらにはクラウドストレージと時代に合わせて、データの保存先も増えていきます。データの種別も、構造化データ、半構造化データの他、非構造化データ、ストリーミングデータなど複数の種類が存在します。

 このように、異なるデータソースのメタ情報をいちいち手動で集めていては、人手がいくらあっても足りません。自動でメタ情報を収集する仕組みが必要ですが、複数のデータ保存先、複数のデータ種類が存在する現在において、将来的にデータソースが増えていくことを考慮した場合、そのすべてを一元的に管理できるデータカタログ製品は多くないのが現状です。