「将来、大規模なデータバンクにおいては、データがマシン内でどのように編成されているか(内部表現)について、ユーザーが意識しなくて済むようにしなければならない」
これはリレーショナルデータベース(RDB)の生みの親、エドガー・フランク・コッド博士が1970年に発表した、いわゆる「コッド論文」の冒頭にある言葉である。原文は次の通りで筆者が訳した。
“Future users of large data banks must be protected from having to know how the data is organized in the machine(the internal representation).”
コッド博士の提言を実現するには、ビジネスの現場を担うユーザーが理解でき、場合によっては自ら記述できるデータの定義と、定義に沿ったデータをつくり出し、処理する情報システム(データベースを含む)の両方を用意しなければならない。
例えば、ユーザーが分かる定義を登録すると、システムの内部で変換して、データベース管理システム(DBMS)につないでくれる。業務が変化した場合、ユーザーは定義を変更するだけでよい。また、情報システム側の都合でDBMSを入れ替えても、ユーザー側の定義には影響しない。
コッド博士の提言から50年を経て、我々はこれを実現できたのだろうか。50年、我々は何をしてきたのか、と暗くなってしまうほど、ほとんどできてはいない。
しかも最近になって“Data is the New Oil.”といった言葉や書籍『無形資産が経済を支配する』(ジョナサン・ハスケル、スティアン・ウェストレイク著、山形浩生訳、東洋経済新報社)が登場し、情報システムの専門家以外からデータマネジメント重視論が盛り上がり始めている。
これを受け、ユーザーは「俺たちのデータはどこにあるのか」と言い出している。そう尋ねられた情報システム担当者やIT企業のエンジニアがDBMSに実装するための工夫を盛り込んだ図(データダイヤグラム)を見せたとしてもユーザーは自分に関係する資料とは思わない。
コッド博士は50年後に、そんなことが起こると予感していたのだろうか。
概念データモデルを描いているか
「ビジネスの現場を担うユーザーが理解でき、場合によっては自ら記述できるデータの定義」として概念データモデルがある。業務ルールを表現するモデルだ。これに対し、DBMSに実装するテーブル構造の仕様を表すのが物理データモデルである。両者の中間に、セキュリティーやガバナンスを実現するための論理データモデルを置く。
本連載を担当している「IT勉強宴会」は第1回で佐野初夫氏が示したように「データの構造」を通じてビジネスを捉えることに1つの軸足を置いている。