全3898文字
PR

DXの推進には膨大な量の、かつ多種多様なデータの扱いが求められる。従来のリレーショナルデータベース(RDB)ではデータの処理が難しい場合もある。RDBと非リレーショナルデータベースを適切に使い分けることでニーズを満たせる。

 デジタルトランスフォーメーション(DX)においてデータの利活用を進めると、企業は膨大で多種多様なデータを扱うことが求められます。スマートフォンの普及やIoT(インターネット・オブ・シングズ)によって多様な機器がインターネットに接続され、取得されるデータは急速に増え、その種類も多岐にわたります。アプリケーションのログやSNS(交流サイト)をはじめとするWebサービスのログ、IoT機器のセンサーデータなどです。

 大規模で多種多様なデータを迅速に分析・集計するには、リレーショナルデータベース(RDB)では扱うことが難しいケースがあります。構造化されたデータについて、整合性を重視してトランザクション処理をするのとは異なるニーズがあるからです。

 RDBが抱えている課題の解決には、大規模なデータの集計・分析に特化したデータウエアハウス(DWH)や、行と列の構造では表現が難しいデータを扱えるNoSQL(Not Only SQL)と呼ぶ非リレーショナルデータベースが有効です。

 クラウドベンダーは一般的なRDBの他、DWH、NoSQLでもさまざまなマネージドサービスを提供しています。柔軟性・俊敏性に富むクラウド環境で、大規模かつ多種多様なデータの処理に対してこれらのデータベースを利用できます。素早くサービスを立ち上げ、試行錯誤を繰り返しながら品質を高めていくというDXで多く採られる開発プロセスにおいては大きなメリットです。

データベースの種類とその特徴

 データベースの種類は事前に定義された構造化データを管理する(広義での)リレーショナルデータベースと、それ以外の非リレーショナルデータベース(NoSQL)に大きく分けられます。さらにデータの管理方法などによって細分化されます。

表 クラウドで提供されるデータベースの種類と主な特徴
多種多様なデータベースサービスがそろう
表 クラウドで提供されるデータベースの種類と主な特徴
[画像のクリックで拡大表示]

 どのデータベースが最適かはユースケースによって異なります。DXにおいては、まず汎用的なデータストアとしてのRDBがあり、その課題を解決・補完するために他のデータベースがあります。適切な種類のデータベースを選んで、RDBと併用するという考え方がよいでしょう。

 以下で各データベースについてその特徴を見ていきましょう。

リレーショナルデータベース(RDB)

 RDBは事前に定義したテーブルで構造化データを管理する最も一般的なデータベースです。ACID(Atomicity、Consistency、Isolation、Durability)特性を備えたトランザクション処理に強い特徴があります。データにリレーション(関係性)を持たせることによってSQLを使用した柔軟なクエリーを実行できます。

データウエアハウス(DWH)

 従来のRDBが行単位にデータを管理するのに対し、DWHは列単位にデータを管理するため、列指向データベースと呼ばれます。列単位でアクセスする場合に物理的なデータアクセスの量を減らせることから、分析、集計などの性能を最適化できます。

 SQLを使用したクエリーを実行できますが、参照処理に最適化したデータベースのため、更新トランザクションは制限されます。一般的にはRDBやファイルシステム、データレイクなどから一定の周期でデータを取得します。その際、クエリーの性能を上げる目的で、クエリーに合った形にデータを非正規化して格納します。このようにしてRDBでは処理が難しい大規模データの分析、集計、BI(ビジネスインテリジェンス)などで使用されます。