デジタルトランスフォーメーション(DX)に取り組む中でデータの利活用を進めると、企業のデータベースにはこれまでにはなかった膨大な量の、かつ多種多様なデータを扱うことが要求されます。
スマートフォンの普及やIoT(インターネット・オブ・シングズ)化によって多様な機器がインターネットに接続され、そこから取得されるデータは急速に増加しています。データの種類も多岐にわたります。アプリケーションのログやSNSをはじめとするWebサービスのログ、IoT機器のセンサーデータなどです。
大規模で多種多様なデータを迅速に分析・集計するには、従来のリレーショナルデータベース(RDB)では難しいところがあります。構造化されたデータについて、整合性に重きをおいてトランザクション処理をするのとは異なるニーズがあるからです。
既存のRDBが抱えている課題の解決方法として、大規模データの集計・分析に特化したデータウエアハウス(DWH)や、行と列からなる構造では表現が難しいデータを扱えるNoSQL(Not Only SQL)と呼ばれる非リレーショナルのデータベースが有効な選択肢としてクローズアップされます。
こうしたイノベーションはクラウドの領域で活発です。クラウドベンダーは一般的なRDBに限らず、DWH、NoSQLでもさまざまなマネージドサービスを提供しています。柔軟性・俊敏性に富むクラウド環境で、大規模かつ多種多様なデータの処理にこれらのデータベースを利用できることは、素早くサービスを立ち上げ、試行錯誤を繰り返しながら品質を高めていくというDXで多く採られる開発プロセスにおいて大きなメリットです。
連載の第3回ではAmazon Web Services(AWS)、Microsoft Azure(Azure)、Google Cloud Platform(GCP)、Oracle Cloud Infrastructure(OCI)が提供する最新のデータベースサービスを紹介します。
データベースの種類とその特徴
データベースの種類は大きくは事前に定義された構造化データを管理する(広義での)リレーショナルデータベースとそれ以外の非リレーショナルデータベース(NoSQL)に分けられます。さらにデータの管理方法などによって細分化されます。
どのデータベースが最適かはユースケースによって異なりますが、DXへの取り組みにおいては、まず汎用的なデータストアとしてのRDBがあり、その課題を解決・補完するために他のデータベースから適切なものを選んで併用するという考え方がよいでしょう。
利用するデータベースサービスが多くなると、データ連係やデータの一貫性を保つコストが大きくなります。できるだけ少ない種類のデータベースサービスでニーズを満たすようにするのが肝要です。以下で各データベースサービスについてその特徴を見ていきましょう。