全3079文字
PR

DX(デジタルトランスフォーメーション)の推進にデータ基盤の整備は不可欠である。事前に整備することでDXの試行回数を増やせ、成功率も上げられる。ただし一気に全データを取り込むのではなく、スモールスタートで素早く始めるのが得策だ。

 AI(人工知能)、IoT(インターネット・オブ・シングズ)、分析などの手段を用いてDXを進める際、データをいかに効率良く蓄積して活用できるかによってそのスピードは変わります。

 例えば分析の場合、データサイエンティストの業務時間の8割はデータの収集やクレンジング(データを選別し、不要なデータを削除するなどして「洗浄」すること)といった前処理に費やされていると言われています。これではDXのスピードは上がりませんし、一般的に報酬が高いデータサイエンティストが前処理に多くの時間を割くような状況では投資対効果を上げられません。

図 データ基盤の整備とDXのスピード
図 データ基盤の整備とDXのスピード
データ基盤を維持してDXの試行回数を増やす
[画像のクリックで拡大表示]

 そこでDXに利用するデータ基盤には、データを自動的に収集し、クレンジングし、常にデータを利用できる状態に維持しておくという役割が求められます。この役割を果たすには、従来のデータ基盤に求められていた安定性や、単独のシステム内における整合性に加えて、いくつかの特性を兼ね備える必要があります。以下に主な特性を列挙します。

 ①さまざまなデータ提供元やデバイスから、データの蓄積が可能な拡張性の高いストレージを利用できる、②分析やDXの取り組みを進める中で利用・生成される非構造化データを処理できる、③データの統合処理やクレンジングを自動化できる仕組みを用意している、④データの利用者に対してデータ基盤にどのようなデータがあるのかを分かりやすく伝えるデータカタログが存在する、⑤外部とデータをやり取りするためのAPI(アプリケーション・プログラミング・インターフェース)を整備している――です。

 データ基盤の仕組みを構築して運用する役割を担うのが、データエンジニアとデータベースエンジニアです。データエンジニアはデータそのもののアーキテクチャー設計や統合、クレンジングの仕組み、カタログの整備を担当します。データベースエンジニアはデータ基盤のインフラアーキテクチャーを設計し、安定して運用する役割を担います。