PR

 米Netezzaは,時系列データを収めた情報分析用データベースであるデータ・ウエアハウス(DWH)向けに特化した高速SQL検索アプライアンス「Netezza Performance Server」を開発するベンダーである。この高速SQL検索アプライアンスの最大の特徴は,ストレージに近い場所でSQL文を実行する独自のアーキテクチャにより,一般的なアーキテクチャと比べて検索にかかる時間を短縮している点である。2009年4月には位置情報をSQLで扱えるようにするオプション・ソフト「Netezza Spatial」を出荷する。ITproは,同社で位置情報オプションの責任者を務めるJon Shepherd氏と,日本法人代表のDouglas Etzel氏に,DWHの需要とDWHアプライアンスの動向を聞いた。

(聞き手は日川 佳三=ITpro


米NetezzaでLocation Based Solutions担当General Managerを務めるJon Shepherd氏(写真左)と,日本ネティーザで代表取締役兼北アジアゼネラルマネージャーを務めるDouglas Etzel氏(写真右)
米NetezzaでLocation Based Solutions担当General Managerを務めるJon Shepherd氏(写真左)と,日本ネティーザで代表取締役兼北アジアゼネラルマネージャーを務めるDouglas Etzel氏(写真右)
[画像のクリックで拡大表示]

独自アーキテクチャのDB検索装置を作った背景は何か。

Douglas Etzel氏:会社を設立した2000年当時,世の中のDWHには問題があると感じていた。情報系の時系列蓄積データベースでありながら,勘定系のオンライン・トランザクション処理(OLTP)などと同様に,汎用のDBMSやサーバー機,ストレージを組み合わせていた。これでは,データの規模が大きくなると,検索に時間がかかり過ぎてしまう。ディスクからDBサーバーのメモリー上に検索対象データを転送するのに,時間がかかる。

 そこで,汎用のやり方とは異なる,DWH専用のアーキテクチャを考えた。検索用データの移動に時間がかかるのであれば,「データを移動させずに,データが書かれた場所でSQL処理してしまおう」というコンセプトだ。このコンセプトを効率的に実現するため,FPGA(Field Programmable Gate Array)搭載コンピュータ基盤と1台のHDD(ハードディスク・ドライブ)を合体させたストレージ・ユニットが生まれた。3年間の開発期間を経て,2003年春から出荷している。

 現時点で,Netezza Performance Server(NPS)のユーザーはワールドワイドで200社以上(国内40社以上)に達している。まず最初は,通信業界(主な用途は交換機の明細データ),流通業界(同POSデータ),金融業界(同取引明細),官公庁,といった業界で導入が進んでいった。これらの業界の共通点は,すでに膨大な時系列データが存在しているということ。こうしたデータを活用する需要があった。

Oracle Exadataも同様のコンセプトだが汎用のハードウエアだ。

Douglas Etzel氏:Oracle Exadataのコンセプトは極めて正しい。DWHアプライアンスを製品化することも正しいし,アーキテクチャの方向性も正しい。

 ただし,方向性は正しいのだが,機能の一部分しかストレージ側に持っていくことができていない。フロント側のDBサーバーは1台ではなく8台でクラスタを組んでいるし,検索用インデックス・ファイルも利用している。

 ストレージ側にSQL検索処理を持っていくという方向性を突き詰めると,NPSのような,FPGAを用いたディスク・ユニットになる。Netezzaは,性能と簡易性において自信を持っている。

 もちろん,Oracleなどの参入によりDWHアプライアンス市場が盛り上がるのは大歓迎だ。多くのベンダーがDWHアプライアンスを製品化してほしい。DWH構築やDWHアプライアンス導入がもっと一般的になるべきだ。今後は,DWHといえば,すべてアプライアンスになるだろう。

利点として挙げている性能と簡易性とはどういうことか。

Douglas Etzel氏:データベースのチューニングが要らないので,ユーザーのビジネス・インテリジェンス(BI)ツールの使い方に依存することなく,すぐに利用できる。これがもし汎用的なDBMSを使っていたのなら,BIツールが発行するクエリーの性質に応じて,検索用のテーブルを作成したり,インデックスを張ったり,データベースの改造やチューニングが必要になる。

 従来,NPSのようなDWHアプライアンスが無かった頃は,せっかく良いBIツールがあっても,DBMSがボトルネックとなり足を引っ張っていたため,BIの威力を出せずじまいだった。ところが,NPSのようなDWHアプライアンスが登場したことで,BIツールがようやく真価を発揮できるようになった。

DWHの需要は高いのか。勘定系DBだけで済まないのか。

Douglas Etzel氏:全社で単一のエンタープライズDWHを運用している企業は,実は少ない。なぜなら,全社DWHを構築しようとすると,従来の汎用DBMSの技術では永遠に完成しないからだ。業務は変化し続けているため,全社DWHのためのDB設計をやっていると,「完成した時には業務が変わっている」という事態になりかねない。だからこそ,簡易に導入できるNPSのようなDWHアプライアンスが必要になる。

 情報系のDBを作らずに勘定系のDBにアクセスするユーザーは,あまりいない。日々の業績をレポートするソフトウエアはたくさんあるが,いわゆる情報分析には,最低でも13カ月,できれば3年から5年くらいの時系列データが必要だ。勘定系のDBには,それだけのデータを格納しておけない。

 BIツールからDWHにアクセスするユーザー層は幅広い。深い分析を実施して経営者に資料を渡す立場のユーザーのほか,定型レポートの生成など,さまざまだ。NPSのライセンスはシンプルであり,ユーザー数などにはまったく依存していない。必要な性能(FPGA付きディスク・ユニットの数)と,実際に使ったデータ量を1Tバイト単位で課金するデータ量課金,以上の2つの要素で値段が決まる仕組みだ。

位置(地理)情報を検索する需要は高いのか。

Jon Shepherd氏:世の中のあらゆるものが位置情報を持っている。位置情報をBIに利用したいという需要は大きい。そんな背景の下,位置を表現するデータ型や,位置に関する情報を検索するSQL文が整備されていった。この分野では,OpenGISコンソーシアムと呼ぶ標準化団体が活躍している。

 現在,ユーザー企業のデータの中には,位置情報が資産として蓄積されている。NPSの位置情報オプションでは,これを活用できるようにする。実際,NPSユーザーの8割程度が,位置情報をSQLで検索する機能を必要としている。だから,位置情報を検索するためのSQL文をFPGAで実行できるようにした。

Douglas Etzel氏:これまでDWHが普及しなかったのは,位置情報を扱えなかったからとも言える。位置情報さえ高速に検索できるようになれば,位置情報を必要とする新規ユーザーが,DWHを導入するようになる。