PR
写真1●EMC Greenplum HDについて説明する、EMCジャパンでデータ・コンピューティング事業本部テクノロジー&プロフェッショナルサービス部テクニカルコンサルタントを務める中村完氏
写真1●EMC Greenplum HDについて説明する、EMCジャパンでデータ・コンピューティング事業本部テクノロジー&プロフェッショナルサービス部テクニカルコンサルタントを務める中村完氏
[画像のクリックで拡大表示]
写真2●DWH/データマートをオンデマンドで調達するEMC Greenplum Chorusのセルフサービス・ポータル画面
写真2●DWH/データマートをオンデマンドで調達するEMC Greenplum Chorusのセルフサービス・ポータル画面
[画像のクリックで拡大表示]

 EMCジャパンは2011年8月9日、買収した米GreenplumのDWH(データウエアハウス)製品に関する最新動向をアップデートした。Hadoop互換製品を2011年第3四半期に、セルフサービス・ポータル製品を2011年内に出荷する。いずれも、米EMCが2011年4月から5月にかけて発表した製品であり、今回、同製品群に関する説明会を国内で開催したかたち。

 前提となるGreenplum Databaseは、RDBMS(リレーショナルデータベース管理システム)のPostgreSQLをシェアードナッシングのMPP(超並列処理)型で動作するようにした、DWH用途のデータベースサーバーである。サーバー機の台数を増やすスケールアウトによって性能をリニアに拡張できる。汎用のPCサーバー上で動作するため、専用ハードウエアを用いる他社のDWHアプライアンス製品よりも安価にMPP型のDWHを構築できるとしている。

 EMCは、まず、開発会社のGreenplumを2010年に買収し、Greenplum Databaseをプリインストールしたしたアプライアンス「EMC Greenplum Data Computing Appliance」(DCA)を製品化した。日本国内では、EMCジャパンが2011年1月から出荷を開始している。

 その後、2011年4月5日にDCAの製品ラインアップを拡充する発表を行った。具体的には、DCAをこれまでの1種類から3種類へと拡充した。さらに、米SAS InstituteのBI(ビジネスインテリジェンス)ソフトをDCAの上に搭載したBIシステム製品「SAS High-Performance Analytics on Greenplum DCA」を、2011年第4四半期に出荷することを発表した。

 製品ラインアップの拡充では、容量重視型の「Greenplum High Capacity DCA」と、性能重視型の「Greenplum High Performance DCA」を追加した。容量重視型モデルは、ディスクの物理容量を36Tバイトから124Tバイトへ、データ圧縮時容量を144Tバイトから496Tバイトへと拡大した。ただし、データ検索性能は1秒あたり24Gバイトから14Gバイトへと下がる。一方で、性能重視型のモデルは、ディスクにSSDを採用し、データ検索性能を1秒あたり72Gバイトへと高めた。

 2011年5月9日には、米国ラスベガスで開催したEMC World 2011で、Apache Hadoop互換製品「EMC Greenplum HD」を2011年第3四半期に出荷することを発表している。同ソフトは企業版のHadoopという位置づけであり、米MapR Technologiesが開発したソフト技術を採用した。なお、もともとGreenplum Databaseが備えていたMapReduceインタフェース処理機能とは別物であり、Hadoop互換ソフトとしてHadoop同様の分散処理ができる。

 EMC Greenplum HDでは、Hadoopに対して処理性能と可用性を高めている。性能は、コア部分をJavaではなくC言語で一から開発したことなどにより、「Hadoopよりも3~5倍高速」(EMCジャパン データ・コンピューティング事業本部テクノロジー&プロフェッショナルサービス部テクニカルコンサルタント 中村完氏、写真1)としている。一方で、Hadoopとの互換性を維持しており、Hadoop用に開発したJavaアプリケーションが100%動作するという。可用性では、マスターサーバーとなるネームノードを冗長化することで単一障害点を排除した。

 今回の説明会では、Greenplum時代に発表していたソフトウエア製品「EMC Greenplum Chorus」の出荷時期が2011年内であることと、開発中のベータ版の画面(写真2)も発表した。同ソフトは、Greenplum Databaseを用いたDWHやデータマートをセルフサービス型で調達できるポータルソフトである。Webポータル画面から、必要に応じて迅速にプロビジョニングできるようにする。2011年内に出荷する第1版ではデータソースがGreenplum Databaseに限られるが、順次、ほかのデータベースも利用できるようにする。