PR

拡張性を考えるなら大規模指向の製品を

 現在市場にあるエンタープライズ・サーチ製品は,製品によってアーキテクチャや細かな機能に違いがあり,対象ユーザーも異なる。具体的には,導入の容易さを重視する製品,数千万超の文書を扱える大規模指向の製品,キーワードと完全には一致しない単語を含む文書を検索する「あいまい検索」を特徴とする製品,ほかのユーザーが使ったキーワードの組み合わせを参照できるなど「検索ノウハウを共有」できる製品,といった具合だ。

 導入の容易さを前面に押し出す製品の代表格は,ハードウエアと一体提供するアプライアンス型の製品。全社導入はもちろん,試験的に導入して使い勝手を試す用途にも有用だ。利用価値がなくなった文書や重複ファイルが散在しているような場合に,検索結果を基に無駄なファイルを削除していく。

 エンタープライズ・サーチ製品の多くが文書数やサーバー数に応じて課金するライセンス体系を採っている。このため検索したい文書を絞り込むことで,本格導入時の費用も下げられる。

 大規模指向の製品では,クローラ,インデクサ,サーチャーを独立させられるなど,全社,あるいは企業グループ全体への導入を視野に入れた構造となっている。導入時には小規模展開でも,将来的に拡張する可能性があるなら,こうした大規模指向の製品を選ぶ方がよいだろう。

SNS/ブログ連携で「人づて」の検索が可能なものも

 エンタープライズ・サーチのエンドユーザーがどう検索できるかにも違いがある。エンドユーザーのパソコンやインターネットに対する習熟度などによって異なる。使い勝手に関するエンドユーザーのニーズを見極めることが肝心である。

 検索時のキーワード選定でキーボードを打つ手が止まるエンドユーザーが多いような場合は,検索のノウハウを共有できる製品が便利だ。検索条件を利用者間で共有する機能を持つ製品を選ぶのが良いだろう。最近では,SNSブログソーシャル・ブックマークと連携する機能やソリューションを武器に,人づてで情報を探せる製品も出始めた。

ライセンス体系次第でコストが大幅に変わる

 製品選択に際しては,ライセンス体系も押さえておきたい。製品価格がサーバー台数で決まるもの,対象文書数で決まるものなど,ライセンス体系は様々である。例えば法律事務所のように文書数は膨大だが利用者数が数人というようなケースでは,サーバー・ライセンスが有利。逆に文書数が少なく利用者が多い場合は,文書数に応じて段階的に価格が変わる方が無駄な費用を支払わずに済む。

 「容量」で価格が決まる製品もある。例えば文書から抽出したテキストの容量である。数Mバイトのパワーポイント形式(.ppt)のファイルであっても,インデックス・データベースに格納するテキスト成分の容量は数Kバイト程度に過ぎない。

 総じて文書の数が多い場合は,検索対象に含める文書を導入前に整理しておくことも費用を削減するといった点からは重要だ。拡張子やフォルダ,サーバー単位でリストアップしておけば,無駄なファイルをインデックスに格納するコストを減らせる。製品によっては,価格の安い下位版を選択する余地が生まれる。アプライアンス型の製品や下位版の製品を導入して,サーバーやフォルダごとにファイルを検索し,重複や古さの目立つ文書を見つけて整理したうえで本格導入するという手もある。

デスクトップ検索との連携は双方向で

 文書ファイルをはじめとする情報があふれかえっているのは,サーバーだけではない。個々人のパソコンにも数多くのデータがある。最近のパソコンは標準で数十Gバイトのハードディスクを搭載しており,データの量は増える一方だ。当然,サーバーだけでなくパソコンの中にあるデータも検索したいというニーズが出てくる。

 こうしたニーズに応えるツールが「デスクトップ検索」製品である。2005年ころから無償の製品が広く普及し始めている。パソコンの中にあるファイルを,インターネットのコンテンツと同様にキーワードで検索できる。

 いくつかのエンタープライズ・サーチ製品では,デスクトップ検索の画面に,エンタープライズ・サーチの検索結果をマージできる。デスクトップ検索から,ローカルとリモートを区別することなく横断検索が可能になる。

 それとは反対に,デスクトップ検索ツールのAPIを呼び出すことで統合的に検索するエンタープライズ・サーチ製品もある。APIが公開されているデスクトップ検索製品が多いため,こうした連携機能の作り込みは比較的容易である。エンタープライズ・サーチのエンジンがサーバーの検索結果にデスクトップ検索の結果を統合して,一つの画面に表示する。