PR

いまや企業内では数多くのサーバーが稼働し,大量の情報が分散している。そこで重要性を増しているのが「エンタープライズ・サーチ」だ。キーワードをいくつか指定すれば,社内の各種サーバーを横断的に検索し,瞬く間に該当データを探し出して一覧表示してくれる。データが氾らんしている昨今,企業情報システムの必須アイテムになりつつある。(高橋 秀和=日経コミュニケーション

 エンタープライズ・サーチのシステムは,インターネットで使われている検索エンジンと構造的には同じである。具体的には,(1)ネットワークを介して検索対象のシステムから文書を収集する「クローラ」,(2)収集した文書からテキストを抽出して索引を作成する「インデクサ」,(3)ユーザーからの問い合わせに従って索引を調べ,検索結果を返す「サーチャー」という三つのプログラム・モジュールが連携して動作する(図1)。エンタープライズ・サーチ製品は,これに簡易なポータル・サーバーの機能や,アクセス制御を実現するための。ディレクトリ・サービス連携機能を持たせてある。

図1●社内に散在している情報を横断的に検索する「エンタープライズ・サーチ」製品の基本構造
図1●社内に散在している情報を横断的に検索する「エンタープライズ・サーチ」製品の基本構造
クローラが文書を収集,インデクサが文書の索引を作成する。サーチャーはユーザーのアクセス権限に応じた検索結果を返す。

 検索システムの動作はこうだ。まず(1)のクローラが,あらかじめユーザー企業のシステム管理者が設定したスケジュールに基づいて各サーバーにアクセスする。この際,サーバーには管理者権限でアクセスするため,サーバー上のすべての文書を収集できるようになっている。

 対象がイントラネットのWebサーバーならHTTPでアクセスしてページを取得。グループウエアなら専用のAPIを介すか,Webブラウザ向けのページにアクセスしてデータを取得する。日常の業務でよく使われるオフィス・ソフトのファイルのほか,各種グループウエア,Webページなど,よく使われているファイル形式の文書はたいてい収集可能で,製品間で大きな違いはない。

 ただし,グループウエアや文書管理製品を検索対象とする場合には,専用のゲートウエイ・ソフト(アダプタ)をオプションとして別途購入しなければならない製品が多い。また,ベンダーの独自形式などオプションにないファイル形式に対応させたい場合は,個別に作り込むことになる。

 次に(2)のインデクサが,こうして収集した文書ファイルの内容を解析し,索引を付ける。文章を単語に切り分ける技術を使って文書に含まれている単語を抽出。これを索引として文書ファイルと対応付ける。

 (3)のサーチャーは,いわばエンタープライズ・サーチの「顔」に当たる部分である。エンドユーザーに検索窓のあるWebページを提供し,検索の要求を受け付ける。この「顔」のWebページは,エンタープライズ・サーチ製品が標準で備えているが,社内ポータルやグループウエアのページに組み込むこともできる。

 検索窓にキーワードが入力されると,サーチャーはこれをインデクサに送信。インデクサが索引を検索した結果を返すと,サーチャーがエンドユーザー向けの検索結果ページを生成する。この際,結果の掲載順序(ランキング)は,あらかじめ設定したルールに基づいてサーチャーが自動判定する。

 サーチャーへのアクセスに際しては,アクセス制御のためにエンドユーザーを検索エンジンにログインさせる必要がある。ただ,検索時にいちいちログインするのではユーザーには面倒。そこで,シングルサインオン機能を使って検索エンジンへのログイン処理を隠ぺいする。どのエンタープライズ・サーチ製品もシングルサインオンに対応している。導入に当たっては,検索対象システムとのシングルサインオン設定が欠かせない。