PR

 NTTアイティは,企業内に点在するファイル・サーバーを対象とした全文検索エンジン「InfoBee/EX」を,2007年4月23日に販売開始する。社内Webコンテンツ用の検索エンジン「InfoBee」をベースに,新たにファイル・サーバーを検索対象とした。利用料金は年額制で,初年度は,利用者50人で150万円(税別),300人で300万円(税別),500人で450万円(税別)。販売目標は,2007年度100ライセンス。

 InfoBee/EXは,Webコンテンツに加えて,ファイル・サーバーに格納されているファイルを検索対象とした企業向け全文検索エンジン。Microsoft Officeの文書やPDFなど各種文書ファイルを検索できる。ファイル・サーバーに専用のエージェント・ソフトをインストールして運用する。ファイル・サーバー上でのファイル操作をリアルタイムに検知して検索に反映できるほか,ファイル・システムのアクセス権限を利用した検索結果のフィルタリングが可能である。

 検索対象となるファイル・サーバーの要件は,Windows OSを用いていること。ファイル・サーバー上で動作するエージェント・ソフトがファイル操作を検知し,アクセス権限などの属性情報と合わせて全文検索に必要な情報を取得,検索エンジンへ送信する。

 エージェント・ソフトが,全文検索に必要な情報を検索エンジンへ受け渡す方法には以下の2種類の方法がある。1つは,検索対象となるファイルそのものを送信する方法。この場合は,検索エンジン側で全文検索用のテキストを抽出する。受け取った原本の文書ファイルは,テキストの抽出後に破棄する。

 もう1つは,エージェント・ソフトが,文書ファイルからテキストを抽出した後に,抽出後のテキスト・ファイルを検索エンジンに送信する方法である。テキストの抽出には,各種の文書ファイルの形式ごとに用意したWindowsのテキスト抽出ライブラリ「IFilter」を用いる。

 全文検索用の検索インデックスを生成するアルゴリズムは,日本語の文章を意味を持った語句ごとに分ける形態素解析である。形態素解析のための同義語辞書は約12万語。辞書に載っていない形態素も未知語として登録する。

 稼働OSは以下の通り。検索エンジンは,Linux。ファイル・サーバーは,Windows 2000/XP,Windows 2000 Server,Windows Server 2003。検索操作のためのクライアント・ソフトは,Windows 2000/XP,Windows 2000 Server,Windows Server 2003。なお,クライアント・ソフト上では,検索結果として得たファイルの閲覧と更新が可能だ。