Web技術の標準化団体であるWorld Wide Web コンソーシアム(W3C)は米国時間で3月19日,「Canonical XML 1.0」を勧告した。XMLデータをテキスト・ファイルとして表現形式を統一する技術で,XMLデータにディジタル署名するときに不可欠ともいえる。ディジタル署名では,XMLデータであろうと,単なるデータとして処理する。ところが,XMLデータは,企業間でやり取りしたり,システムを経由したりすると,その内容は変わらないものの,表現形式が変わったりすることがある。こうなると,ディジタル署名が使えなくなる。そこで,標準化されたのがCanonical XMLである。

Canonical XMLは,XMLデータの内容を保ったまま,統一した表現形式(正規化形式:canonical form)に変換する方法を定義する。XMLでは同じ情報を文字で表現したり文字コードで表現したりできるため,単純に比較したのではXMLデータの同一性を検証できないケースがある。例えば,XMLデータには「」という文字を直接記述することもできるし,「あ」や「あ」のように文字コードで記述することもできる。これらはすべて,内容的には同じ“あ”という情報を意味するが,単純に文字列として比較すると異なるデータとして扱われてしまう。そこで,比較したいXMLデータをCanonical XMLに従って正規化形式に変換し,その変換結果を比較することで,XMLデータの内容が同じであるかどうかを検証する。

Canonical XMLは,W3CとInternet Engineering Task Force(IETF)の共同作業グループ「XML Signature Working Group」が策定した。このワーキング・グループには,米アイ・ビー・エム,米マイクロソフト,米アリバ,米ボルチモア・テクノロジズなどが参加している。(H.J.)