PR

 Word 2007の大きな改革として注目されるのが、ファイル形式の変更だ。文書ファイルがこれまでの独自形式からXML形式に変わり、拡張子も「doc」から「docx」になった。XML形式とは何か、どんなメリットがあるのか、さらに旧バージョンでの読み込みは可能なのか。気になる点を探っていこう。

 XML(Extensible Markup Language)というのは、データを記述する言語のひとつ。HTMLのように「タグ」を使い、テキスト形式で記述するため、どんな環境でも扱えるのが魅力だ。“文書ファイルがテキスト形式で保存される”と単純に考えると、データ交換や検索のしやすさなど、そのメリットがほんのりと見えてくる。

 ではXML形式の文書ファイルとは、実際どのようなものなのだろうか。見た目は従来の文書ファイルと変わらないが、実は複数のファイルをZIP形式で圧縮したもの。ファイル名の後ろに「.zip」を追加すると、アイコンがZIPの圧縮ファイルに変わり、ダブルクリックで内容を見ることができる。

図1 Word 2007の文書ファイルはXML形式(拡張子docx)で保存される。ZIP形式の圧縮ファイルなので、ファイル名に拡張子「.zip」を追加すると中味を見ることができる

文書は複数のファイルで構成される

 圧縮ファイルの中には、文書を構成する様々なファイルが格納されている。核となる部分は「Word」フォルダにまとめられ、テキスト部分は「document.xml」に記述されている。また、写真や図形などの画像ファイルは「media」フォルダに保存される。

拡大表示
図2 文書のテキスト部分は「Word」フォルダ内の「document.xml」に記述されている。また写真や図形などの画像ファイルは「media」フォルダに保存されている

 このように、文書を各部に分けて保存することで、次のようなメリットが生まれる。
 ・テキストや写真を個別に表示したり、修正することができる
 ・一部のデータが破損しても、他のデータを救える
 ・複数のファイルをまとめて圧縮することで、ファイルサイズが小さくなる

Wordを使わずにテキストや写真を修正

 試しに「document.xml」を開いて、文章の修正をしてみよう。「document.xml」をダブルクリックすると、XMLで記述されたテキスト形式のデータが、InternetExplorerに表示される。<w:t></w:t>というタグに囲まれているのが、文書のテキスト部分だ。

 文章を修正するときは、InternetExplorerの「表示」メニューから「ソース」を選び、メモ帳に内容を表示する。ここでは「春夏」を「秋冬」と書き替えた。修正が終わったら「document.xml」を別の場所(デスクトップやマイドキュメントなど)に保存する。上書き保存はできないので注意しよう。

 後は保存した「document.xml」を圧縮ファイル内のwordフォルダにドラッグし、元の「document.xml」と置き換えればOKだ。なお、最初に「document.xml」を解凍し、これを メモ帳などで修正して元のファイルと置き換えてもいい。

拡大表示
図3 「document.xml」をダブルクリックして内容を確認。ソースをメモ帳に表示して文字を修正し、別の場所に保存。それを圧縮ファイル内の「document.xml」と置き換える

 写真の入れ替えは、さらに簡単。圧縮ファイル内の画像ファイルを、新しい画像ファイルに置き換えるだけでいい。なお同じファイル名で置き換えるため、元の画像ファイルは消えてしまう。必要に応じてバックアップしておこう。

拡大表示
図4 画像ファイルは、圧縮ファイル内の「media」フォルダで直接置き換える。新しいファイルは置き換えるファイルと同じ名前「image1.jpeg」にする

 修正が終わったら、拡張子の「.zip」を取って元の「バッグコレクション.docx」に戻し、文書ファイルをWordで開く。文章も写真もきちんと修正されていた。

拡大表示
図5 圧縮ファイルの拡張子「.zip」を削除して文書ファイルに戻し、Word 2007で開く。タイトル文字と写真が変更された

 文章や写真の修正はWordから行うのが普通だが、このように外部からの修正が可能になったことで、データの活用範囲は広がるだろう。ただ活用にはXMLの知識や、作業に伴うスキルも必要だ。

 なおXMLを利用して、リボンをカスタマイズすることもできる。ただしこれもXMLの知識がないと難しい。一般のユーザーとしては、リボンのカスタマイズ機能をWord内部に用意してもらいたいところだ。