PR

 メールの本文や件名が意味不明の文字列になる、いわゆる“文字化け”は、表示する「文字」と「文字コード」が適切に変換されないことで発生する。文字と文字コードを対応付けるルール(エンコード方式)は複数あり、日本語を扱えるエンコード方式としては「JISコード」「シフトJISコード」「EUCコード」「ユニコード(Unicode)」の4種類がある。ルールが違えば同じ文字でも割り当てられる文字コードが異なる。保存したときと異なるルールで解釈しようとすると文字化けが生じる。

 例えばシフトJISでは、16進数表記で「82A8」の2バイトに、ひらがなの「お」が対応付けられている。これを、同じシフトJISとして変換(表示)すれば「お」に戻るが、EUCなど異なるルールでは文字化けしてしまう(図5)。

●文字化けの原因は「文字コード」
図5 Windows上では、文字情報は「文字コード」に変換されて取り扱われる。日本語を扱える文字コードには、JISコードやシフトJIS、EUC、ユニコードなどがある。それぞれの文字に割り振られるコードは方式によって異なるため、同じ方式で読み出さないと、文字コードが適切に変換されず、いわゆる“文字化け”が発生する
図5 Windows上では、文字情報は「文字コード」に変換されて取り扱われる。日本語を扱える文字コードには、JISコードやシフトJIS、EUC、ユニコードなどがある。それぞれの文字に割り振られるコードは方式によって異なるため、同じ方式で読み出さないと、文字コードが適切に変換されず、いわゆる“文字化け”が発生する
[画像のクリックで拡大表示]