メールの本文や件名が意味不明の文字列になる、いわゆる“文字化け”は、表示する「文字」と「文字コード」が適切に変換されないことで発生する。文字と文字コードを対応付けるルール(エンコード方式)は複数あり、日本語を扱えるエンコード方式としては「JISコード」「シフトJISコード」「EUCコード」「ユニコード(Unicode)」の4種類がある。ルールが違えば同じ文字でも割り当てられる文字コードが異なる。保存したときと異なるルールで解釈しようとすると文字化けが生じる。
例えばシフトJISでは、16進数表記で「82A8」の2バイトに、ひらがなの「お」が対応付けられている。これを、同じシフトJISとして変換(表示)すれば「お」に戻るが、EUCなど異なるルールでは文字化けしてしまう(図5)。