
CharCode
FrontPage > IndexPage > CharCode
○文字コード
■Unicode
いっちょかみ@文字コード
http://member.nifty.ne.jp/PaleG/k_char1.htm
ではぼろくそに言われていたUnicode。
問題の中国、日本、韓国の漢字を無理矢理まとめた文字集合は
CJK統合漢字というそうです。
文字コードについて
http://ash.or.jp/code/code.htm
CJK統合漢字には 20902 字が割当てられているそうです。
いっちょかみの話を読んだ時は
「Unidcodeは文字に割当てる領域が足りないから漢字を統合した
→Unicodeで扱える漢字は従来の文字コードよりも少ない」
と勘違いしていたのですが、実際には現在規格化されている日本語の
文字セットは
・JIS第一・第二水準(JIS X 0208):3390文字
・JIS第三・第四水準(JIS X 0213):
ということで、従来の文字コードよりは多くの文字を扱えます。
まあ、いっちょかみで指摘されているのは別な点
(中日韓の別の文字が無理矢理ひとつのコードに割当てられている等)
なんですが。
■メール本文のエンコーディング
Outlookが不可解なエンコーディングをしているという話は
知っていたのですが、非常に解りやすく解説しているページがあった
のでクリッピング。
Outlook 2002におけるメッセージ・エンコーディングの問題点
http://www.atmarkit.co.jp/fwin2k/win2ktips/127ol2002encerr/127ol2002encerr.html
------------------------------------------------------------
■リンク集
◆いっちょかみ@文字コード
http://homepage3.nifty.com/PaleG/k_char1.htm
僕にとっての文字コード入門書。
最終更新から5年経ってなお、ここまでちゃんとまとめられたリソース
は他にないと思っています。