CharCode



FrontPage > IndexPage > CharCode

○文字コード

■Unicode
いっちょかみ@文字コード
http://member.nifty.ne.jp/PaleG/k_char1.htm

ではぼろくそに言われていたUnicode。
問題の中国、日本、韓国の漢字を無理矢理まとめた文字集合は
CJK統合漢字というそうです。

文字コードについて
http://ash.or.jp/code/code.htm

CJK統合漢字には 20902 字が割当てられているそうです。

いっちょかみの話を読んだ時は
「Unidcodeは文字に割当てる領域が足りないから漢字を統合した
 →Unicodeで扱える漢字は従来の文字コードよりも少ない」
と勘違いしていたのですが、実際には現在規格化されている日本語の
文字セットは

・JIS第一・第二水準(JIS X 0208):3390文字
・JIS第三・第四水準(JIS X 0213):

ということで、従来の文字コードよりは多くの文字を扱えます。

まあ、いっちょかみで指摘されているのは別な点
(中日韓の別の文字が無理矢理ひとつのコードに割当てられている等)
なんですが。

■メール本文のエンコーディング
Outlookが不可解なエンコーディングをしているという話は
知っていたのですが、非常に解りやすく解説しているページがあった
のでクリッピング。

Outlook 2002におけるメッセージ・エンコーディングの問題点
http://www.atmarkit.co.jp/fwin2k/win2ktips/127ol2002encerr/127ol2002encerr.html

------------------------------------------------------------

■リンク集

◆いっちょかみ@文字コード
http://homepage3.nifty.com/PaleG/k_char1.htm
僕にとっての文字コード入門書。
最終更新から5年経ってなお、ここまでちゃんとまとめられたリソース
は他にないと思っています。


[PR]liLOハ^:LOハ^lCハ^lョハ^