言語空間+備忘録

メモ (備忘録) をつけながら、私なりの言論を形成すること (言語空間) を目指しています。

広告

※このエリアは、60日間投稿が無い場合に表示されます。記事を投稿すると、表示されなくなります。

文字コードと文字化け

2010-04-29 | 日記
 以前、「ブログ記事の検閲・自動書換えが行われているらしい」 に掲載した記事ですが、

   政治的な問題ではなく、技術的な問題 ( 文字コードの問題 ) ではないか、

ということで、話が収まったようです。



 しかし、もともとのブログ、「ひねくれ老耄記」 の HTML ソースを見ると、

   <meta http-equiv="Content-Type" content="text/html; charset=euc-jp" />

とあり、EUC-JP で記述されていることがわかります。



Kawa.netxp Shift_JIS に含まれない文字をエスケープ (Jcode.pm編)

下記の『』『』『』の3文字は
現在は Unicode を使って表現できますが、
Shift_JIS には含まれない文字のため、
クライアント環境によっては表示できない場合は依然多く、文字化けしやすいです。


 「とう小平」の「とう()」は、Shift_JIS には含まれない文字であるが、EUC-JP には含まれる (定義されている) 、と解説し、次の表が掲げられています。


漢字CP932EUC-JPUCS2UTF8補足
FAB1-FA11EFA891山+立+可
FBB98FE2C79127E984A7とう小平
FBFC-9AD9E9AB99ハシゴ高




 とすると、なぜ、EUC-JP で記述されているサイト、「ひねくれ老耄記」 において、「とう()」を原因とする文字化けが発生するのか、という疑問が残ります。

 どなたか、ご存知のかたがおられましたら、ぜひともご教示ください。



 なお、当ブログでは、「深圳」の「圳」など、日本語にない文字 ( または文字コード上問題の発生しそうな文字 ) については、原則として、

   「深圳 (シンセン)」

といった表記を行っています (「中国の技術力」に実例があります ) 。
ジャンル:
ウェブログ
コメント   この記事についてブログを書く
この記事をはてなブックマークに追加
« 中国製品の競争力と世界の状況 | トップ | 表向きの工場と、ウラ工場 »

コメントを投稿


コメント利用規約に同意の上コメント投稿を行ってください。

数字4桁を入力し、投稿ボタンを押してください。

あわせて読む

トラックバック

この記事のトラックバック  Ping-URL
  • 送信元の記事内容が半角英数のみのトラックバックは受け取らないよう設定されております。
  • このブログへのリンクがない記事からのトラックバックは受け取らないよう設定されております。
  • ※ブログ管理者のみ、編集画面で設定の変更が可能です。