技術情報メモ

コンピュータ等の技術情報をメモっていきます。
mysqlやqmailなど...。

文字エンコーディングについて

2005年12月19日 | webデザイン
文字エンコーディングについて

文字エンコーディングとは
Let's begin XHTML -- Appendix A

コンピュータでは,まず,どんな文字を使うのか決めなくてはならない。英語であれば,さしあたっては英数字と基本的な記号があればよいだろう。ヨー ロッパ言語全般なら,これにアクセントがついたアルファベットが必要になってくる。日本語は,英数字も使うが,かな・漢字が必須だ(これは欧米の言語に比 べたらたいへんな数になる)。韓国語なら,ハングルと漢字が要る。

 どんな文字を使うかを決めたところで,これを伝送・蓄積するには,それをどのように数値に直すか(番号を振るか)という約束を決めなくてはならな い。これが文字エンコーディングである。送り手では文字を番号に変え,それを送り,受け手では番号から対応する文字に直す。文字エンコーディングが決めら れて,文字が伝わる。

文字コード(Wikipedia)

コンピュータでは、すべての文章は文字コードの並びとして扱う。コンピュータの発展が早かった英語圏やその他のアルファベットを使用する言語(主に西洋)、日本語、朝鮮語などは言語固有の文字コードが制定され、利用可能になっているが、大部分の言語ではコンピュータ上で文字を正常に表現することができない。

文字コードの歴史は電気通信の歴史とほぼ等しい。古くはテレックスで用いられた国際電信アルファベット第2、英語圏で多く利用されてきた ASCII、IBMによって開発されたEBCDICがあった。しかしコンピュータシステムが多くの言語圏で利用されるようになるにつれて文字コードの種類も増大し、現在では 100種類以上の代表的な文字コードが存在する。

文字コードとは、コンピュータにおける文字(ひらがな・カタカナ・漢字など)とコンピュータ内の記号との対応表のこと?
WindowsコンピュータやUNIX等、Mac等のコンピュータが登場した当時は、各社が独自の文字コード(UNIX:EUC、Windows,MAC:SJIS)
)を使用していたが、インターネット等によりコンピュータが相互に接続された昨今では、相互の文字コードで作成された文書等を閲覧しなくてはならない場合が出てきた。