しつこいようですが、テキストデータについてもう少し考えてみました。
テキストデータの本質は、
であり、それによって得られるバイナリデータに対する利点は、
という事になるかと思います。
(イ)と(ロ)は、バイナリデータと言うより、画像データとの比較と言う事になります。
バイナリデータに対して、テキストデータは「人間が読める」という違いがあるわけですが、
「人間が読める」と言う事だけならば、画像データも同じだからです。
画像データの場合、人間は、脳が画像全体から瞬時に認識して意味を汲み取れる訳ですが、
今のコンピュータは、画像を構成する点を一つ一つ計算していく事しかできません。
テキストデータの場合、もちろん人間は文字を単位として意味を汲み取る訳ですが、
コンピュータも簡単に文字を単位として処理ができます。
テキストデータは、人間が扱える単位からも、コンピュータが扱える単位からも、
とても近いデータで、人間にも機械にも優しいデータ形式と言えます。
バイナリデータに対して、圧倒的に有利な点が(ハ)になるでしょう。
バイナリデータは、何かによって人間に分かる形に変換されなければ、
人間が理解する事が難しいか、人間に理解できません。
人間に分かる形に変換してくれる何かが無くなってしまった場合、
そのデータは意味を失い、存在しない事と同じ事になります。
テキストデータも、その正体はバイナリデータであるので、
同じ問題を抱えています。
バイナリデータが意味を失わないようにするためには、
標準化して、人間に分かる形への変換の仕方が、誰にでも分かるようにする事と、
広く多くの人々に使われ、深く深く浸透して、無くてはならない物になる事が大切です。
そして、最も広く多くの人々に使われていて、最も深く深く浸透していて、
最も無くてはならない物になっているバイナリデータの標準こそが
テキストデータです。
ここまで書いて気がついたのですが、どうも、最初に掲げた(イ)(ロ)(ハ)の三項目の内、
(イ)(ロ)をまとめる事が出来そうです。
また、(ハ)の方が重要そうなので順番を入れ替えたほうが良さそうです。
つまり、テキストデータの本質は、
という事になると思います。
元の記事: それは「ストリーム」か「レコード」かという事では?(ふにょい日記)←この記事に 2009/04/11 03:13 頃、追記しました。
大本の記事: バイナリとテキストの本当の違い(404 Blog Not Found)
テキストデータの本質は、
- (イ)「文字」である事による抽象性
- (ロ)「数」が割り振られている事による計算のしやすさ
- (ハ)広く深く浸透している「標準」
であり、それによって得られるバイナリデータに対する利点は、
- 「再利用のしやすさ」
という事になるかと思います。
(イ)と(ロ)は、バイナリデータと言うより、画像データとの比較と言う事になります。
バイナリデータに対して、テキストデータは「人間が読める」という違いがあるわけですが、
「人間が読める」と言う事だけならば、画像データも同じだからです。
画像データの場合、人間は、脳が画像全体から瞬時に認識して意味を汲み取れる訳ですが、
今のコンピュータは、画像を構成する点を一つ一つ計算していく事しかできません。
テキストデータの場合、もちろん人間は文字を単位として意味を汲み取る訳ですが、
コンピュータも簡単に文字を単位として処理ができます。
テキストデータは、人間が扱える単位からも、コンピュータが扱える単位からも、
とても近いデータで、人間にも機械にも優しいデータ形式と言えます。
バイナリデータに対して、圧倒的に有利な点が(ハ)になるでしょう。
バイナリデータは、何かによって人間に分かる形に変換されなければ、
人間が理解する事が難しいか、人間に理解できません。
人間に分かる形に変換してくれる何かが無くなってしまった場合、
そのデータは意味を失い、存在しない事と同じ事になります。
テキストデータも、その正体はバイナリデータであるので、
同じ問題を抱えています。
バイナリデータが意味を失わないようにするためには、
標準化して、人間に分かる形への変換の仕方が、誰にでも分かるようにする事と、
広く多くの人々に使われ、深く深く浸透して、無くてはならない物になる事が大切です。
そして、最も広く多くの人々に使われていて、最も深く深く浸透していて、
最も無くてはならない物になっているバイナリデータの標準こそが
テキストデータです。
ここまで書いて気がついたのですが、どうも、最初に掲げた(イ)(ロ)(ハ)の三項目の内、
(イ)(ロ)をまとめる事が出来そうです。
また、(ハ)の方が重要そうなので順番を入れ替えたほうが良さそうです。
つまり、テキストデータの本質は、
- (甲)最も広く深く浸透している「標準のバイナリデータ形式」
- (乙)人間にも機械にも扱いやすい「データ単位」
という事になると思います。
元の記事: それは「ストリーム」か「レコード」かという事では?(ふにょい日記)←この記事に 2009/04/11 03:13 頃、追記しました。
大本の記事: バイナリとテキストの本当の違い(404 Blog Not Found)