「日本文学の革命」の日々

「日本文学の革命」というホームページを出してます。「日本文学の革命」で検索すれば出てきますので、見てください

電子同人雑誌の可能性 174 「コンピュータの本質―文字の「01化」」

2018-11-28 05:40:21 | 日本文学の革命
視覚や音を数値化「01化」してコンピュータ内に取り込めることが分かった。これらは画像や音声としてコンピュータ画面で大活躍しているのだが、しかしこれらに優ってコンピュータの画面上で大活躍しているものがある。それが「文字」である。パソコン画面の中で文字が占める比重は相当なものである。各種メディアの中では本に次いで多いと言えるだろう。なぜこんなに文字の比重が多いのか(ちなみに現実世界では「文字」なるものは、ほとんど全く存在していない。自然界にはもともと無いものだし、人間以外の全動物も文字を全く認識できず、彼らに文字を見せたとしても完全無視するだけである。文字が存在するのは、街中や仕事部屋など人間の居住空間だけである)。
それはコンピュータが情報のメディアという性格を持っているからである。

われわれは情報を言葉や文章、文字情報としてやり取りしているのである。「オッケー グーグル。この辺で安くておいしいランチのお店を教えて」という文章によって一つの情報をゲットしようとしているのであり、このような文章なしに複雑な情報のやり取りはできないだろう(コンピュータ同士なら「01」の数値情報だけで直接情報のやり取りができるのだろうが、人間には無理である)。コンピュータ画面で文字が活躍しているのは、それが情報をやり取りするための伝達手段となっているからである。文字を「01化」してコンピュータに取り込むことは、情報のメディア・コンピュータにとって不可欠なのである。

この文字の「01化」は実に簡単にできる。一つ一つの文字を「コード化」してしまえばいいのである。「2・12」というコードはこの文字、「3・F」というコードはあの文字、というふうに対応させてゆけば、一つ一つの文字をコードという形で数値化することができる。漢字などという何万もある文字も、根気よくコード化してゆけばすべての文字をコード化してしまえる。あとはそれを「01化」された数値データとしてコンピュータに計算処理させればいいだけである。
コンピュータはこの際、文字の意味などはまるで理解していない。ただ数値的コードとして把握しているだけである。しかしそれでも様々な判断を下すことができるのだ。たとえばある男性の検索文字コードに高い割合で頻出してくるコードがある。数値コードを文字に直してみると「淫乱」「萌え系」「人妻」「女子高生」などとある。すると「コイツ。アダルトビデオばかり見てるな」という判断が下せるのである。

コンピュータが文字の意味など理解せずに、ただ数値コードとして把握していることには、大きな利点もある。それは文字情報を高速で処理できるという利点である。
先ほどの「安くておいしいランチのお店」を検索するには、膨大な量の情報処理が必要とされるだろう。まず半径数百メートル以内の外食店が片っ端からかき集められる。店の名前の意味などいちいち考えずに、外食店らしき文字コードを自動的にかき集めるから瞬時にできるのである。ついでそれぞれの店の過去ログや口コミ情報やネットでの評判から「おいしい」という文字コードの頻出具合を調べて、その割合の高い店をピックアップしてゆく。またそれぞれの店のランチメニューの値段を調べて、価格の低い店を調べ上げてゆく。そして「おいしい」と「安い」の組み合わせを行ってゆき、最適の組み合わせを持った店を判断してゆく。そして最後に地図上の一点を表示して「ここのカツ丼定食が安くておいしいですよ」とユーザーに教える訳である。
このような高速処理は、文字の意味をいちいち読み取っていては行えない。文字をコード化数値化し、数値情報として処理するからこそ、膨大な情報処理も瞬時に行われるのである。