goo blog サービス終了のお知らせ 

辞書引く日々

辞書が好きなのだ。辞書を引くのだ。

閉館情報反映されざること

2006年08月30日 | Weblog
名古屋は今池にある「国際劇場・国際シネマ」が8月19日に閉館した。ところが、きょう8月30日になっても、多くの(私が見たかぎりすべての)映画上映情報提供サイトが、依然として同映画館の上映スケジュールが載せている。

ネット上の情報とやらについて、あらためて考えさせられた。

白地図づくりは楽に非ず

2006年08月29日 | Weblog
白地図が必要になって、Web 上を探しまわる。

ところが地図というのは、白地図といえども、どれもこれも著作者が複製を禁じたものばかりで、完全に自由に使えるものが少ない。たまにあっても、gif ファイルで、拡大や加工に耐えないものばかりだ (さらに、出どころがあやしい)。

なんで、公的な測量の結果によって作られる白地図を使うのに、どこかに金を払わねばならぬのか、多少腹が立ってきた。

そこで、国土地理院が公表している「地球地図日本」から、「後ろめたくなくて拡大もできる日本の白地図」を作成してみようと思い立った。

地球地図は地球サミットの「アジェンダ21の趣旨」に沿って旧建設省が提唱したプロジェクトで、「地球の全陸域をカバーし」「統一された仕様で」「誰にでも安価に提供される」「解像度1kmのデジタル形式の地理情報」。「個人の非営利目的での使用においては」「必要なユーザ登録」により「自由に利用でき」るそうである。しかも「非営利目的での使用においては,無料」だ。

今回の計画には、もってこいのデータソースである。しかし、そこから白地図を作成するのは、なかなかやっかいだ。

 地球地図の公表に利用されている shapefile という形式の仕様を読む。
 これは、esri 社という会社が作成した規格だ。
 処理するために R を使うことにしたので、R のマニュアルを読む。
 R にいろいろなパッケージを導入する。パッケージのマニュアルを読む。
 使用したパッケージの制限で、飛び地があるとハングしてしまうことを発見。
 飛び地を削除するために、あれこれやる。
 各県の市町村をすべて合併する。
 R で png ファイルに出力して、Gimp でパスとしてトレースする。
 SVG 形式で出力。

これを Linux 上で行えば、アプリケーションも含めて、すべてフリーのソースで「後ろめたくなくて拡大もできる日本の白地図」が作成できるというわけだ。

あとは、トレースという段階なのだが、これがなかなか熟練が必要。
白地図という性質上、かなり縮小しても美しくなるように海岸線を単純化していかなければならぬのだ。

ともかく北海道だけ作成したので、jpeg に変換したものを貼っておくことにしよう。

そのうち、日本全国を作成して SVG フォーマットで出力し、Adobe Illustrator などで読み込めるようにし、公開いたしたい。



一文字に要約

2006年08月25日 | Weblog
むかし、どこかの国の大統領は三行より長い書類は読まないと言ったそうだが、究極は一文字に要約することではなかろうか。たとえば、サイトの内容を、機械的に一文字で表現する手段はないものであろうか。

頻出する字ということでやるとどんなサイトでも助詞の「は」とか「が」になってしまう。

尤度ということを考えるといいのかもしれない。

ある漢字が出た場合の、他の字の出現確率というのを一般的に調べておいてから、それぞれのサイトで、どの文字を説明変数としたときに、そのページの他の字の出現について最も尤もらしく説明できるかを比べることになるか。

たとえば、あるサイトの内容が「漢字」の二文字だけだったとして、一般に「字」があらわれた場合に「漢」があらわれる確率よりも、一般に「漢」があらわれた場合に「字」があらわれる確率よりも高いならば、このサイトを代表する文字として「字」ではなく「漢」を採用するのである。

しかし、問題は、これではおそろしく計算時間がかかってしまうということである。
まず、事前に調べておくのを一組の常用漢字だけに限っても 2000 * 2000 で 4000000 程ある。

それに、もしあるサイトが 1000 種類の文字から成り立っていたとすると、このサイトを代表する文字を計算するのに 1000 * 999 回の掛け算を行わなくてはいけない。

計算に時間はかかりそうだが、仕組みとしては単純なので、そのうち実現できる日がくるかもしれない。

ひさしぶりにあれを見る

2006年08月22日 | Weblog
1940 年のタコマ橋崩壊の映像を久しぶりに見る。
タコマ橋付近にあるカメラ屋の著作になるもので、シアトルに留学していた M 氏が当のカメラ屋で購入し土産に呉れたものである。
せっかくだから公開しようかと思ったが、著作権がいつ切れるのかまったくわからないので(公開年も著作者の生存期間も不明)、ちょっと無理そう。残念。


ウーとムルチ

2006年05月29日 | Weblog
ウルトラマン(初代)の再放送をやっているので見る。

先日は怪獣「ウー」の回なり。村人に冷たくされる弧児の、さいごには死んで仕舞うという話なり。イデ隊員も母親を幼くして亡くしたる者なれば、ウルトラマンことハヤタ隊員、怪獣を倒したる後に、弧児の死したるをイデ隊員に伝える能わずして、これは山に帰りたりと告げたるなり。

弧児の冷たくされる話は、「帰ってきたウルトラマン」にもありき。
「ムルチ」の話なり。けだし、この怪獣名たるムルチはあるいはラテン語の「大衆」より取りたるものなるべし。これは、善良なる宇宙人、弧児とともに住みたるが、群衆に石投げられ、これに加わりたる警察官により射殺される話なり。

かかる性悪説的なる話、近年のウルトラマンには、たえて無きやうなり(見ておらぬもの少なくなければ、断言し得ず)。

キャベツの千切りのやり方について

2006年05月12日 | Weblog
祖母はたいへんキャベツの千切りが上手であった。ずっと昔、祖母のやっていたことを観察した結果と、自分で考えたところをまとめておくのだ。べつにオリジナリティがあるわけではなくて、多くの人が唱え、またさまざまなウェブ上のページにも記されているところでもあるが、いくらか細かく記さむ。

キャベツを千切りにするには、指の力が要る。

(1) まず、葉をすべて芯(茎)から外す。このとき、ひどく太い葉脈は切除する。

(2) それから、葉の葉脈方向をそろえて重ねておいて、これを中心が葉脈方向と平行になるように、巻く。このとき葉の厚いキャベツだと、折れるので、三つくらいに折りたたむつもりでもよろしい。

(3) これを左指でたいへんな圧力をもっておさつける。

(4) そして、包丁で葉脈と垂直な方向に切断するわけである。(このとき、細く切るならば、これを見ている人には削っているように見える)

切断においては、できるだけ細いことが好ましいのだが、もっと大事なことは、千切られた一本一本の断面が、はしからはしまで均等な幅になるように切るということだ。先が尖った短い千切りというのは、いくら細く切れていてもうまくない。左手のおさえつけるのもこのためで、おさえつけが甘いと葉の間に隙間ができ、葉が固定されないので、具合が悪い。

問題は、無駄が出るということで、どうしても葉が小さく厚くなる中心部は千切りにすることができぬ。これは妻に見つからぬようにこっそりと捨てる。

未来人の顔

2006年04月29日 | Weblog
なんだかよく言われていたことに、未来の人間は顎が細くなってしまうというのがある。曰く、柔らかいものばかり食っているからだとか。

で、考えてみると、キリンは毎日首を伸ばしていたから、長い首を獲得したわけではない。たまたま首の長いキリンが出現して、偶然か環境かはべつとして、そいつらが生き残ったのだ(と少なくともダーウィン派の人は言う)。

だとすると、柔らかいものばかり食っていたからといって、生まれつきのあごの骨格が細くなるわけもなく、もしそういう傾向があるのだとすれば、男女間における顔の好みの結果で、あごの細い人がよく子孫を残した、ということであろう。

したがって、顎が細くなるという傾向をとらえて、それが続いたら100年後にどうなるかと予測するというのは馬鹿馬鹿しい話ではないか。

ある本は、「数学的にいえば外挿という操作で、コンピュータを使えばむずかしいことではありません」などとして例の気味の悪い想像図を載せていたが、一般に外挿が難しいと言われるのは計算が難しいからではあるまいに。

TeX 情報乏しいぞ

2006年03月28日 | Weblog
TeX ってどんな仕組みなのかと気になって、検索かけれども、引っかかっくるのは LaTeX ばかりなり。TeX と書いてあるページのほとんどが LaTeX のこと書いてあるじゃん。豚について調べようと思ったら酢豚のページばかり引っかかってくるみたいなもんではないか。TeXBook なるもんを買わなくてはならんのか。邦訳もう絶版みたいだし。そんな深く知りたいわけでもないのに、ええーっ、どうして、という感じですわい。