2019年1月のブログ記事一覧-29Lib 分館

自然言語処理の関連領域を広く薄く知る

2019-01-29 11:34:27 | 読書ノート

小町守監修 ; 奥野陽, グラム・ニュービッグ, 萩原正人著『自然言語処理の基本と技術』翔泳社, 2016.

　　自然言語処理の仕組みと関連領域を通覧できる教科書。言葉と図示による説明のみで、数式は使われていない。このテーマについて、深入りするほどではないけれども簡単な知識ぐらいは持っておきたい、という向きには適切な内容だろう。トピックとしては、テキストマイニング、形態素解析、日本語処理、機械翻訳、情報検索、意味推定などが扱われている。

　　情報検索の章では、機械的な索引語抽出、転置ファイル、ブール演算子、検索結果の重みづけ、精度と再現率などについて説明されている。これらは図書館情報学領域でも目にする内容であるが、その領域での入門書とは違った方法でさらりと説明されている。個人的には、今井耕介著に出てきたもののよく理解できていなかった「TF-IDF」の概念が、本書のおかげでわかった（ような気になれた）点でためになった。

　　なお本書は、標題紙と奥付で記載事項が異なっており、目録記入の点でも興味をひく。奥付にはタイトル名のみ記載で、サブタイトルやシリーズ名はない。しかし、標題紙にはシリーズ名「仕組みが見えるゼロからわかる」と、"Information Technology"の記載がある。後者は、あまり特定性の高くない語で無視してもよいように思えるが、国立国会図書館の目録ではサブタイトル扱いされている。また、著者名と監修者名以外に、奥付において企画・編集として会社イノウなどが記載されている（標題紙には表記なし）。アマゾンの販売書誌はイノウまで表記している。

7種のギター系統の楽器を使い響きの微妙な違いを聴かせる

2019-01-25 22:32:15 | 音盤ノート

Quique Sinesi "Pequenos mensajes sonoros" bar buenos aires, 2018.

　　アルゼンチンのギタリストによるインスト音楽。邦題は「小さな音のことづて」。フォルクローレとスペイン系のクラシックギター音楽が上品にブレンドされたような感覚は健在で、メロディをつまびく瞬間はフュージョンぽくなるところも相変わらずである。

　　全曲ソロでの演奏で、いつも数曲あるゲスト演奏家は無し。楽器は普通のアコギだけでなく、10弦または7弦のナイロン弦のギター、バンジョーのほか、チャランゴ、ronroco、requintoなど聴き慣れない小型のギター系の楽器が用いられている。丁寧にも各楽器をリペアする専門家(luthierと言うらしい)までライナーノーツにクレジットされている。全17曲で49分だから一曲平均3分弱の演奏時間である。静謐で清涼ながら、音数が少ないわけではなく、速い指使いで細かく舞うようなアルペジオが全編を通じて鳴り響く。そうであるのにうるさくなく、静かに感じる。

　　前作の"7 sueños / Familia"以来4年ぶりということだが、昨年3月には発行されていたらしい。さらに6月には日本公演も行われたとのこと。うーん観たかった。最近になってこの作品の存在に気付いたのだが、マイナー音楽家なので情報が入ってこない。どういう方向にアンテナを張っておけばタイミングよく情報を得られるのだろう。

より多くの命を救うためのチャリティの考え方

2019-01-22 18:17:52 | 読書ノート

ウィリアム・マッカスキル『〈効果的な利他主義〉宣言!：慈善活動への科学的アプローチ』千葉敏生訳, みすず書房, 2018.

　　チャリティをより効果的に行うための考え方について指南する啓蒙書。著者は1987年生まれの英国の若い哲学者で、オックスフォード大に籍をおいている。かつ、いくつかのNPO法人を掛け持ちして運営しており、慈善やらキャリア相談やら地球上で解決すべき問題に優先順位を付けるプロジェクトやらいろいろ手広くやっている¹⁾。原書はDoing good better : how effective altruism can help you make a difference (Avery, 2015.)である。

　　著者は、自己満足の慈善ではなく、真に人の役に立つ慈善を勧める。ではその効果をどう測るか。質調整生存年(QALY)を使うのである。これによって、同額を投資した場合の、エイズ対策とマラリア対策のどちらが効果的かを比較できる。例えば、先進国で医者になっても数人の命を救えるだけだが、効果的な寄付をすれば途上国におけるQALYを大きく改善できるという。このほか、東日本大震災の例から自然災害の被害者に対して寄付をしても効果は小さいことを、労働搾取的工場の製品でも購入したほうが途上国の労働者の境遇を改善することを、フェアトレード商品を優先して購入してもその利益が農場労働者には行き渡らないことを教えてくれる。なお、途上国に本を送るプロジェクトの効果は怪しいとのこと。

　　全体としては途上国の貧困層への言及が多く、先進国における貧困への関心は薄い。どこにいようと命は平等であるので、費用対効果を追及すると前者のほうが救える人数が多くなるからである。一方で、先進国における貧困はきちんとその国の政治家が処理すべきというスタンスだ。わかると言えばわかるが、後者への無関心さに違和を感じないこともない。とはいえ、話の展開も巧みで、面白い書籍だろう。

1) William MacAskill hphttp://www.williammacaskill.com/

繁殖のために厳しい環境を選ぶ種もある

2019-01-18 22:51:41 | 読書ノート

鈴木紀之『すごい進化：「一見すると不合理」の謎を解く』中公新書, 中央公論, 2018.

　　進化生物学。配偶行動において他種と自種を見分けられないなど、適応の立場からは「不合理」に見える現象について、より細かく調査することで合目的的な進化であることを再確認するという内容。著者は昆虫の生態を専門とする研究者である。

　　いくつか昆虫が紹介されるが、とりわけテントウムシが大きく採りあげられている。松の木のみに生息する、捕まえにくく栄養的にも劣るアブラムシに特化して捕食するテントウムシがいる。しかし、実験室環境ではすべてのアブラムシを食べるという。なぜそのような不合理な特化が起こるのか。その理由は、このテントウムシが、別種のテントウムシのいる環境下では、別種の異性に対して間違えて求愛行動をしてしまうためである。これは繁殖の失敗につながる。こうしたエラーを避けた結果として繁殖場所とエサの特化が起こったとする。

　　有性生殖の起源についての新説も短く紹介されている。赤の女王仮説(参考)は、説得力に問題があるという。代わって、オスの存在が無性生殖を有性生殖化するという説を唱えている。オスが無性生殖の細胞に無理矢理遺伝子を流し込むのだという。ロジックはわかるが、無性生殖をしてきた側がなぜ遺伝子のシャッフルを拒むメカニズムを備えないのか（逆かもしれない。なぜ遺伝子のシャッフルを受け入れる仕組みを備えたのか）の説明が欲しい気がする。さらなる謎ということだろう。

　　このほかにも不完全で中途半端な擬態のメリットなどが検討されている。進化の全貌がわかるというわけではないが、進化生物学の考え方や研究の進め方がわかって興味深い小著だろう。

人工知能論から読解力重視の教育論に

2019-01-15 20:59:57 | 読書ノート

新井紀子『AI vs. 教科書が読めない子どもたち』東洋経済新報, 2018.

　　人工知能の可能性と限界を説きつつ、人口知能が普及するはずの未来に対応できる教育について考察するというもの。著者は国立情報学研究所所属の数学者で、東大入試を突破することを目標に人工知能を改良するプロジェクトを主催している。

　　まずは著者による東大入試の突破を目標とするAI（東ロボくん）についてだが、現在のところ全国模試で偏差値57ぐらいだとのこと。しかし、AIには解きにくい問題のパターンもあらわとなってきており、改良の限界に近づきつつあるという。AIは大量のデータに基づいて推論するものだが、そもそもデータが蓄積されていなければ確度の高い推論ができない。だが、データが十分供給されていない領域──特に言語関連──もあって、能力の向上を阻んでいるという。

　　「AIには文の「意味」がわからない」というのが人間との違いだと著者はいう。では、どの程度の日本人が教科書レベルの日本語を理解できているのだろうか、と疑問に思って、全国の学校で独自の読解力テストを実施したというのが続く話である。その結果、中学卒業段階で約3割の生徒が教科書をきちんと理解できないことがわかったという。読解力のない彼らの労働は将来AIに代替されてしまう、といわけで、著者は読解力教育の必要性を訴えている。

　　しかし「読解力の必要性」が強調されたといっても、行間の読み取りの話ではない。掲載されている読解力テストでは、言語で表現された条件記述を正確に読み取れるかどうかが重要であり、語句の定義さえ理解できていればブール代数的な演算によって解くことができる。個人的には、コンピュータがこうした「読解」が得意で、義務教育修了者の3割がこれを不得手とするというのは、驚くような話ではないという気がする。彼らはすでにコンピュータに代替されないような職に就いているだろう。むしろ、AIが苦手な「行間の読み取り」こそ代替されない読解力であると考えたくなるのだが、著者の視野には入っていない。

　　とはいえ、問題提起の書として本書は十分読み応えのあるものだろう。昨年のベストセラーであり、入手もしやすい。

南米産の室内楽風現代歌曲集

2019-01-12 21:08:43 | 音盤ノート

Andre Mehmari, Juan Quintero, Carlos Aguirre "Serpentina" NRT, 2017.

　　アコースティック楽器による歌もの作品。アンドレ・メーマリはブラジル人ピアニスト、ファン・キンテーロはアカセカ・トリオのギタリスト(参考)、カルロス・アギーレは自身のグループを持つ鍵盤奏者で、ここでは主にアコーディオンを弾いている。後者二人はアルゼンチン人である。

　　ピアノ中心のバッキング演奏に男声が伸びやかに美しく歌う。ボーカルはキンテーロが中心で、数曲アギーレが歌う。コーラスは全員で行っている。ギターとアコーディオンも聞こえるが、ピアノほど目立たない。このほかシンセサイザー、ベース、打楽器や琴など、曲によって楽器の取り換えがある。それぞれのオリジナル曲を演奏しているほか、ミルトン・ナシメント作の'San Vicente'と、キューバのSSWのSilvio Rodriguez作でやはりナシメントがかつて歌ったことで知られる'Sueno con Serpientes'の二曲のカバー曲が収録されている。

　　素晴らしいし、ガラス細工のように美しい。だが、音がきれいに整理されすぎてしまっているという気もしなくもない。「歌を聴かせるのが主目的で、演奏はあくまでバッキングのため」というコンセプトが上手く行き過ぎたのが原因だろう。楽器演奏の部分を厚めにして演奏者のエゴを出すことを推奨し、緊張感を高めるなどの要素も加えれば、もっと生気がみなぎったものになったと思う。

理解力なき有能性が理解力そのものを凌駕してゆくという

2019-01-09 08:29:55 | 読書ノート

ダニエル・C.デネット『心の進化を解明する：バクテリアからバッハへ』木島泰三訳, 青土社, 2018.

　　米国の哲学者デネットの新著。意識とは何か、なぜ意識があることが可能となったのか、を探求する大著である。結論を先に記せば、意識とは脳や神経系の物理的構造によって生み出される「ユーザーイリュージョン」である、ということだ。徹底的に唯物論的な立場であり、心に神秘の存在を認めない。そして、この見解に対して沸き起こるさまざまな疑問を整理してゆく。原書はFrom bacteria to Bach and back: the evolution of minds(2017)である。

　　意識は進化のプロセスにおける適応によってチューニングされてきた。多くの生物は自分自身に理由を分かっていなくても、十分に合目的的に行動・作動ができる。著者はこれを「理解力なき有能性」と呼んでいる。動物と人間の間に意識が「ある/ない」と分けられるものではなく、神経系の複雑さに従って段階的に準・意識なるものを想定できる。人間の意識もまたそうなのであり、それは自分の身体や神経系の働きを完全に理解しているわけではない。例えるならばコンピュータのメカニズムは物理的なものだが、ソフトウェアがそれを自覚することができないようなものだという。

　　ただし、文化（本書ではドーキンスに倣ってミーム概念が使われる）によって、人間のみがダーウィン的な環境からの脱出ができたとされる。重要なのは言語である。理性・理由なるものは言語をより高度に処理するためにインストールされたソフトウェアだ。ここでニワトリと卵の問題が起きるのだが、言語と人間の脳の共進化の可能性を指摘することで、著者は起源の問題を回避している。そこでのミーム自体が繁殖力を持つという議論はとても興味深く、個人的には心当たりがあって説得される（人生のあらゆる局面でまったく役に立たないのになぜか覚えているCM曲などが思い出される）。

　　その後は、意識を実体的なものと考えてしまう人間の傾向についての批判となる。最終章はAIについてである。人間は思考をAIに委ねることによって、現在ある理解力を退化させてしまう可能性がある。したがってAIによって人間が操作されることが懸念される。ただし、AIはまだ自分自身で行動の目的を設定できるほど洗練されていない。AIが道具に留まるよう、社会に分散されて保持されている人間の現在の能力の維持を訴えて締めくくられる。
　　
　　以上。長いし難しい内容ではあるけれども、面白く読めた。先だって8年前に『ダーウィンの危険な思想』を読んだ際のエントリを見返してみたが、恥ずかしながら全然分かってなかったことがわかる。以降、関連する議論を追いかけてきたこともあって、以前よりは理解できるようになったような気がする。が、完全にわかったというわけではない。本書を読むのに、予備知識として進化生物学の知識は必要だろう。

Rとデータ分析を楽しく学べる教科書だが難易度高め

2019-01-04 22:35:33 | 読書ノート

今井耕介『社会科学のためのデータ分析入門』粕谷祐子, 原田勝孝, 久保浩樹訳, 岩波書店, 2018.

　　フリーの統計ソフトRの使い方を覚えながら、社会科学領域のデータ分析の方法をマスターするという教科書である。著者は日本人であるが、現在は米国ハーバード大に所属して活躍する研究者であり、原書は英語で書かれている(Quantitative social science: an introduction Princeton University Press, 2017.)。併せて無料でダウンロードできる練習用のプログラムや問題用のデータも英語となっている（日本語版は無いようだ）。

　　上下二巻の全7章構成。検定を7章に、確率を6章にと数学的な話を後ろの方に置き、グラフの作成や、ループを作るプログラミングなどの技術的なことをそれ以前の段階で教示しつつ、サンプリングやら因果関係の考え方を理解させてゆくという順序となっている。例題に使用されるデータはとても面白くて、触っているだけでわくわくする。黒人っぽい名前で履歴書を送った場合の採用率、女性政治家の存在によって政策の優先順位は変わるか、少人数クラスによって成績は上がるか、最低賃金の変更がもたらす就業率への影響、『フェデラリスト』の著者予測などなど、結果だけはどこかで小耳に挟んだことのあるだろう、有名な研究からそれぞれ抜粋されている。

　　ただし難易度は高い。きちんとRのコードを打ち込みながら読み進めなければならないので、読了するにはそれなりの日数が必要となる。練習問題もけっこう難しい。また論述においても癖があって、定義はきっちり与えられるがパラフレーズがあまりなされない。このためネットやら他の書籍やらを参照して別の説明を求めることがしばしばあった。というわけで、素晴らしくためになる書籍ではあるが読者を選ぶ内容だ。プログラミングやベイズ統計の知識がないと独学は難しく、私大文系の学部生にはつらい、と思う。先生が付くなら話は別だが。絶賛している人はみんな頭がいいんだろうなあ。

　　

2019年1月
日	月	火	水	木	金	土
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

図書館・情報学関連の雑記、読書ノート、音楽ノート、日常生活の愚痴など。

プロフィール

ブックマーク

カレンダー

カテゴリー

最新記事

最新コメント

バックナンバー

ログイン

goo blog お知らせ

goo blog おすすめ