小町守監修 ; 奥野陽, グラム・ニュービッグ, 萩原正人著『自然言語処理の基本と技術』翔泳社, 2016.
自然言語処理の仕組みと関連領域を通覧できる教科書。言葉と図示による説明のみで、数式は使われていない。このテーマについて、深入りするほどではないけれども簡単な知識ぐらいは持っておきたい、という向きには適切な内容だろう。トピックとしては、テキストマイニング、形態素解析、日本語処理、機械翻訳、情報検索、意味推定などが扱われている。
情報検索の章では、機械的な索引語抽出、転置ファイル、ブール演算子、検索結果の重みづけ、精度と再現率などについて説明されている。これらは図書館情報学領域でも目にする内容であるが、その領域での入門書とは違った方法でさらりと説明されている。個人的には、今井耕介著に出てきたもののよく理解できていなかった「TF-IDF」の概念が、本書のおかげでわかった(ような気になれた)点でためになった。
なお本書は、標題紙と奥付で記載事項が異なっており、目録記入の点でも興味をひく。奥付にはタイトル名のみ記載で、サブタイトルやシリーズ名はない。しかし、標題紙にはシリーズ名「仕組みが見えるゼロからわかる」と、"Information Technology"の記載がある。後者は、あまり特定性の高くない語で無視してもよいように思えるが、国立国会図書館の目録ではサブタイトル扱いされている。また、著者名と監修者名以外に、奥付において企画・編集として会社イノウなどが記載されている(標題紙には表記なし)。アマゾンの販売書誌はイノウまで表記している。
自然言語処理の仕組みと関連領域を通覧できる教科書。言葉と図示による説明のみで、数式は使われていない。このテーマについて、深入りするほどではないけれども簡単な知識ぐらいは持っておきたい、という向きには適切な内容だろう。トピックとしては、テキストマイニング、形態素解析、日本語処理、機械翻訳、情報検索、意味推定などが扱われている。
情報検索の章では、機械的な索引語抽出、転置ファイル、ブール演算子、検索結果の重みづけ、精度と再現率などについて説明されている。これらは図書館情報学領域でも目にする内容であるが、その領域での入門書とは違った方法でさらりと説明されている。個人的には、今井耕介著に出てきたもののよく理解できていなかった「TF-IDF」の概念が、本書のおかげでわかった(ような気になれた)点でためになった。
なお本書は、標題紙と奥付で記載事項が異なっており、目録記入の点でも興味をひく。奥付にはタイトル名のみ記載で、サブタイトルやシリーズ名はない。しかし、標題紙にはシリーズ名「仕組みが見えるゼロからわかる」と、"Information Technology"の記載がある。後者は、あまり特定性の高くない語で無視してもよいように思えるが、国立国会図書館の目録ではサブタイトル扱いされている。また、著者名と監修者名以外に、奥付において企画・編集として会社イノウなどが記載されている(標題紙には表記なし)。アマゾンの販売書誌はイノウまで表記している。