情報組織化研究グループ研究会
原田隆史氏(同志社、NDL)
大阪駅前第2ビル キャンパスポート大阪
情報組織化研究グループ月例研究会報告(2012.6)
国立国会図書館サーチ:その開発経緯・機能・特長・今後
http://josoken.digick.jp/meeting/2012/201206.html
かつてフォーカスグループインタビューにも呼んでいただいたNDLサーチの最新状況をお聞きするために出席。
以下、例によって、自分なりの理解と、自分なりのメモです。
■導入
○多くのシステムを比較検討
日本のシステムは合格点に達せず。
ALEPHに加えて、Primoというサブシステムを導入。
○NDL蔵書、冊子だけでなく、デジタル情報・画像・音声なども対象にというコンセプト
○ユーザの声を反映するための調達方法
プロトタイプ仕様、開発版の公開、本公開
フォーカスグループ・インタビュー
対象は「国民」
→来館者だけでない
図書館のユーザだけでない
(私からの質問)
・「対象は国民」インタビューの時は、国民というのは広すぎるというニュアンスだったように思いますが?
→使い分けているところもある。
気持ちは半々。そういうことも意識して、自分を鼓舞している部分も。
○適用すべき技術標準の指針
・利用者の利便性向上に資する技術の積極的な採用 などなど
できることはやってみる
ダメだったら、後から変える
■機能とシステム構成
○ディスカバリー・インターフェース
○操作性・視認性 ◆
・デザイン上の工夫、簡略化、単純化
デザイナーによる。「随分反対した」とも
色使い、コントラスト・・・
(私からの質問)
・デザインはかわいくすると見にくくなることもあるが、納得できなかったのと、納得した部分は?
→色の変化はよかった。
一方、健常者の操作性を損なったところは、もう少し考えるところがあってもよかったかも(例えば、ボタンの位置、プルダウンを選択したら飛べる)。
多くの人が使えるようにという点でよかったかと。
・ユーザビリティ・アクセシビリティに配慮した画面デザイン
読み上げソフト対応
・類似操作に関わる手段の統一
左に「絞り込み」、右に「拡張」
○検索性能の向上
・あいまい検索(りんご・リンゴ・林檎)
・形態素解析は実装「していた」
→高速化のために外した。しかし、諦めていない。今年度の改良で復活させたい。
目標は2秒
・高速化
データが数千万件を超えると、マシンを追加しても早くならない。
Solrのインデックスにすべての検索語を搭載した。
○翻訳検索機能
○連想キーワード
○検索対象資料の範囲の拡大
○表示される内容の充実
書影、目次、あらすじ :現在はきわめて限られた資料のみ
○外部サービス連携
検索結果で右サイドに「見る・借りる」 →図書館名をクリック →書誌詳細画面に行かない
いずれそうしたいが、各OPACにそれができる機能を入れてほしい。
◆例えば、パーマリンクでも。ISBNを指定したら、その詳細画面に行くという仕組みを標準化すべき。
NDLとしては、各図書館がその標準仕様を採用できるような提案をする。
10月末までには暫定報告。年末には、各図書館、各ベンダー向けの説明会を行う。
各図書館の次の調達の時に含めてほしい文言を検討している。
○システム構成図
7000万件のデータだと、RDBでは扱えない
NDLは130台のマシンで処理。
Hadoopで。
但し、Hadoopは、7000万件に1件追加しただけでも「全データを対象とした更新処理しかできない」らしい
→日次の処理に、22h。今年度、4h短縮を目指す。
○今後
・知識インフラを作るベースになりたい
・NDLラボ(仮称)の設置
・来年3月11日に、震災アーカイブを公開
・知識インフラのポータルに
原田隆史氏(同志社、NDL)
大阪駅前第2ビル キャンパスポート大阪
情報組織化研究グループ月例研究会報告(2012.6)
国立国会図書館サーチ:その開発経緯・機能・特長・今後
http://josoken.digick.jp/meeting/2012/201206.html
かつてフォーカスグループインタビューにも呼んでいただいたNDLサーチの最新状況をお聞きするために出席。
以下、例によって、自分なりの理解と、自分なりのメモです。
■導入
○多くのシステムを比較検討
日本のシステムは合格点に達せず。
ALEPHに加えて、Primoというサブシステムを導入。
○NDL蔵書、冊子だけでなく、デジタル情報・画像・音声なども対象にというコンセプト
○ユーザの声を反映するための調達方法
プロトタイプ仕様、開発版の公開、本公開
フォーカスグループ・インタビュー
対象は「国民」
→来館者だけでない
図書館のユーザだけでない
(私からの質問)
・「対象は国民」インタビューの時は、国民というのは広すぎるというニュアンスだったように思いますが?
→使い分けているところもある。
気持ちは半々。そういうことも意識して、自分を鼓舞している部分も。
○適用すべき技術標準の指針
・利用者の利便性向上に資する技術の積極的な採用 などなど
できることはやってみる
ダメだったら、後から変える
■機能とシステム構成
○ディスカバリー・インターフェース
○操作性・視認性 ◆
・デザイン上の工夫、簡略化、単純化
デザイナーによる。「随分反対した」とも
色使い、コントラスト・・・
(私からの質問)
・デザインはかわいくすると見にくくなることもあるが、納得できなかったのと、納得した部分は?
→色の変化はよかった。
一方、健常者の操作性を損なったところは、もう少し考えるところがあってもよかったかも(例えば、ボタンの位置、プルダウンを選択したら飛べる)。
多くの人が使えるようにという点でよかったかと。
・ユーザビリティ・アクセシビリティに配慮した画面デザイン
読み上げソフト対応
・類似操作に関わる手段の統一
左に「絞り込み」、右に「拡張」
○検索性能の向上
・あいまい検索(りんご・リンゴ・林檎)
・形態素解析は実装「していた」
→高速化のために外した。しかし、諦めていない。今年度の改良で復活させたい。
目標は2秒
・高速化
データが数千万件を超えると、マシンを追加しても早くならない。
Solrのインデックスにすべての検索語を搭載した。
○翻訳検索機能
○連想キーワード
○検索対象資料の範囲の拡大
○表示される内容の充実
書影、目次、あらすじ :現在はきわめて限られた資料のみ
○外部サービス連携
検索結果で右サイドに「見る・借りる」 →図書館名をクリック →書誌詳細画面に行かない
いずれそうしたいが、各OPACにそれができる機能を入れてほしい。
◆例えば、パーマリンクでも。ISBNを指定したら、その詳細画面に行くという仕組みを標準化すべき。
NDLとしては、各図書館がその標準仕様を採用できるような提案をする。
10月末までには暫定報告。年末には、各図書館、各ベンダー向けの説明会を行う。
各図書館の次の調達の時に含めてほしい文言を検討している。
○システム構成図
7000万件のデータだと、RDBでは扱えない
NDLは130台のマシンで処理。
Hadoopで。
但し、Hadoopは、7000万件に1件追加しただけでも「全データを対象とした更新処理しかできない」らしい
→日次の処理に、22h。今年度、4h短縮を目指す。
○今後
・知識インフラを作るベースになりたい
・NDLラボ(仮称)の設置
・来年3月11日に、震災アーカイブを公開
・知識インフラのポータルに
※コメント投稿者のブログIDはブログ作成者のみに通知されます