知識は永遠の輝き

学問全般について語ります

ファイル検索ソフトの話 - Google DeskTop 代替 -

2016-06-05 08:06:32 | その他、雑記
前回の続き

 さて"Google DeskTop"の方ですが、実は何年か前から使っていませんでした。Windowsのファイル検索機能で中身のテキストもある程度は読めるようになっていたので、ハード変更のどさくさで不便ながらも"Google DeskTop"はインストールせずに何とかやっていたという次第です。しかし最近、やはりWindowsのファイル検索機能では物足りず調べてみたら既に"Google DeskTop"は終了していたことを知りました。

 で、こちらの代替は以下の2つを試し始めました。が、たぶんこれで快調に使えそうです。

1.Everything Search Engine フリー、ファイル名検索
  下記サイトから適切なものをダウンロードできます。32ビット版(x86)と64ビット版(x64)があり、日本語版もあります。
   http://www.voidtools.com/
   http://www.voidtools.com/downloads/
  ぼくんちのTV別館(2014/09/30)に解説記事があります。

2.DesktopHE フリー(作: S.kohno氏)、ファイル内テキスト検索
  Musee d'Dimancheのソフトウェア一覧の中にあります。
  そのリンク先に概要とダウンロード先があります。
  窓の杜の紹介記事も参考になるでしょう。

 "Everything"はファイル名検索で中身は見ないだけに非常に軽い。ファイル名に適切に情報を入れておけば、これだけでも快適に検索できるでしょう。キーになりそうな単語をファイル名の先頭側に持ってくるといった工夫をすれば単なるファイル名での並び替え(ソーティング、sorting)でも対応できますが、"Everything"はファイル名の中間にある語も検索することができますので遥かに役立ちます。

 "DesktopHE"の説明の前に、そもそも膨大なファイルの中身を速く検索できるのはなぜかというと、あらかじめ索引(インデックス,index)を作っているからです。つまり、単語や文章に対して、それを含むファイル名を関連付けた辞書を作っておくわけです。この辞書があれば実際に検索する時は速くできますが、索引を作る段階では対象とするファイルの総容量にほぼ比例して時間がかかります。
 この仕組みはGoogleなどのインターネット検索ソフトも全く同じで、世界中の公開されたウェブ・ファイルからせっせと索引を作り、巨大な容量のハードディスクにため込んでいるわけです。世界中のウェブは日々変化していますから、索引作りも日々行われています。ソフトウェア・ロボットによって。

 これがひとつのPC付属のHDであれば索引作りもさほど時間はかかりません。"DesktopHE"も"Google DeskTop"も同じことなのですが、試してみると昔の"Google DeskTop"より速かったです。とはいえ、ハードの進歩もあるので比較はできません。

 しかし確実に優れていて良かったのが、検索できるファイルの種類を自在に設定できることでした。そもそもファイルの中身の文章すなわち文字列を検索するのですから、文字列を持っているファイルだけ対象にすればよいわけで、"Google DeskTop"ではテキストファイル[.TXT]の他、主なワープロソフトや表計算ソフトのデータファイルの中から対象とするファイルの種類を設定することができました。しかし選べる種類は自由自在ではなく、限られたものからの選択でした。

 私にとって不便だったのは将棋ソフトの棋譜ファイルの標準であるKIF形式ファイル[*1]やCSA形式ファイル[*2]が検索できなかったことでした。これらは中身はテキストだけなのに。そして対局日、棋戦、対局者などの情報が入っていますし、ネットから得たものでは観戦情報が入っていたりしますから、中身検索ができると非常にありがたいのです。PGNファイル形式("Portable Game Notation")[*3)]も忘れてはいけません。

 で、"DesktopHE"ならそれがサクッとできてしまいます。カ・ン・ゲ・キ。いかにもフリーソフトらしく、プロクラマーが「こんなことができたらいいな」と思ったことを余計な邪念を入れずに形にしたという感じのソフトです。

 なおフリーソフトらしく使用勝手は慣れない人にはとっつきにくいかも知れませんから、私なりの使用上の注意点を挙げてみました。

 インストールは作者が書いている通りで、ダウンロードしたZIP形式ファイルを好みのフォルダに入れて解凍すると、実行ファイルその他の入ったフォルダが作られます。なおダウンロードサイトにある"Desktop"の方を使うこと。"Desktop_src"はソースファイル(source file)の意味でしょうから御自分で拡張してみたい人以外には役立ちません。むろんソースファイルを使う場合は作者の著作権に十分に配慮すること。

 後はできたフォルダの中の方にある"DesktopHE.EXE"をダブルクリックで実行するだけです。ショートカットを作って使いやすい場所においておけばよいでしょう。

 さて実行するとメニュー画面が開きますが、最上段のメニューの「設定」のプルダウンには、「全般」「インデックス設定」「上級者向けインデックス設定」と3つだけです。「インデックス設定」で、検索対象フォルダやテキストファイルとして扱う拡張子やHTMLファイルとして扱う拡張子が自在に設定できます。またインデックスを入れておく場所(フォルダ)も自在に設定できます。

 デフォルトでは検索対象フォルダはとても狭く設定されていますので、C:\、D:\など見たいディレクトリをまず設定します。

 "Google DeskTop"のように黙っていても裏でインデックス作成をしてくれるのではありませんから、最上段のメニューの「ファイル」のプルダウンから「インデックス開始」を選択する必要があります。まあ、ある程度ファイルが増えたと思ったら作り直しておくのが良いでしょう。

 「ファイル」のプルダウンのメニューは、「インデックス開始」「削除したファイルの情報を除去」「キーワード抽出」「インデックス最適化」の4つです。意味は想像がつきますね。

 ファイルを検索する時は最初の画面の上部の1行の検索窓に語を入れてリターンキーないし検索ボタンクリックで開始です。検索窓の右横にファイルの種類を選択するプルダウンメニューがありデフォルトは「全てのファイル」となっています。当然種類を限定すれば速くなりますが、ここで「TXT(テキスト)」を選ぶと、テキストファイルとして扱うように設定した拡張子を持つファイルが全て対象となります。

 ということで、代替はなんとかなりそうです。

------------------------------
*1) 柿木義一氏提案の棋譜ファイル形式で日本でのデファクトスタンダードと言える。中身は棋譜をテキストとしてそのまま書き込んだようなものだが、コメント行を認識する記号と指し手の分岐を示す記号が使われている。
*2) 基本は英語表記のゆえか世界的にはこちらが一般的だと思う。コンピューター将棋教会のサイト仕様がある。
*3) PNGではないよ。ウェブ検索エンジンも「それってPNGの間違いじゃない?」と思うらしいけど(^_^)


コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 画像管理ソフトの話 - 2 - | トップ | 会計の中の二つの顔(1) 複式... »
最新の画像もっと見る

コメントを投稿

その他、雑記」カテゴリの最新記事