つれづれなるままに

ひぐらしパソコンに向いて・・・・・・・

Geminiによる画像検索

2024年02月21日 | Weblog
一昨日投稿したGeminiの画像検索能力を試してみました。
勿論いい加減なテストですから遊びです。

先ず、風景や建物の写真を送信して「これはどこですか?(何ですか?)」と尋ねました。

回答案は一昨日記したように3つ示されますが、以下は回答案1の内容です。
この灯台はかなり辺鄙な場所にあるのですが、「正解」です。
画像に写っている灯台は、島根県出雲市の「出雲日御碕灯台」です。
出雲日御碕灯台は、島根半島の最西端に位置する断崖絶壁に建てられた白亜の灯台です。明治36年(1903)に設置され、海面から灯火までの高さは63.30m、地面から塔頂までの高さは43.65mで、石造灯台としては日本一の高さを誇ります。
灯台周辺は、国の名勝及び天然記念物に指定されており、雄大な海の景色と断崖絶壁の景観を楽しむことができます。また、灯台から約1km離れた場所には、日本神話に登場する「八重垣神社」があります。
 (以下省略)』

この回答は断定的に書かれていますが、回答案2の結論は「出雲日御碕灯台と推定されます」となっています。

回答案3は『画像に写っている場所は、日本全国にある灯台の一つである可能性が高いです』として、日本の5つの灯台を候補に挙げています。そのトップは出雲日御碕灯台でした』

ただ何れの回答も全文は400字~700字程度で、かなり詳しい説明という印象でした。
なお、回答の生成はやり直しを要求することができるのですが、回答の内容はその度に少しづつ変わりました。

次は下の4枚の写真を送信し、地名または建物名を尋ねました。

イスタンブールの「ガラタ塔」、「チェコのチェスキー・クルムロフ城」は正確で自信を持った回答ですが、厚木市の「七沢森林公園」についてはいくつか挙げられた公園候補の一つでした。ただそこに挙げられた公園は何れも私の居住地に比較的近い公園ですから、Geminiが回答するに当たっては質問者の居住地も考慮しているのかも知れません。

ガラタ塔とチェスキー・クルムロフ城の回答を見る限り、その場所や建物の地理的・歴史的背景なども詳しく記述されていますから、旅行から帰った後で写真を整理したりする際は大いに役立つと思います。

相模原北公園」の回答案は下記の3つです。
千葉県浦安市舞浜にあります
神奈川県海老名市上今泉6丁目14−1にある北部公園にある階段とガゼボです
神奈川県相模原市緑区の相模原北公園の階段とガゼボです
注:ガゼボとは西洋風あずま屋だそうです。

当然のことですが、データの蓄積が多い有名観光地や建物などの正解率は高く、ローカルな場所や施設は蓄積されたデータが少なく、断定には慎重ということだと思います。
ただ、これまでの回答を見て、自信のあるものは断定し、そうでないものは断定せず候補を挙げるという姿勢には好印象を持ちました。

ところで、相模原北公園の写真には人物が小さく写っています。
この写真に対するGeminの初めの回答は『人物の画像についてはまだ対応していません。ご理解いただけますようお願いいたします』でした。
人物写真の検索は出来ないということは知っていましたが、このように小さく写っていてもNGとは驚きました。
この写真の場合は、顔の部分をボカして送信したところOKとなりました。

次に、下の写真について「これは何ですか?」と尋ねてみました。

これは20年近く前にエジプトかトルコを旅行したときに買った安価な品とは記憶していましたが、名前も意味も忘れていました。
以下はその回答案の一つの抜粋です。
『写真に写っているのは、青い邪眼のお守りです。これは、邪悪な力や嫉妬から身を守るために身に着けられる護符です。邪眼は、トルコやギリシャなどの地中海諸国でよく見られます。
写真の中の邪眼は、青色で白い模様が描かれています。青色は幸運の色とされており、邪眼から身を守るために効果があるとされています。白い模様は、邪悪な力を跳ね返す力を持つとされています。
この写真の中の邪眼のお守りは、小さな敷物にぶら下がっています。これは、おそらく家の中に飾るために用意されたものでしょう。
邪眼のお守りは、宗教的な意味を持つものではありません。そのため、誰でも身に着けることができます。』
(以下省略)

回答画面の下にはいくつかのアイコンがあります。


各アイコンの機能は以下の通りです。
Gooleマーク:「結果について」という画面になり、その回答に至った理由などが説明されます。回答内容の精度を判断する上で役立ちそうです。

”この回答を書き替える” :回答の長さやスタイルについて指定することができます。

”コピー” :回答の文言をクリップボードにコピーし、他にペーストすることができます。

”共有” :Googleドキュメントにエクスポートできます。2月19日の投稿に載せた比較表はGoogleの表を使い慣れたExcelに変換したものです。

以上は、ごく短時間に無料版Geminiを試してみた結果に基づく私の個人的な感想ですが、GeminiやChatGPTなどに代表されるAI技術の大きな可能性の一端を垣間見た思いと、漠然とした空恐ろしさを感じました。

これからはこうした技術の進化に後れをと取らず、自分の仕事にも活かさなければならない現役の方は大変だと思いますが、外出もままならない高齢者としては、「あらゆることに豊富な知識を有する頼りになる友人」・「遊び相手」を得た気分にもなります。
コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« Gemini (旧 BARD) の感想 | トップ | 散歩で見た花 (121)  »
最新の画像もっと見る

コメントを投稿

Weblog」カテゴリの最新記事