木燃人の波止場

花やお寺や観光地の写真を紹介しつつ、皆さんとの交流を計りたく思ってます、気軽に見て戴き、コメントを戴ければ嬉しいです。

SQLで遊ぶ (No 2189)

2020-02-01 08:00:00 | パソコン

 「花写真鑑」「花写真集」をデーターベース化しようとしたが、前述の通り、私の内部的には出来たが、一般公開が出来ず、暗礁に乗り上げたので、一時的には一般公開を諦め、私が使い易いように作ろうと考えた。 

  元はと言えば、前に見た岩淵さんの「あの頂きを越えて」で見た、花名からの「あいまい検索」(文字列の部分一致検索)を私もやりたいと思ったことであったが、これは一応出来る見通しが立った(公開は出来ない)ので、 まずこれをやろうと考えた。

 例えば、花を見付けた時に、「何とかラン」とか、「アカ何とか」と花名を断片的に記憶しているが、名前が思い出せない時や、初めてみた花が「何とかサクラ」と聞いたが忘れてしまったことなどが、時々あるので、これが役に立つ。 

 MySQLでの検索(クエリ)は、  WHERE 花名 LIKE '%〇〇〇%'   である。〇〇〇の所へ文字を入れる。(「花名」はテーブルの列名)

 

 ① 花などの大小を花名で表す 

 前に見付けた花を基準に考えた時、それより小さい場合は「コ(小)」とか「ヒメ(姫)」を付け、大きい場合は「オオ(大)」などとされているので、調べてみた。

 「コ(小)」 561個抽出したが、当然のことながら、「オオバコ」など意味のないものが多数含まれており、実用にはほど遠い。

 「ヒメ(姫)」 63個、 「ヒナ(雛)」も同様につかわれることがあるが、今回は8個の名前を抽出した。

  「オオ(大)」 49個、 「オオニガナ」「オオイバラ」など・・・

 

 ② 生えてる場所から、付けられた名前の場合

 「ヤマ(山)」 73個、 但し、この内16個は、もっと深い山の意味で「ミヤマ(深山)」の文字が付属している。

  「イワ(岩)」 42個、 岩がごうごつした場所に生えるのだろう。但し、それに関係のない「タイワンユリ」なども含まれるから、要注意!。

 「オカ(丘)」 9個、 「オカワカメ」などであるが、中には「オオカニコウモリ」も含まれる。

  「ニワ(庭)」 11個、 「ニワウメ」のみならず、「タニワタリ」も含む。

 

 ③ その形態から、小動物の名前が良く付けられる。

 「イヌ(犬)」 12個、 「オオイヌノフグリ」など

 「スズメ(雀)」 4個、 「スズメウリ」、「ムレスズメ」など

 「カラス(烏)」 7個、 「カラスウリ」、「カラスノエンドウ」など

 

 ④ 花や茎の色から付ける名前、黄色は「キバナ」と付くことがある。

 「アカ(赤)」 56個、 「アカヤシオ」ばかりではなく、「アカシア」なども

 「シロ(白)」 30個、 「シロヤシオ」の他に「キジムシロ」なども・・・

 「アオ(青)」 32個、 「アオバナ」のみならず「ホテイアオイ」も・・・

 

 ⑤ 「ハナ(花)」「クサ(草)」

 「ハナ」 81個、「バナ」100個と連濁の有無も要注意。

 「クサ」 52個、「グサ」82個

 

 ⑥ 似ていたり、科名や属名が同じであったりすると、付く名前

 「ラン(蘭)」 144個、名前に預かろうとしたのや、「キランソウ」なども含むが、結構多いのに驚く。

 「バラ(薔薇)」 16個、「スバラキシス」や「マツバラン」も含むからね!。

 「ユリ(百合)」 42個、 

 「サクラ(桜)」 23個、 意外に少なかった。

  

 なお、この「検索」は、表記の文字そのものの検索ではなく、文字コードからの検索であるので、採用している文字コードの違いにより、検索結果が変ってくる点を注意すべきである。例えば、私の「写真集」を見ても、その違いがあり、検索結果にはそれを見込んでおく必要がある。

 私の体験から言えば、特に半角文字には注意が必要、更には半角の濁点が付くともうひとつのハードルがあることを、承知していないと行けないことが、判明した。 その意味では、一度原表を同じ文字コードに修正すべきかも知れない。

 

 

 余り意味はないが、集録数を調べたので、備忘録ついでに書き残す。

花の名前の数 (全集録数 3755の花の内訳) 
 2個以上  1174
 3 〃     406
 4 〃     150・・・スイレン、ブラシノキ、ルピナス他
 5 〃       14・・・ボタン、ツユクサ、ハナニラ他
 6 〃         4・・・ホタルブクロ、カッシア他
 7個          1・・・アニソドンテア

 

                              以上

コメント