ばばちゃんのおっちゃんの日本語の先生への道

日本語の先生になろうと一念発起いたしました。

その62 6000語辞書仕様

2021-11-20 06:43:18 | 8.ミャンマー語独習

6000語辞書の仕様

 OCRを使ってWordへの取り込みは、1/4ほど済みました。

 手順は、とりあえずOCRソフトで、Wordに取り込み、多少整理して、Excelに取り込みます。そして、(数種類のPDIC辞書化しやすいように)Excel上で、分類・整理。ミャンマー文字、発音記号は、OCRの仕様に有りませんので、メチャクチャ。これから、一文字ずつ手動で取り込みます。

 ソースの日本語訳語に対してGoogle翻訳、TexTra等でミャンマー語訳をし、同じスペリングのものをPDIC辞書のリストに取り込みます。訳語が見つからない場合は、一文字づつソフトキー入力。制作時間節約のため、ほぼ学習者に必要ない植物、動物の名前は、とりあえず、省きます。(およそ1,300語ほどあるそうです。ただこの6000語辞書は、その点が特徴だそうなので、最終的のどうするか考えてみます。)

 ソース辞書を整備していて、私にとっても難しい漢字があります。学習者には恐らく無理でしょうから、彼ら向けの緬日辞書にはルビ付きを、そして、日緬辞書には、ひらがな見出しにしたいと考えます。

 また、日緬辞書の語彙数は、多義語があったり、類似語がたくさんあったりしますので、植物名1,300語を省いても、日本語の見出しは、10,000語以上に成るのではないでしょうか。

 追記:ミャンマー語のOCRソフトが見つかり、多少、荷が軽くなりましたので、編者の意図に従って、それらを省略しないことにしました。一応、ミャンマー語の取り込みは終わりました(2/5)。これから、発音記号の取り込みに入ります。

 最終的には、発音記号付きにしたい。適当なソフトキー入力アプリも見つかりました。この場合も、ソフトキーボードを使って、一文字づつの入力になります。したがいまして、初版は、ひらがな見出しの日麺辞書と発音記号なしで漢字にひらがな付きの緬日辞書。第2版は、日本人向けに、発音記号付き、漢字混じりの見出しの日麺辞書と発音記号付きの緬日辞書を考えています。

試しに少しやってみました。

 困りましたね。

 悲しいかな、Google翻訳やTexTraは、ソース辞書の見出しと同じスペリングのミャンマー語をほとんど提供してくれないですね。利用できるのは、2~3割程度でしょうか、全く見込み違いでした。また、一文字ずつ入力したミャンマー語にミスがないかGoogle翻訳やTexTraで検証しますが、これも、目論見通り運ばないですね。訳語となかなか一致しません。この作業は、ソース辞書の印刷があまり鮮明でないので、私のミス入力がないかの作業です。これはネイティブに検証してもらわないとだめですね。

 なんか、ゴールが随分遠くへ、逃げていってしまったように感じます。目論見よりもさらに長期戦になりそうですし、誰かネイティブの世話にならなければ、誤りの多い辞書になってしまいそうです。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

その61 PDICデータ提供

2021-11-18 07:38:51 | 8.ミャンマー語独習

 PDICデータ提供

 6000語辞書の完成まで、時間がかかります。また第1段階で収集したものも必ずしも整備できておらず、洗練されたものになっていません。が、しかし、少しでも皆さんの役に立てる方策がないかと考えました。

 皆さんも、OCRソフトがない。ユニコードになっていない。緬日辞書(紙)しかない。AI利用のオンライン辞書Google翻訳、TexTraも今ひとつ。ミャンマー文字を見ても発音がわからない。等々で、お困りでしょう。何とか皆さんのミャンマー文字入力の手間を省き、PCを使っての学習のお手伝いをできないものかと言うのが私の望みです。

 種々取り込んだママの状態ではありますが、提供し、皆様のご都合に合わせてご自分で整備していただいてはどうかと考えます。私の入力ミスも混じっていると思いますが、その場合は、元のソースやGoogle翻訳、TexTra等で、お確かめください。ソースは、指差し会話帳の索引。独り歩き。検定単語集。絵辞典索引。みん日初級ⅠⅡ(MM Bizさん編)、GigaDict(10万語、漢語、専門語ばかりで、初中級ではあまり役に立たない。同じ語彙で、英緬版も有ります)が提供できます。指差し、独り歩きはカタカナ発音付き。検定は、アルファベット発音、英語付き。絵辞典は英語付き。ご請求は、下記へ(ブログ上での提供方法がわかりませんので・・・・・・)

y_baba(この( )部分は、削除してください。ジャンクメール対策です)@nike.eonet.ne.jp

 6000語取り込みに関しても、ある程度手順がわかりましたので、何ヶ月掛かるかわかりませんが、それがまとまれば、それ以降は、それを基準に物事を考えれば、正確さが向上すると考えます。

 参考書、AIオンライン辞書では、多義語については、性質上、不十分なのでやはり、基準に成る辞書が必要と考えます。『英辞郎』のように、PC上で、能率よく利用できたらと考えます。学習者の時間を画期的に節約してくれますので、なんとか早く提供したいものです。 ミャンマー語の音節の辞書も提供できます。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

その60 促音・鼻音の発音

2021-11-16 07:38:40 | 8.ミャンマー語独習

促音・鼻音の発音

 前記の単語収集と同時に、それぞれの単語の発音を試みましたが、私が作成しました鼻音・促音・拗音図表を参照しながらトライアルいたしましても、探し出すのにも手間がかかり、なかなかうまく行きません。

(参照:その44 鼻音・促音・拗音)

https://blog.goo.ne.jp/houren_naka1000/e/16591c0b319b4c1d7f1c31337a60f837 )

更に、覚え方を工夫しなければ、『ミャンマー語が読める』というレベルに到達するのは程遠いという感想です。

 今、思いつきますのは、それぞれの子音と組み合わせて、実用されているものを選び出して、それらを強引に覚えるという方法です。抽出しましたら促音:145組、鼻音195組もありました。

Quizletの読み方01~06に取り出してみました。

https://quizlet.com/y_babachan2/folders/98200652/sets

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

その59 私家版日緬・緬日辞書

2021-11-14 13:45:42 | 8.ミャンマー語独習

私家版日緬・緬日辞書

 ミャンマー語の辞書の環境が非常に不便なので、PDICを利用しての辞書作成中です。

 出来上がりますと、日緬・緬日双方から、瞬時に検索できるようになり、日本人にとりましてもミャンマー人にとりましても誠に便利なものになる筈です。完成の暁には皆さんに提供したいと考えております。ミャンマー文字もユニコード仕様でおこないます。

 第1段階として、ミャンマー文字がなかなか正しく読めないので、カタカナルビ付きの単語を探して集めます。(指差し会話帳、こんな時なんて言うの、独り歩きのミャンマー語、面白いほど身につく本等々から)およそ3,000語程度収集出来ると推測します。

 それとは別に、音節の発音が難しいのと、数が多いので、『ミャンマー語音節⇒カタカナ音節』の辞書も制作します。(初期段階、発音の大きな過ちを防止し、出来るだけ、オリジナルに近づけるための手段)

 第2段階として、前記以外の頻度の高い単語の取り込み。おそらくその頃になりますと、ミャンマー文字が多少読めるようになっているでしょうという推測から、ルビなしになるでしょう。困ったときは、『ミャンマー語音節⇒カタカナ音節』辞書が助けてくれるます。

第3段階として、6,000語辞書の取り込み。

最終段階として、2万円している辞書からの取り込み。

を考えています。 

 という事で、第1段階のルビ付きの採取は、ほぼ、終わりました。また、『ミャンマー語音節⇒カタカナ音節』の辞書も、整備は未完ですが、ほぼ出来上がりました。それを利用して、スペリングの短い単語にもルビを付けたりしています。

 そして。第2段階のMM Bizさんの『みん日』初級Ⅰ、Ⅱ及び、『ビルマ語絵辞典 索引』からExcelへの取り込みも終わりました。PDIC辞書にアップロードして、整備する予定です。

 ここで、ボキャブラリーを増やすという作業の大変さを改めて認識しました。指差し単語帳のときもそうでしたが、収集には結構手間と時間がかかるのです。検証と一文字づつの入力のため。そこからそれらを覚えるとなりますと、それらの数倍、十数倍かかるでしょう。聞き流しの動画でさえ、一通り終えますのに結構時間がかかります。一つ一つ覚えると成ると、ホント膨大な時間が必要となります。なんとか効率の良い方法を模索したいと考えます。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

その58 制作済みFC等

2021-11-12 13:22:23 | 8.ミャンマー語独習

その58 制作済みFC等

 制作しっぱなしのフラッシュカードを、利用しやすいように、整備しようとしています。仲間語のカードは、ボキャブラリーを増やす(成人向けの英緬教材から)、カタカナルビを付ける等。

 音節のカードについては、実際に使って、訓練をやって見ましたが、よく間違えます。まだ、ほとんど、要領が頭に入っていないようです。音節の図表を見直し、誤解しているところ、忘れているところが、多々ありますので、それらを、修正・復習しています。

 そして、カタカナルビについては、私家版日緬辞書に取り込んだ『音節データ』が、ようやく、役立つようになってきました。ルビを付ける際、ほぼ間違いなく利用できます。ちなみに、調べてみますと、データは2,000個弱収集していました。あまりにも多いので、なかなかうまく行かなかったはずです。

 トレーニングは、挨拶文と基本的な構文から覚えていこうとしています。参考にします挨拶文は、意訳もありますので、それぞれ分解して、単語の記憶と単語の使い方を学習して行こうと考えています。

 今まで、気が付きませんでしたが、日本人向けミャンマー語検定の単語集にもアルファベットの発音が付いていました。比較的わかりやすそうなので、これも辞書に付け加えたいと考えます。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

その57 拗音、促音、鼻音

2021-11-09 21:00:56 | 8.ミャンマー語独習

拗音、促音、鼻音

子音は、通常ア段で発音されますが、拗音で、「ျ」「ြ」が付く場合は、「イ」段で発音されます。また、「ွ」が付く場合は、子音が、「か」関連(「က」「ခ」「ဂ」「င」)だけで、それらの「ウ」段で発音されます。「ှ」が付く場合は、子音は、「ア」段の発音です。例外に、『ကြွ』(チュワ)や『ရှ』(シャ)があり、単独で覚えたほうが良さそうです。

以前の記事 https://blog.goo.ne.jp/houren_naka1000/e/16591c0b319b4c1d7f1c31337a60f837

 促音、鼻音(≒撥音)は、日本語では、「ッ」や「ン」だけで、単純に表現・発音されますが、ミャンマー語の場合、それなりの法則をなかなか見出すことが出来ません。

拗音は、ミャンマー語の基本字母表の左端の子音「က」「စ」「တ」「ပ」の上に、『်』が付いています。そして鼻音はそれ以外の字母についています。(というところまで分析できました。) 今後は、作成した図表を、そのままパターン認識して覚えるより仕方ないようです。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする