BLOG 思い遥か

日々新たなり/日本語学2020

品詞分解ツール

2021-06-19 | #日本語教育

解析ツール、無料というから、どんなものかと、便利さに感謝して使ってみる。
15 日に続いて、読解文章の段落を実験解析した。品詞分けに使ってみる。自立語付属語を分けるのはよしと、できるものの、補助用言の扱いなどに注意がいる。品詞名を問わなければよいかもしれない。

例文:
 一方、日本語では、人間の体についての語彙がとても大ざっぱである。一説には、これは 日本人が元来肉食ではなく、動物の体の部位について無関心であったためであると言われて いる。実際、日本人は体に関して詳しく言うのは何となく恥ずかしく感じるし、上手でもない。小説などを見ても、西洋のものに比べて、登場人物の体の特徴についてより、その人物 の全体的な姿、服装、雰囲気についての言及が多いことがわかる。

また、言語行動や対人行動の特徴が語彙に表れていることも多い。例えば、日本人は、「語らぬ」民族、あるいは「語ることを重視しない」民族だと言われてきた。確かに、日本語に は、発言が多いことについて、「おしゃべり」「口うるさい」「べらべらしゃべる」「ずけずけ言う」などのように、否定的な意味合いを持つ語彙や表現が多い。反対に、「言外の意味」や 「本音と建前」という言葉があることからわかるように、はっきり言わないこと、そして相 手が言葉で表していない部分まで理解することが期待されるのである。

出現頻度情報
単語 品詞 出現回数
、 特殊 22
に 助詞 14
の 助詞 14
て 助詞 12
が 助詞 10
。 特殊 8
「 特殊 8
」 特殊 8
は 助詞 8
こと 名詞 7
だ 助動詞 7
特殊 6
つく 動詞 5
言う 動詞 5
ある 助動詞 4
と 助詞 4
体 名詞 4
多い 形容詞 4
特殊 3
する 助動詞 3
で 助詞 3
ない 助動詞 3
や 助詞 3
れる 助動詞 3
を 助詞 3
日本人 名詞 3
語彙 名詞 3
いる 助動詞 2
た 助動詞 2
ない 形容詞 2
など 助詞 2
も 助詞 2
よう 助詞 2
わかる 動詞 2
人物 名詞 2
日本語 名詞 2
民族 名詞 2
特徴 名詞 2
行動 名詞 2
言葉 名詞 2
語る 動詞 2
ある 動詞 1
あるいは 接続詞 1
いう 動詞 1
いる 動詞 1
おしゃべり 名詞 1
から 助詞 1
くる 助動詞 1
これ 名詞 1
し 助詞 1
しゃべる 動詞 1
ずけずけ 副詞 1
そして 接続詞 1
その 連体詞 1
ため 名詞 1
でも 助詞 1
とても 副詞 1
ぬ 助動詞 1
はっきり 副詞 1
べらべら 副詞 1
また 副詞 1
まで 助詞 1
もの 名詞 1
より 副詞 1
一方 接続詞 1
一説 名詞 1
上手 名詞 1
人間 名詞 1
何となく 副詞 1
例えば 副詞 1
元来 名詞 1
全体的 形容動詞 1
動物 名詞 1
反対 名詞 1
口うるさい 形容詞 1
否定的 形容動詞 1
大ざっぱ 形容動詞 1
姿 名詞 1
実際 名詞 1
対人 名詞 1
小説 名詞 1
建前 名詞 1
恥ずかしい 形容詞 1
意味 名詞 1
意味合い 名詞 1
感じる 動詞 1
手 名詞 1
持つ 動詞 1
服装 名詞 1
期待 名詞 1
本音 名詞 1
比べる 動詞 1
無関心 名詞 1
理解 名詞 1
発言 名詞 1
登場 名詞 1
相 名詞 1
確か 形容動詞 1
肉食 名詞 1
表す 動詞 1
表れる 動詞 1
表現 名詞 1
西洋 名詞 1
見る 動詞 1
言及 名詞 1
言外 名詞 1
言語 名詞 1
詳しい 形容詞 1
部位 名詞 1
部分 名詞 1
重視 名詞 1
関 動詞 1
雰囲気 名詞 1



日本語品詞分解ツール
入力された文章を品詞分解して、見やすく表示します。
入力するたびに表示されるので、日本語の文法の学習にご利用ください。研究等のためCSVでもダウンロードできます。

https://tool.konisimple.net/text/hinshi_keitaiso

日本語品詞分解ツールについて
• 多く表示される単語を一覧表示するので、同じ言葉をどのくらい使っているか簡単に確認できます(単語出現頻度情報)。
• このツールでは、 Yahoo! Japan社が公開している日本語形態素解析 APIを利用しています。解析結果には誤りを含む場合があります。
Web Services by Yahoo! JAPAN


3 コメント

コメント日が  古い順  |   新しい順
品詞分解 (Maria)
2021-06-20 14:55:02
Maria です。
割った話、「へー、この程度でいいんだ」「ふぅうーん、あぁ、そうなんだ」とかいった「嘲で笑っちゃうレベル」なんですが、「ここ四半世紀、日本語の形態素解析が進歩していないのは、我々の責任なのか?!」という反省しきりです。
まず「特殊」の扱いをどうするか、という問題があります。「特殊な」はありますが、「特殊に」は(明治時代の文献には「特殊なる」はあるかもしれませんが、「用例を示せ」とか言われても困るわけですが)「品詞(分類)として、どう立てるか」というのは悩みどころです。
> いる 助動詞 2
に関しては、自立語の「いる」と、「持ってく」「取っとく」「持ってる」のような、補助動詞としてに「ゆく」「おく」「いる」に属すと考えているので、「助動詞」ではなく「自立語」と「補助動詞」の二種がある、という観点が抜け落ちているおではないか、と指摘しておきます。
それを言うと、
> いる 動詞 1
は品詞分解としていかがなものか、とか
> おしゃべり 名詞 1
は「おしゃべりな」という用例があるので「形容動詞」に分類する流儀もあると思います。
「いまどきの形態素解析の水準って、こんなものなの?」とかいった絶望感はあります。
まぁ、日本語処理というのは、いまだに「よちよち歩き」だということだと思いますが、その一端は国文法学者の方々が担っていらっしゃるわけで、もっと堂々と表舞台に立っていただきたく思います。
返信する
ツール (ksky)
2021-06-20 23:54:40
ツールをよくみると、
>13 : 特殊(句読点、カッコ、記号、空白、タブ、改行など)
というところで、説明があります。
コメントの説明は、上記の解析結果についての項目のことで、取り違えでしょう。

ほかも同様ですが・・・
返信する
ツール (Maria)
2021-06-21 10:25:24
ちょっと弄ってみたところ、けっこう苦労しているのだなぁ、と思いました。
苦労の理由には思いあたる点があって、学校文法や益岡=田窪文法における品詞分類との整合性を取ろうとすると、品詞の命名がなかなかうまくゆかない、という問題があります。「形容動詞」という命名はあまりふさわしくないので「名詞」の下の「名形」とするなどは、工夫があると思います。
その点を踏まえて、「品詞分類」というのは単純に羅列できるものではなく学校文法にあるような単純な二分木構造でもなく、二次元の表でも表現しづらい複雑な構造を持っているように思います。
たとえば「案ず」「案ずる」「案じる」なんかはそれぞれ「五段ザ行」「五段ザ行の特殊用法」「ザ変動詞」という解釈もできるのですが、「特殊用法」というのが「五段ザ行がザ変の活用に引きずられて起きた混乱」と見ることもでき、そのあたりの整理を行なって叩き台にする、という作業が必要です。
ただ、なかなか興味を持つ研究者が見つからないのが残念だと感じています。
返信する

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。