友人が書いた小説の中の誤字脱字を探すために読んでいる最中に、気がついた。
形態素解析すればいいじゃない、と。
誤字脱字を探すだけなら、文章中に用いられた単語をリストアップして表示させるだけで短時間のうちに作業が終わる。
……とは言うものの、形態素解析ができるツールを一つも持っていない俺には出来ない話。
MeCabを使えばいーんだけどね。いーんだけど、どうせなら自分で作りたい。
……と言って簡単に出来るほど単純な物じゃないことはよく分かってる。
大体、品詞分解と言う言葉の中の「品詞」が何を指すものなのかもよく分かってる気がしない。
文章を分解することの出来る最小単位だと言う説明くらいしかできん。
種類があるとか数がいくつだとか組み合わせのルールだとかそういうのはまるで分からん。
こんな人間がやる気だけで形態素解析prgを作ろうとしたら、単語のDB作ってDB内に登録されているキーワードを文章中から検索するくらいしか出来ないだろう。
動詞とか名詞とか接続詞とか、そういう情報は辞書を使えばなんとなく分かるけどそれらの組み合わせ方による文脈の読み方とか、そういうのはまるで想像つかん。
簡単には思いつけないような手法についてアレコレ考えるのは面白いケド。
でも、どうせ文脈解析をするなら処理系を作りたい。
独自言語を作ってみたい。単純に興味があるからだ。何か明確な目的があるわけでは無い。
だから処理効率とか、翻訳クォリティとか、そういう属性において他の処理系に勝るものを作ろうだなんて事は思っちゃいない。
構文木って言葉に興味があるだけとも言える。
階層構造のものは何でも触ってみたいという感じだろうか?
まぁ、ぶっちゃけ会社で必要になった新しい言語の勉強するのが嫌で、現実逃避したいだけなんだが。
JavaScriptを超える言語なんて存在シネーヨ。セキュリティとかグダグダになるけどとにかくなんでもJSでやりゃえーねん。
形態素解析すればいいじゃない、と。
誤字脱字を探すだけなら、文章中に用いられた単語をリストアップして表示させるだけで短時間のうちに作業が終わる。
……とは言うものの、形態素解析ができるツールを一つも持っていない俺には出来ない話。
MeCabを使えばいーんだけどね。いーんだけど、どうせなら自分で作りたい。
……と言って簡単に出来るほど単純な物じゃないことはよく分かってる。
大体、品詞分解と言う言葉の中の「品詞」が何を指すものなのかもよく分かってる気がしない。
文章を分解することの出来る最小単位だと言う説明くらいしかできん。
種類があるとか数がいくつだとか組み合わせのルールだとかそういうのはまるで分からん。
こんな人間がやる気だけで形態素解析prgを作ろうとしたら、単語のDB作ってDB内に登録されているキーワードを文章中から検索するくらいしか出来ないだろう。
動詞とか名詞とか接続詞とか、そういう情報は辞書を使えばなんとなく分かるけどそれらの組み合わせ方による文脈の読み方とか、そういうのはまるで想像つかん。
簡単には思いつけないような手法についてアレコレ考えるのは面白いケド。
でも、どうせ文脈解析をするなら処理系を作りたい。
独自言語を作ってみたい。単純に興味があるからだ。何か明確な目的があるわけでは無い。
だから処理効率とか、翻訳クォリティとか、そういう属性において他の処理系に勝るものを作ろうだなんて事は思っちゃいない。
構文木って言葉に興味があるだけとも言える。
階層構造のものは何でも触ってみたいという感じだろうか?
まぁ、ぶっちゃけ会社で必要になった新しい言語の勉強するのが嫌で、現実逃避したいだけなんだが。
JavaScriptを超える言語なんて存在シネーヨ。セキュリティとかグダグダになるけどとにかくなんでもJSでやりゃえーねん。