文字クラスにおける日本語
【開発環境】
OS:Win10(64ビット)
Ruby 3.0.1
VSCodeバージョン: 1.57.1
Rubyにおいてはマルチバイトを認識できる文字コード(u, s, e)を指定した場合には文字クラス内に全角文字を1つの文字として指定することが出来ます。
/[赤青緑]色/u
「赤」「青」「緑」はそれぞれ1つの文字として扱われますので、上記は「赤色」「青色」「緑色」のいずれかの文字列にマッチします。
【ひらがな、カタカナ、漢字を表す文字クラス】
文字クラスではメタ文字のハイフン(-)で範囲指定が可能です。そこでひらながとカタカナを表す文字クラスは概ね次のように記述することが出来ます。
/[ぁ-ん]/u
/[ァ-ヴ]/u
漢字を表す文字クラスは文字コードによって異なります。
/[一-龠]/u
/[亜-煕]/s
サンプルプログラム
※コメント投稿者のブログIDはブログ作成者のみに通知されます