職案人

求職・歴史・仏教などについて掲載するつもりだが、自分の思いつきが多いブログだよ。適当に付き合って下さい。

文字クラスにおける日本語

2021年11月17日 | Ruby3.0.1
文字クラスにおける日本語


【開発環境】
OS:Win10(64ビット)
Ruby 3.0.1
VSCodeバージョン: 1.57.1

Rubyにおいてはマルチバイトを認識できる文字コード(u, s, e)を指定した場合には文字クラス内に全角文字を1つの文字として指定することが出来ます。

/[赤青緑]色/u
「赤」「青」「緑」はそれぞれ1つの文字として扱われますので、上記は「赤色」「青色」「緑色」のいずれかの文字列にマッチします。

【ひらがな、カタカナ、漢字を表す文字クラス】
文字クラスではメタ文字のハイフン(-)で範囲指定が可能です。そこでひらながとカタカナを表す文字クラスは概ね次のように記述することが出来ます。

/[ぁ-ん]/u
/[ァ-ヴ]/u

漢字を表す文字クラスは文字コードによって異なります。
/[一-龠]/u
/[亜-煕]/s

サンプルプログラム
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする