初めてのＲｕｂｙを読む　その２３　４．９

2011-10-04 11:35:41 | Ruby

「初めてのRuby」を読むの続き

４章　文字列
４．９　Ruby１．８とマルチバイト文字
から

※注意！１．８です。１．９は、明日。

■４．９．１　文字列＝バイト列

・Ruby1.8までは、文字列は、単なるバイト列
　　→エンコーディングを認識しない
　　→Stringのlengthメソッドは、バイト長を課閲す
　　→StringのupcaseはＡＳＣＩＩの範囲のみ、大文字にする

・でも、一部の機能は日本語対応
　　→$KCODE対応メソッドと正規表現処理の２つ

■４．９．２　$KCODE対応メソッド

・一部のメソッドは「規定のエンコーディング」に従って、処理を変える
　→Stringのinspectメソッド：「規定のエンコーディング」で解釈、表示

・$KCODE：「規定のエンコーディング」を保持するグローバル変数

■４．９．３　正規表現
・正規表現は、日本語によく対応
　　→ .　は１バイトでなく、１文字に対応

・scanメソッド
　　→正規表現にマッチする部分文字列があると、ブロックを繰り返す
　　→生成時のオプションn,s,e,uが指定されていれば、それに
　　　指定されていなければ、$KCODEに従って処理する

■４．９．４　文字列の同値性

・文字列の大小は、単純に先頭から１バイトづつ比較
　　→エンコーディングは関知しない
　　→文字列は同じでも、エンコーディングが違えば違う文字

■４．９．５　多言語対応

・$KCODEによって処理系のモードを切り替え
　　　→複数のエンコーディングが混在する場合は向いていない
　　　→他のスレッドが$KCODEを書き換えると、予期せぬ状況に

・Ruby1.8で国際化、多言語対応：UTF-8を仕様

次回は、１．９のマルチバイト処理

ランキングに参加中。クリックして応援お願いします！

« Androidのカメラアプリ、シャ... | トップ | ＰＭＢＯＫのお勉強　その２... »

このブログの人気記事

最新の画像［もっと見る］

日	月	火	水	木	金	土
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

アクセス
閲覧	1,348	PV
訪問者	513	IP
トータル
閲覧	35,132,042	PV
訪問者	8,823,971	IP
ランキング
日別	776	位
週別	493	位

	【11/18】goo blogサービス終了のお知らせ
	【PR】ドコモのサブスク【GOLF me！】初月無料
	【コメント募集中】goo blogでの思い出は？
	「#gooblog引越し」で体験談を募集中

ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです（たま～にコンピューター関係も）