■UTF-8文字コードファイルの扱い(Fedora5) LAST UPDATE 2007/05/18
------------------------------
UTF-8対応のエディタが標準で備わっているため問題ないですが、
コンソール環境などでは、必ずしもLinuxで快適に利用できる環境が最初から揃っているとは限らないので
UTF-8文字エンコードされているファイルを扱う環境を作成する。
1.UTF-8ファイルを見る
'cat'や'less'ではUTF8エンコードされたファイルを正しく表示できないので
UTF-8ファイルを利用する場合は、これに変わるコマンドとして、'lv'コマンドを利用する。
例)
%lv [FileName]
2.文字コードの変換
文字コードを変換するには、'nkf'を利用していました。この代替も'lv'でできます。
例)
%lv -Oej file.utf8 > file.euc-jp
これで、UTF-8エンコードファイルをEUC-JPに変換します。
manで書式を確認してください。
指定できる代表的な文字コードは以下の通りです。
j :iso-2022-jp
e :Extended Unix Code
ej :euc-jp
u7 :UTF-7
u8 : UTF-8
i1・・・i9 :iso-8859-1・・・iso-8859-9
s :shift-jis
3.vi(vim)でUTF-8ファイルを利用する
vi(vim)では、6.x系以上でUTF-8ファイルを利用できます。
利用するには、~/.vimrcの以下の行を編集(追加)する。
※初期状態では.vimrcの新規作成が必要。
------------------------------
syntax on >--文字の色分けを実施
set nobackup >--バックアップファイル(file~)を作らない指定
set fileencoding=japan >--デフォルトの保存エンコード。[japan]はeuc-jp、UTF-8の場合は[utf-8]
set fileencodings=iso-2022-jp,euc-jp,utf-8,ucs2le,ucs-2,cp932 >--読み込むことのできるエンコードを列挙。
------------------------------
4.emacsでUTF-8ファイルを利用する
emacsでUTF-8ファイルを利用するには、mule-ucsが必要です。
なお、UTF-8の改行コードも他の文字コードと同じように指定できます。
utf-8-unix : 文字コードUTF-8、改行コードUNIX形式
utf-8-mac :文字コードUTF-8、改行コードMAC形式
utf-8-win :文字コードUTF-8、改行コードWindows形式