いこいの森

Think globally, Act locally!
 -Globis、IT、経営力を高める-

UTF-8文字コードファイルの扱い(Fedora5)

2007-05-16 | サーバ構築・環境設定

■UTF-8文字コードファイルの扱い(Fedora5)  LAST UPDATE 2007/05/18
------------------------------
UTF-8対応のエディタが標準で備わっているため問題ないですが、
コンソール環境などでは、必ずしもLinuxで快適に利用できる環境が最初から揃っているとは限らないので
UTF-8文字エンコードされているファイルを扱う環境を作成する。


1.UTF-8ファイルを見る
'cat'や'less'ではUTF8エンコードされたファイルを正しく表示できないので
UTF-8ファイルを利用する場合は、これに変わるコマンドとして、'lv'コマンドを利用する。

例)
%lv [FileName]

 
2.文字コードの変換
文字コードを変換するには、'nkf'を利用していました。この代替も'lv'でできます。
例)
%lv -Oej file.utf8 > file.euc-jp

これで、UTF-8エンコードファイルをEUC-JPに変換します。
manで書式を確認してください。

指定できる代表的な文字コードは以下の通りです。
j           :iso-2022-jp
e           :Extended Unix Code
ej          :euc-jp
u7          :UTF-7
u8          : UTF-8
i1・・・i9  :iso-8859-1・・・iso-8859-9
s           :shift-jis


3.vi(vim)でUTF-8ファイルを利用する
vi(vim)では、6.x系以上でUTF-8ファイルを利用できます。
利用するには、~/.vimrcの以下の行を編集(追加)する。
 ※初期状態では.vimrcの新規作成が必要。
------------------------------
syntax on      >--文字の色分けを実施
set nobackup    >--バックアップファイル(file~)を作らない指定
set fileencoding=japan   >--デフォルトの保存エンコード。[japan]はeuc-jp、UTF-8の場合は[utf-8]
set fileencodings=iso-2022-jp,euc-jp,utf-8,ucs2le,ucs-2,cp932 >--読み込むことのできるエンコードを列挙。
------------------------------


4.emacsでUTF-8ファイルを利用する
emacsでUTF-8ファイルを利用するには、mule-ucsが必要です。
なお、UTF-8の改行コードも他の文字コードと同じように指定できます。

utf-8-unix : 文字コードUTF-8、改行コードUNIX形式
utf-8-mac  :文字コードUTF-8、改行コードMAC形式
utf-8-win  :文字コードUTF-8、改行コードWindows形式


最新の画像もっと見る