会社のエライ人から難題を持ちかけられますた。
何でも「EBCDICからSJISに変換してくれないと暴れちゃうゾ」とのことで、早速調査を開始したところ、これがまた意外と大変なことらしいことが発覚。EBCDICとかSJISてのは所謂2byteコード表のことね。当然他にもコードはイッパイあるわけで、ざっくりと紹介すると・・・
EBCDIC:IBM系ホストコンピュータで使われることが多い。
JEF:富士通系ホストコンピュータで使われることが多い。
EUC:UNIX系ワークステーションで使われることが多い。
JIS:今や電子メールぐらいしか用途がない?
SJIS:Windows系のパソコンで使われることが多い。実はAIXのデフォルトはこれだったりする。
しまった。脱線した。
話を戻すと、EBCDICの"あ"とSJISの"あ"は違うコードが振られるワケで、これをコード変換してくれ。と、こーゆーワケなのですな。そんでもってコード変換で有名なのはnkfてツールがありまして、これ使えば一発じゃ~んと、軽く見てたら罠があってnkfではEBCDICは英数カナしか対応してなかったのでしたorz
くそー漢字も頼むよー。
次に見たのがiconvです。AIXにもしっかり実装されてますんで、これならいけるでしょう♪
> iconv -f IBM-930 -t IBM-932 ebcdicのファイル
・
・
・
ブルータスよ、お前もか!
これも漢字が対応してませんでした。てゆーか、そもそも規格レベルのEBCDICとして決まってるのが
cp930 : IBM codepage 930, EBCDIK ( カタカナ )
cp939 : IBM codepage 939, EBCDIC ( 英小文字 )
だけみたいなので漢字は別に対応しないとイケナイらしいです。
うーむ。どーしよ?
その昔、EBCDICのコードページ変換に関するソースをあさったのがあるから、それ見て作っちまうか?
お手軽にツール使ってラクしたいよ~。
何でも「EBCDICからSJISに変換してくれないと暴れちゃうゾ」とのことで、早速調査を開始したところ、これがまた意外と大変なことらしいことが発覚。EBCDICとかSJISてのは所謂2byteコード表のことね。当然他にもコードはイッパイあるわけで、ざっくりと紹介すると・・・
EBCDIC:IBM系ホストコンピュータで使われることが多い。
JEF:富士通系ホストコンピュータで使われることが多い。
EUC:UNIX系ワークステーションで使われることが多い。
JIS:今や電子メールぐらいしか用途がない?
SJIS:Windows系のパソコンで使われることが多い。実はAIXのデフォルトはこれだったりする。
しまった。脱線した。
話を戻すと、EBCDICの"あ"とSJISの"あ"は違うコードが振られるワケで、これをコード変換してくれ。と、こーゆーワケなのですな。そんでもってコード変換で有名なのはnkfてツールがありまして、これ使えば一発じゃ~んと、軽く見てたら罠があってnkfではEBCDICは英数カナしか対応してなかったのでしたorz
くそー漢字も頼むよー。
次に見たのがiconvです。AIXにもしっかり実装されてますんで、これならいけるでしょう♪
> iconv -f IBM-930 -t IBM-932 ebcdicのファイル
・
・
・
ブルータスよ、お前もか!
これも漢字が対応してませんでした。てゆーか、そもそも規格レベルのEBCDICとして決まってるのが
cp930 : IBM codepage 930, EBCDIK ( カタカナ )
cp939 : IBM codepage 939, EBCDIC ( 英小文字 )
だけみたいなので漢字は別に対応しないとイケナイらしいです。
うーむ。どーしよ?
その昔、EBCDICのコードページ変換に関するソースをあさったのがあるから、それ見て作っちまうか?
お手軽にツール使ってラクしたいよ~。