Linux

Linux nkfで文字コード変換半角カタカナを変換する際は注意必要です

外部からShift_JISのCSVで受け取ったファイルをutf8に変換したところ次の点、うっかりバグを作ってしまいました。(半角カタカナのデータなんて混じる事知らんかったし、、、)

Shift_JIS で記載された内容(nkftest.csv)
1,オレンジ,オレンジ
2,リンゴ,りんご
3,ブドウ,葡萄
半角カタカナが全角カタカナになる
[oracle@vm013 ~]$ nkf -Lu -w nkftest.csv > nkftest.utf8_w.csv
[oracle@vm013 ~]$ cat nkftest.utf8_w.csv
1,オレンジ,オレンジ
2,リンゴ,りんご
3,ブドウ,葡萄

x オプションが必要でした
[oracle@vm013 ~]$ nkf -Lu -wx nkftest.csv > nkftest.utf8_wx.csv
[oracle@vm013 ~]$ cat nkftest.utf8_wx.csv
1,オレンジ,オレンジ
2,リンゴ,りんご
3,ブドウ,葡萄
スポンサーリンク