[全体] [技術メモ] 各一覧の該当ページへ

BOMにハマる2

[技術メモ] 2008年6月7日(土曜日) 22:06

BOMにハマるのその後。

TExchange

複数行置換ソフトTExchangeはその後も快調で、UTF-8の文字化けもまだありません。
ただし、仕様上BOMが付いてしまいますので、それを取らねば…

KanjiTranslator

BOMを取るために導入したKanjiTranslator。分かりやすく使いやすいGUIで快調でしたが、置換結果を示す文字列に、
「このテキストはUTF-8ですが、変換できない文字があります」と表示されているのを発見。BOMのみならず文字コードや改行コードも変えてくれるツールなので、奇妙な文字列が入っていると当然、BOMもとってくれません。
ツール自体は、悪いデータを指摘してくれるすばらしいものです。問題は、どの文字に問題があるのかがなかなか分からない事(ノД`)
他のエディタでは引っかからない場合も少なくありませんので、ひょっとすると、Unicodeの奇々怪々な仕様に由来する部分なのかもしれません(未確認)。

non-BOM

と言うわけで、BOMだけ取るnon-BOMを導入する事にしました。Sendtoのディレクトリに入れ「右クリックの送る」でフォルダまるごと処理。
問題があるとされてKanjiTranslatorでスキップされてしまうファイルのBOMもサッパリと外してくれます。

しばらくは、TExchange+non-BOM で行ってみよう(・∀・)

トラックバック URL :

コメントをどうぞ

表示アバターはGravatarsです。
メールアドレスに対してアバター画像を登録できます。