[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[port139ml:03185] Re: jstrings (Japanese 'strings' command)



Port139 伊原です。

遅ればせながら www.port139.co.jp/task/jptest.dd でテストしてみました。
ばっちり出てます :-)

[0029a801](CP932): あいうえお
[0029a80d](CP932): かきくけこ
[0029a818](CP932): ABCDEFGHIJK
[0029a826](CP932): 日本語文字列をうまく検出できるかな。

On Fri, 02 May 2003 11:08:27 +0900
"HASEGAWA, Yosuke" <hasegawa@xxxxxxxxx> wrote:

> えぇ、情報が散逸していて、まとまっていないので、ここらで文字コード本が
> 欲しい、と思ったりしませんか?

はやくでるといいですね :-)、33日遅れになってるという噂も(笑)

> jstrings -iCP932 -iUTF16 ntfs.dd
> 
> みたいにできれば、ntfs.dd に含まれる SJIS な文字列と Unicode な文字列の
> 両方が拾えたりできてうれしいかなぁと。

二つ以上の場合、出力(画面表示)文字コードはどうなるんでしょ?
NKF な何かを通して一括して Shift_JIS へ変換してから表示させる
とかすることになるんでしょうか...
 
> ISO-2022-JP では複数の文字コード(文字集合)をエスケープシーケンスによっ
> て切り替えることができますので、途中にゴミが入ると -- 言い換えれば、バイ
> ト列の断片だけを見るのでは -- その部分がどの文字コードを指しているのか
> 判断しようがない、というわけです。

ゴミにより判断できない場合には、強制的に何らかのエスケープシー
ケンスを指示して処理する形が妥当な解決策になるのでしょうか?

通常の用途で jstrings を利用するのであればゴミは無視するという
方向になるのかもしれませんが...どいうのがいいんでしょね...

-- 
Hideaki Ihara <hideaki@xxxxxxxxxxxxx>
Port139 URL: http://www.port139.co.jp/
PGP PUBLIC KEY: http://www.port139.co.jp/pgp/