[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[port139ml:03179] Re: jstrings (Japanese 'strings' command)



はせがわといいます。

# port139 の subscribe、予想より速い…。ほんとに手動登録ですか?

>えーと もとのぶ先生が、[port139ml:03118] で紹介した はせがわさんのを
>ベースに? EUC-JP にも対応したのを公開されています。

とりあえず、もにょさん版 jstrings-0.21 を見ました。

私も同じ失敗をしていたんですが、SJIS で leadbyte - leadbyte - tailbyte
という並びになっていたときに、最初の leadbyte を見た時点で tailbyte 待
ちになってしまい、2バイト目+3バイト目の SJIS な文字がうまく認識できない
です。

ちなみに、これは --ascii でもおかしいかも。
----
G:\jstrings-0.21>dump /a test.txt
00000000 82 30 31 32 33 0D 0A                             ..123..

file:TEST.TXT 7bytes readed.

G:\jstrings-0.21>cat test.txt |jstrings --ascii


G:\jstrings-0.21>
----

で、はせがわ版でこれらを直したものを
 http://www.alles.or.jp/~hasepyon/jstrings/jstrings-0.3.lzh
においてあります。

とりあえず時間と環境がなくて VC++ 以外はコンパイルさえ確認していません。

もにょさん版とは違う味付けにしようと思って、とりあえず実装の楽な EBCDIC
対応なども入っていたりします。

もちろん、ファイル内でのオフセット位置の表示もOKです。

ちなみに、ファイル名はオプションより前にあっても OK ですし、-i や -n に
続くスペースはなくても構いません。

C:\>jstrings -f test01.txt -iASCII -n 10 test02.txt

とか。

>email の残骸を拾えるようにぜひ JIS(ISO-2022-JP)へも対応いただけると
>嬉しいっす。

そうしたいのですが、時間が…。あと、仕様的にも

1b 24 42 24 22 00 24 22 
               ↑ゴミが挟まってる

みたいな文字列に対して、2度目に出現した 24 42 はどう扱う? みたいな問題
もあったりします。

---
   はせがわ hasegawa@xxxxxxxxx

   "UNIX 4.3BSDの設計と実装" 復刊リクエスト投票募集中
   http://www.fukkan.com/vote.php3?no=4316