[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[connect24h:10022] Re: Unicode バグについて



佐名木という者です。

HASEGAWA Yosuke wrote on 2005-11/15(火) 14:13:36
>はじめまして。

はじめまして。

>> UNICODE バグについて、いろいろと取り上げられているのですけど、
>> PathTravarsal だけではなくて、より深刻な問題だと思ってます。
>> そこで、以下の文書を作ってみました。
>> http://rocketeer.dip.jp/unicode/index.htm
>
>まださらっと眺めただけなのですが、各処理系について広く調査
>されていてすごいですね。

いえいえ、三人で、調べていますからね。
次回、更新時は、Java 関連が増えると思う。-> Java 担当者がんばれ!
(Ansiな)Linux 上のJava(uniocde) は特に疑わしさ満点です。

>「Unicodeなんて使ってないから関係ないよ」と思っている人でも
>実は無関係ではないことに気付かされることうけあい。

スクリプト言語はほぼ UNICODE ですからね。

また、VC++6.0SP6 ですと、ほとんどのウィザードが
 _MBCS オプションですから、危険ですね。
(私の COM ツールも同様ですが...)

>とりあえず、表面的なことばかりですが、気付いた点をいくつか。
>あまり書くと、近い将来のネタがなくなってしまうのでアレなんです
>けれど :-)

ありがとうです。

>- FAT32であっても長いファイル名は Unicode で格納される。
>- 円記号からバックスラッシュへの変換は日本語 Windows 特有の
>  問題であるが、それ以外の言語版であっても他の文字では同様の
>  問題が発生する可能性はある(ウォン記号など)。
>- Windows は MultiByteToWideChar / WIdeCharToMultiByte 以外
>  にも複数の ANSI と Unicode の変換ルーチンを持っている。
>  MLang 系など。それぞれ変換ルールが微妙に異なるようである。
>- ファイル名以外にも暗黙のうちに ANSI - Unicode の変換が行われる
>  箇所が(言語にもよるが)ある。
→ 1.PostgreSQL,mySQL の SQL インジェクションが典型です。
   2.cmd.exe は呼び出すコマンドが UNICODE/ANSI を判断して
     コマンド引数を変換してくれるようです。
>- まっちゃ139での資料のURLは
>  http://matcha139.hiemalis.org/~isamik/document.html#06
>  のほうが適切かも知れません。
>  なお、この資料の解説が
>  http://d.hatena.ne.jp/hasegawayosuke/20041203#p3
>  あたりにあります。

次回更新時に、修正しておきます。

以上、よろしくお願いします
2005-11/15(火) 14:21:50 作成開始

 -----------------------------------------------------
 佐名木 智貴(Tomoki Sanaki) 
    E-mail=active@xxxxxxxxxxxxxxxxxx
 PGP FingerPrint 
 = 34E5 2A31 45C8 2CB5 3CED  0B46 F328 A402 7182 DCC6

--[PR]------------------------------------------------------------------
 _____┏━━━━━━━━━━━━━━━━━━━━━━━━┓___
 ☆…☆…☆┃ 豪華賞品あれこれまとめてセットで当たります! ┃☆…☆
  ̄ ̄ ̄ ̄ ̄┗━━━━━━━━━━━━━━━━━━━━━━━━┛ ̄ ̄ ̄
        懸賞ならココ!ふくびき.comであなたも運試し♪
      http://www.fukubiki.com/vgu/Regist.do?aid=frml051001
------------------------------------------------------------------[PR]--
■GMO INTERNET GROUP■ GMO INTERNET www.gmo.jp