xyzzyの使い方が分からぬやし 励ましあえ その10at SOFTWARE
xyzzyの使い方が分からぬやし 励ましあえ その10 - 暇つぶし2ch812:名無しさん@お腹いっぱい。
07/08/08 18:20:01 C3X9Qxhb0
>>811
726 を書いた者だけど、事情は書いたほど単純なものではなかった
簡潔に言うと、xyzzy は gb2312 のコードを正しく扱うことができる
問題は、gb2312 として流通しているファイルのほとんどが、実際には
拡張された上位の文字セットである GBK だということ

つまり、GBK では1バイト目と2バイト目が gb2312 から拡張されていて
その拡張された部分を含む文字を読み込んだときに、バイト単位で文字がずれる
つまり文字化けが起こり、それは行末まで続く

gb2312 では 94×94=8836文字までしか扱うことができず、これは中国では
絶対的に不足していたため、Microsoft が Windows95 で独自に拡張を行い、
約2万字(強)を扱えるようにし、そしてそれは普及した。これが GBK。
例をあげると、html に charset=gb2312 として記述されている場合、
実際に使われている文字コードは GBK であることが多い

これに対応させるためには gb2312 を最初から GBK として扱うか、または
GBK を xyzzy で扱える文字コードとして追加する必要があると思う

813:811
07/08/08 21:19:06 EpFI/c3Q0
>>812
詳しい解説感謝です。
なるほどこんなところにもMSの呪いが。xyzzyは悪くなかったんだ。

> これに対応させるためには gb2312 を最初から GBK として扱うか、または
> GBK を xyzzy で扱える文字コードとして追加する必要があると思う

件の一部化けメールは gb2312 として送られてきてしまっておるので、
対応法としては前者の方がベターなんでしょうかね…。
厳密には規格違反なんだろうけど、でも現状で日本語の文字も
Windows拡張文字までちゃんと表示されてる訳ですし。(されないと困るし)

814:名無しさん@お腹いっぱい。
07/08/09 16:08:00 ehRMv1Y70
kamailv3の属性検索の質問って、ここでして良い?

815:名無しさん@お腹いっぱい。
07/08/09 16:11:42 sVf4vF+20
そんなこと聞かずにいきなり質問するべし
駄目って言いたくなっちゃうから

816:名無しさん@お腹いっぱい。
07/08/09 16:28:28 ehRMv1Y70
属性検索で、1つ以上の属性を指定したいんですが
どうやったらいいですか?

例えば、巷のメーリングリストには、subjectに「[~]」という
MLの名称が入っていますが、こういう場合に
特定の2つのML(例えばML1、ML2)以外の
メールだけを表示したいのです。

query->何も検索式は入力せず。
attribute->@title !STRINC [ML1] AND @title !STRINC [ML2]
order->@cdate NUMD
↑だと、ダメみたいです。


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch