datをUTF8にするのはどうだろうスレッドat OPERATE
datをUTF8にするのはどうだろうスレッド - 暇つぶし2ch2:動け動けウゴウゴ2ちゃんねる
08/04/12 13:15:03 UJKL7VVbP
↓ハゲスト

3:動け動けウゴウゴ2ちゃんねる
08/04/12 13:15:27 2lzvvu5k0




4:ひろゆき@どうやら管理人 ★
08/04/12 13:15:37 0 BE:341069-S★(1017889)
utf8にしちゃえば、read.jsが使えるので、
サーバリソースは軽くなるかなぁと。


5:動け動けウゴウゴ2ちゃんねる
08/04/12 13:20:51 x7ZamL2B0 BE:97300122-S★(1010113)
ぅぉたらこだ

6:動け動けウゴウゴ2ちゃんねる
08/04/12 13:22:59 YxILKQC60
転送量とDAT容量は増加するかね。

やるならBOMつきにしてほしいなぁ。

7:c(・ω・c)))))) ◆....w.VIPQ
08/04/12 13:29:09 Q2BscwRD0
   /⌒ヽ)
  i三 ∪
 ○三 |
  (/~∪
  三三
 三三
三三三

8:動け動けウゴウゴ2ちゃんねる
08/04/12 13:29:54 6duUvB8e0
今更変更かい

9: [―{}@{}@{}-] 動け動けウゴウゴ2ちゃんねる
08/04/12 13:32:00 cHsq6m3t0
       _r-._,-,_
      r‐' __ ~t_
     j'/"il li ~\〈
     rf/l |_l_l| |l_l_ i゙ト'、
   /"ハl U  U |l゙i l    
  / / li.ゝ γニ ヽノ | l |   ふ~ん
.  l /  il f:`l .l i_| | j l |
  |/  ξ ゞ_`,-ィイ ξ l|
  彡    /:::::::::::〇,   ミ
  ソ    i::::::::::::::l_l:l   リ

10:root▲▲ ★
08/04/12 13:34:07 0 BE:1095326-DIA(100256)
今日はちとこれからおでかけにつき、記念カキコのみで。

何となく、いろんなところが影響ありな気がしますけど、
やる価値はあるかもですね。

ただ、これまでのSJISのdatを変換するのは実際的ではなさそうなので、
どうしても「混ざった」状態になると。
ということで大抵のスクリプト(削除など)は、
両方対応にしないと、だめなような。

11:動け動けウゴウゴ2ちゃんねる
08/04/12 13:34:42 brQJu+/UP
大変だ!キャップが割れたぞ!!

12:root▲▲ ★
08/04/12 13:35:32 0 BE:5745997-DIA(100256)
で、ライブなdatだけでも一斉に変換するかどうか、
というのも考えどころなのかな、と。

13:動け動けウゴウゴ2ちゃんねる
08/04/12 13:37:15 dKHHUdt+0
UTF8なんてffftpの設定か
テラタームの初期設定くらいでしか見たことない

14:動け動けウゴウゴ2ちゃんねる
08/04/12 13:37:53 xAdVa0Bc0
そんなにサーバリソースが重かったのか
知らなかった

15:ひろゆき@どうやら管理人 ★
08/04/12 13:41:17 0 BE:284459-S★(1017889)
utf8のdatファイルを.dataとかにするか、
qb7みたいに新しいサーバ名の.datを全部utf8にするか、、、

管理周りは粛々と対応すればなんとかなると思うのですが、
アスキーアートみたいに、出来なくなることとか、
デメリットはどういうのがあるのかなぁ。。と。


16:Cooks
08/04/12 13:41:34 V2OGDCmc0 BE:442768829-DIA(200748)
よくわからんけど
read.cgiをapacheモジュールにしたらいい
ついでにbbs.cgiも
mod_2ch

17:動け動けウゴウゴ2ちゃんねる
08/04/12 13:42:54 xDM6T07D0
>>15
そんなことよりbeをどうにかしろやコラ

18:動け動けウゴウゴ2ちゃんねる
08/04/12 13:44:45 rbaOIjlz0
デメリットや手間のわりにメリットは少ないかと・・・
大抵のソフトウェアはdatはSJISだと決めてハードコーディングしてるだろうかなぁ・・・

19:stream ◆PNstream2s
08/04/12 13:52:47 sMNaDZg+0
UTF-8でAAが影響受ける?なんで?
フォントなら、CSSでsans-serifつけりゃいいと思ってるけど

20:ひろゆき@どうやら管理人 ★
08/04/12 13:54:07 0 BE:94853-S★(1017889)
半角カナとか。

21:stream ◆PNstream2s
08/04/12 13:55:15 sMNaDZg+0
>>4
現状でもある程度read.jsは使えてるし、UTF-8にしてもそんな軽くならないと思う

>>6
UTF-8にBOMは必要ないから反対

>>20
半角カタカナはUnicodeに存在して普通に使えるよ

22:動け動けウゴウゴ2ちゃんねる
08/04/12 13:55:50 dKHHUdt+0
上のもんは下のもんの気持ちは汲んでも
顔色を伺ったらあかん

って仮面の兄ちゃんがいってた

23:stream ◆PNstream2s
08/04/12 13:56:08 sMNaDZg+0
UTF-8の問題点は、サイズだな。
日本語の場合たいてい1文字で3バイト使うから、500KB制限を引き上げる必要があると思う。

24:動け動けウゴウゴ2ちゃんねる
08/04/12 13:57:01 6duUvB8e0
ひろゆきがこんな事を思いつくとは思えない
ひろゆきにUTF-8を勧めた人間出て来い

25:ひろゆき@どうやら管理人 ★
08/04/12 13:57:13 0 BE:303168-S★(1017889)
>半角カタカナはUnicodeに存在して普通に使えるよ
まじすか。


26:動け動けウゴウゴ2ちゃんねる
08/04/12 13:58:51 dKHHUdt+0
URLリンク(code.cside.com)

これのことか
ユニコード上にある半角カタカナってーのは

27:動け動けウゴウゴ2ちゃんねる
08/04/12 13:59:50 YxILKQC60
半角カナはバイト数増えるけどつかえるよ。

28:動け動けウゴウゴ2ちゃんねる
08/04/12 14:01:05 nO2fnwtX0
UTF8でdatのサイズが大きくなったら、ますます重くなるのでは
サーバリソースも食う事になる

29:動け動けウゴウゴ2ちゃんねる
08/04/12 14:02:38 sQLXHZR10 BE:671630966-2BP(6600)
なるほどなるほど

30:stream ◆PNstream2s
08/04/12 14:04:35 sMNaDZg+0
サイズが問題ならUTF-16にする?w

31: 株価【950】 △△ ◆cZfSunOs.U
08/04/12 14:05:12 S3vPJJLd0
ん...... UTF-8 にしないと read.js が使えない環境ってどんなのだろう?
少なくとも,IE6 での問題は anydat.so で対策されてますが......

32:ひろゆき@どうやら管理人 ★
08/04/12 14:08:38 0 BE:114629-S★(1017889)
anydat.soみたいなサーバ処理がいらないものだけで、
回せないかなと。


33: 株価【950】 △△ ◆cZfSunOs.U
08/04/12 14:13:29 S3vPJJLd0
IE6 を無視すれば Content-Type で charset=Shift_JIS を追加するとかでいいんで
mod_headers で事足りるわけですが......
IE7 への強制アップデートもあったらしいですし,今後 IE6 の比率が下がれば
それでいいのかも,とも......

34:動け動けウゴウゴ2ちゃんねる
08/04/12 14:17:48 S6q0mxTHP
2ちゃんねるの中というか日本ではIE7アレルギーが異常だから
欧米とかに比べると普及は遅れていると思うよ>>33

35:動け動けウゴウゴ2ちゃんねる
08/04/12 14:18:16 d8DDhQ/80
IE厨は腹を切って死ぬべきである

36: 株価【950】 △△ ◆cZfSunOs.U
08/04/12 14:22:10 S3vPJJLd0
まぁ IE6 での問題は文字コードより,JavaScript が時々挙動不審になったり
ブラウザの動作が重くなったり,ということの方が大きいんですけどね.

# それで read.js をデフォルトにするのを断念した,という経緯も......

37:動け動けウゴウゴ2ちゃんねる
08/04/12 14:22:37 nO2fnwtX0
>>30
UTF-16にすると、1バイトで表現できている英数文字が2バイトに
なるであってる?
UTF-8は漢字が2バイトから3バイト必要になる
どちらにしても、datサイズが増える事に変わりがないような
そうすると、オンメモリで処理可能なdatの総量が何割か減ったり、
通信容量の増大を招いたりでいい事がないような

38:stream ◆PNstream2s
08/04/12 14:26:40 sMNaDZg+0
>>37
あってる

ただ、Shift_JISは日本語のコードにASCIIを含んでるから(つまり腐ってる)
UTF-8にすればShift_JISだったから必要な余計な処理が無くなって
負荷が減るとかコードの見通しが良くなるとかあるかもね。
Rock54まわりはいろいろ大変だったような。

39:動け動けウゴウゴ2ちゃんねる
08/04/12 14:34:16 dKHHUdt+0
ほいほい文字コード変えられたら
内部設定をテキストファイルで読み込ませる組み込みは大変なことになる
多言語対応なんてやってられねーんだよ
どこのlinux脳だ
ということに

40: 株価【950】 △△ ◆cZfSunOs.U
08/04/12 14:37:31 S3vPJJLd0
まぁ read.js 以外のことを考えた場合,>>38 のような利点はありますけどね.
もっとも,その点に関しては EUC-JP でもいいんですけど.

41:動け動けウゴウゴ2ちゃんねる
08/04/12 14:39:48 YxILKQC60
UTF8になったらしばらくは変える必要無さそうだけどね。

EUCはなぁ。ちょっと変える利点が。

42:動け動けウゴウゴ2ちゃんねる
08/04/12 14:46:47 ddwKMOyI0
キャップの文字化けとか
目欄で「age」の直前に「鋭郭虐茎行市峻尽壮痴」でsageになってたとか
そんなの無くなる?

43:動け動けウゴウゴ2ちゃんねる
08/04/12 14:49:14 YxILKQC60
なくなるね。

トリップはどうなるんだろう。
送られるデータが変わるわけだからやっぱり変わるよな。

44: 株価【950】 △△ ◆cZfSunOs.U
08/04/12 14:50:32 S3vPJJLd0
不正バイトシーケンスの問題は,どの文字コード使うにせよ
解決するならきちんとチェックするという以外ないような.

45:動け動けウゴウゴ2ちゃんねる
08/04/12 15:00:02 d8DDhQ/80
なんぞこれ
URLリンク(www.itmedia.co.jp)

46:stream ◆PNstream2s
08/04/12 15:21:54 V5lKbYlC0
持ってる運用情報のdatファイル1102個をiconvを使ってCP932からUTF-8に変換してみた。
正常に変換できたdatが1024個(偶然)。

CP932の場合 98.1MB (平均で98KB)
UTF-8の場合 121MB (平均で122KB)  1.24倍

意外と大きくなってない。
この程度の増加なら、全然許容範囲だと思った。

47:動け動けウゴウゴ2ちゃんねる
08/04/12 15:37:44 YxILKQC60
>>46
出た異常についてkwsk

48:stream ◆PNstream2s
08/04/12 15:38:36 V5lKbYlC0
>>47
iconv: 位置 138601 で不正な入力シーケンスがありました
携帯の絵文字が入ってたとかそんなとこかねえ

49:動け動けウゴウゴ2ちゃんねる
08/04/12 15:45:05 Kt287Ydo0
1.24倍の容量増をでかいと思うか、ちいさいと思うかは
メディアコストに対する認識の差だろうな

50:動け動けウゴウゴ2ちゃんねる
08/04/12 16:26:54 nO2fnwtX0
サーバリソースを軽くするのが目的で、24%増になるのは本末転倒じゃないだろうか

51:動け動けウゴウゴ2ちゃんねる
08/04/12 16:33:17 i2IKMcHY0
容量が増えると花子が困るな

52:動け動けウゴウゴ2ちゃんねる
08/04/12 16:48:22 sjQIQGbL0
2ちゃん用の文字コード作ればいいよ

53:動け動けウゴウゴ2ちゃんねる
08/04/12 17:26:10 goAdvWs50
ザウルスとか旧Palmとか古い機種の専ブラは大丈夫なんだろうか?

54:動け動けウゴウゴ2ちゃんねる
08/04/12 17:56:53 rDg1K0sD0
>>50
処理量を優先するかストレージを優先するかの優先度の問題でしか無い。

55:動け動けウゴウゴ2ちゃんねる
08/04/12 18:12:22 GThHi3CAP
UTF-8にするんなら、いっそのことdatの仕様を思いっきり弄くり回すとか。
レイアウトとフォントはCSSにすればdat自体の容量は減る
互換性全くなしで、専ブラがひどいことになるがw

56:動け動けウゴウゴ2ちゃんねる
08/04/12 18:19:15 Kt287Ydo0
「これが、私が考えた掲示板だ。使い勝手についていろいろ言う人もいるかもしれない。
 それは対応する専用ブラウザを作るボランティアや利用者が、この仕様に合わせてもらうしかない」

この道ーはー
いつかーきたみーちー

57:動け動けウゴウゴ2ちゃんねる
08/04/12 18:35:33 H6XV6cuW0
最大の問題は過去のdatの扱い(一括変換するにしてもshift-jisのまま放置にしても)

58:動け動けウゴウゴ2ちゃんねる
08/04/12 18:42:56 mbw97Ct90
将来を見据えた時代の流れでいいんじゃね?
Shift-JISが許されるのは20世紀までだよね


59:動け動けウゴウゴ2ちゃんねる
08/04/12 18:56:20 mbw97Ct90
とりあえず新板で試すのがベターだろうな
で、専ブラ作者には馴れてもらうと
その流れで文字コードの判別にセンシティブになってもらうと

変換とか引越しって、絶対にトラブるんだよな

60:動け動けウゴウゴ2ちゃんねる
08/04/12 19:04:54 rbaOIjlz0
新板からとか、スレッド番号でスッパリ分けるとかするべきだろう。
あと、文字コード情報について正しくヘッダを送る。

既存のスレッド全部変換するのは、失敗のリスクとかが大きいと思う。
それから512KB制限も考え直すべきでしょう。

61:動け動けウゴウゴ2ちゃんねる
08/04/12 19:13:44 utU0d0eVO
>>60
512MB制限…
  <⌒/ヽ-、___
/<_/____/


62:動け動けウゴウゴ2ちゃんねる
08/04/12 19:15:58 d+zKBbrFP
新板立てなくとも金があるじゃない。

63:動け動けウゴウゴ2ちゃんねる
08/04/12 19:20:08 mbw97Ct90
専ブラがdat拾うときもhttpで拾うわけだから、Content-typeのヘッダ見れば
理論上はいいのけ?追加メタ情報いらない?

64:動け動けウゴウゴ2ちゃんねる
08/04/12 19:24:05 qz4qWTVKO
なんか変更を見据えた話になってる?
多言語扱うわけじゃないし
変えるメリットが見当たらない

ここはひろゆきをなだめて止めさせるべきだろ

65:ひろゆき@どうやら管理人 ★
08/04/12 19:35:32 0 BE:171239-S★(1017889)
サーバリソースを使わないモデルにできれば、
人大杉が無くなるかなぁと。


66:動け動けウゴウゴ2ちゃんねる
08/04/12 19:41:41 UJKL7VVbP
IEのためにマイクロソフトにでも頼まれたのか

67:動け動けウゴウゴ2ちゃんねる
08/04/12 19:42:21 zZm1c7bD0
つか人大杉をなくしてread.htmlに転送して欲しい。


68:動け動けウゴウゴ2ちゃんねる
08/04/12 19:43:11 ddwKMOyI0
全部read.jsにしておまえらのブラウザで処理してくれー
つーことに?人大杉よりはいい罠

69:▲ ◆SANUKI/VII
08/04/12 19:44:34 CPqqrF6qP BE:6342072-PLT(13132)
datの仕様も変えてくれりょ

70:動け動けウゴウゴ2ちゃんねる
08/04/12 19:45:57 jcGGWTbi0
>>63
過去ログを.datファイルで入手したときに分かりにくくなる。
BOM有りならutf-8、無しならshift-jisと判断できるのが一番簡単で確実。

71:動け動けウゴウゴ2ちゃんねる
08/04/12 19:46:45 8xB8Odfh0
>>69
具体的に何を変えて欲しいんよ?

72: 株価【866】 △△ ◆cZfSunOs.U
08/04/12 19:47:25 S3vPJJLd0
人大杉解消が一義的な目的であれば,少なくとも read.js に関しては
ネックになるのはむしろ文字コード以外の部分ですね(>>36).
anydat.so 自体は,ライブな dat を扱う際はデフォルトハンドラとほぼ同程度の
処理しかしないので,負荷的には anydat.so を使わない場合とほぼ変わらないかと.

73: 株価【866】 △△ ◆cZfSunOs.U
08/04/12 19:56:31 S3vPJJLd0
ちなみに,人大杉状態の時に板トップの「read.cgi モード切替」が効かない問題に関しては,
技術的問題よりポリシーの問題(いつぞやの FOX さんの「見えないようにしているのは意図的なので
人大杉の時には read.html に振らないようにしてほしい」という趣旨の発言を受けたもの)なので,
これについてはしかるべき人にしかるべき方針を打ち出してもらえれば,効くようにすることは不可能ではないです.

74:動け動けウゴウゴ2ちゃんねる
08/04/12 19:58:02 LVULPQ2v0
AAにユニコード文字がほのまま使えるなら賛成

ってか互換性がどうなるんだろう

75:動け動けウゴウゴ2ちゃんねる
08/04/12 19:58:07 P0Wz6qUM0
UTF8ってbe系の板で既にやってなかったっけ?

76:動け動けウゴウゴ2ちゃんねる
08/04/12 20:00:51 S6q0mxTHP
>>75
やってない。前Be系の板はBe関連のシステムがPHPで文字コードがEUC-JPだったから
それに合わせてたけど06年ぐらいにログ全部Shift_JISにコンバートして移行した

77:動け動けウゴウゴ2ちゃんねる
08/04/12 20:02:23 LVULPQ2v0
>>53
あー古い機械からは全部見れなくなるな…
昔の携帯もダメかもしれん

78:動け動けウゴウゴ2ちゃんねる
08/04/12 20:03:48 LVULPQ2v0
>>55
datは現状でいいんでね?

と、思ったが、日付とIDとbeとかが全部一つになってるのはちょっとな
xmlにしてくれたら助かるが、そうはいかんか

79:stream ◆PNstream2s
08/04/12 20:06:05 6gzpKs4Q0
>>64
多言語扱えたほうが便利でしょ
曲のタイトルにアクセント記号つきのアルファベットとかあるし
ニュースで中国人の名前書くとき便利になるし
àáâäçñ

>>78
XMLは単純にレスを追記することが出来ないからねえ。
<>区切りはどうかと思うが。

80:動け動けウゴウゴ2ちゃんねる
08/04/12 20:06:40 zZm1c7bD0
外字とか画数の多い漢字は実体参照にしてutf-8で実体山椒のままにしておく必要のない
実体三章は素の文字に変えて、とりあえずutf-8にしてしまったらええ。
専ブラなんて気にすんな。utf-8にしてフラッシュでも何でもつこたらええ。

81:動け動けウゴウゴ2ちゃんねる
08/04/12 20:10:30 P0Wz6qUM0
>>76
あ..EUCだったな。
コンバートしたのは不覚にも全然知らなかった。
でも、それに対応するために多くの専ブラはEUC-JPに対応してるはずだから、
実装によっては今回の対応が必要ないものもあるのかも。

82:動け動けウゴウゴ2ちゃんねる
08/04/12 20:11:32 LVULPQ2v0
<2chdat>
 <res>
  <name>名無しさん</name>
  <msg>datは現状でいいんでね?と、思ったが、日付とIDとbeとかが全部一つになってるのはちょっとなxmlにしてくれたら助かるが、そうはいかんか</msg>
 <res>
 <res>
  <name>名無しさん</name>
  <msg>datは現状でいいんでね?と、思ったが、日付とIDとbeとかが全部一つになってるのはちょっとなxmlにしてくれたら助かるが、そうはいかんか</msg>
 <res>
</2chdat>
じゃなくて
 <res>
  <name>名無しさん</name>
  <msg>datは現状でいいんでね?と、思ったが、日付とIDとbeとかが全部一つになってるのはちょっとなxmlにしてくれたら助かるが、そうはいかんか</msg>
 <res>
 <res>
  <name>名無しさん</name>
  <msg>datは現状でいいんでね?と、思ったが、日付とIDとbeとかが全部一つになってるのはちょっとなxmlにしてくれたら助かるが、そうはいかんか</msg>
 <res>
と、単純追加出来る独自形式とか…w

今でこそ<>区切りは掲示板のログの標準だけど
何かの標準規格で、それに2chが合わせただけなの?
それとも慣習?

83:動け動けウゴウゴ2ちゃんねる
08/04/12 20:15:41 P0Wz6qUM0
昔はカンマ区切りだったな

84:動け動けウゴウゴ2ちゃんねる
08/04/12 20:44:32 B39+wJHk0
>>83
ヌル区切りにすりゃ良くね?

85:動け動けウゴウゴ2ちゃんねる
08/04/12 21:04:34 sjQIQGbL0
区切りなら0x1C-0x1Fを使えばいいじゃない
せっかくASCIIが現役で生き残ってるんだから有効に使わないと

86:動け動けウゴウゴ2ちゃんねる
08/04/12 21:16:53 sjQIQGbL0
>>82
HTMLをデータとして持つ場合はHTMLで使わない文字列で区切らないと
区切り位置がバグる可能性があるでしょ
そう考えると最も単純に区切れる文字列は<>になる

87:動け動けウゴウゴ2ちゃんねる
08/04/12 21:19:38 LVULPQ2v0
テキストエディター ってかキーボードから打ち込めない文字を使うのは嫌だな
まぁDATを直接編集する事なんてそうあるもんじゃないけど

88:stream ◆PNstream2s
08/04/12 21:28:50 JtND79Jx0
TSVで良いと思うんだけどねえ

89:動け動けウゴウゴ2ちゃんねる
08/04/12 21:33:32 sjQIQGbL0
2ちゃんのdatに使われてる制御文字はLFだけだから
1byte文字で全く使われてない領域が32文字分あるんだよね
勿体無いというか無駄というか

90:動け動けウゴウゴ2ちゃんねる
08/04/12 21:38:49 Kt287Ydo0
過去ログだって
専ブラで取得したらログとして残る
いままでの専ブラで累積したログの変換にも
おまえら対応しろよ

91:動け動けウゴウゴ2ちゃんねる
08/04/12 21:46:58 UJKL7VVbP
>>90
はい 頑張ります

92:未承諾広告※ ◆TWARamEjuA
08/04/12 21:52:28 RXwERaHF0
perl本体としては処理が軽くなるのかしら?
そしてperl5.10移行は未だ先なのかしら?

Rock54系は、別に変わりはないと思う。。。@現状euc-jp→Shift_JISしている(´・ω・`)

多分一番のネックは携帯系かしら?

93:ひろゆき@どうやら管理人 ★
08/04/12 21:53:27 0 BE:202548-S★(1017889)
ほいだら、人大杉のときは、
read.htmlをデフォルトで動くようにしちゃってくださいー。


94:stream ◆PNstream2s
08/04/12 21:53:29 JtND79Jx0
>>92
Rock54は全部UTF-8のまま扱えるから負荷がさがるんでねえか?

95:動け動けウゴウゴ2ちゃんねる
08/04/12 21:54:52 GlCRmdt00
目的を明確にできないかな。
どういう板、どういうスレ、どういう場合に必要とか。

そういう話の進め方を意図してないのか
あるいは既に暗黙の了解があるのかも分からないけど。

スレタイはsjis。

96:動け動けウゴウゴ2ちゃんねる
08/04/12 21:56:22 LVULPQ2v0
つーかなんでひろゆきってなんで運営に関わる事2ch上で言うけど
当然しかるべき人にはメールで伝えて、2chに書き込むのは告知のためだよな?

97:動け動けウゴウゴ2ちゃんねる
08/04/12 21:57:33 5VEp3aUo0
日本語で

98:動け動けウゴウゴ2ちゃんねる
08/04/12 22:00:15 LVULPQ2v0
×つーかなんでひろゆきってなんで運営に関わる事2ch上で言うけど
○つーかひろゆきってなんで運営に関わる事2ch上で言うけど

最初は
つーかなんでひろゆきってなんで運営に関わる事2ch上で言うの?
って書いてたけど
「2chの事を2ch上で言うのに理由なんて無いだろ」って言われるのが目に見えてたからやめた

99:動け動けウゴウゴ2ちゃんねる
08/04/12 22:01:04 LVULPQ2v0
つーかひろゆきって運営に関わる事2ch上で言うけど
当然しかるべき人にはメールで伝えて、2chに書き込むのは告知のためだよな?

100:動け動けウゴウゴ2ちゃんねる
08/04/12 22:01:28 KeiU5ZPe0
>>1
早く金払えよ犯罪者タラコ

101:動け動けウゴウゴ2ちゃんねる
08/04/12 22:01:31 sjQIQGbL0
>>4
read.jsをSJISに対応させた方が早かったりしないの?

102:動け動けウゴウゴ2ちゃんねる
08/04/12 22:05:20 rbaOIjlz0
>>92
perlのEncodeモジュールや、utf8フラグのあたりはなかなか難解。

理解できれば便利、でも理解できないと原因不明の文字化けに一生苦しむという諸刃の剣。

そんな俺は、スクリプトは全部utf8で書いてuse utf8;、でもってbinmodeで入出力の文字コードを指定、これラクチン。
とととところがどっこい、

入力sjis→変換→Perl内utf8→変換→出力sjis

という風に、無駄に変換がおこなわれてCPU時間食いまくりでオワタ

103:動け動けウゴウゴ2ちゃんねる
08/04/12 22:05:26 S6q0mxTHP
>>101
元々SJISで処理してますが何か?
IE6の時だけ不具合があるからUTF-8で渡してる。

104:動け動けウゴウゴ2ちゃんねる
08/04/12 22:08:15 GlCRmdt00
あそっか>>4が目的か。
事務屋と技術屋は出発点がまるで違うよな・・

俺はこれ以上異議を唱える根拠も対案も無いから逃げるけど・・・

105:動け動けウゴウゴ2ちゃんねる
08/04/12 22:12:10 sjQIQGbL0
>>103
IEのバグならMSに頼めば解決じゃないの?

106:動け動けウゴウゴ2ちゃんねる
08/04/12 22:15:36 fnip0fwl0
告知というより、自分でやりたくないだけじゃw

107:動け動けウゴウゴ2ちゃんねる
08/04/12 22:16:10 EbL6AfUg0
>>105
いや、すでに不具合を解消したニューバージョンが出ているので。
いろいろな事情で6から7に移行しない人が多いのだよ。

108:動け動けウゴウゴ2ちゃんねる
08/04/12 22:22:25 LVULPQ2v0
ここで「2chをIEで見る時はIE7を推奨します。IE6は保証外です」って言ってみたらどうなるか興味あるな

109:動け動けウゴウゴ2ちゃんねる
08/04/12 22:27:37 r3kzlRsw0
なんだかんだで専用ブラウザ・外部ツールが一気に使えなくなって不便になるだけの悪寒
ほとんどのブラウザ・ツールが対応し終えた1年後にはIE7もかなり普及していたりして
何のための改変だったのかと思うことだろう

110:動け動けウゴウゴ2ちゃんねる
08/04/12 22:32:13 sjQIQGbL0
>>107
なら2ちゃんTOPに>>108で解決な気がする

111:動け動けウゴウゴ2ちゃんねる
08/04/12 22:41:06 ddwKMOyI0
>>72-73

>>93

ということで

datをUTF8にする?どうだろ?議論は継続?

112:動け動けウゴウゴ2ちゃんねる
08/04/12 22:49:00 goAdvWs50
旧型機器の専ブラが使えなくなるのはキビしいので、できればSJISのままで
お願いしたいな。

113:動け動けウゴウゴ2ちゃんねる
08/04/12 22:52:16 S6q0mxTHP
>>111
とりあえず人大杉時にread.html切り替えしてもいいってお触れが出たので
一段落でないかい

114:動け動けウゴウゴ2ちゃんねる
08/04/12 22:55:44 YDSCmcu10
元々裏でコソコソやらずになんでもオープンにっていう主義じゃないか
rootさんにしても何かやる時は大抵、スレに書き込みとして残すし

本来なら、管理人って立場なんだから勝手にいろいろ弄くって
事後報告とか、関係者とメルなりなんなりで話しつけて
いろいろやっちゃってもいいんだろうけど、そうじゃないところがイイ

まあ、ひろゆきの場合はただ単に自分で全部考えるのがめんどくさいという線も捨てがたいがw

115:動け動けウゴウゴ2ちゃんねる
08/04/12 23:01:29 0GY5xnVJ0
2ちゃんねるの場合、ひろゆきがこーゆうのやりたいって公開の場で言えば、
そのやりたいことを実現できる人間が集まってくるからじゃね?

116:※
08/04/12 23:08:45 uLxpBJZm0
というか、過去に勝手に弄って問題起こしたからでしょ。
事後報告だったよ、あれも。

まーオープンでっていうのもあるけどね。

117:ひろゆき@どうやら管理人 ★
08/04/13 00:27:03 0 BE:189465-S★(1017889)
スピナッチ。スピナッチ。

118:動け動けウゴウゴ2ちゃんねる
08/04/13 00:32:57 zj4uHz890
日本語でおk
URLリンク(newsplus.jp)

119:動け動けウゴウゴ2ちゃんねる
08/04/13 00:34:46 zj4uHz890
スレリンク(operate板:909-913番)
ううむ

120:動け動けウゴウゴ2ちゃんねる
08/04/13 00:34:52 3C1SSbvo0
アッー!

121:動け動けウゴウゴ2ちゃんねる
08/04/13 00:39:55 SbE0ciHo0
専ブラすぐ対応できるのかなー
(過去ログ含む)

122:動け動けウゴウゴ2ちゃんねる
08/04/13 00:40:28 DYHqJMaE0
ほうこくれんらくそうだんかー

123: 株価【940】 △△ ◆cZfSunOs.U
08/04/13 00:47:16 2j/Y2XY60
>>117 >>93 のを受けて人大杉時に read.html に振るようにしましたが,
tmp7 についてはどうしますかね?

124:動け動けウゴウゴ2ちゃんねる
08/04/13 01:01:08 tvyqUBKq0
>>25
ここまでバカだとは思わなかったよ。

125:動け動けウゴウゴ2ちゃんねる
08/04/13 01:10:09 WwSbXBGt0
どうせ変えるならP2P掲示板でも作ってみろ

126:ひろゆき@どうやら管理人 ★
08/04/13 01:20:21 0 BE:133237-S★(1017889)
tmp7って特殊な事情でもあるんですか?


127:動け動けウゴウゴ2ちゃんねる
08/04/13 01:22:07 9vihDT590
あそこは吹き溜まりだからなぁ

128:動け動けウゴウゴ2ちゃんねる
08/04/13 01:27:29 SbE0ciHo0
>>126
2ch特化型サーバ・ロケーション構築作戦 Part27
スレリンク(operate板:909-番)


129:動け動けウゴウゴ2ちゃんねる
08/04/13 01:28:50 Wu6bVQ1G0
それより2ch総BE化して閲覧は出来るけど書き込みはBEにしたほうが良いって俺意見
無駄な書き込みが減る
削除管理がしやすい


130:動け動けウゴウゴ2ちゃんねる
08/04/13 01:29:45 69UFjW+90
旧専ブラは切り捨てですかそうですか

131:動け動けウゴウゴ2ちゃんねる
08/04/13 01:30:33 DM/v/XWgP
>>123
ボボン連発な訳だが‥関係あるのかな。
スレリンク(operate板:367-番)


132: 株価【940】 △△ ◆cZfSunOs.U
08/04/13 01:31:24 2j/Y2XY60
>>126 個人的にはよくわからないですが,詳しい説明は FOX さんにおながいしますということで......

133: 株価【940】 △△ ◆cZfSunOs.U
08/04/13 01:38:00 2j/Y2XY60
>>131 うむ......旧 banana は全廃になったので mod_rewrite の罠は解消したと思ったんですが,
science6 と academy6 にはまだ残ってたんですかね......
いったん .htaccess を元に戻します......

134: 株価【940】 △△ ◆cZfSunOs.U
08/04/13 01:43:53 2j/Y2XY60
となると,mod_rewrite の設定は全鯖配布用 .htaccess じゃなくて,
現在人大杉の鯖で個別に行った方が良さそうですね.
今人大杉の鯖ってどれですかね?

135:動け動けウゴウゴ2ちゃんねる
08/04/13 01:49:53 spGbs0y80
janeは改造が大掛かりになっちゃうなぁ
Sjisに変換表示したら意味ないし

136:動け動けウゴウゴ2ちゃんねる
08/04/13 01:50:15 SbE0ciHo0
T-banana3206 (T-Banana64) science6/academy6/society6

2ちゃんねるの転送量
URLリンク(server.maido3.com)


137:動け動けウゴウゴ2ちゃんねる
08/04/13 01:50:28 DM/v/XWgP
>>133
乙です、解決した模様。


138:動け動けウゴウゴ2ちゃんねる
08/04/13 01:53:10 fzCQaRPH0
さっさとUTF8にしろ。

139:動け動けウゴウゴ2ちゃんねる
08/04/13 01:53:48 69UFjW+90
    ハ,,ハ
   ( ゚ω゚ )
   i^∩∩^i  お断りします
   ヽ_ノ ヽノ
    / .y  ) 
    /ー(ー<   
   ./:::/ ヽ:::ヽ 
   i:::〈   ヽ::::) 
   ヽ:::)   レ'

140:動け動けウゴウゴ2ちゃんねる
08/04/13 02:02:47 C3hy+q/R0
面倒くさいから見切り発車で導入だな

141:動け動けウゴウゴ2ちゃんねる
08/04/13 02:03:36 yJLob+1dO
ミ(゚θ゚)彡
URLリンク(moepic2.dip.jp)



142: 株価【1040】 △△ ◆cZfSunOs.U
08/04/13 02:06:13 2j/Y2XY60
hobby10 と mamono に read.html に振る設定入れますた.
他に人大杉の鯖ありますたかね?

143:動け動けウゴウゴ2ちゃんねる
08/04/13 02:06:51 Xrh7AVcr0
ひろゆき天皇の発言は絶対・・・か

144:動け動けウゴウゴ2ちゃんねる
08/04/13 02:07:35 C3hy+q/R0 BE:223699924-2BP(6211)
tmp7は……要らんな

145:動け動けウゴウゴ2ちゃんねる
08/04/13 02:07:57 teAifd1V0
ひろゆきかわいいよひろゆき

146:動け動けウゴウゴ2ちゃんねる
08/04/13 02:09:16 3WR5+H8+0
ありがとうございます@mamono

147:委員長 ◆/DABoneCRY
08/04/13 04:22:24 tCeEzQLV0
専ブラの対応としては、仮にUTF-8に変更するとして、
気になるのは移行方法かな?
過去ログも含めて全部一気にUTR-8に変更?
それとも、新たに立てたスレッドからUTF-8になるとか。

148:動け動けウゴウゴ2ちゃんねる
08/04/13 04:29:04 +2F/2VhoP
>新たに立てたスレッドから
になると思いますよ
文字コードの判定はBOMつけるってのもあるけど
UTF-8としてはイレギュラーなんだよね
だから初めの一行を読み込んで判断すればいいと思う

149:動け動けウゴウゴ2ちゃんねる
08/04/13 04:41:48 pyJ0SWQN0
つー事は最初はShift_JISのスレとUTF-8のスレが混在する訳か

150:委員長 ◆/DABoneCRY
08/04/13 04:45:05 tCeEzQLV0
>148
文字コードの判定が必要になるってのは良いのですが、
1000レスに到達していないスレッドまでUTF-8に変換した場合
ほとんどの専ブラはバイト数であぼーんの有無を判断しているハズなので
取得し直しになりますよね。
「新たに立てたスレッドから」であるなら、その心配はないですが
read.cgi的には二種類の振る舞いが必要になるわけですよね?
そう考えると全部一気に変換しちゃうのかなぁと想像ました。

151:動け動けウゴウゴ2ちゃんねる
08/04/13 04:53:02 xuOEgi7L0
単発質問スレという認識でよろしいですか?

152:動け動けウゴウゴ2ちゃんねる
08/04/13 06:19:05 WwSbXBGt0
かちゅ~しゃは独自ログだから関係ないよね?

153:動け動けウゴウゴ2ちゃんねる
08/04/13 06:45:50 ooYitbSt0
>>142
etc7

154: 株価【840】 △△ ◆cZfSunOs.U
08/04/13 07:08:56 2j/Y2XY60
>>153 etc7 にも read.html に振る設定入れますた.

155:動け動けウゴウゴ2ちゃんねる
08/04/13 07:30:52 ooYitbSt0
おお、おつです

156:う
08/04/13 08:25:14 P7RZZbCn0
>>1
乙。

157:動け動けウゴウゴ2ちゃんねる
08/04/13 09:40:36 QX30fn2x0
>ひろゆき ★

>beポイント:1017889
>登録日:2004-11-16
>紹介文
>AA等のアイコンを作っていて、beのプロフィールで使ってもいいという人がいましたら、
>ご連絡くださいー。

俺beやってないから意味が分からなかったけど
ひろゆきのアイコンにAAを追加したいと判断したお

どんなAAキボン?

158:動け動けウゴウゴ2ちゃんねる
08/04/13 10:39:49 GE7LabKu0
それいつの話だよ

159:動け動けウゴウゴ2ちゃんねる
08/04/13 11:33:24 S20X8prC0
どうせ専ブラもすべて書き換えになるのだから
.datの拡張子を変更したらいいんじゃないの?
古い専ブラが知らずに読んでクラッシュするってことも無くなるし。


160:動け動けウゴウゴ2ちゃんねる
08/04/13 12:50:56 ttNDUOp+0
datはUTFにしたらログ大きくなる

161:動け動けウゴウゴ2ちゃんねる
08/04/13 12:57:21 fhXK1V5D0
まさか
ここが原因じゃないよね?
まさかね

162:動け動けウゴウゴ2ちゃんねる
08/04/13 12:57:58 7OKuKexi0
鴨試練

163:動け動けウゴウゴ2ちゃんねる
08/04/13 12:58:51 teAifd1V0
間違えて落としちゃううんえいかわいいよ

164:動け動けウゴウゴ2ちゃんねる
08/04/13 12:59:49 4fie/cjp0
設定入れたのは一部の鯖だけだからこことは関係ないのでは

165:動け動けウゴウゴ2ちゃんねる
08/04/13 13:01:53 JV/EXswU0
全鯖に設定入れてないので関係はしないと思う

166:動け動けウゴウゴ2ちゃんねる
08/04/13 13:05:12 j+e3UiwN0
ひろゆき「またやっちゃいました」

167:ひろゆき@どうやら管理人 ★
08/04/13 14:56:19 0 BE:132473-S★(1017890)
文字コードを変えるとしたら、
サーバ移転ごととかそんな感じすかね。


168:動け動けウゴウゴ2ちゃんねる
08/04/13 14:56:49 xTlUCmvY0
キャー

169:動け動けウゴウゴ2ちゃんねる
08/04/13 14:58:08 7ll30m+t0
きたわー

170:動け動けウゴウゴ2ちゃんねる
08/04/13 15:03:15 kxv6NZZS0
やっぱりやるのorz

171:動け動けウゴウゴ2ちゃんねる
08/04/13 15:04:59 0XvMalSq0
やるのか・・・

いろいろ書き変えなきゃだから面倒なんだよなー

172:動け動けウゴウゴ2ちゃんねる
08/04/13 15:05:56 kVyyRmgi0
クライアント殺しですな

173:動け動けウゴウゴ2ちゃんねる
08/04/13 15:07:16 kxv6NZZS0
転送量もうp

174:動け動けウゴウゴ2ちゃんねる
08/04/13 15:14:22 tJNqLDKd0
>>167
まずはvipで実験とか無いの?

175:動け動けウゴウゴ2ちゃんねる
08/04/13 15:15:08 tJNqLDKd0
まずはvipで実験

176:動け動けウゴウゴ2ちゃんねる
08/04/13 15:18:33 rvnAmOzj0
UTF-8板を作ればいいじゃない

177:動け動けウゴウゴ2ちゃんねる
08/04/13 15:30:12 VH1s+Zc80
じゃあ、それでー

178:動け動けウゴウゴ2ちゃんねる
08/04/13 15:33:51 aGQDXiog0
ったく、どこもかしこもAjaxだな・・・

179:動け動けウゴウゴ2ちゃんねる
08/04/13 15:35:34 a9sD+1fd0 BE:311031937-2BP(0)
勝手にどうぞ


180:動け動けウゴウゴ2ちゃんねる
08/04/13 16:12:18 ScidMAOk0
>>167
削除のスクリプト
復帰のスクリプト
bbs.cgi
read.cgi
offlaw.cgi
f22
バーボン

すべて自分で直すのならやってもいいよ

181:動け動けウゴウゴ2ちゃんねる
08/04/13 16:37:09 q0zHxcQA0
トリップは変えないでね

182:動け動けウゴウゴ2ちゃんねる
08/04/13 17:29:42 bUtMGTU00
>>180
datの文字コード変えても、F22とかバーボンには影響出ないんでないかい?

183:動け動けウゴウゴ2ちゃんねる
08/04/13 17:31:03 ScidMAOk0
>>182
F22はキャップかどうかを区別してdat落ちされる機能があったような
バーボンは関係無かったかも

184:動け動けウゴウゴ2ちゃんねる
08/04/13 17:31:22 dlOra1gw0
Firefoxに目覚めたりUnicodeに目覚めたりひろゆきも大変だな
今度は鯖を全部lighttpdにしろとか言い出したりして

185:動け動けウゴウゴ2ちゃんねる
08/04/13 18:12:51 bQzKPqzI0
>>184
OSをLinuxにしろというのが先な気ガス

186:動け動けウゴウゴ2ちゃんねる
08/04/13 18:39:47 tkOSp5550
>>184
現状に満足してなにもしないひろゆきなんてひろゆきじゃない

187:動け動けウゴウゴ2ちゃんねる
08/04/13 18:44:14 q0zHxcQA0
トリップはどうすんのー?

188:動け動けウゴウゴ2ちゃんねる
08/04/13 18:47:33 v+chTub70
URLリンク(qb5.2ch.net)

172 :ひろゆき@どうやら管理人 ★ [] :04/11/21 16:00:50 ID:???
トリップに全角を使うのは間違いですよ。うむうむ。

189:動け動けウゴウゴ2ちゃんねる
08/04/13 19:27:09 tNpHuAU40
この際だからトリップも変えたらー
もう8完程度は数ヶ月で出るレベルだろ

190:動け動けウゴウゴ2ちゃんねる
08/04/13 19:28:41 B/AZbDKM0
「その理屈はおかしい」
     ,. -─- 、
    /   /⌒ i'⌒iヽ、
   /   ,.-'ゝ__,.・・_ノ-、ヽ
   i ‐'''ナ''ー-- ● =''''''リ      _,....:-‐‐‐-.、
  l -‐i''''~ニ-‐,.... !....、ー`ナ      `r'=、-、、:::::::ヽr_
   !. t´ r''"´、_,::、::::} ノ`     ,.i'・ ,!_`,!::::::::::::ヽ
   ゝゝ、,,ニ=====ニ/r'⌒;   rー`ー' ,! リ::::::::::::ノ
    i`''''y--- (,iテ‐,'i~´ゝ''´    ̄ ̄ヽ` :::::::::::ノ
    |  '、,............, i }'´       、ー_',,...`::::ィ'
 ●、_!,ヽ-r⌒i-、ノ-''‐、    ゝ`ーt---''ヽ'''''''|`ーt-'つ
    (  `ーイ  ゙i  丿   ;'-,' ,ノー''''{`'    !゙ヽノ ,ヽ,
    `ー--' --'` ̄       `ー't,´`ヽ;;;、,,,,,,___,) ヽ'-゙'"
                   (`ー':;;;;;;;;;;;;;;;ノ
                    ``''''''``'''''´

191:動け動けウゴウゴ2ちゃんねる
08/04/13 19:56:00 yLuJOOIH0
>>185
それはかなりの確率でないと思うよ

192:動け動けウゴウゴ2ちゃんねる
08/04/13 20:43:48 so96GoL1P BE:1860432899-2BP(6000)
Unicodeは?

193:動け動けウゴウゴ2ちゃんねる
08/04/13 21:07:18 NAu5wA4u0
これは・・・

194:動け動けウゴウゴ2ちゃんねる
08/04/13 21:16:16 pyJ0SWQN0
UTF-16じゃなくてUTF-8にしたのは理由があるの?
UTF-8の方が優れてるのか?

195:未承諾広告※ ◆TWARamEjuA
08/04/13 21:22:17 sI/zeL780
>>180
丁稚どんが、なかまに入りたそうにこちらを見ています。

196:動け動けウゴウゴ2ちゃんねる
08/04/13 21:22:46 5qNEkOKV0
utf-16だと正義の報告スレや芋掘りスレがすぐ500KB行くな

197:ひろゆき@どうやら管理人 ★
08/04/13 22:49:56 0 BE:202548-S★(1017890)
URLリンク(money6.2ch.net)
も特殊事情すか?


198:動け動けウゴウゴ2ちゃんねる
08/04/13 22:51:16 ScidMAOk0
>>197
ただ単に忘れられているだけでしょ

199:ひろゆき@どうやら管理人 ★
08/04/13 22:58:57 0 BE:397679-S★(1017890)
うひょ

200:動け動けウゴウゴ2ちゃんねる
08/04/13 22:59:21 snz6m59l0
1回read.cgi全停止して負荷のテストしようよ。
労力をかけてread.jsを広める価値があるか見極めよう。

201:動け動けウゴウゴ2ちゃんねる
08/04/13 22:59:32 fzCQaRPH0
>>194
優れている。ASCII互換。

202:動け動けウゴウゴ2ちゃんねる
08/04/13 23:17:20 79W2bbXw0
utf-8に移行したほうがいいよ。
eucとかsjisを使う時代じゃねえしな
ajaxでクライアントサイドでもっとおもしろいことをやってほしいな
質問。開発には名無しで参加できないの?

203:動け動けウゴウゴ2ちゃんねる
08/04/13 23:19:06 KIagsko40
開発っていうのかな。これ。
どっちかと言うとメンテナンスに近いような。

Ajaxの作成なら面白ければ採用されるかもね。

204:動け動けウゴウゴ2ちゃんねる
08/04/13 23:20:42 DYHqJMaE0
何だか>>202からプロフェッショナルなニオイがします クンクン

205:動け動けウゴウゴ2ちゃんねる
08/04/13 23:22:32 azBiCliC0
素人騙すのは簡単なんだな

206:動け動けウゴウゴ2ちゃんねる
08/04/13 23:26:29 TVTorZbK0
プロフェッショナルな方なら優れた点だけじゃなくて
互換性や移行することで起こるデメリットもちゃんと考えてもらいたいものですね

207:動け動けウゴウゴ2ちゃんねる
08/04/13 23:37:27 4GGbGOj50
>>200
同意。
転送サイズが増えることで、当然圧縮負荷が増えるわけだから
本当にメリットがあるのか判断すべきだよね。

208:動け動けウゴウゴ2ちゃんねる
08/04/13 23:44:08 DM/v/XWgP
目先のシステム負荷だけじゃなく
翻訳機能を付ける(スポンサーが増えるよ?)
とか、展望があるなら賛成だけはさせて貰います。

209:※
08/04/13 23:46:31 Cf1nArvr0
2ちゃんねるなんて意味不明の文字列が多いのに
翻訳したらどうなるのかな?

210:動け動けウゴウゴ2ちゃんねる
08/04/13 23:50:18 yiqhMaUM0
ひねくれてUTF-16にしようぜ

211:動け動けウゴウゴ2ちゃんねる
08/04/13 23:51:04 DM/v/XWgP
学問、政治系などはOK。
それなりに意味はあると思う。

212:未承諾広告※ ◆TWARamEjuA
08/04/13 23:54:06 sI/zeL780
どうしても「あやっくす」と読んでしまいます(照)>ajax

213:※
08/04/13 23:56:04 Cf1nArvr0
そうか文系は効果ありそうだね。
面白そうではあるけど。
海外ドメイン規制が行われている昨今、海外進出?
それとも在日ターゲットかしら、、、

214:動け動けウゴウゴ2ちゃんねる
08/04/13 23:56:32 yLuJOOIH0
BBS_UNICODE=changeのおかげでシリア語ブラクラ投稿や変な文字使ったAAが
投稿できなかった板も再びそれらで汚染されていくのかね

215:動け動けウゴウゴ2ちゃんねる
08/04/13 23:58:16 fzCQaRPH0
>>214
別にシリア文字は個別に表示できないようにすればいいだけ

216:root▲▲ ★
08/04/13 23:58:32 0 BE:3648285-DIA(100256)
UTF-8 にする、ということは、
いわゆるCJKじゃないやつも書けるわけで(何もチェックしないなら)、

とここまで書いて思ったのは、
SETTING.TXT でやるのが、専用ブラウザ的にも bbs.cgi 的にも
いいのかもしんないですね。

BBS_UNICODE=utf-8 とか。

217:動け動けウゴウゴ2ちゃんねる
08/04/14 00:01:22 fzCQaRPH0
>>216
普通にHTMLヘッダでcharset=UTF-8 じゃダメなの?

218:動け動けウゴウゴ2ちゃんねる
08/04/14 00:04:13 yLuJOOIH0
>>215
自分は専用ブラウザであぼーんするからいいけど
IEでread.html使っててひっかかるのが嫌な場合
フォント削除するしか対策法ないよね
2ch側ではじいてくれるならいいが

219:stream ◆PNstream2s
08/04/14 00:05:19 lljZ5hxu0
必要性って言うなら
わざわざ日本語の文字に限定する必要性もないし

220:root▲▲ ★
08/04/14 00:06:37 0 BE:1641863-DIA(100256)
>>217
いや、内部処理的にって話で。

221:root▲▲ ★
08/04/14 00:07:47 0 BE:3283766-DIA(100256)
今自分の環境が SJIS 環境なのか UTF-8 環境なのか、
cgi の内部でわかるといいっていう話です。

いろんな方法が考えられるんでしょうけど、
SETTING.TXT に入れるというのは、そのうちの一つということで。

222:動け動けウゴウゴ2ちゃんねる
08/04/14 00:09:19 JRpRJhxcO
2chの場合はメリットよりデメリットの方が多いのではないか?
専ブラ対応とか以前に黒山羊とか。日本の携帯はしばらく(短くても4~5年?)はSJISメインだし。
SJISの仕様のいい加減さもそれに合わせた実装の厄介さも知ってるけど、今は動きにくいよ。
特に携帯がなぁ…。

そのへんどうなのよ?

223:動け動けウゴウゴ2ちゃんねる
08/04/14 00:11:34 GcHpuStD0
全然関係ないんだがそういえば最近メリットってシャンプーみかけなくなったな

224:stream ◆PNstream2s
08/04/14 00:12:23 N0GpEYGp0
>>216>>221
Shift_JISのままにしておく板と
UTF-8にする板が混在するってことですか?

225:root▲▲ ★
08/04/14 00:13:00 0 BE:3648285-DIA(100256)
YahooがこないだEUC-JPからUTF-8に変わったんでしたっけ。
Wikipediaは最初からUTF-8か。

PCのほうはUTF-8でも今や割と大丈夫かなと。
何せ日本のPCの6割ぐらいは、スタートページがYahooらしいんで。

携帯サイトとかはどうなんだろう。
そのままUTF-8出して大丈夫なんだっけか。

226:root▲▲ ★
08/04/14 00:14:11 0 BE:3283294-DIA(100256)
>>224
そうなるかどうかよくわからないけど、
少なくともbbs.cgiとかは両方対応にしておきたい気がしますね。
直感だけですけど。

227:動け動けウゴウゴ2ちゃんねる
08/04/14 00:14:56 IXMEQBy50
>>223
メリットの弱酸性は地肌に悪いらしいぞ
頭皮が心配な方は要注意

228:動け動けウゴウゴ2ちゃんねる
08/04/14 00:15:39 groaCB79P
>>225
URLリンク(miniturbo.org)
最近のは対応してるみたいですね

229:動け動けウゴウゴ2ちゃんねる
08/04/14 00:15:49 JHhdwy/60
うーむ・・・確かに変更にはかなりの手間がかかることが予想されるが・・・
今後を見据えると、sjisもそのうち廃れるかなぁ

だが問題は、utf8に変えて5年ぐらいたった後にUnicodeの次の規格とかが現れはしないか、ということだ

230:動け動けウゴウゴ2ちゃんねる
08/04/14 00:16:40 +XpIpRG20
そのまえに2ちゃんが・・・w

231:root▲▲ ★
08/04/14 00:18:03 0 BE:4377986-DIA(100256)
>>229
UTF-8は単なる「エンコーディング方式」であって、
Unicodeの規格は常にバージョンアップしているんではないかなと。

つい先だっても、Unicode 5.1が出たばっかり。
確か1000文字以上追加されたんじゃなかったっけか。

232:動け動けウゴウゴ2ちゃんねる
08/04/14 00:18:22 ijHQs/T00
>>229
>だが問題は、utf8に変えて5年ぐらいたった後にUnicodeの次の規格とかが現れはしないか、ということだ

現れない。万が一現れたところで絶対に普及しない。


233:※
08/04/14 00:21:15 Wz1y+uBn0
>>225
私の自宅サーバはUTF-8仕様です。
携帯からもアクセスしてます。

234:root▲▲ ★
08/04/14 00:23:10 0 BE:3283294-DIA(100256)
あと直感的にUTF-8にする場合、
これに注意、ってかんじですかね。

URLリンク(www.wdic.org)

235:動け動けウゴウゴ2ちゃんねる
08/04/14 00:27:45 5Zy1uAAsO
auの場合はGWでtext/から始まるMIMEは自動的にSJISに変換するよ

236:動け動けウゴウゴ2ちゃんねる
08/04/14 01:16:03 jFRZTMlU0
これはタラコの罠だぞ

237:動け動けウゴウゴ2ちゃんねる
08/04/14 01:57:02 GnyASzU20
>>229
Unicodeが改定されたところで
符号化方式であるUTF-8には関係ない

238:ミ(゚θ゚)彡
08/04/14 02:11:31 refxpzT5O
URLリンク(portable.blog.ocn.ne.jp)


239:動け動けウゴウゴ2ちゃんねる
08/04/14 02:21:40 uJeEyM4Q0
まずは文字集合と符号化方式の違いからお勉強しようか

240:動け動けウゴウゴ2ちゃんねる
08/04/14 11:06:42 UqZJCtMn0
datをxml化するのもひとつの手だと思う。たた>>86の指摘もあるので、やるんなら

<?xml version='1.0' encoding='UTF-8'?>
<2ch:dat>
<2ch:post time="">
 <2ch:name value="" id="" be="" />
<2ch:msg>ほげ</2ch:msg>
</2ch:post>
<2ch:post time="">
 <2ch:name value="" id="" be="" />
<2ch:msg>あげ</2ch:msg>
</2ch:post>
</2ch:dat>

みたいな形でしょうね・・・。

241:動け動けウゴウゴ2ちゃんねる
08/04/14 12:24:07 uS+Zg9fZ0
今はdatにレスを追加する時
動け動けウゴウゴ2ちゃんねる<>sage<>2008/04/14(月) 02:21:40 ID:uJeEyM4Q0<> まずは文字集合と符号化方式の違いからお勉強しようか <>
を単純に追加すれば良かったが、xmlならそうはいかないんだよね
単純に追加するのとxmlを再構築するのにどれくらい処理時間/処理能力に差があるのかしらん

242:動け動けウゴウゴ2ちゃんねる
08/04/14 13:18:19 UqZJCtMn0
XML化のメリット?

・beのようなdatに書く性格の機能追加対応が容易
・クライアント側にパースレンダリングを投げられるため、当該部分のストリーム転送だけで済むので負荷が減る
・ディスク追記のタイミングを非同期に出来る(ライブスレッドは基本オンメモリで)

243:動け動けウゴウゴ2ちゃんねる
08/04/14 13:53:08 8lP9ZWi10
XML文書にすると、<>区切りよりはるかにサイズがでかくなってしまうよ(´・ω・`)。
だけど、一度に読み込んでメモリ上にDOM展開できるから、いろんな抽出や
編集処理はし易くなるね。

244:動け動けウゴウゴ2ちゃんねる
08/04/14 14:02:25 UqZJCtMn0
XML採用の最大のデメリットはメモリとディスク容量の問題(UTF8化と含めて約3倍ぐらい)ですね。
とはいえ、UTF8化だけでも512KBリミッターが確実に問題になるので、そのへんをひろゆきがどうしたいか次第でしょうね。

ちなみにUTF8化は2chが抱える2つの問題の解消も図れます。

・read.js使用が容易になる
・UTF-8系がデフォであるトラックバックの文字化け解消



245: 株価【1000】 △△ ◆cZfSunOs.U
08/04/14 16:06:00 uW55yU790
>>244 上の方で書いたことではあるんですが,少なくとも現状では
read.js 利用上 Shift JIS が問題になっているということはほとんどないですし,
逆に UTF-8 にすれば read.js の抱える問題が目に見えて改善されるということもないと思います
(read.js の抱える問題はむしろ別のところにある,と >>36).

まぁ,read.js 云々とは別の観点(国際化とか)からは検討の価値はあるかも,
というところだとは思いますが.

246:動け動けウゴウゴ2ちゃんねる
08/04/14 18:15:41 0Ly6tNjI0
新鯖追加のついでに外人用鯖、板でも作ったりする?w
新規の外人なら専ブラ使わないし。

GLの英語化とか必要だろうし、削除とか大変そうだけど。。

247:動け動けウゴウゴ2ちゃんねる
08/04/14 20:19:09 X9wUUlTC0
>>240
名前空間接頭辞の最初の文字に数字は使えません

248:動け動けウゴウゴ2ちゃんねる
08/04/14 20:24:11 groaCB79P
>>244
トラックバックってもうないだろ・・・

249:動け動けウゴウゴ2ちゃんねる
08/04/14 20:25:15 40B7tu6Z0 BE:813086093-2BP(920)


250:動け動けウゴウゴ2ちゃんねる
08/04/14 20:26:27 40B7tu6Z0
誤爆申し訳ない。
ところで誤爆ついでに質問なのだが、トリップなどは正常に今までどおり機能するの?
どこかでトリップが云々って聞いたんですがー

251:動け動けウゴウゴ2ちゃんねる
08/04/14 21:03:30 r1BeOitr0
昔のbe板みたいに
トリップの互換性はなくなるねぇ

252:未承諾広告※ ◆TWARamEjuA
08/04/14 21:06:25 xJ37E6qd0
酉は酉屋さんで♪
tu-kaもう既に改定案はまとまっていたりしちゃったりしてたんだっけ?

253:動け動けウゴウゴ2ちゃんねる
08/04/14 21:45:09 eoQYvWuF0
>>252
まとまってないというか、人大杉解除&鯖新設で急ぐ必要が無くなって
しまったので停滞中と言うか。

究極的に >>65が目的ならその内また必要性が湧いてくるのだろうけど。

254:動け動けウゴウゴ2ちゃんねる
08/04/14 21:48:17 KR/tGomC0
旧be板みたいに別のサーバに別のbbs.cgiを入れて、
テスト鯖作ればいいんじゃないですか。
snow.2ch.netみたいな実験サーバ扱いで。

実験板で最低限の動作確認したら、
VIPなりν速なり狼なりを入れればいいんだし。
それで問題なければ、サーバリフレッシュ工事でどんどん移転していくと。

255:動け動けウゴウゴ2ちゃんねる
08/04/14 22:10:16 30U21/ag0
そういや find.2ch.net ってEUCだったっけ?

256:動け動けウゴウゴ2ちゃんねる
08/04/14 22:20:53 cCOFpiLP0 BE:49593762-PLT(12346)
be.2ch.netもEUCだったような・・・?

257:動け動けウゴウゴ2ちゃんねる
08/04/14 22:31:23 KR/tGomC0
/dat/1234567890.dat ←従来のdat
/utf/1234567890.utf ←UTF-8なdat
って感じでUTF-8なdatは別フォルダに置くのもありかもね

258:動け動けウゴウゴ2ちゃんねる
08/04/14 22:50:19 aKkJUmqR0
Unicode使うと海外とかからのロボット爆撃が激しくなるなんてことないよね…?
EUC-JPやUTF-8は海外でも分かりやすい規格だけど
Shift_JISって日本のみで使われてるんだよね…?

259:動け動けウゴウゴ2ちゃんねる
08/04/14 22:50:44 eOGH3P2Y0
いっちょ鯖負荷テストの精鋭、VIPPERにテストをお願いしてみては

260:動け動けウゴウゴ2ちゃんねる
08/04/15 00:47:03 Ccobbv9t0
>>257
dat容量が単純に倍(orそれ以上)になるのはHDD容量的にきつくないか?

261:動け動けウゴウゴ2ちゃんねる
08/04/15 00:56:05 42mEP3AY0
書き込みコストも倍(最大)だぜ

262:動け動けウゴウゴ2ちゃんねる
08/04/15 01:53:14 x33BRSyR0
SJIS以外のコードにすると携帯の絵文字は全滅だよね
ってか、2ちゃんの書き込みなんて99%はSJISの文字
(正確を期すとJIS X 0201と0208の文字集合)
なんだから利用者的にはUTF-8になるメリットが少なくね?

263:動け動けウゴウゴ2ちゃんねる
08/04/15 03:48:42 ne8d6Vtf0
動機が動機ですからそういう話ではないかと

264:動け動けウゴウゴ2ちゃんねる
08/04/15 04:27:23 fw6LTgXw0
そもそも2chはぴろゆきの個人の掲示板なので、利用者のメリットとかあんまどうでもいいのです。。。

265:動け動けウゴウゴ2ちゃんねる
08/04/15 07:21:22 zruzuaAC0
>>260
書き込みがあるたびに、shift jisの.datとutf-8の.utfの両方を作るんじゃなくて、
.utfしか作らないんだけど、別フォルダにしておくと言いたかったのです。
subject.txtもutf-8版はsubject.utfにすれば、subject.txtや/datは
エンコードが変更しましたと書かれている924.datだけ置いてutfに誘導できるから。

266:stream ◆PNstream2s
08/04/15 08:27:58 owLyqy6F0
ところで、提案者の示した目的が「負荷軽減」だけど、( >>4 )
負荷軽減はUTF-8化では無理、というかむしろマイナスという結論。
それを受けて提案者はどう考えてるのか。

267:動け動けウゴウゴ2ちゃんねる
08/04/15 08:33:33 fw6LTgXw0
>>265ぬるぽど・・・とすると例えば、新しい構成のdatは
/operate/utf/1207973589.dat
とかなってて普通にutf8版datが入ってて、mod_rewriteで
RewriteRule ^/operate/dat/([0-9]+)\.dat$ /operate/dat/pleaseuseutf8.dat
とかしておいて
/operate/dat/pleaseuseutf8.dat
にはsjisで
utf8使え<>utf8使え<>utf8使え<>utf8版を使えや(゚Д゚)ゴルァ!!<>utf8版を使えや(゚Д゚)ゴルァ!!
みたいなのが一行だけ入ってる、とw

268:動け動けウゴウゴ2ちゃんねる
08/04/15 09:07:31 9wLnJxGDP
>>1
shift_jisとUTF-8の(具体的な)コスト比較をやってけれ!
って事なのかな?

269:動け動けウゴウゴ2ちゃんねる
08/04/15 10:14:58 gVyxVVdr0
2ちゃんねるブラウザ「JaneView」 Part54
スレリンク(win板:840番)
840 名前:View ◆AcQTmXmylo [sage] 投稿日:2008/04/15(火) 05:19:13 ID:zEhpNNaT
ガクブル
長い目で見たらメリットはあるだろうけど、
ネイティブでやろうとするとDoeのレス表示の部分の修正だけでもえらいことに。

表示だけでなく書き込みやNGワードなどユニコードに対応したUIの必要性を考えると・・・
ユニコードのコンポーネントはTntWareがTMS Unicodeになってシェア化されてしまってたり。
RichEdit2.0を使うのもいろいろ問題有り。

JaneViewに関しては自分がTntWareの最終版を持ってるのでどうにでもなるけど、
OJはいよいよまずいかな。。。

270:動け動けウゴウゴ2ちゃんねる
08/04/15 11:09:56 42mEP3AY0
>>262
絵文字はむしろ排除の方向で

271:動け動けウゴウゴ2ちゃんねる
08/04/15 11:10:25 gCHxp9NE0
サーバリソースのゆとりがあるなら、の話ですが、utf8>sjis変換サービスってのもありかも。

sjisで要求→1234567890.utfしかない→read.cgiは別ホストで動いている変換サービスにutf-datを投げる
→変換サービスはdatをsjisに変換→変換サービスは要求したホストに直接datを返す。

去年の後半あたりから「非同期」が一種のキーワードになっています。
これはその考えを反映させたもの。

272:動け動けウゴウゴ2ちゃんねる
08/04/15 13:48:52 JP1tmOnY0
人大杉対策としてread.cgiはc.2ch.netなしくみで動かすというのもありかも。

現在のc.2ch.netのphpスクリプトを元に
ブラウザで表示したときの見た目がread.cgiと同等なものを作って
それをpc.2ch.netみたいな名前を付けたサーバで動かして
bbs.cgiが入っている鯖のread.cgiは全部止める変わりにそっち使ってという感じで。

273:動け動けウゴウゴ2ちゃんねる
08/04/15 13:49:06 KsMxiwKa0
キャッシュ機能とかも持たせれば効率いいソリューションになりそうだね

274:動け動けウゴウゴ2ちゃんねる
08/04/15 14:37:02 v+BHHlzC0
文字コードは根っこが深いからテストサーバー作って
コツコツとつついていくのが良いと思う。
utf8.2ch.net

275:動け動けウゴウゴ2ちゃんねる
08/04/15 14:37:47 42mEP3AY0
pc.2ch.net は予約済(現在は過去ログ鯖)
非公式なら既に存在する

276:動け動けウゴウゴ2ちゃんねる
08/04/15 14:48:46 2CK6LpAs0
いきなり現行の板に適用したりしたら
たぶん専ブラの中の人が大変なことに…

277:動け動けウゴウゴ2ちゃんねる
08/04/15 15:44:48 +NkgmXUf0
単にIE6でアクセスされたら専ブラかIE7かFirefoxかSafariかOpera使えって返せば良い予感。文字コードだけが問題じゃないようだし。

278:動け動けウゴウゴ2ちゃんねる
08/04/15 16:31:43 RHiqUynv0
MEサポートしろ

279:動け動けウゴウゴ2ちゃんねる
08/04/15 17:49:51 +NkgmXUf0
>>278
PC買い換えるかUbuntu使え

280:動け動けウゴウゴ2ちゃんねる
08/04/15 18:06:43 fDN7Mt7+0
>>277
(・∀・)ソレダ!!

281:動け動けウゴウゴ2ちゃんねる
08/04/15 19:21:48 GaC/2Jby0
なんで西村はこんなことを思い付いたの?

282:未承諾広告※ ◆TWARamEjuA
08/04/15 21:08:59 6Jv1uKWo0
林檎機開発環境だと負担軽減するのかなぁ♪

283:動け動けウゴウゴ2ちゃんねる
08/04/15 21:11:26 +NkgmXUf0
林檎はDarwinだからなぁ。LinuxもLinuxだし。FreeBSD向け開発にはFreeBSDが一番な気ガス。

284:動け動けウゴウゴ2ちゃんねる
08/04/15 22:23:36 v+BHHlzC0
>>281
日本以外のマルチバイトな文字に対応したいんだろうな。

285:あらすじ
08/04/15 23:23:25 9ycp3lZE0
ひろゆき)人大杉が出ると、閲覧できる人が減って広告収入に影響がでるから困る。

ひろゆき)鯖のセッティングのことはよくわからないけど、人大杉が出るってことはサーバーリソースを使いすぎってことだろう。

ひろゆき)サーバーリソースを使わないread.jsを標準にすればよくね?

SunOs)read.jsだとIE6で挙動不審だからデフォルトで採用できないっす。

ひろゆき)なるほど。(文字コードがUTF8なら問題解決ってことだな)

///////////////////スレ立て////////////////////////////////

ひろゆき)datをUTF8にするのはどうだろう。 >>1

技術屋さん達)ざわざわ。問題点はあーだこーだ。

ひろゆき)サーバリソースを使わないモデルにできれば、人大杉が無くなるよね。(真意)>>65

SunOs)read.jsを標準で使わない理由は文字コードの問題じゃないってばよ。>>36,72

SunOs)ちなみに人大杉の時にread.jsを効かなくしてるのは、鯖屋のFOXの指示ですわ。>>73

ひろゆき)じゃあ人大杉のときはread.jsを標準で使うようにしてください。(目的達成)>>93

SunOs)了解っす。>>123

技術屋さん達)ざわざわ。UTF8にしたらあんなことやこんなことを。

ひろゆき)文字コードを変えるとしたら、サーバ移転ごととかそんな感じすかね。(適当な思いつき)>>167

技術屋さん達)ざわざわ。あーだこーだ。

root)管理人がやれって言うならやるけどさ。技術屋の威信をかけて。>>216

専ブラ作者)思いつきで仕様変えるのかよ('A`)マンドクセ>>269

286:動け動けウゴウゴ2ちゃんねる
08/04/15 23:40:23 msDMZS8WP
まとめ乙

287:動け動けウゴウゴ2ちゃんねる
08/04/15 23:41:06 FySE2P/g0
苦労してまでUTF-8にするメリットが見つかりませんが・・・
ちなみにUnicodeならJIS2004も扱えたりするんですけど、専ブラも当然対応するんですよね?

288:動け動けウゴウゴ2ちゃんねる
08/04/15 23:46:06 JfBALhQn0
ていうか専ブラの対応なんてそんなに大変じゃないだろ
なんて思う俺はOSX

289:動け動けウゴウゴ2ちゃんねる
08/04/15 23:48:53 2CK6LpAs0
しばらく実験用の鯖だけで動かしていれば
その間にユーザーがつつくから対応してくれるかもしれない。
更新が止まって久しいソフトは淘汰されそうな気がする。

290:stream ◆PNstream2s
08/04/15 23:50:04 bBUm3FbL0
スレ立て前の経緯を今知ったぞ

291:動け動けウゴウゴ2ちゃんねる
08/04/15 23:58:49 FySE2P/g0
RLO(Right-to-Left Override)の問題は大丈夫っすか?
RLO埋め込んだアドレスでjpgファイルに見せかけたexeファイルをうpするとか・・・
URLリンク(ura2ch)

URLリンク(ura2ch)
とか

292:動け動けウゴウゴ2ちゃんねる
08/04/16 00:03:38 4/Qc/rGp0
あったなぁそんなの

293:root▲▲ ★
08/04/16 01:06:57 0 BE:3648285-DIA(100256)
>>291
確かに。
>>234 と同様に Unicode の問題ですね。

294:動け動けウゴウゴ2ちゃんねる
08/04/16 01:13:00 fJ7JEU020
>>291
それ、今でも文字参照で可能。ただ、既にブラウザ・OS側で対策されてるからあまり問題ない。
98? ME? んなサポート切られたOSなんて知らね。
2000? M$神はあなたを見放した。

295:動け動けウゴウゴ2ちゃんねる
08/04/16 01:15:17 fJ7JEU020
ちなみに参考
スレリンク(software板:116番)

296:stream ◆PNstream2s
08/04/16 01:17:53 ek0XYmnn0
今の2chでも&rlo;使えるしなあ
&rlo;あなるえ使;olr&もでhc2の今

297:動け動けウゴウゴ2ちゃんねる
08/04/16 01:22:34 73yP5jMQ0
> &rlo;あなる

まで読んだ。

298:動け動けウゴウゴ2ちゃんねる
08/04/16 01:23:21 VmcCj0d9P
リンクの偽装に使えるのかしら。
いずれにしてもリンク先になにがあるかは2chが関知するところではないのだけど。

299:動け動けウゴウゴ2ちゃんねる
08/04/16 06:15:02 FX89xfze0
地デジでも採用されてる、ARIB 8単位符号(STD-B24)にしようよ。

JIS 8単位符号ベースだから、多国語対応もOK。
DRCSをつかってユーザ定義の絵文字を混ぜられる。
漢字は2 bytes、英数・平仮名・片仮名は1 byte。要エスケープシーケンス。
更にC0, C1制御符号を使って、書式も付けられる。

300:動け動けウゴウゴ2ちゃんねる
08/04/16 07:20:03 laDIPMVY0
特殊記号作品スレ5
スレリンク(aasaloon板)

301:動け動けウゴウゴ2ちゃんねる
08/04/16 13:52:37 yM0xssmr0
シリアスに考えないで、研究目的で実験サーバ立てればいいじゃない

302:動け動けウゴウゴ2ちゃんねる
08/04/16 14:38:38 j6iNdeGw0
じゃあ頼んだぞ

303:動け動けウゴウゴ2ちゃんねる
08/04/16 16:58:06 KAYqMy1f0
>>22
妙に感動した27歳フリーターの夕暮れ

304:動け動けウゴウゴ2ちゃんねる
08/04/16 21:47:05 8vcknS5q0
サーバはタダじゃない

305:動け動けウゴウゴ2ちゃんねる
08/04/16 22:49:07 2koVwYXu0
utf化でどの程度、データーの容量増えるか実測してみた
tmp7のdownload板の全datファイルをダウソして実験

元のdat  -- 38MB
UTF8化dat --- 46MB (1.2倍)


次に、gzipでこれらを圧縮してみた
UTF8化してもほぼ同じ容量になる

圧縮後の元のdat -- 12MB
圧縮後のUTF8化dat -- 13MB (1.1倍)

メジャーなブラウザーは通信時データーをgzipで圧縮できるので
通信帯域的にはUTF8であろうがなかろうが同じ程度になると思う。


次に、datをUTF8化して、更に、XML化してみた
↓例えばこのスレのdatをXML化
URLリンク(www7.axfc.net)
XML化しても圧縮するとやはり元のdatと同程度のサイズだった。

XML化後のdat -- 54MB (元のdatの1.4倍)
圧縮後のxml化dat -- 14MB (圧縮後のdatの1.2倍)


datをUTF8化して、ついでにXML化もしてはどうかな?

今read.cgiにアクセスしてくるようなビュワーを使わない「普通の」閲覧者にも
XML化datとスタイルシートを与えて閲覧者のブラウザー側で見栄えを処理してもらえば
perlとかをガリガリ動かすより負荷も減るかと思う。

閲覧者に広告をフィルタリングされやすくなっちゃうだろうけどw
逆に見てもらいたい広告を挿入しやすくもなると思う。

306:動け動けウゴウゴ2ちゃんねる
08/04/16 23:04:41 8iiGNMQL0
>>305
必要に迫られない面倒くさいことはやらない(基本)

307:動け動けウゴウゴ2ちゃんねる
08/04/16 23:29:45 PW3HC1soP
UTF-8にしてXMLにしてgzip圧縮して
それって逆に負荷を増やしているんじゃないのか

308:動け動けウゴウゴ2ちゃんねる
08/04/16 23:36:04 8vcknS5q0
XMLはコンテンツのみで
見栄えはXSLTでいいんじゃね

309:動け動けウゴウゴ2ちゃんねる
08/04/16 23:38:27 whhUnnKa0
SJISからUTF-8にしたり
datをXMLに変換するのは負荷になるだろうね。
そこで最初からUTF-8、最初からXMLであれば話は別かと。

310:動け動けウゴウゴ2ちゃんねる
08/04/17 00:00:32 v8ifVSIP0
CPUの負荷と、回線の転送料の負荷と、ファイルの容量が混ざってないか

311:動け動けウゴウゴ2ちゃんねる
08/04/17 00:51:12 IgHwqogZ0
>>308
IE6のXSLTは酷いから使うのはお勧めしないよ。

312:動け動けウゴウゴ2ちゃんねる
08/04/17 03:11:26 LfXY4knO0
そんなことより、顔文字を共通化して文字コードを割り振って、国際標準にしろよw

313:動け動けウゴウゴ2ちゃんねる
08/04/17 17:33:04 v8ifVSIP0
AA職人に欲しい記号をリストアップして貰おうか

逆半角スラッシュ?

314:動け動けウゴウゴ2ちゃんねる
08/04/17 17:55:25 M/L+gyPS0
今のままでいいよ

315:動け動けウゴウゴ2ちゃんねる
08/04/17 19:31:33 GmeyqZuk0
ユニコードってバックスラッシュと円記号って違うコード?
エンコードによって揺れる?

316:動け動けウゴウゴ2ちゃんねる
08/04/17 19:50:50 x31S+u9S0
2ch DAT落ちスレ ミラー変換機の管理人さんが0chスクリプトを
UTF-8化したものを配布(URLリンク(mirror.s151.xrea.com))していて、
サンプル(URLリンク(mirror.s151.xrea.com))もあるので、
どんな感じになるのかはここで実験できるかもしれない。

317:動け動けウゴウゴ2ちゃんねる
08/04/17 20:26:07 l0VrTek40
>>315
違うに決まってんでしょ

318:動け動けウゴウゴ2ちゃんねる
08/04/17 21:11:03 0giwvNAd0
>>316
サンプルの惨状にワロス

319:動け動けウゴウゴ2ちゃんねる
08/04/17 21:21:30 chmztg1a0
多言語なんて荒れるんじゃない?

320:動け動けウゴウゴ2ちゃんねる
08/04/17 22:33:14 x31S+u9S0
>>318
荒れてるんじゃなくて、台湾版ニコニコ動画の掲示板のログを持ってきた
って管理人さんが書いてた。
考えてみたら、URLリンク(tw.bbs.nicovideo.jp) の方を紹介すべきだったかな。
ニコニコ動画が運営しているUTF-8エンコードのサポート掲示板。

321:動け動けウゴウゴ2ちゃんねる
08/04/18 16:24:52 QnO5qrZL0
>>315
違うコードだけど、Windowsではどちらも¥に見える

322:動け動けウゴウゴ2ちゃんねる
08/04/18 18:28:59 PzY0ZFSE0
>>321
たぶんそれはアプリに問題が

323:動け動けウゴウゴ2ちゃんねる
08/04/18 19:33:59 sdKsYN1gO
暗黙の了解でバックスラッシュは特殊な仕様になってる。
詳しくは調べてね

324:動け動けウゴウゴ2ちゃんねる
08/04/19 00:04:03 hJxMwF/u0
マイクロソフトの変換法では、日本の円記号はUnicodeのバックスラッシュ(U+005C)に変換される。
そして、日本語用のフォントではバックスラッシュ(U+005C)を円記号として表示してしまうのである。
賛否両論の対応ではあったが、旧来のソフトウェアを捨て去ることなくUnicodeを利用できる現実的な方法として広く使われている。

なにこれー

325:動け動けウゴウゴ2ちゃんねる
08/04/19 04:37:18 PNa6uLXK0
Windows のフォントにパッチを当てて、円記号を無理やりバックスラッシュにしたり
してた人も居たはず…

326:動け動けウゴウゴ2ちゃんねる
08/04/19 09:40:01 E5leIjkHP
Beかなんかで、トリップの文字化けがあったよね。関係あるのかな。
ログだけじゃなく、全部ひっくるめて統一したい、とか?

327:動け動けウゴウゴ2ちゃんねる
08/04/19 10:47:11 i4TihsY/0
エンコーディングにSJISを使うかUTF-8を使うか、ということより
最終的にどんなフォントが使われるかということだな、問題は。

328:動け動けウゴウゴ2ちゃんねる
08/04/19 11:29:41 RC0Bf5GwP
フォントにな

329:動け動けウゴウゴ2ちゃんねる
08/04/19 12:05:13 WwihNvKZ0
すくなくともバックスラッシュを多用する板なんて限られてくるんだし(ム板とか)
そいつらがBSを表示できれば問題ない

330:動け動けウゴウゴ2ちゃんねる
08/04/19 12:18:26 BN4RLckC0
AA職人もバックスラッシュは欲しがるんじゃないか?
ってもMS標準のUnicodeフォントで統一されるなら支障無いと思うけど

331:動け動けウゴウゴ2ちゃんねる
08/04/19 12:25:16 Eb+X94MG0
バックスラッシュは是非欲しい

332:動け動けウゴウゴ2ちゃんねる
08/04/19 13:04:42 ZaXhrfEE0
\ ←?

333:動け動けウゴウゴ2ちゃんねる
08/04/19 13:42:54 WwihNvKZ0
>>332
\

334:動け動けウゴウゴ2ちゃんねる
08/04/19 13:43:17 boa9zPeZ0
>>328

335:動け動けウゴウゴ2ちゃんねる
08/04/19 14:29:20 PNa6uLXK0
以下スレチ
>>326
(旧 BE板と) BE プロフィール画面でのトリップ非互換問題は以下の通り。

・BE の内部処理が EUC-JP で、なおかつ本来トリップとしては不正な多バイトコード
 もしくはいわゆる半角カタカナを使用しているため。
・プロフィール画面の方では、各処理系で特殊用途として用いられる文字のエスケープ
 処理が板のトリップでの処理と違うため(「"、'、[、]、\」なんかが該当)。

すべての原因は何処かのスレで自身が発言してた、ひ(rが文字コード問題に弱いため。

336:動け動けウゴウゴ2ちゃんねる
08/04/19 14:33:40 AofXqpHw0
スレリンク(be板:225番)
5:トリップが化けないようにして

いまいち文字コード周りに弱いおいらです。。。
DBの文字コードを変えるとさらに文字化けを誘発しそうなんですよね。。

337:動け動けウゴウゴ2ちゃんねる
08/04/19 18:12:39 7NOZ3hUG0
>>328


338:動け動けウゴウゴ2ちゃんねる
08/04/19 21:00:50 pEn192nm0
UTF-8を理解していない人が
スレ参加とか。。アフォかと。。。

339:動け動けウゴウゴ2ちゃんねる
08/04/19 22:57:37 E5leIjkHP
もはや釣堀w

340:動け動けウゴウゴ2ちゃんねる
08/04/20 00:20:40 FJYFc2yt0
専ブラ作者には負担かけるわけだよねー
●で儲けさせてもらったくせにその仕打ちはどうかと

341:▲ ◆SANUKI/VII
08/04/20 00:30:15 CZ8CMSVeP BE:25368487-PLT(13132)
>>340
、、、。

342:動け動けウゴウゴ2ちゃんねる
08/04/20 00:49:13 ioURv1tiP
\(^O^)/ドンマーイ

343:動け動けウゴウゴ2ちゃんねる
08/04/20 02:52:04 6eEXFguv0
世界はUTF-8

344:動け動けウゴウゴ2ちゃんねる
08/04/20 04:29:24 2uISEUW5O
俺のサイトもSjisからUTF8にしようと思ったけど面倒だからやめた。
PHP使ってるから初めからほうしとけば良かった。

345:動け動けウゴウゴ2ちゃんねる
08/04/20 10:42:00 E+evngot0
>>340
エンコ指定なんてふつう外出しにしてるだろ。大した手間じゃないよ。

346:動け動けウゴウゴ2ちゃんねる
08/04/20 10:46:48 ioURv1tiP
讃岐は●非対応、いや未対応。
完全ボラだからなー。

347:動け動けウゴウゴ2ちゃんねる
08/04/20 11:21:20 gBO4l9OF0
>>340
>>269

348:動け動けウゴウゴ2ちゃんねる
08/04/20 11:28:21 gBO4l9OF0
340じゃなくて345だった

349:動け動けウゴウゴ2ちゃんねる
08/04/20 12:56:44 E+evngot0
つまりJaneViewの設計が糞だってことか

350:動け動けウゴウゴ2ちゃんねる
08/04/20 13:03:17 6E0oOuN20
えんこーでぃんぐだけじゃなくてゆーあいにひょうじしたりあぼーんでのしょりがふくざつになるのに
お前はアホか。

351:動け動けウゴウゴ2ちゃんねる
08/04/20 14:07:13 75H7xodgP
ID:E+evngot0
ここはあなたみたいな無知な方が来る所じゃありませんよ、と

352:動け動けウゴウゴ2ちゃんねる
08/04/20 14:09:46 AQa/Gq8O0
内部処理がSjisの専ブラの方が多いだろ

353:動け動けウゴウゴ2ちゃんねる
08/04/20 16:11:58 sNEtEpdP0
WinアプリでWin95系をサポートしてるなら内部処理Unicodeにするのは困難

354:動け動けウゴウゴ2ちゃんねる
08/04/20 16:26:03 OWZ6WVMR0
いまさら95/98/MEを使っている奴なんて…いないだろう?
いないよね?いないと言ってくれよ!

355:動け動けウゴウゴ2ちゃんねる
08/04/20 16:41:03 16hsI3LLP
ここにいる!

356:動け動けウゴウゴ2ちゃんねる
08/04/20 16:42:43 E+evngot0
つまりエンコの変更に対応できないようなソフトを作っておいて
自前のコントロールじゃないからどうとか開発環境の内部処理が
どうとかOSがどうとか言い訳がましいことを言うなと

357:動け動けウゴウゴ2ちゃんねる
08/04/20 16:45:36 siTEX6bu0
>>353
でも不可能じゃ無いし、実際95でも使えるアプリでUnicode対応してるのも
ある。

ちょっと検索すれば判る程度の話だし。

358:動け動けウゴウゴ2ちゃんねる
08/04/20 17:05:38 6E0oOuN20
不可能じゃなければ簡単なわけじゃない。

>>356
やったことがなくてわからない事までろくに知りもせずに言及するな。
>>345のような発言する時点で実際にどんな問題が出てくるか全く把握してないだろ。

359:動け動けウゴウゴ2ちゃんねる
08/04/20 17:09:44 OWZ6WVMR0
ここは2chだし「まずやってみよう!」の精神でいいんじゃないかな?
問題が起きたら後から考えると。

360:動け動けウゴウゴ2ちゃんねる
08/04/20 17:12:52 iVEweGOHP
やるんならアフィ速とかVIPとか小規模に実験してから全板にいれてくれ

361:動け動けウゴウゴ2ちゃんねる
08/04/20 17:22:48 CuEhiLzy0
2chブラウザ製造機によく使われてるDelphiがUTF(Unicode)に標準で対応してないんだ。
かちゅ、ギコナビ、ホットゾヌ、Jane系は騙し騙しの対応になるか、対応を諦めるかのいずれかになるな。

そもそもひろゆきがUTF8に変更する積極的な理由がなくなったんだから
このままでいいんじゃないのかね。

362:動け動けウゴウゴ2ちゃんねる
08/04/20 17:47:46 E+evngot0
2ch鯖がSJISに特化した処理結果を返してるからといって
クライアントがSJISを前提にした設計にしちゃっていい理由には
ならんだろ?文字コードが変更されたとき、ユーザーの手間を
最小限に抑えて最低限の表示が出来るような設計にしておかなきゃ
糞だろ?

363:動け動けウゴウゴ2ちゃんねる
08/04/20 18:19:31 a/sg/Mv90
必レスのガイドラインスレに迷い込んだのかと思った。

364:動け動けウゴウゴ2ちゃんねる
08/04/20 18:41:36 nLYdFtzu0
専用ブラウザがどうのこうの言ってるけど
おいらのJDには関係ない
ついでにいうとNavi2chでも関係ない
つまりはどうでもいいってこった。

365:動け動けウゴウゴ2ちゃんねる
08/04/20 18:53:32 SICVUDUsO
>>362
フリーソフトにどんだけスケーラビリティ求めてんだ。ww
頭悪いの?それとも常識がないの?

366:動け動けウゴウゴ2ちゃんねる
08/04/20 19:58:54 OWZ6WVMR0
2chサーバ側の仕様なんて、これまでも結構変わっているわけで、
専ブラ作者もそれに追従してきている。
(gzip圧縮とか、EUCとか、バーボン回避のウエイト挿入とか)

今回の場合、暫定回避策を作るとすればliveb1.2ch.netみたいのを
ベースに変換Proxyを用意して、未対応の専ブラはそこを経由させる
ような対応もあるだろう。

もちろん「表示不能な文字が出る」「更新が遅延する」等の制限も
あるわけで、それを回避したい作者はUTF-8の本格対応をしてくる
だろう。

ま、実験サーバで様子見ながら進めるのが良いだろうね。

367:動け動けウゴウゴ2ちゃんねる
08/04/20 20:59:57 glaB1xWs0
ていうかそもそもUTF-8にするメリットってあんの?
専ブラとかトリップとかデメリットははっきりしてるけど

368:動け動けウゴウゴ2ちゃんねる
08/04/20 22:29:35 OWZ6WVMR0
UTF-8のメリットと言うよりも、SJISのデメリットの方が大きかったり。
SJISのままだとまともに検索処理できなかったりするしなあ。

findがEUCなのもこの辺が理由だろうし。

369:動け動けウゴウゴ2ちゃんねる
08/04/20 22:33:59 AfSvaIcn0
>>352
んなこたあない

370:動け動けウゴウゴ2ちゃんねる
08/04/21 03:35:19 L/X3LHo3O
>>368
そりゃ設計が甘いだけであって文字コードの問題じゃないだろ、jk。

371:動け動けウゴウゴ2ちゃんねる
08/04/21 08:34:06 B3naUrlS0
こんなことグダグダ言ってる体質だから、お前ら童貞なんだよ

372:動け動けウゴウゴ2ちゃんねる
08/04/21 10:30:04 SsWHcakdO
ティンコねえよばーか

373:動け動けウゴウゴ2ちゃんねる
08/04/21 20:25:58 aKzPBjG80
ほうほうwそれで?




・・・・えっ?

374:動け動けウゴウゴ2ちゃんねる
08/04/21 22:25:50 fSMi00ydO
同鯖なんだから、iframeでSJISのテキストひっぱってきて、
JSで整形すればいいジャマイカ
IE6どころかそれ以前でも問題ない

Ajaxにこる必要はないですよ、と。。。

375:動け動けウゴウゴ2ちゃんねる
08/04/22 01:51:28 ANEjSamR0
UTF8にすんの?ハングルとか中国語で蹂躙されそうでこわいんですけど

376:動け動けウゴウゴ2ちゃんねる
08/04/22 06:42:01 yL4lzVkx0
>>375
バカなんだから、黙ってろバカウヨ

377:動け動けウゴウゴ2ちゃんねる
08/04/22 08:03:32 uY/iJg580
半島、大陸からはボボン行きにしちゃえばいいのだろうけど国内からの投稿はなあ

378:動け動けウゴウゴ2ちゃんねる
08/04/22 14:17:45 kM4VdlnL0
結局決まったのは「人大杉の時はread.js使ってね」だけか?

379:動け動けウゴウゴ2ちゃんねる
08/04/22 17:00:23 Cn13HtzZ0
そんでひろゆき満足してそう

380:動け動けウゴウゴ2ちゃんねる
08/04/22 17:05:15 rxRpnF6x0
じゃあもう要らないね

↓スレスト

381:▲ ◆SANUKI/VII
08/04/22 17:10:32 nZhF1lJIP BE:16308566-PLT(13132)
ひろゆきモンハンやろうぜ

382:動け動けウゴウゴ2ちゃんねる
08/04/23 04:42:43 syvdi/8X0
そもそも言語とはなんぞやという問題が云々

383:動け動けウゴウゴ2ちゃんねる
08/04/23 05:56:01 EDGasE+IP
いつかはやるべきだろうけど、「動いているモノはいじるな」でしょうか。
googlebot対策なんかやるのかな?

384:ひろゆき@どうやら管理人 ★
08/04/25 07:50:49 0 BE:170093-S★(1018222)
sports11もread.jsの設定お願いしますー。


385:動け動けウゴウゴ2ちゃんねる
08/04/25 09:56:53 deYgxNnf0
ぴろりん発見

386: 株価【830】 △△ ◆cZfSunOs.U
08/04/25 10:42:26 3m/nTh190
>>384 人大杉時に read.js に振る設定が FOX さんに override されて
「秘密の花園」に飛ばされてしまうのですが,とりあえずやっておきます.

# 再度 override されるようなら,↓あたりの話を FOX さんと詰める必要があるのではないかと......
# スレリンク(operate板:15-番)n

387:動け動けウゴウゴ2ちゃんねる
08/04/25 13:20:09 g1Y2XeLi0
ぴろり菌発見w

388:あぼーん
あぼーん
あぼーん

389:動け動けウゴウゴ2ちゃんねる
08/05/05 17:25:01 afyb9tX10
(´・ω・`)このスレ終わっちゃったの?

390:動け動けウゴウゴ2ちゃんねる
08/05/05 17:58:44 U3TbI2+30
>>389
「俺がUTF8化してやるぜ! utf.2ch.netという名前を付けて鯖よこせ! 」
みたいなことを言う人が現れなかったので終了しました。

391:動け動けウゴウゴ2ちゃんねる
08/05/06 20:48:45 ZGvvJhjr0
うお乗り遅れた

っつっても俺がやってやるから鯖よこせと言えるだけのパワーは無いけど

392:動け動けウゴウゴ2ちゃんねる
08/05/06 21:05:24 ztX/ckgM0
実際UTF8化した場合、簡単な設定変更で表示可能なブラウザって
IE以外だと何がありますか?(IEならエンコードは自動認識だったかな)

393:動け動けウゴウゴ2ちゃんねる
08/05/06 21:19:51 u8C45HHC0
ウェブブラウザのシェア統計に名前が出るブラウザなら特に設定の変更は無いです

394:動け動けウゴウゴ2ちゃんねる
08/05/06 22:11:05 ghDM9x940
navi2ch はすぐだな


395:動け動けウゴウゴ2ちゃんねる
08/05/06 22:42:03 V+cwX45t0
>>392
っていうか、むしろその IE(6) で問題が大有りなんだが… IE7 なら割と平気。

396:動け動けウゴウゴ2ちゃんねる
08/05/07 00:26:42 8uJffkUH0
>>394
emacs自体のユニコード処理が微妙だったり無かったり

397:動け動けウゴウゴ2ちゃんねる
08/05/07 00:43:11 FVQiW6yh0
今時、問題になるようなウェブブラウザはないかと。
(ウェブブラウザが見るのはhtmlだから、もし問題ならread.cgiが
SJISなhtmlを吐くようにすればいい)
対応が大変なのはdatを自分で読んでいる専ブラ。

398:委員長 ◆/DABoneCRY
08/05/07 05:20:13 QxFtrOUb0
専用ブラウザの場合、最悪IEコンポーネントを使っているなら
そのままUTF-8で吐き出せば表示されるかな?と思いますが
独自描画だとキツいでしょうねぇ。
内部でSJISにコンバートしてから表示ってことになるかな?

SUBJECT.TXTもUTF-8になるのなら、同じ感じですね。
スレッド一覧表示のところね。
上手く表示出来ない文字とか出るんでしょうねぇ。

SJISのままで行きましょうよ……。

399:動け動けウゴウゴ2ちゃんねる
08/05/07 05:59:47 YZj/IRfH0
もういいじゃないこのままで

400:動け動けウゴウゴ2ちゃんねる
08/05/07 10:37:11 FVQiW6yh0
ご時世を考えるとむしろ内部UTF-8な専ブラもあったりするんじゃないかと
思わないでもなかったり。

ところでトリップの話が出てますけど、トリップだけはSJISに変換して
計算すればいいんでない?
あと、トリップの強度を上げる話は、キーはSJIS8バイト以内なら現トリップ、
それよりキーが長ければ次世代トリップというように、互換性をもたせたまま
拡張する手もある。

401:動け動けウゴウゴ2ちゃんねる
08/05/07 17:07:17 swK7kCX6O
今こそおいらロビーインターナショナルの復活の時

402:動け動けウゴウゴ2ちゃんねる
08/05/07 18:05:49 PHJOcw2w0
>>400
トリップの件… 多分この板の過去スレのどこかにソースがあるはずだけど(トリップ
統一スレだっけかな?)、2ちゃんねるの仕様としては、non-ASCII なキャラクタは
トリップコードしては不正なはず。

403:stream ◆PNstream2s
08/05/07 18:28:39 m32b509z0
>>188

404:動け動けウゴウゴ2ちゃんねる
08/05/11 10:29:19 3JPX5k+W0
管理人がそう言っていたとしても、
現実使ってる奴がいる以上需要はあるかと。

対応する理由が2ch側には無いのはわかってますけどね。

405:動け動けウゴウゴ2ちゃんねる
08/05/16 09:17:59 oK7aNu1R0
2NNはUTF-8なんだな

406:動け動けウゴウゴ2ちゃんねる
08/05/18 06:06:12 yWeFaP7n0
S-JISを通信の世界に出すなと言う20年以上昔の議論の結論が今頃出てきたなw わずかな期間のわずかなリソース節約の為にどれだけのパワーが削がれてきたのか、 そして、正しき状態に戻すためにどれだけのパワーを必要とされるのか、、、南無、、、

407:動け動けウゴウゴ2ちゃんねる
08/05/18 07:05:02 QBG0YZC80
正しき状態とかもうね

408:動け動けウゴウゴ2ちゃんねる
08/05/18 07:23:47 e9j/YDzI0
欠陥の多い間に合わせの文字コードだからな。

409:動け動けウゴウゴ2ちゃんねる
08/05/18 08:30:45 uwERh9TE0
>>406
20年以上前は80x40の端末しか存在しなかったから
改行して読みやすくするなどの
読み手のことなど全く考慮する必要がないということですね。

410:動け動けウゴウゴ2ちゃんねる
08/05/18 09:17:21 jVWe2BtW0
通信の世界で使えと言ってたのはISO-2022-JPなわけだが(今でも日本語メールにその名残がある)
datをISO-2022-JPにしろとでもおっしゃいますか
アホか

411:動け動けウゴウゴ2ちゃんねる
08/05/18 11:08:47 HxyQJ5j/0
>>410
名残もなにも、RFC 1468(ISO-2022-JP)は現役バリバリで obsolete されていないから、
text/plain での日本語環境 mail/netnews じゃ ISO-2022-JP しか使っちゃ駄目。

412:動け動けウゴウゴ2ちゃんねる
08/05/18 12:41:42 LZxEStfR0
mailとnetnewsではね
2chにはあまり関係のないお話

413:動け動けウゴウゴ2ちゃんねる
08/05/19 14:57:34 OHADN8NA0
そこまで言うならUTF-7でいいよ

414:動け動けウゴウゴ2ちゃんねる
08/05/19 19:36:53 CI88+YrjO
むしろUTF-18で

415:動け動けウゴウゴ2ちゃんねる
08/05/19 21:28:50 ETRrbr/x0
いっそのことUTF-9で

416:未承諾広告※ ◆TWARamEjuA
08/05/19 22:00:30 X4v1z3oV0 BE:5881469-2BP(7088)
うっとこはJST-9だよっ♪

417:動け動けウゴウゴ2ちゃんねる
08/05/19 22:56:52 ZQSwr6w90
>>413
全部実在するから始末に負えない

418:動け動けウゴウゴ2ちゃんねる
08/05/19 23:02:17 PaaKUwwi0
こんなにあるもんなのか

UTF-7
UTF-16 (後述)で表したUnicodeをBase64で変換して表す方式。
ただし、ASCIIのアルファベット範囲等については(ry

UTF-9
8ビット単位の可変長コード(1?5バイト)にエンコードする方式。
ISO-8859-1に対して一部互換である。
しかし、UTF-8が普及しつつあり、それと比べて欠(ry

UTF-18 (エイプリルフールネタだそうで)
Unicode符号位置を単一の18ビットによりエンコードする方式。
UTF-8に対するUTF-16のようなものだが、RFC公開時点のUnicodeで文字が定義されていた(ry

419:動け動けウゴウゴ2ちゃんねる
08/05/19 23:22:46 ACmPGLE70
ネタもあるから注意が必要だ
有名どころではハトとか

420:動け動けウゴウゴ2ちゃんねる
08/05/19 23:50:08 PaaKUwwi0
HTCPCP/1.0とかもなw

421:動け動けウゴウゴ2ちゃんねる
08/05/20 08:32:07 Yq4y55V5O
実用的なところでは洗濯バサミとかなw
家庭内やSOHOぐらいだと意外と使えるぞ。

422:動け動けウゴウゴ2ちゃんねる
08/05/20 15:02:44 CxBd8N6S0
> 30 名前:止まない雨は名無しさん[sage] 投稿日:2008/04/11(金) 17:52:40 ID:3n18t16j0
> 狐は「もうずっと人大杉」にした。
>   ひろゆきは三度、専ブラを使え(で書き込め)なくした。
>     それを受け、むむむさんは静かにqb5・6を停止した。

ニュース実況++ / 2ちゃん人大杉拡大 行き場を失ったユーザーの荒らし行為が各地で続発★3
スレリンク(liveplus板:30番)
 嫌な予感がしてkakikomi.txt確認したら…>‎>1ネタをネタと(ry

423:動け動けウゴウゴ2ちゃんねる
08/05/23 20:07:51 7tXSpSoi0
よし、文字コード設計からやろう

424:動け動けウゴウゴ2ちゃんねる
08/05/24 01:23:43 m9uPvIcS0
datの先頭あたりで判別できるようにすればいいんじゃないかな

Shift_JIS:[名無し]さん(bin+cue).rar<>sage<>
UTF-8:[名無し]さん(bin+cue).rar><sage<>

ってみたいに


425:動け動けウゴウゴ2ちゃんねる
08/05/24 02:10:03 zjd3Cur70
判別するだけだったら1文字か2文字でいいんじゃない?

426:動け動けウゴウゴ2ちゃんねる
08/05/24 02:32:35 m9uPvIcS0
できそうなところがないじゃない

427:動け動けウゴウゴ2ちゃんねる
08/05/24 08:52:12 oBnQpL6S0
UTF-8なDATは、BOM付きUTF-8にすればいい
先頭を見てBOMならUTF-8、さもなくばSJIS

428:動け動けウゴウゴ2ちゃんねる
08/05/24 12:23:35 d7IdQZ8a0
専ブラは差分取得するのでdatの先頭にBOMを付けても役に立たない

429:動け動けウゴウゴ2ちゃんねる
08/05/24 12:46:32 oKxq3p9z0
ファイルの途中からUTF-8に変えるのかい?

430:動け動けウゴウゴ2ちゃんねる
08/05/24 12:49:22 PCPcTJ5b0
いわゆる BOM 付き UTF-8 は問題児なので反対。RFC 3626 でも基本的に
「使用を禁止すべき」扱いだし。ていうか、HTTP header の Content-Type の
charset で十分だべ。

431:動け動けウゴウゴ2ちゃんねる
08/05/24 15:28:00 jwQb16jz0
datファイルは2ちゃんねる専用フォーマットだから自由に設計していいんじゃね?
もちろん標準バリバリでXML化でも良いけど、標準ってのも移り変わるもんだからねぇ。

432:動け動けウゴウゴ2ちゃんねる
08/05/24 15:43:50 9dlsmaAP0
XMLは無駄にサイズ食うからなぁ。コードの見通しも悪いし。
賢明な選択肢とは思えん。

433:動け動けウゴウゴ2ちゃんねる
08/05/24 15:50:33 jwQb16jz0
圧縮とセットならXMLもそれほど容量に影響しないと思う。
同じようなキーワードが並ぶのなら全部符号化されちまう。

434:動け動けウゴウゴ2ちゃんねる
08/05/25 09:38:23 nr0ZnGPL0
XML化は利点が見えない。現状の1行1レコード、<>がフィールドセパレータ、で
困らないと思う。

435:動け動けウゴウゴ2ちゃんねる
08/05/25 13:45:49 U0RJgIvu0
このスレの主旨?とはまったく異なる視点で…

・read.cgi が吐くものを XML で再定義する
・それに食わせる dat?も XML で再定義する

ってのなら、まだ分からんでもないけど > dat?の XML 化

専ブラ開発者からみたら、メリットはないわな。

436:動け動けウゴウゴ2ちゃんねる
08/05/25 14:07:56 rNTH5CZP0
これ以上専用ブラウザ作者に迷惑をかけるのはやめてやれよ

437:動け動けウゴウゴ2ちゃんねる
08/05/25 15:57:25 nr0ZnGPL0
> ・read.cgi が吐くものを XML で再定義する

read.cgiの吐くhtmlにスキーマを付けるのには全く独立した話として賛成。

438:動け動けウゴウゴ2ちゃんねる
08/05/25 19:13:36 /yE7qfVJ0
>>430
> いわゆる BOM 付き UTF-8 は問題児なので反対。RFC 3626 でも基本的に
> 「使用を禁止すべき」扱いだし。

RFC 3626 Optimized Link State Routing Protocol (OLSR) って
Unicode 関係なくない?

439:動け動けウゴウゴ2ちゃんねる
08/05/25 19:23:33 foEE4xHPP
>>438
RFC 3629

440:動け動けウゴウゴ2ちゃんねる
08/05/25 19:43:12 nr0ZnGPL0
書き込みがちょん切れたorz

RFC3629的には、
datが、HTTPでやりとりされる物だと見るなら、HTTPのContent-Type
ヘッダがあるからBOMは禁止すべきということになるけど、
dat ファイル単体として見ると、エンコーディングを知る方法が
(なんらかの拡張をしない限り)ないから、BOMは禁止されるべきでない。

専ブラがローカルに持ってるdatについて、ファイル名を変えるとか、
専ブラ独自の形式にするとか、外部に情報ファイルを持つとか、
しなきゃいけなくなる。

441:動け動けウゴウゴ2ちゃんねる
08/05/26 16:51:29 ZKBghHLV0
うぁ… RFC の番号打ち間違えてたか、すまん orz

dat 単体で見たときは云々、ってのはあくまでローカルな環境、ユーザエンドで
ファイル単体として扱うときの話なんで、それは環境・アプリ依存。
2ch の素の dat のファイルがどうあろうと、それをユーザ・アプリがどう扱おうと
好きにすればいい。

意味的には、したらばの EUC-JP な dat を Winodws な専ブラがローカルに
Shift_JIS(CP932) で保存するようなもの。

442:動け動けウゴウゴ2ちゃんねる
08/05/26 18:51:20 xSM3vYZLO
DATをテキストだと考えるからややこしいんだ。
いっそoctet-streamとしてバイナリ扱いにでもすればいい。

443:動け動けウゴウゴ2ちゃんねる
08/05/26 23:05:42 4dBEta1n0
そもそも人間が読めるようにしてるのは誰かってことを考えればなんてことないわけで
作り直すのに時間とお金がかかるのが問題なのかなあとか思ったり
ご飯食べないで生きられて時間が無限にあれば全部解決

とか実も蓋もないことを書いてみる

444:動け動けウゴウゴ2ちゃんねる
08/05/29 00:47:21 ivI86OvK0
金も時間もあって2chの心臓部に触れられる人間というと一人しかいないな
飯のかわりにうまい棒で済むし

445:動け動けウゴウゴ2ちゃんねる
08/05/29 01:58:12 PsXz3U600
そのおっさんがどうだろうって言ってるわけでふりだしに戻る

446:動け動けウゴウゴ2ちゃんねる
08/05/29 11:44:06 0unnv0s00
いやもう結論でてるし

447:動け動けウゴウゴ2ちゃんねる
08/05/29 23:11:39 +LT7fBA+0
そうか
IDかっこいいな

448:動け動けウゴウゴ2ちゃんねる
08/05/31 11:35:12 m2txMOod0
おっさんの気が変わった時に備えて議論しておこうとか

449:あぼーん
あぼーん
あぼーん

450:kita159028.kitanet.ne.jp
08/09/10 19:41:26 3SVxHFXR0
てす

451:kita159028.kitanet.ne.jp テス
08/09/10 19:47:17 3SVxHFXR0
テステス

452:動け動けウゴウゴ2ちゃんねる
08/09/12 06:49:48 Yi4KG57V0
tes

453:,,・´∀`・,,)っ-○◎●
08/09/23 16:11:48 YDhzyxaB0
>>312
俺も国際標準になるんだぜ?

454:動け動けウゴウゴ2ちゃんねる
08/09/25 12:45:42 3T+dkcPm0
read.cgiをいじってみるよスレッド
スレリンク(operate板)

455:動け動けウゴウゴ2ちゃんねる
08/11/04 19:47:09 TFZ/W06V0
sjisをブラウザでutf8に変換してread.js使えばおkじゃねの?


456:動け動けウゴウゴ2ちゃんねる
08/11/04 20:58:01 FoqwzlC20
>>455
何周遅れだw

457:動け動けウゴウゴ2ちゃんねる
08/11/05 00:22:36 X27+ADGy0
sjisをブラウザでutf8に変換とかある意味凄い発想ではある(わらい

458:動け動けウゴウゴ2ちゃんねる
09/02/11 21:18:57 qUTVryWc0 BE:689577293-PLT(18613)
DBの容量食うけどutf8でよいよ。
???????がなくなるな。

459:動け動けウゴウゴ2ちゃんねる
09/04/11 11:27:06 0wma4iid0
おっさんがまたその気にならないかなぁ

460:動け動けウゴウゴ2ちゃんねる
09/05/25 16:07:09 ZveJmHBs0
utf8にしたらrockの方もutf8にする必要あるんじゃないの?

現在のshift-jisに無い文字はhtmlで使われてる&~; で対応可能だけど
utf8になったら生を扱う事になって(ry

461:未承諾広告※ ◆TWARamEjuA
09/05/25 20:47:18 L9EDgs7/0 BE:1524672-BRZ(10072)
その方がごっつぅ都合良かったりします♪

462:動け動けウゴウゴ2ちゃんねる
09/05/30 17:31:30 WUEb7YiBP
SJISはダメ文字がうざいな。
管理人の主眼はread.jsのようだが。

専ブラの対応は、文字コード処理なんてどの言語も
関数なりライブラリなりがあるから大した手間じゃないでしょ。
と、スクリプト程度しか作れない身で思ったら、
Delphiはめんどいのか>>361


切り替えは、ある時期に旧鯖は新スレ禁止、
utf鯖に全てスレを立て直して、keyの前後で区別すればいいよ。
鯖での区別はリスト保持がめんどい>>15

463: [―{}@{}@{}-] 動け動けウゴウゴ2ちゃんねる
09/06/03 13:22:42 64ScwrmkP
>>462
Delphiは2009からネイティブUnicode、
それ以前のでも表示させるのは可能だ
いまんとこJane系はNidaはUTF8も読める

スレタイにSJIS範囲外の文字が入ると化けるけど

464:動け動けウゴウゴ2ちゃんねる
09/07/08 08:20:48 /VI8w+Vs0
dat + read.js

XML + XSLT
は、ブラウザはどっちが軽いんだろう。


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch