datをUTF8にするのはどうだろうスレッドat OPERATE
datをUTF8にするのはどうだろうスレッド - 暇つぶし2ch229:動け動けウゴウゴ2ちゃんねる
08/04/14 00:15:49 JHhdwy/60
うーむ・・・確かに変更にはかなりの手間がかかることが予想されるが・・・
今後を見据えると、sjisもそのうち廃れるかなぁ

だが問題は、utf8に変えて5年ぐらいたった後にUnicodeの次の規格とかが現れはしないか、ということだ

230:動け動けウゴウゴ2ちゃんねる
08/04/14 00:16:40 +XpIpRG20
そのまえに2ちゃんが・・・w

231:root▲▲ ★
08/04/14 00:18:03 0 BE:4377986-DIA(100256)
>>229
UTF-8は単なる「エンコーディング方式」であって、
Unicodeの規格は常にバージョンアップしているんではないかなと。

つい先だっても、Unicode 5.1が出たばっかり。
確か1000文字以上追加されたんじゃなかったっけか。

232:動け動けウゴウゴ2ちゃんねる
08/04/14 00:18:22 ijHQs/T00
>>229
>だが問題は、utf8に変えて5年ぐらいたった後にUnicodeの次の規格とかが現れはしないか、ということだ

現れない。万が一現れたところで絶対に普及しない。


233:※
08/04/14 00:21:15 Wz1y+uBn0
>>225
私の自宅サーバはUTF-8仕様です。
携帯からもアクセスしてます。

234:root▲▲ ★
08/04/14 00:23:10 0 BE:3283294-DIA(100256)
あと直感的にUTF-8にする場合、
これに注意、ってかんじですかね。

URLリンク(www.wdic.org)

235:動け動けウゴウゴ2ちゃんねる
08/04/14 00:27:45 5Zy1uAAsO
auの場合はGWでtext/から始まるMIMEは自動的にSJISに変換するよ

236:動け動けウゴウゴ2ちゃんねる
08/04/14 01:16:03 jFRZTMlU0
これはタラコの罠だぞ

237:動け動けウゴウゴ2ちゃんねる
08/04/14 01:57:02 GnyASzU20
>>229
Unicodeが改定されたところで
符号化方式であるUTF-8には関係ない

238:ミ(゚θ゚)彡
08/04/14 02:11:31 refxpzT5O
URLリンク(portable.blog.ocn.ne.jp)


239:動け動けウゴウゴ2ちゃんねる
08/04/14 02:21:40 uJeEyM4Q0
まずは文字集合と符号化方式の違いからお勉強しようか

240:動け動けウゴウゴ2ちゃんねる
08/04/14 11:06:42 UqZJCtMn0
datをxml化するのもひとつの手だと思う。たた>>86の指摘もあるので、やるんなら

<?xml version='1.0' encoding='UTF-8'?>
<2ch:dat>
<2ch:post time="">
 <2ch:name value="" id="" be="" />
<2ch:msg>ほげ</2ch:msg>
</2ch:post>
<2ch:post time="">
 <2ch:name value="" id="" be="" />
<2ch:msg>あげ</2ch:msg>
</2ch:post>
</2ch:dat>

みたいな形でしょうね・・・。

241:動け動けウゴウゴ2ちゃんねる
08/04/14 12:24:07 uS+Zg9fZ0
今はdatにレスを追加する時
動け動けウゴウゴ2ちゃんねる<>sage<>2008/04/14(月) 02:21:40 ID:uJeEyM4Q0<> まずは文字集合と符号化方式の違いからお勉強しようか <>
を単純に追加すれば良かったが、xmlならそうはいかないんだよね
単純に追加するのとxmlを再構築するのにどれくらい処理時間/処理能力に差があるのかしらん

242:動け動けウゴウゴ2ちゃんねる
08/04/14 13:18:19 UqZJCtMn0
XML化のメリット?

・beのようなdatに書く性格の機能追加対応が容易
・クライアント側にパースレンダリングを投げられるため、当該部分のストリーム転送だけで済むので負荷が減る
・ディスク追記のタイミングを非同期に出来る(ライブスレッドは基本オンメモリで)

243:動け動けウゴウゴ2ちゃんねる
08/04/14 13:53:08 8lP9ZWi10
XML文書にすると、<>区切りよりはるかにサイズがでかくなってしまうよ(´・ω・`)。
だけど、一度に読み込んでメモリ上にDOM展開できるから、いろんな抽出や
編集処理はし易くなるね。

244:動け動けウゴウゴ2ちゃんねる
08/04/14 14:02:25 UqZJCtMn0
XML採用の最大のデメリットはメモリとディスク容量の問題(UTF8化と含めて約3倍ぐらい)ですね。
とはいえ、UTF8化だけでも512KBリミッターが確実に問題になるので、そのへんをひろゆきがどうしたいか次第でしょうね。

ちなみにUTF8化は2chが抱える2つの問題の解消も図れます。

・read.js使用が容易になる
・UTF-8系がデフォであるトラックバックの文字化け解消



245: 株価【1000】 △△ ◆cZfSunOs.U
08/04/14 16:06:00 uW55yU790
>>244 上の方で書いたことではあるんですが,少なくとも現状では
read.js 利用上 Shift JIS が問題になっているということはほとんどないですし,
逆に UTF-8 にすれば read.js の抱える問題が目に見えて改善されるということもないと思います
(read.js の抱える問題はむしろ別のところにある,と >>36).

まぁ,read.js 云々とは別の観点(国際化とか)からは検討の価値はあるかも,
というところだとは思いますが.

246:動け動けウゴウゴ2ちゃんねる
08/04/14 18:15:41 0Ly6tNjI0
新鯖追加のついでに外人用鯖、板でも作ったりする?w
新規の外人なら専ブラ使わないし。

GLの英語化とか必要だろうし、削除とか大変そうだけど。。

247:動け動けウゴウゴ2ちゃんねる
08/04/14 20:19:09 X9wUUlTC0
>>240
名前空間接頭辞の最初の文字に数字は使えません

248:動け動けウゴウゴ2ちゃんねる
08/04/14 20:24:11 groaCB79P
>>244
トラックバックってもうないだろ・・・

249:動け動けウゴウゴ2ちゃんねる
08/04/14 20:25:15 40B7tu6Z0 BE:813086093-2BP(920)


250:動け動けウゴウゴ2ちゃんねる
08/04/14 20:26:27 40B7tu6Z0
誤爆申し訳ない。
ところで誤爆ついでに質問なのだが、トリップなどは正常に今までどおり機能するの?
どこかでトリップが云々って聞いたんですがー

251:動け動けウゴウゴ2ちゃんねる
08/04/14 21:03:30 r1BeOitr0
昔のbe板みたいに
トリップの互換性はなくなるねぇ

252:未承諾広告※ ◆TWARamEjuA
08/04/14 21:06:25 xJ37E6qd0
酉は酉屋さんで♪
tu-kaもう既に改定案はまとまっていたりしちゃったりしてたんだっけ?

253:動け動けウゴウゴ2ちゃんねる
08/04/14 21:45:09 eoQYvWuF0
>>252
まとまってないというか、人大杉解除&鯖新設で急ぐ必要が無くなって
しまったので停滞中と言うか。

究極的に >>65が目的ならその内また必要性が湧いてくるのだろうけど。

254:動け動けウゴウゴ2ちゃんねる
08/04/14 21:48:17 KR/tGomC0
旧be板みたいに別のサーバに別のbbs.cgiを入れて、
テスト鯖作ればいいんじゃないですか。
snow.2ch.netみたいな実験サーバ扱いで。

実験板で最低限の動作確認したら、
VIPなりν速なり狼なりを入れればいいんだし。
それで問題なければ、サーバリフレッシュ工事でどんどん移転していくと。

255:動け動けウゴウゴ2ちゃんねる
08/04/14 22:10:16 30U21/ag0
そういや find.2ch.net ってEUCだったっけ?

256:動け動けウゴウゴ2ちゃんねる
08/04/14 22:20:53 cCOFpiLP0 BE:49593762-PLT(12346)
be.2ch.netもEUCだったような・・・?

257:動け動けウゴウゴ2ちゃんねる
08/04/14 22:31:23 KR/tGomC0
/dat/1234567890.dat ←従来のdat
/utf/1234567890.utf ←UTF-8なdat
って感じでUTF-8なdatは別フォルダに置くのもありかもね

258:動け動けウゴウゴ2ちゃんねる
08/04/14 22:50:19 aKkJUmqR0
Unicode使うと海外とかからのロボット爆撃が激しくなるなんてことないよね…?
EUC-JPやUTF-8は海外でも分かりやすい規格だけど
Shift_JISって日本のみで使われてるんだよね…?

259:動け動けウゴウゴ2ちゃんねる
08/04/14 22:50:44 eOGH3P2Y0
いっちょ鯖負荷テストの精鋭、VIPPERにテストをお願いしてみては

260:動け動けウゴウゴ2ちゃんねる
08/04/15 00:47:03 Ccobbv9t0
>>257
dat容量が単純に倍(orそれ以上)になるのはHDD容量的にきつくないか?

261:動け動けウゴウゴ2ちゃんねる
08/04/15 00:56:05 42mEP3AY0
書き込みコストも倍(最大)だぜ

262:動け動けウゴウゴ2ちゃんねる
08/04/15 01:53:14 x33BRSyR0
SJIS以外のコードにすると携帯の絵文字は全滅だよね
ってか、2ちゃんの書き込みなんて99%はSJISの文字
(正確を期すとJIS X 0201と0208の文字集合)
なんだから利用者的にはUTF-8になるメリットが少なくね?

263:動け動けウゴウゴ2ちゃんねる
08/04/15 03:48:42 ne8d6Vtf0
動機が動機ですからそういう話ではないかと

264:動け動けウゴウゴ2ちゃんねる
08/04/15 04:27:23 fw6LTgXw0
そもそも2chはぴろゆきの個人の掲示板なので、利用者のメリットとかあんまどうでもいいのです。。。

265:動け動けウゴウゴ2ちゃんねる
08/04/15 07:21:22 zruzuaAC0
>>260
書き込みがあるたびに、shift jisの.datとutf-8の.utfの両方を作るんじゃなくて、
.utfしか作らないんだけど、別フォルダにしておくと言いたかったのです。
subject.txtもutf-8版はsubject.utfにすれば、subject.txtや/datは
エンコードが変更しましたと書かれている924.datだけ置いてutfに誘導できるから。

266:stream ◆PNstream2s
08/04/15 08:27:58 owLyqy6F0
ところで、提案者の示した目的が「負荷軽減」だけど、( >>4 )
負荷軽減はUTF-8化では無理、というかむしろマイナスという結論。
それを受けて提案者はどう考えてるのか。

267:動け動けウゴウゴ2ちゃんねる
08/04/15 08:33:33 fw6LTgXw0
>>265ぬるぽど・・・とすると例えば、新しい構成のdatは
/operate/utf/1207973589.dat
とかなってて普通にutf8版datが入ってて、mod_rewriteで
RewriteRule ^/operate/dat/([0-9]+)\.dat$ /operate/dat/pleaseuseutf8.dat
とかしておいて
/operate/dat/pleaseuseutf8.dat
にはsjisで
utf8使え<>utf8使え<>utf8使え<>utf8版を使えや(゚Д゚)ゴルァ!!<>utf8版を使えや(゚Д゚)ゴルァ!!
みたいなのが一行だけ入ってる、とw

268:動け動けウゴウゴ2ちゃんねる
08/04/15 09:07:31 9wLnJxGDP
>>1
shift_jisとUTF-8の(具体的な)コスト比較をやってけれ!
って事なのかな?

269:動け動けウゴウゴ2ちゃんねる
08/04/15 10:14:58 gVyxVVdr0
2ちゃんねるブラウザ「JaneView」 Part54
スレリンク(win板:840番)
840 名前:View ◆AcQTmXmylo [sage] 投稿日:2008/04/15(火) 05:19:13 ID:zEhpNNaT
ガクブル
長い目で見たらメリットはあるだろうけど、
ネイティブでやろうとするとDoeのレス表示の部分の修正だけでもえらいことに。

表示だけでなく書き込みやNGワードなどユニコードに対応したUIの必要性を考えると・・・
ユニコードのコンポーネントはTntWareがTMS Unicodeになってシェア化されてしまってたり。
RichEdit2.0を使うのもいろいろ問題有り。

JaneViewに関しては自分がTntWareの最終版を持ってるのでどうにでもなるけど、
OJはいよいよまずいかな。。。

270:動け動けウゴウゴ2ちゃんねる
08/04/15 11:09:56 42mEP3AY0
>>262
絵文字はむしろ排除の方向で

271:動け動けウゴウゴ2ちゃんねる
08/04/15 11:10:25 gCHxp9NE0
サーバリソースのゆとりがあるなら、の話ですが、utf8>sjis変換サービスってのもありかも。

sjisで要求→1234567890.utfしかない→read.cgiは別ホストで動いている変換サービスにutf-datを投げる
→変換サービスはdatをsjisに変換→変換サービスは要求したホストに直接datを返す。

去年の後半あたりから「非同期」が一種のキーワードになっています。
これはその考えを反映させたもの。

272:動け動けウゴウゴ2ちゃんねる
08/04/15 13:48:52 JP1tmOnY0
人大杉対策としてread.cgiはc.2ch.netなしくみで動かすというのもありかも。

現在のc.2ch.netのphpスクリプトを元に
ブラウザで表示したときの見た目がread.cgiと同等なものを作って
それをpc.2ch.netみたいな名前を付けたサーバで動かして
bbs.cgiが入っている鯖のread.cgiは全部止める変わりにそっち使ってという感じで。

273:動け動けウゴウゴ2ちゃんねる
08/04/15 13:49:06 KsMxiwKa0
キャッシュ機能とかも持たせれば効率いいソリューションになりそうだね

274:動け動けウゴウゴ2ちゃんねる
08/04/15 14:37:02 v+BHHlzC0
文字コードは根っこが深いからテストサーバー作って
コツコツとつついていくのが良いと思う。
utf8.2ch.net

275:動け動けウゴウゴ2ちゃんねる
08/04/15 14:37:47 42mEP3AY0
pc.2ch.net は予約済(現在は過去ログ鯖)
非公式なら既に存在する

276:動け動けウゴウゴ2ちゃんねる
08/04/15 14:48:46 2CK6LpAs0
いきなり現行の板に適用したりしたら
たぶん専ブラの中の人が大変なことに…

277:動け動けウゴウゴ2ちゃんねる
08/04/15 15:44:48 +NkgmXUf0
単にIE6でアクセスされたら専ブラかIE7かFirefoxかSafariかOpera使えって返せば良い予感。文字コードだけが問題じゃないようだし。

278:動け動けウゴウゴ2ちゃんねる
08/04/15 16:31:43 RHiqUynv0
MEサポートしろ

279:動け動けウゴウゴ2ちゃんねる
08/04/15 17:49:51 +NkgmXUf0
>>278
PC買い換えるかUbuntu使え

280:動け動けウゴウゴ2ちゃんねる
08/04/15 18:06:43 fDN7Mt7+0
>>277
(・∀・)ソレダ!!

281:動け動けウゴウゴ2ちゃんねる
08/04/15 19:21:48 GaC/2Jby0
なんで西村はこんなことを思い付いたの?

282:未承諾広告※ ◆TWARamEjuA
08/04/15 21:08:59 6Jv1uKWo0
林檎機開発環境だと負担軽減するのかなぁ♪

283:動け動けウゴウゴ2ちゃんねる
08/04/15 21:11:26 +NkgmXUf0
林檎はDarwinだからなぁ。LinuxもLinuxだし。FreeBSD向け開発にはFreeBSDが一番な気ガス。

284:動け動けウゴウゴ2ちゃんねる
08/04/15 22:23:36 v+BHHlzC0
>>281
日本以外のマルチバイトな文字に対応したいんだろうな。

285:あらすじ
08/04/15 23:23:25 9ycp3lZE0
ひろゆき)人大杉が出ると、閲覧できる人が減って広告収入に影響がでるから困る。

ひろゆき)鯖のセッティングのことはよくわからないけど、人大杉が出るってことはサーバーリソースを使いすぎってことだろう。

ひろゆき)サーバーリソースを使わないread.jsを標準にすればよくね?

SunOs)read.jsだとIE6で挙動不審だからデフォルトで採用できないっす。

ひろゆき)なるほど。(文字コードがUTF8なら問題解決ってことだな)

///////////////////スレ立て////////////////////////////////

ひろゆき)datをUTF8にするのはどうだろう。 >>1

技術屋さん達)ざわざわ。問題点はあーだこーだ。

ひろゆき)サーバリソースを使わないモデルにできれば、人大杉が無くなるよね。(真意)>>65

SunOs)read.jsを標準で使わない理由は文字コードの問題じゃないってばよ。>>36,72

SunOs)ちなみに人大杉の時にread.jsを効かなくしてるのは、鯖屋のFOXの指示ですわ。>>73

ひろゆき)じゃあ人大杉のときはread.jsを標準で使うようにしてください。(目的達成)>>93

SunOs)了解っす。>>123

技術屋さん達)ざわざわ。UTF8にしたらあんなことやこんなことを。

ひろゆき)文字コードを変えるとしたら、サーバ移転ごととかそんな感じすかね。(適当な思いつき)>>167

技術屋さん達)ざわざわ。あーだこーだ。

root)管理人がやれって言うならやるけどさ。技術屋の威信をかけて。>>216

専ブラ作者)思いつきで仕様変えるのかよ('A`)マンドクセ>>269

286:動け動けウゴウゴ2ちゃんねる
08/04/15 23:40:23 msDMZS8WP
まとめ乙

287:動け動けウゴウゴ2ちゃんねる
08/04/15 23:41:06 FySE2P/g0
苦労してまでUTF-8にするメリットが見つかりませんが・・・
ちなみにUnicodeならJIS2004も扱えたりするんですけど、専ブラも当然対応するんですよね?

288:動け動けウゴウゴ2ちゃんねる
08/04/15 23:46:06 JfBALhQn0
ていうか専ブラの対応なんてそんなに大変じゃないだろ
なんて思う俺はOSX

289:動け動けウゴウゴ2ちゃんねる
08/04/15 23:48:53 2CK6LpAs0
しばらく実験用の鯖だけで動かしていれば
その間にユーザーがつつくから対応してくれるかもしれない。
更新が止まって久しいソフトは淘汰されそうな気がする。

290:stream ◆PNstream2s
08/04/15 23:50:04 bBUm3FbL0
スレ立て前の経緯を今知ったぞ

291:動け動けウゴウゴ2ちゃんねる
08/04/15 23:58:49 FySE2P/g0
RLO(Right-to-Left Override)の問題は大丈夫っすか?
RLO埋め込んだアドレスでjpgファイルに見せかけたexeファイルをうpするとか・・・
URLリンク(ura2ch)

URLリンク(ura2ch)
とか

292:動け動けウゴウゴ2ちゃんねる
08/04/16 00:03:38 4/Qc/rGp0
あったなぁそんなの

293:root▲▲ ★
08/04/16 01:06:57 0 BE:3648285-DIA(100256)
>>291
確かに。
>>234 と同様に Unicode の問題ですね。

294:動け動けウゴウゴ2ちゃんねる
08/04/16 01:13:00 fJ7JEU020
>>291
それ、今でも文字参照で可能。ただ、既にブラウザ・OS側で対策されてるからあまり問題ない。
98? ME? んなサポート切られたOSなんて知らね。
2000? M$神はあなたを見放した。

295:動け動けウゴウゴ2ちゃんねる
08/04/16 01:15:17 fJ7JEU020
ちなみに参考
スレリンク(software板:116番)

296:stream ◆PNstream2s
08/04/16 01:17:53 ek0XYmnn0
今の2chでも&rlo;使えるしなあ
&rlo;あなるえ使;olr&もでhc2の今

297:動け動けウゴウゴ2ちゃんねる
08/04/16 01:22:34 73yP5jMQ0
> &rlo;あなる

まで読んだ。

298:動け動けウゴウゴ2ちゃんねる
08/04/16 01:23:21 VmcCj0d9P
リンクの偽装に使えるのかしら。
いずれにしてもリンク先になにがあるかは2chが関知するところではないのだけど。

299:動け動けウゴウゴ2ちゃんねる
08/04/16 06:15:02 FX89xfze0
地デジでも採用されてる、ARIB 8単位符号(STD-B24)にしようよ。

JIS 8単位符号ベースだから、多国語対応もOK。
DRCSをつかってユーザ定義の絵文字を混ぜられる。
漢字は2 bytes、英数・平仮名・片仮名は1 byte。要エスケープシーケンス。
更にC0, C1制御符号を使って、書式も付けられる。

300:動け動けウゴウゴ2ちゃんねる
08/04/16 07:20:03 laDIPMVY0
特殊記号作品スレ5
スレリンク(aasaloon板)

301:動け動けウゴウゴ2ちゃんねる
08/04/16 13:52:37 yM0xssmr0
シリアスに考えないで、研究目的で実験サーバ立てればいいじゃない

302:動け動けウゴウゴ2ちゃんねる
08/04/16 14:38:38 j6iNdeGw0
じゃあ頼んだぞ

303:動け動けウゴウゴ2ちゃんねる
08/04/16 16:58:06 KAYqMy1f0
>>22
妙に感動した27歳フリーターの夕暮れ

304:動け動けウゴウゴ2ちゃんねる
08/04/16 21:47:05 8vcknS5q0
サーバはタダじゃない

305:動け動けウゴウゴ2ちゃんねる
08/04/16 22:49:07 2koVwYXu0
utf化でどの程度、データーの容量増えるか実測してみた
tmp7のdownload板の全datファイルをダウソして実験

元のdat  -- 38MB
UTF8化dat --- 46MB (1.2倍)


次に、gzipでこれらを圧縮してみた
UTF8化してもほぼ同じ容量になる

圧縮後の元のdat -- 12MB
圧縮後のUTF8化dat -- 13MB (1.1倍)

メジャーなブラウザーは通信時データーをgzipで圧縮できるので
通信帯域的にはUTF8であろうがなかろうが同じ程度になると思う。


次に、datをUTF8化して、更に、XML化してみた
↓例えばこのスレのdatをXML化
URLリンク(www7.axfc.net)
XML化しても圧縮するとやはり元のdatと同程度のサイズだった。

XML化後のdat -- 54MB (元のdatの1.4倍)
圧縮後のxml化dat -- 14MB (圧縮後のdatの1.2倍)


datをUTF8化して、ついでにXML化もしてはどうかな?

今read.cgiにアクセスしてくるようなビュワーを使わない「普通の」閲覧者にも
XML化datとスタイルシートを与えて閲覧者のブラウザー側で見栄えを処理してもらえば
perlとかをガリガリ動かすより負荷も減るかと思う。

閲覧者に広告をフィルタリングされやすくなっちゃうだろうけどw
逆に見てもらいたい広告を挿入しやすくもなると思う。

306:動け動けウゴウゴ2ちゃんねる
08/04/16 23:04:41 8iiGNMQL0
>>305
必要に迫られない面倒くさいことはやらない(基本)

307:動け動けウゴウゴ2ちゃんねる
08/04/16 23:29:45 PW3HC1soP
UTF-8にしてXMLにしてgzip圧縮して
それって逆に負荷を増やしているんじゃないのか

308:動け動けウゴウゴ2ちゃんねる
08/04/16 23:36:04 8vcknS5q0
XMLはコンテンツのみで
見栄えはXSLTでいいんじゃね

309:動け動けウゴウゴ2ちゃんねる
08/04/16 23:38:27 whhUnnKa0
SJISからUTF-8にしたり
datをXMLに変換するのは負荷になるだろうね。
そこで最初からUTF-8、最初からXMLであれば話は別かと。

310:動け動けウゴウゴ2ちゃんねる
08/04/17 00:00:32 v8ifVSIP0
CPUの負荷と、回線の転送料の負荷と、ファイルの容量が混ざってないか

311:動け動けウゴウゴ2ちゃんねる
08/04/17 00:51:12 IgHwqogZ0
>>308
IE6のXSLTは酷いから使うのはお勧めしないよ。

312:動け動けウゴウゴ2ちゃんねる
08/04/17 03:11:26 LfXY4knO0
そんなことより、顔文字を共通化して文字コードを割り振って、国際標準にしろよw

313:動け動けウゴウゴ2ちゃんねる
08/04/17 17:33:04 v8ifVSIP0
AA職人に欲しい記号をリストアップして貰おうか

逆半角スラッシュ?

314:動け動けウゴウゴ2ちゃんねる
08/04/17 17:55:25 M/L+gyPS0
今のままでいいよ

315:動け動けウゴウゴ2ちゃんねる
08/04/17 19:31:33 GmeyqZuk0
ユニコードってバックスラッシュと円記号って違うコード?
エンコードによって揺れる?

316:動け動けウゴウゴ2ちゃんねる
08/04/17 19:50:50 x31S+u9S0
2ch DAT落ちスレ ミラー変換機の管理人さんが0chスクリプトを
UTF-8化したものを配布(URLリンク(mirror.s151.xrea.com))していて、
サンプル(URLリンク(mirror.s151.xrea.com))もあるので、
どんな感じになるのかはここで実験できるかもしれない。

317:動け動けウゴウゴ2ちゃんねる
08/04/17 20:26:07 l0VrTek40
>>315
違うに決まってんでしょ

318:動け動けウゴウゴ2ちゃんねる
08/04/17 21:11:03 0giwvNAd0
>>316
サンプルの惨状にワロス

319:動け動けウゴウゴ2ちゃんねる
08/04/17 21:21:30 chmztg1a0
多言語なんて荒れるんじゃない?

320:動け動けウゴウゴ2ちゃんねる
08/04/17 22:33:14 x31S+u9S0
>>318
荒れてるんじゃなくて、台湾版ニコニコ動画の掲示板のログを持ってきた
って管理人さんが書いてた。
考えてみたら、URLリンク(tw.bbs.nicovideo.jp) の方を紹介すべきだったかな。
ニコニコ動画が運営しているUTF-8エンコードのサポート掲示板。

321:動け動けウゴウゴ2ちゃんねる
08/04/18 16:24:52 QnO5qrZL0
>>315
違うコードだけど、Windowsではどちらも¥に見える

322:動け動けウゴウゴ2ちゃんねる
08/04/18 18:28:59 PzY0ZFSE0
>>321
たぶんそれはアプリに問題が

323:動け動けウゴウゴ2ちゃんねる
08/04/18 19:33:59 sdKsYN1gO
暗黙の了解でバックスラッシュは特殊な仕様になってる。
詳しくは調べてね

324:動け動けウゴウゴ2ちゃんねる
08/04/19 00:04:03 hJxMwF/u0
マイクロソフトの変換法では、日本の円記号はUnicodeのバックスラッシュ(U+005C)に変換される。
そして、日本語用のフォントではバックスラッシュ(U+005C)を円記号として表示してしまうのである。
賛否両論の対応ではあったが、旧来のソフトウェアを捨て去ることなくUnicodeを利用できる現実的な方法として広く使われている。

なにこれー

325:動け動けウゴウゴ2ちゃんねる
08/04/19 04:37:18 PNa6uLXK0
Windows のフォントにパッチを当てて、円記号を無理やりバックスラッシュにしたり
してた人も居たはず…

326:動け動けウゴウゴ2ちゃんねる
08/04/19 09:40:01 E5leIjkHP
Beかなんかで、トリップの文字化けがあったよね。関係あるのかな。
ログだけじゃなく、全部ひっくるめて統一したい、とか?

327:動け動けウゴウゴ2ちゃんねる
08/04/19 10:47:11 i4TihsY/0
エンコーディングにSJISを使うかUTF-8を使うか、ということより
最終的にどんなフォントが使われるかということだな、問題は。

328:動け動けウゴウゴ2ちゃんねる
08/04/19 11:29:41 RC0Bf5GwP
フォントにな

329:動け動けウゴウゴ2ちゃんねる
08/04/19 12:05:13 WwihNvKZ0
すくなくともバックスラッシュを多用する板なんて限られてくるんだし(ム板とか)
そいつらがBSを表示できれば問題ない

330:動け動けウゴウゴ2ちゃんねる
08/04/19 12:18:26 BN4RLckC0
AA職人もバックスラッシュは欲しがるんじゃないか?
ってもMS標準のUnicodeフォントで統一されるなら支障無いと思うけど

331:動け動けウゴウゴ2ちゃんねる
08/04/19 12:25:16 Eb+X94MG0
バックスラッシュは是非欲しい

332:動け動けウゴウゴ2ちゃんねる
08/04/19 13:04:42 ZaXhrfEE0
\ ←?

333:動け動けウゴウゴ2ちゃんねる
08/04/19 13:42:54 WwihNvKZ0
>>332
\

334:動け動けウゴウゴ2ちゃんねる
08/04/19 13:43:17 boa9zPeZ0
>>328

335:動け動けウゴウゴ2ちゃんねる
08/04/19 14:29:20 PNa6uLXK0
以下スレチ
>>326
(旧 BE板と) BE プロフィール画面でのトリップ非互換問題は以下の通り。

・BE の内部処理が EUC-JP で、なおかつ本来トリップとしては不正な多バイトコード
 もしくはいわゆる半角カタカナを使用しているため。
・プロフィール画面の方では、各処理系で特殊用途として用いられる文字のエスケープ
 処理が板のトリップでの処理と違うため(「"、'、[、]、\」なんかが該当)。

すべての原因は何処かのスレで自身が発言してた、ひ(rが文字コード問題に弱いため。

336:動け動けウゴウゴ2ちゃんねる
08/04/19 14:33:40 AofXqpHw0
スレリンク(be板:225番)
5:トリップが化けないようにして

いまいち文字コード周りに弱いおいらです。。。
DBの文字コードを変えるとさらに文字化けを誘発しそうなんですよね。。

337:動け動けウゴウゴ2ちゃんねる
08/04/19 18:12:39 7NOZ3hUG0
>>328


338:動け動けウゴウゴ2ちゃんねる
08/04/19 21:00:50 pEn192nm0
UTF-8を理解していない人が
スレ参加とか。。アフォかと。。。

339:動け動けウゴウゴ2ちゃんねる
08/04/19 22:57:37 E5leIjkHP
もはや釣堀w

340:動け動けウゴウゴ2ちゃんねる
08/04/20 00:20:40 FJYFc2yt0
専ブラ作者には負担かけるわけだよねー
●で儲けさせてもらったくせにその仕打ちはどうかと

341:▲ ◆SANUKI/VII
08/04/20 00:30:15 CZ8CMSVeP BE:25368487-PLT(13132)
>>340
、、、。

342:動け動けウゴウゴ2ちゃんねる
08/04/20 00:49:13 ioURv1tiP
\(^O^)/ドンマーイ

343:動け動けウゴウゴ2ちゃんねる
08/04/20 02:52:04 6eEXFguv0
世界はUTF-8

344:動け動けウゴウゴ2ちゃんねる
08/04/20 04:29:24 2uISEUW5O
俺のサイトもSjisからUTF8にしようと思ったけど面倒だからやめた。
PHP使ってるから初めからほうしとけば良かった。

345:動け動けウゴウゴ2ちゃんねる
08/04/20 10:42:00 E+evngot0
>>340
エンコ指定なんてふつう外出しにしてるだろ。大した手間じゃないよ。

346:動け動けウゴウゴ2ちゃんねる
08/04/20 10:46:48 ioURv1tiP
讃岐は●非対応、いや未対応。
完全ボラだからなー。

347:動け動けウゴウゴ2ちゃんねる
08/04/20 11:21:20 gBO4l9OF0
>>340
>>269

348:動け動けウゴウゴ2ちゃんねる
08/04/20 11:28:21 gBO4l9OF0
340じゃなくて345だった

349:動け動けウゴウゴ2ちゃんねる
08/04/20 12:56:44 E+evngot0
つまりJaneViewの設計が糞だってことか

350:動け動けウゴウゴ2ちゃんねる
08/04/20 13:03:17 6E0oOuN20
えんこーでぃんぐだけじゃなくてゆーあいにひょうじしたりあぼーんでのしょりがふくざつになるのに
お前はアホか。

351:動け動けウゴウゴ2ちゃんねる
08/04/20 14:07:13 75H7xodgP
ID:E+evngot0
ここはあなたみたいな無知な方が来る所じゃありませんよ、と

352:動け動けウゴウゴ2ちゃんねる
08/04/20 14:09:46 AQa/Gq8O0
内部処理がSjisの専ブラの方が多いだろ

353:動け動けウゴウゴ2ちゃんねる
08/04/20 16:11:58 sNEtEpdP0
WinアプリでWin95系をサポートしてるなら内部処理Unicodeにするのは困難

354:動け動けウゴウゴ2ちゃんねる
08/04/20 16:26:03 OWZ6WVMR0
いまさら95/98/MEを使っている奴なんて…いないだろう?
いないよね?いないと言ってくれよ!

355:動け動けウゴウゴ2ちゃんねる
08/04/20 16:41:03 16hsI3LLP
ここにいる!

356:動け動けウゴウゴ2ちゃんねる
08/04/20 16:42:43 E+evngot0
つまりエンコの変更に対応できないようなソフトを作っておいて
自前のコントロールじゃないからどうとか開発環境の内部処理が
どうとかOSがどうとか言い訳がましいことを言うなと

357:動け動けウゴウゴ2ちゃんねる
08/04/20 16:45:36 siTEX6bu0
>>353
でも不可能じゃ無いし、実際95でも使えるアプリでUnicode対応してるのも
ある。

ちょっと検索すれば判る程度の話だし。

358:動け動けウゴウゴ2ちゃんねる
08/04/20 17:05:38 6E0oOuN20
不可能じゃなければ簡単なわけじゃない。

>>356
やったことがなくてわからない事までろくに知りもせずに言及するな。
>>345のような発言する時点で実際にどんな問題が出てくるか全く把握してないだろ。

359:動け動けウゴウゴ2ちゃんねる
08/04/20 17:09:44 OWZ6WVMR0
ここは2chだし「まずやってみよう!」の精神でいいんじゃないかな?
問題が起きたら後から考えると。

360:動け動けウゴウゴ2ちゃんねる
08/04/20 17:12:52 iVEweGOHP
やるんならアフィ速とかVIPとか小規模に実験してから全板にいれてくれ

361:動け動けウゴウゴ2ちゃんねる
08/04/20 17:22:48 CuEhiLzy0
2chブラウザ製造機によく使われてるDelphiがUTF(Unicode)に標準で対応してないんだ。
かちゅ、ギコナビ、ホットゾヌ、Jane系は騙し騙しの対応になるか、対応を諦めるかのいずれかになるな。

そもそもひろゆきがUTF8に変更する積極的な理由がなくなったんだから
このままでいいんじゃないのかね。

362:動け動けウゴウゴ2ちゃんねる
08/04/20 17:47:46 E+evngot0
2ch鯖がSJISに特化した処理結果を返してるからといって
クライアントがSJISを前提にした設計にしちゃっていい理由には
ならんだろ?文字コードが変更されたとき、ユーザーの手間を
最小限に抑えて最低限の表示が出来るような設計にしておかなきゃ
糞だろ?

363:動け動けウゴウゴ2ちゃんねる
08/04/20 18:19:31 a/sg/Mv90
必レスのガイドラインスレに迷い込んだのかと思った。

364:動け動けウゴウゴ2ちゃんねる
08/04/20 18:41:36 nLYdFtzu0
専用ブラウザがどうのこうの言ってるけど
おいらのJDには関係ない
ついでにいうとNavi2chでも関係ない
つまりはどうでもいいってこった。

365:動け動けウゴウゴ2ちゃんねる
08/04/20 18:53:32 SICVUDUsO
>>362
フリーソフトにどんだけスケーラビリティ求めてんだ。ww
頭悪いの?それとも常識がないの?

366:動け動けウゴウゴ2ちゃんねる
08/04/20 19:58:54 OWZ6WVMR0
2chサーバ側の仕様なんて、これまでも結構変わっているわけで、
専ブラ作者もそれに追従してきている。
(gzip圧縮とか、EUCとか、バーボン回避のウエイト挿入とか)

今回の場合、暫定回避策を作るとすればliveb1.2ch.netみたいのを
ベースに変換Proxyを用意して、未対応の専ブラはそこを経由させる
ような対応もあるだろう。

もちろん「表示不能な文字が出る」「更新が遅延する」等の制限も
あるわけで、それを回避したい作者はUTF-8の本格対応をしてくる
だろう。

ま、実験サーバで様子見ながら進めるのが良いだろうね。

367:動け動けウゴウゴ2ちゃんねる
08/04/20 20:59:57 glaB1xWs0
ていうかそもそもUTF-8にするメリットってあんの?
専ブラとかトリップとかデメリットははっきりしてるけど

368:動け動けウゴウゴ2ちゃんねる
08/04/20 22:29:35 OWZ6WVMR0
UTF-8のメリットと言うよりも、SJISのデメリットの方が大きかったり。
SJISのままだとまともに検索処理できなかったりするしなあ。

findがEUCなのもこの辺が理由だろうし。

369:動け動けウゴウゴ2ちゃんねる
08/04/20 22:33:59 AfSvaIcn0
>>352
んなこたあない

370:動け動けウゴウゴ2ちゃんねる
08/04/21 03:35:19 L/X3LHo3O
>>368
そりゃ設計が甘いだけであって文字コードの問題じゃないだろ、jk。

371:動け動けウゴウゴ2ちゃんねる
08/04/21 08:34:06 B3naUrlS0
こんなことグダグダ言ってる体質だから、お前ら童貞なんだよ

372:動け動けウゴウゴ2ちゃんねる
08/04/21 10:30:04 SsWHcakdO
ティンコねえよばーか

373:動け動けウゴウゴ2ちゃんねる
08/04/21 20:25:58 aKzPBjG80
ほうほうwそれで?




・・・・えっ?

374:動け動けウゴウゴ2ちゃんねる
08/04/21 22:25:50 fSMi00ydO
同鯖なんだから、iframeでSJISのテキストひっぱってきて、
JSで整形すればいいジャマイカ
IE6どころかそれ以前でも問題ない

Ajaxにこる必要はないですよ、と。。。

375:動け動けウゴウゴ2ちゃんねる
08/04/22 01:51:28 ANEjSamR0
UTF8にすんの?ハングルとか中国語で蹂躙されそうでこわいんですけど

376:動け動けウゴウゴ2ちゃんねる
08/04/22 06:42:01 yL4lzVkx0
>>375
バカなんだから、黙ってろバカウヨ

377:動け動けウゴウゴ2ちゃんねる
08/04/22 08:03:32 uY/iJg580
半島、大陸からはボボン行きにしちゃえばいいのだろうけど国内からの投稿はなあ

378:動け動けウゴウゴ2ちゃんねる
08/04/22 14:17:45 kM4VdlnL0
結局決まったのは「人大杉の時はread.js使ってね」だけか?

379:動け動けウゴウゴ2ちゃんねる
08/04/22 17:00:23 Cn13HtzZ0
そんでひろゆき満足してそう

380:動け動けウゴウゴ2ちゃんねる
08/04/22 17:05:15 rxRpnF6x0
じゃあもう要らないね

↓スレスト

381:▲ ◆SANUKI/VII
08/04/22 17:10:32 nZhF1lJIP BE:16308566-PLT(13132)
ひろゆきモンハンやろうぜ

382:動け動けウゴウゴ2ちゃんねる
08/04/23 04:42:43 syvdi/8X0
そもそも言語とはなんぞやという問題が云々

383:動け動けウゴウゴ2ちゃんねる
08/04/23 05:56:01 EDGasE+IP
いつかはやるべきだろうけど、「動いているモノはいじるな」でしょうか。
googlebot対策なんかやるのかな?

384:ひろゆき@どうやら管理人 ★
08/04/25 07:50:49 0 BE:170093-S★(1018222)
sports11もread.jsの設定お願いしますー。


385:動け動けウゴウゴ2ちゃんねる
08/04/25 09:56:53 deYgxNnf0
ぴろりん発見

386: 株価【830】 △△ ◆cZfSunOs.U
08/04/25 10:42:26 3m/nTh190
>>384 人大杉時に read.js に振る設定が FOX さんに override されて
「秘密の花園」に飛ばされてしまうのですが,とりあえずやっておきます.

# 再度 override されるようなら,↓あたりの話を FOX さんと詰める必要があるのではないかと......
# スレリンク(operate板:15-番)n

387:動け動けウゴウゴ2ちゃんねる
08/04/25 13:20:09 g1Y2XeLi0
ぴろり菌発見w

388:あぼーん
あぼーん
あぼーん

389:動け動けウゴウゴ2ちゃんねる
08/05/05 17:25:01 afyb9tX10
(´・ω・`)このスレ終わっちゃったの?

390:動け動けウゴウゴ2ちゃんねる
08/05/05 17:58:44 U3TbI2+30
>>389
「俺がUTF8化してやるぜ! utf.2ch.netという名前を付けて鯖よこせ! 」
みたいなことを言う人が現れなかったので終了しました。

391:動け動けウゴウゴ2ちゃんねる
08/05/06 20:48:45 ZGvvJhjr0
うお乗り遅れた

っつっても俺がやってやるから鯖よこせと言えるだけのパワーは無いけど

392:動け動けウゴウゴ2ちゃんねる
08/05/06 21:05:24 ztX/ckgM0
実際UTF8化した場合、簡単な設定変更で表示可能なブラウザって
IE以外だと何がありますか?(IEならエンコードは自動認識だったかな)

393:動け動けウゴウゴ2ちゃんねる
08/05/06 21:19:51 u8C45HHC0
ウェブブラウザのシェア統計に名前が出るブラウザなら特に設定の変更は無いです

394:動け動けウゴウゴ2ちゃんねる
08/05/06 22:11:05 ghDM9x940
navi2ch はすぐだな


395:動け動けウゴウゴ2ちゃんねる
08/05/06 22:42:03 V+cwX45t0
>>392
っていうか、むしろその IE(6) で問題が大有りなんだが… IE7 なら割と平気。

396:動け動けウゴウゴ2ちゃんねる
08/05/07 00:26:42 8uJffkUH0
>>394
emacs自体のユニコード処理が微妙だったり無かったり

397:動け動けウゴウゴ2ちゃんねる
08/05/07 00:43:11 FVQiW6yh0
今時、問題になるようなウェブブラウザはないかと。
(ウェブブラウザが見るのはhtmlだから、もし問題ならread.cgiが
SJISなhtmlを吐くようにすればいい)
対応が大変なのはdatを自分で読んでいる専ブラ。

398:委員長 ◆/DABoneCRY
08/05/07 05:20:13 QxFtrOUb0
専用ブラウザの場合、最悪IEコンポーネントを使っているなら
そのままUTF-8で吐き出せば表示されるかな?と思いますが
独自描画だとキツいでしょうねぇ。
内部でSJISにコンバートしてから表示ってことになるかな?

SUBJECT.TXTもUTF-8になるのなら、同じ感じですね。
スレッド一覧表示のところね。
上手く表示出来ない文字とか出るんでしょうねぇ。

SJISのままで行きましょうよ……。

399:動け動けウゴウゴ2ちゃんねる
08/05/07 05:59:47 YZj/IRfH0
もういいじゃないこのままで

400:動け動けウゴウゴ2ちゃんねる
08/05/07 10:37:11 FVQiW6yh0
ご時世を考えるとむしろ内部UTF-8な専ブラもあったりするんじゃないかと
思わないでもなかったり。

ところでトリップの話が出てますけど、トリップだけはSJISに変換して
計算すればいいんでない?
あと、トリップの強度を上げる話は、キーはSJIS8バイト以内なら現トリップ、
それよりキーが長ければ次世代トリップというように、互換性をもたせたまま
拡張する手もある。

401:動け動けウゴウゴ2ちゃんねる
08/05/07 17:07:17 swK7kCX6O
今こそおいらロビーインターナショナルの復活の時

402:動け動けウゴウゴ2ちゃんねる
08/05/07 18:05:49 PHJOcw2w0
>>400
トリップの件… 多分この板の過去スレのどこかにソースがあるはずだけど(トリップ
統一スレだっけかな?)、2ちゃんねるの仕様としては、non-ASCII なキャラクタは
トリップコードしては不正なはず。

403:stream ◆PNstream2s
08/05/07 18:28:39 m32b509z0
>>188

404:動け動けウゴウゴ2ちゃんねる
08/05/11 10:29:19 3JPX5k+W0
管理人がそう言っていたとしても、
現実使ってる奴がいる以上需要はあるかと。

対応する理由が2ch側には無いのはわかってますけどね。

405:動け動けウゴウゴ2ちゃんねる
08/05/16 09:17:59 oK7aNu1R0
2NNはUTF-8なんだな

406:動け動けウゴウゴ2ちゃんねる
08/05/18 06:06:12 yWeFaP7n0
S-JISを通信の世界に出すなと言う20年以上昔の議論の結論が今頃出てきたなw わずかな期間のわずかなリソース節約の為にどれだけのパワーが削がれてきたのか、 そして、正しき状態に戻すためにどれだけのパワーを必要とされるのか、、、南無、、、

407:動け動けウゴウゴ2ちゃんねる
08/05/18 07:05:02 QBG0YZC80
正しき状態とかもうね

408:動け動けウゴウゴ2ちゃんねる
08/05/18 07:23:47 e9j/YDzI0
欠陥の多い間に合わせの文字コードだからな。

409:動け動けウゴウゴ2ちゃんねる
08/05/18 08:30:45 uwERh9TE0
>>406
20年以上前は80x40の端末しか存在しなかったから
改行して読みやすくするなどの
読み手のことなど全く考慮する必要がないということですね。

410:動け動けウゴウゴ2ちゃんねる
08/05/18 09:17:21 jVWe2BtW0
通信の世界で使えと言ってたのはISO-2022-JPなわけだが(今でも日本語メールにその名残がある)
datをISO-2022-JPにしろとでもおっしゃいますか
アホか

411:動け動けウゴウゴ2ちゃんねる
08/05/18 11:08:47 HxyQJ5j/0
>>410
名残もなにも、RFC 1468(ISO-2022-JP)は現役バリバリで obsolete されていないから、
text/plain での日本語環境 mail/netnews じゃ ISO-2022-JP しか使っちゃ駄目。

412:動け動けウゴウゴ2ちゃんねる
08/05/18 12:41:42 LZxEStfR0
mailとnetnewsではね
2chにはあまり関係のないお話

413:動け動けウゴウゴ2ちゃんねる
08/05/19 14:57:34 OHADN8NA0
そこまで言うならUTF-7でいいよ

414:動け動けウゴウゴ2ちゃんねる
08/05/19 19:36:53 CI88+YrjO
むしろUTF-18で

415:動け動けウゴウゴ2ちゃんねる
08/05/19 21:28:50 ETRrbr/x0
いっそのことUTF-9で

416:未承諾広告※ ◆TWARamEjuA
08/05/19 22:00:30 X4v1z3oV0 BE:5881469-2BP(7088)
うっとこはJST-9だよっ♪

417:動け動けウゴウゴ2ちゃんねる
08/05/19 22:56:52 ZQSwr6w90
>>413
全部実在するから始末に負えない

418:動け動けウゴウゴ2ちゃんねる
08/05/19 23:02:17 PaaKUwwi0
こんなにあるもんなのか

UTF-7
UTF-16 (後述)で表したUnicodeをBase64で変換して表す方式。
ただし、ASCIIのアルファベット範囲等については(ry

UTF-9
8ビット単位の可変長コード(1?5バイト)にエンコードする方式。
ISO-8859-1に対して一部互換である。
しかし、UTF-8が普及しつつあり、それと比べて欠(ry

UTF-18 (エイプリルフールネタだそうで)
Unicode符号位置を単一の18ビットによりエンコードする方式。
UTF-8に対するUTF-16のようなものだが、RFC公開時点のUnicodeで文字が定義されていた(ry

419:動け動けウゴウゴ2ちゃんねる
08/05/19 23:22:46 ACmPGLE70
ネタもあるから注意が必要だ
有名どころではハトとか

420:動け動けウゴウゴ2ちゃんねる
08/05/19 23:50:08 PaaKUwwi0
HTCPCP/1.0とかもなw

421:動け動けウゴウゴ2ちゃんねる
08/05/20 08:32:07 Yq4y55V5O
実用的なところでは洗濯バサミとかなw
家庭内やSOHOぐらいだと意外と使えるぞ。

422:動け動けウゴウゴ2ちゃんねる
08/05/20 15:02:44 CxBd8N6S0
> 30 名前:止まない雨は名無しさん[sage] 投稿日:2008/04/11(金) 17:52:40 ID:3n18t16j0
> 狐は「もうずっと人大杉」にした。
>   ひろゆきは三度、専ブラを使え(で書き込め)なくした。
>     それを受け、むむむさんは静かにqb5・6を停止した。

ニュース実況++ / 2ちゃん人大杉拡大 行き場を失ったユーザーの荒らし行為が各地で続発★3
スレリンク(liveplus板:30番)
 嫌な予感がしてkakikomi.txt確認したら…>‎>1ネタをネタと(ry

423:動け動けウゴウゴ2ちゃんねる
08/05/23 20:07:51 7tXSpSoi0
よし、文字コード設計からやろう

424:動け動けウゴウゴ2ちゃんねる
08/05/24 01:23:43 m9uPvIcS0
datの先頭あたりで判別できるようにすればいいんじゃないかな

Shift_JIS:[名無し]さん(bin+cue).rar<>sage<>
UTF-8:[名無し]さん(bin+cue).rar><sage<>

ってみたいに


425:動け動けウゴウゴ2ちゃんねる
08/05/24 02:10:03 zjd3Cur70
判別するだけだったら1文字か2文字でいいんじゃない?

426:動け動けウゴウゴ2ちゃんねる
08/05/24 02:32:35 m9uPvIcS0
できそうなところがないじゃない

427:動け動けウゴウゴ2ちゃんねる
08/05/24 08:52:12 oBnQpL6S0
UTF-8なDATは、BOM付きUTF-8にすればいい
先頭を見てBOMならUTF-8、さもなくばSJIS

428:動け動けウゴウゴ2ちゃんねる
08/05/24 12:23:35 d7IdQZ8a0
専ブラは差分取得するのでdatの先頭にBOMを付けても役に立たない

429:動け動けウゴウゴ2ちゃんねる
08/05/24 12:46:32 oKxq3p9z0
ファイルの途中からUTF-8に変えるのかい?

430:動け動けウゴウゴ2ちゃんねる
08/05/24 12:49:22 PCPcTJ5b0
いわゆる BOM 付き UTF-8 は問題児なので反対。RFC 3626 でも基本的に
「使用を禁止すべき」扱いだし。ていうか、HTTP header の Content-Type の
charset で十分だべ。

431:動け動けウゴウゴ2ちゃんねる
08/05/24 15:28:00 jwQb16jz0
datファイルは2ちゃんねる専用フォーマットだから自由に設計していいんじゃね?
もちろん標準バリバリでXML化でも良いけど、標準ってのも移り変わるもんだからねぇ。

432:動け動けウゴウゴ2ちゃんねる
08/05/24 15:43:50 9dlsmaAP0
XMLは無駄にサイズ食うからなぁ。コードの見通しも悪いし。
賢明な選択肢とは思えん。

433:動け動けウゴウゴ2ちゃんねる
08/05/24 15:50:33 jwQb16jz0
圧縮とセットならXMLもそれほど容量に影響しないと思う。
同じようなキーワードが並ぶのなら全部符号化されちまう。

434:動け動けウゴウゴ2ちゃんねる
08/05/25 09:38:23 nr0ZnGPL0
XML化は利点が見えない。現状の1行1レコード、<>がフィールドセパレータ、で
困らないと思う。

435:動け動けウゴウゴ2ちゃんねる
08/05/25 13:45:49 U0RJgIvu0
このスレの主旨?とはまったく異なる視点で…

・read.cgi が吐くものを XML で再定義する
・それに食わせる dat?も XML で再定義する

ってのなら、まだ分からんでもないけど > dat?の XML 化

専ブラ開発者からみたら、メリットはないわな。

436:動け動けウゴウゴ2ちゃんねる
08/05/25 14:07:56 rNTH5CZP0
これ以上専用ブラウザ作者に迷惑をかけるのはやめてやれよ

437:動け動けウゴウゴ2ちゃんねる
08/05/25 15:57:25 nr0ZnGPL0
> ・read.cgi が吐くものを XML で再定義する

read.cgiの吐くhtmlにスキーマを付けるのには全く独立した話として賛成。

438:動け動けウゴウゴ2ちゃんねる
08/05/25 19:13:36 /yE7qfVJ0
>>430
> いわゆる BOM 付き UTF-8 は問題児なので反対。RFC 3626 でも基本的に
> 「使用を禁止すべき」扱いだし。

RFC 3626 Optimized Link State Routing Protocol (OLSR) って
Unicode 関係なくない?

439:動け動けウゴウゴ2ちゃんねる
08/05/25 19:23:33 foEE4xHPP
>>438
RFC 3629

440:動け動けウゴウゴ2ちゃんねる
08/05/25 19:43:12 nr0ZnGPL0
書き込みがちょん切れたorz

RFC3629的には、
datが、HTTPでやりとりされる物だと見るなら、HTTPのContent-Type
ヘッダがあるからBOMは禁止すべきということになるけど、
dat ファイル単体として見ると、エンコーディングを知る方法が
(なんらかの拡張をしない限り)ないから、BOMは禁止されるべきでない。

専ブラがローカルに持ってるdatについて、ファイル名を変えるとか、
専ブラ独自の形式にするとか、外部に情報ファイルを持つとか、
しなきゃいけなくなる。

441:動け動けウゴウゴ2ちゃんねる
08/05/26 16:51:29 ZKBghHLV0
うぁ… RFC の番号打ち間違えてたか、すまん orz

dat 単体で見たときは云々、ってのはあくまでローカルな環境、ユーザエンドで
ファイル単体として扱うときの話なんで、それは環境・アプリ依存。
2ch の素の dat のファイルがどうあろうと、それをユーザ・アプリがどう扱おうと
好きにすればいい。

意味的には、したらばの EUC-JP な dat を Winodws な専ブラがローカルに
Shift_JIS(CP932) で保存するようなもの。

442:動け動けウゴウゴ2ちゃんねる
08/05/26 18:51:20 xSM3vYZLO
DATをテキストだと考えるからややこしいんだ。
いっそoctet-streamとしてバイナリ扱いにでもすればいい。

443:動け動けウゴウゴ2ちゃんねる
08/05/26 23:05:42 4dBEta1n0
そもそも人間が読めるようにしてるのは誰かってことを考えればなんてことないわけで
作り直すのに時間とお金がかかるのが問題なのかなあとか思ったり
ご飯食べないで生きられて時間が無限にあれば全部解決

とか実も蓋もないことを書いてみる

444:動け動けウゴウゴ2ちゃんねる
08/05/29 00:47:21 ivI86OvK0
金も時間もあって2chの心臓部に触れられる人間というと一人しかいないな
飯のかわりにうまい棒で済むし

445:動け動けウゴウゴ2ちゃんねる
08/05/29 01:58:12 PsXz3U600
そのおっさんがどうだろうって言ってるわけでふりだしに戻る

446:動け動けウゴウゴ2ちゃんねる
08/05/29 11:44:06 0unnv0s00
いやもう結論でてるし

447:動け動けウゴウゴ2ちゃんねる
08/05/29 23:11:39 +LT7fBA+0
そうか
IDかっこいいな

448:動け動けウゴウゴ2ちゃんねる
08/05/31 11:35:12 m2txMOod0
おっさんの気が変わった時に備えて議論しておこうとか

449:あぼーん
あぼーん
あぼーん

450:kita159028.kitanet.ne.jp
08/09/10 19:41:26 3SVxHFXR0
てす

451:kita159028.kitanet.ne.jp テス
08/09/10 19:47:17 3SVxHFXR0
テステス

452:動け動けウゴウゴ2ちゃんねる
08/09/12 06:49:48 Yi4KG57V0
tes

453:,,・´∀`・,,)っ-○◎●
08/09/23 16:11:48 YDhzyxaB0
>>312
俺も国際標準になるんだぜ?

454:動け動けウゴウゴ2ちゃんねる
08/09/25 12:45:42 3T+dkcPm0
read.cgiをいじってみるよスレッド
スレリンク(operate板)

455:動け動けウゴウゴ2ちゃんねる
08/11/04 19:47:09 TFZ/W06V0
sjisをブラウザでutf8に変換してread.js使えばおkじゃねの?


456:動け動けウゴウゴ2ちゃんねる
08/11/04 20:58:01 FoqwzlC20
>>455
何周遅れだw

457:動け動けウゴウゴ2ちゃんねる
08/11/05 00:22:36 X27+ADGy0
sjisをブラウザでutf8に変換とかある意味凄い発想ではある(わらい

458:動け動けウゴウゴ2ちゃんねる
09/02/11 21:18:57 qUTVryWc0 BE:689577293-PLT(18613)
DBの容量食うけどutf8でよいよ。
???????がなくなるな。

459:動け動けウゴウゴ2ちゃんねる
09/04/11 11:27:06 0wma4iid0
おっさんがまたその気にならないかなぁ

460:動け動けウゴウゴ2ちゃんねる
09/05/25 16:07:09 ZveJmHBs0
utf8にしたらrockの方もutf8にする必要あるんじゃないの?

現在のshift-jisに無い文字はhtmlで使われてる&~; で対応可能だけど
utf8になったら生を扱う事になって(ry

461:未承諾広告※ ◆TWARamEjuA
09/05/25 20:47:18 L9EDgs7/0 BE:1524672-BRZ(10072)
その方がごっつぅ都合良かったりします♪

462:動け動けウゴウゴ2ちゃんねる
09/05/30 17:31:30 WUEb7YiBP
SJISはダメ文字がうざいな。
管理人の主眼はread.jsのようだが。

専ブラの対応は、文字コード処理なんてどの言語も
関数なりライブラリなりがあるから大した手間じゃないでしょ。
と、スクリプト程度しか作れない身で思ったら、
Delphiはめんどいのか>>361


切り替えは、ある時期に旧鯖は新スレ禁止、
utf鯖に全てスレを立て直して、keyの前後で区別すればいいよ。
鯖での区別はリスト保持がめんどい>>15

463: [―{}@{}@{}-] 動け動けウゴウゴ2ちゃんねる
09/06/03 13:22:42 64ScwrmkP
>>462
Delphiは2009からネイティブUnicode、
それ以前のでも表示させるのは可能だ
いまんとこJane系はNidaはUTF8も読める

スレタイにSJIS範囲外の文字が入ると化けるけど

464:動け動けウゴウゴ2ちゃんねる
09/07/08 08:20:48 /VI8w+Vs0
dat + read.js

XML + XSLT
は、ブラウザはどっちが軽いんだろう。


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch