datをUTF8にするのはどうだろうスレッドat OPERATE
datをUTF8にするのはどうだろうスレッド - 暇つぶし2ch300:動け動けウゴウゴ2ちゃんねる
08/04/16 07:20:03 laDIPMVY0
特殊記号作品スレ5
スレリンク(aasaloon板)

301:動け動けウゴウゴ2ちゃんねる
08/04/16 13:52:37 yM0xssmr0
シリアスに考えないで、研究目的で実験サーバ立てればいいじゃない

302:動け動けウゴウゴ2ちゃんねる
08/04/16 14:38:38 j6iNdeGw0
じゃあ頼んだぞ

303:動け動けウゴウゴ2ちゃんねる
08/04/16 16:58:06 KAYqMy1f0
>>22
妙に感動した27歳フリーターの夕暮れ

304:動け動けウゴウゴ2ちゃんねる
08/04/16 21:47:05 8vcknS5q0
サーバはタダじゃない

305:動け動けウゴウゴ2ちゃんねる
08/04/16 22:49:07 2koVwYXu0
utf化でどの程度、データーの容量増えるか実測してみた
tmp7のdownload板の全datファイルをダウソして実験

元のdat  -- 38MB
UTF8化dat --- 46MB (1.2倍)


次に、gzipでこれらを圧縮してみた
UTF8化してもほぼ同じ容量になる

圧縮後の元のdat -- 12MB
圧縮後のUTF8化dat -- 13MB (1.1倍)

メジャーなブラウザーは通信時データーをgzipで圧縮できるので
通信帯域的にはUTF8であろうがなかろうが同じ程度になると思う。


次に、datをUTF8化して、更に、XML化してみた
↓例えばこのスレのdatをXML化
URLリンク(www7.axfc.net)
XML化しても圧縮するとやはり元のdatと同程度のサイズだった。

XML化後のdat -- 54MB (元のdatの1.4倍)
圧縮後のxml化dat -- 14MB (圧縮後のdatの1.2倍)


datをUTF8化して、ついでにXML化もしてはどうかな?

今read.cgiにアクセスしてくるようなビュワーを使わない「普通の」閲覧者にも
XML化datとスタイルシートを与えて閲覧者のブラウザー側で見栄えを処理してもらえば
perlとかをガリガリ動かすより負荷も減るかと思う。

閲覧者に広告をフィルタリングされやすくなっちゃうだろうけどw
逆に見てもらいたい広告を挿入しやすくもなると思う。

306:動け動けウゴウゴ2ちゃんねる
08/04/16 23:04:41 8iiGNMQL0
>>305
必要に迫られない面倒くさいことはやらない(基本)

307:動け動けウゴウゴ2ちゃんねる
08/04/16 23:29:45 PW3HC1soP
UTF-8にしてXMLにしてgzip圧縮して
それって逆に負荷を増やしているんじゃないのか

308:動け動けウゴウゴ2ちゃんねる
08/04/16 23:36:04 8vcknS5q0
XMLはコンテンツのみで
見栄えはXSLTでいいんじゃね

309:動け動けウゴウゴ2ちゃんねる
08/04/16 23:38:27 whhUnnKa0
SJISからUTF-8にしたり
datをXMLに変換するのは負荷になるだろうね。
そこで最初からUTF-8、最初からXMLであれば話は別かと。

310:動け動けウゴウゴ2ちゃんねる
08/04/17 00:00:32 v8ifVSIP0
CPUの負荷と、回線の転送料の負荷と、ファイルの容量が混ざってないか

311:動け動けウゴウゴ2ちゃんねる
08/04/17 00:51:12 IgHwqogZ0
>>308
IE6のXSLTは酷いから使うのはお勧めしないよ。

312:動け動けウゴウゴ2ちゃんねる
08/04/17 03:11:26 LfXY4knO0
そんなことより、顔文字を共通化して文字コードを割り振って、国際標準にしろよw

313:動け動けウゴウゴ2ちゃんねる
08/04/17 17:33:04 v8ifVSIP0
AA職人に欲しい記号をリストアップして貰おうか

逆半角スラッシュ?

314:動け動けウゴウゴ2ちゃんねる
08/04/17 17:55:25 M/L+gyPS0
今のままでいいよ

315:動け動けウゴウゴ2ちゃんねる
08/04/17 19:31:33 GmeyqZuk0
ユニコードってバックスラッシュと円記号って違うコード?
エンコードによって揺れる?

316:動け動けウゴウゴ2ちゃんねる
08/04/17 19:50:50 x31S+u9S0
2ch DAT落ちスレ ミラー変換機の管理人さんが0chスクリプトを
UTF-8化したものを配布(URLリンク(mirror.s151.xrea.com))していて、
サンプル(URLリンク(mirror.s151.xrea.com))もあるので、
どんな感じになるのかはここで実験できるかもしれない。

317:動け動けウゴウゴ2ちゃんねる
08/04/17 20:26:07 l0VrTek40
>>315
違うに決まってんでしょ

318:動け動けウゴウゴ2ちゃんねる
08/04/17 21:11:03 0giwvNAd0
>>316
サンプルの惨状にワロス

319:動け動けウゴウゴ2ちゃんねる
08/04/17 21:21:30 chmztg1a0
多言語なんて荒れるんじゃない?

320:動け動けウゴウゴ2ちゃんねる
08/04/17 22:33:14 x31S+u9S0
>>318
荒れてるんじゃなくて、台湾版ニコニコ動画の掲示板のログを持ってきた
って管理人さんが書いてた。
考えてみたら、URLリンク(tw.bbs.nicovideo.jp) の方を紹介すべきだったかな。
ニコニコ動画が運営しているUTF-8エンコードのサポート掲示板。

321:動け動けウゴウゴ2ちゃんねる
08/04/18 16:24:52 QnO5qrZL0
>>315
違うコードだけど、Windowsではどちらも¥に見える

322:動け動けウゴウゴ2ちゃんねる
08/04/18 18:28:59 PzY0ZFSE0
>>321
たぶんそれはアプリに問題が

323:動け動けウゴウゴ2ちゃんねる
08/04/18 19:33:59 sdKsYN1gO
暗黙の了解でバックスラッシュは特殊な仕様になってる。
詳しくは調べてね

324:動け動けウゴウゴ2ちゃんねる
08/04/19 00:04:03 hJxMwF/u0
マイクロソフトの変換法では、日本の円記号はUnicodeのバックスラッシュ(U+005C)に変換される。
そして、日本語用のフォントではバックスラッシュ(U+005C)を円記号として表示してしまうのである。
賛否両論の対応ではあったが、旧来のソフトウェアを捨て去ることなくUnicodeを利用できる現実的な方法として広く使われている。

なにこれー

325:動け動けウゴウゴ2ちゃんねる
08/04/19 04:37:18 PNa6uLXK0
Windows のフォントにパッチを当てて、円記号を無理やりバックスラッシュにしたり
してた人も居たはず…

326:動け動けウゴウゴ2ちゃんねる
08/04/19 09:40:01 E5leIjkHP
Beかなんかで、トリップの文字化けがあったよね。関係あるのかな。
ログだけじゃなく、全部ひっくるめて統一したい、とか?

327:動け動けウゴウゴ2ちゃんねる
08/04/19 10:47:11 i4TihsY/0
エンコーディングにSJISを使うかUTF-8を使うか、ということより
最終的にどんなフォントが使われるかということだな、問題は。

328:動け動けウゴウゴ2ちゃんねる
08/04/19 11:29:41 RC0Bf5GwP
フォントにな

329:動け動けウゴウゴ2ちゃんねる
08/04/19 12:05:13 WwihNvKZ0
すくなくともバックスラッシュを多用する板なんて限られてくるんだし(ム板とか)
そいつらがBSを表示できれば問題ない

330:動け動けウゴウゴ2ちゃんねる
08/04/19 12:18:26 BN4RLckC0
AA職人もバックスラッシュは欲しがるんじゃないか?
ってもMS標準のUnicodeフォントで統一されるなら支障無いと思うけど

331:動け動けウゴウゴ2ちゃんねる
08/04/19 12:25:16 Eb+X94MG0
バックスラッシュは是非欲しい

332:動け動けウゴウゴ2ちゃんねる
08/04/19 13:04:42 ZaXhrfEE0
\ ←?

333:動け動けウゴウゴ2ちゃんねる
08/04/19 13:42:54 WwihNvKZ0
>>332
\

334:動け動けウゴウゴ2ちゃんねる
08/04/19 13:43:17 boa9zPeZ0
>>328

335:動け動けウゴウゴ2ちゃんねる
08/04/19 14:29:20 PNa6uLXK0
以下スレチ
>>326
(旧 BE板と) BE プロフィール画面でのトリップ非互換問題は以下の通り。

・BE の内部処理が EUC-JP で、なおかつ本来トリップとしては不正な多バイトコード
 もしくはいわゆる半角カタカナを使用しているため。
・プロフィール画面の方では、各処理系で特殊用途として用いられる文字のエスケープ
 処理が板のトリップでの処理と違うため(「"、'、[、]、\」なんかが該当)。

すべての原因は何処かのスレで自身が発言してた、ひ(rが文字コード問題に弱いため。

336:動け動けウゴウゴ2ちゃんねる
08/04/19 14:33:40 AofXqpHw0
スレリンク(be板:225番)
5:トリップが化けないようにして

いまいち文字コード周りに弱いおいらです。。。
DBの文字コードを変えるとさらに文字化けを誘発しそうなんですよね。。

337:動け動けウゴウゴ2ちゃんねる
08/04/19 18:12:39 7NOZ3hUG0
>>328


338:動け動けウゴウゴ2ちゃんねる
08/04/19 21:00:50 pEn192nm0
UTF-8を理解していない人が
スレ参加とか。。アフォかと。。。

339:動け動けウゴウゴ2ちゃんねる
08/04/19 22:57:37 E5leIjkHP
もはや釣堀w

340:動け動けウゴウゴ2ちゃんねる
08/04/20 00:20:40 FJYFc2yt0
専ブラ作者には負担かけるわけだよねー
●で儲けさせてもらったくせにその仕打ちはどうかと

341:▲ ◆SANUKI/VII
08/04/20 00:30:15 CZ8CMSVeP BE:25368487-PLT(13132)
>>340
、、、。

342:動け動けウゴウゴ2ちゃんねる
08/04/20 00:49:13 ioURv1tiP
\(^O^)/ドンマーイ

343:動け動けウゴウゴ2ちゃんねる
08/04/20 02:52:04 6eEXFguv0
世界はUTF-8

344:動け動けウゴウゴ2ちゃんねる
08/04/20 04:29:24 2uISEUW5O
俺のサイトもSjisからUTF8にしようと思ったけど面倒だからやめた。
PHP使ってるから初めからほうしとけば良かった。

345:動け動けウゴウゴ2ちゃんねる
08/04/20 10:42:00 E+evngot0
>>340
エンコ指定なんてふつう外出しにしてるだろ。大した手間じゃないよ。

346:動け動けウゴウゴ2ちゃんねる
08/04/20 10:46:48 ioURv1tiP
讃岐は●非対応、いや未対応。
完全ボラだからなー。

347:動け動けウゴウゴ2ちゃんねる
08/04/20 11:21:20 gBO4l9OF0
>>340
>>269

348:動け動けウゴウゴ2ちゃんねる
08/04/20 11:28:21 gBO4l9OF0
340じゃなくて345だった

349:動け動けウゴウゴ2ちゃんねる
08/04/20 12:56:44 E+evngot0
つまりJaneViewの設計が糞だってことか

350:動け動けウゴウゴ2ちゃんねる
08/04/20 13:03:17 6E0oOuN20
えんこーでぃんぐだけじゃなくてゆーあいにひょうじしたりあぼーんでのしょりがふくざつになるのに
お前はアホか。

351:動け動けウゴウゴ2ちゃんねる
08/04/20 14:07:13 75H7xodgP
ID:E+evngot0
ここはあなたみたいな無知な方が来る所じゃありませんよ、と

352:動け動けウゴウゴ2ちゃんねる
08/04/20 14:09:46 AQa/Gq8O0
内部処理がSjisの専ブラの方が多いだろ

353:動け動けウゴウゴ2ちゃんねる
08/04/20 16:11:58 sNEtEpdP0
WinアプリでWin95系をサポートしてるなら内部処理Unicodeにするのは困難

354:動け動けウゴウゴ2ちゃんねる
08/04/20 16:26:03 OWZ6WVMR0
いまさら95/98/MEを使っている奴なんて…いないだろう?
いないよね?いないと言ってくれよ!

355:動け動けウゴウゴ2ちゃんねる
08/04/20 16:41:03 16hsI3LLP
ここにいる!

356:動け動けウゴウゴ2ちゃんねる
08/04/20 16:42:43 E+evngot0
つまりエンコの変更に対応できないようなソフトを作っておいて
自前のコントロールじゃないからどうとか開発環境の内部処理が
どうとかOSがどうとか言い訳がましいことを言うなと

357:動け動けウゴウゴ2ちゃんねる
08/04/20 16:45:36 siTEX6bu0
>>353
でも不可能じゃ無いし、実際95でも使えるアプリでUnicode対応してるのも
ある。

ちょっと検索すれば判る程度の話だし。

358:動け動けウゴウゴ2ちゃんねる
08/04/20 17:05:38 6E0oOuN20
不可能じゃなければ簡単なわけじゃない。

>>356
やったことがなくてわからない事までろくに知りもせずに言及するな。
>>345のような発言する時点で実際にどんな問題が出てくるか全く把握してないだろ。

359:動け動けウゴウゴ2ちゃんねる
08/04/20 17:09:44 OWZ6WVMR0
ここは2chだし「まずやってみよう!」の精神でいいんじゃないかな?
問題が起きたら後から考えると。

360:動け動けウゴウゴ2ちゃんねる
08/04/20 17:12:52 iVEweGOHP
やるんならアフィ速とかVIPとか小規模に実験してから全板にいれてくれ

361:動け動けウゴウゴ2ちゃんねる
08/04/20 17:22:48 CuEhiLzy0
2chブラウザ製造機によく使われてるDelphiがUTF(Unicode)に標準で対応してないんだ。
かちゅ、ギコナビ、ホットゾヌ、Jane系は騙し騙しの対応になるか、対応を諦めるかのいずれかになるな。

そもそもひろゆきがUTF8に変更する積極的な理由がなくなったんだから
このままでいいんじゃないのかね。

362:動け動けウゴウゴ2ちゃんねる
08/04/20 17:47:46 E+evngot0
2ch鯖がSJISに特化した処理結果を返してるからといって
クライアントがSJISを前提にした設計にしちゃっていい理由には
ならんだろ?文字コードが変更されたとき、ユーザーの手間を
最小限に抑えて最低限の表示が出来るような設計にしておかなきゃ
糞だろ?

363:動け動けウゴウゴ2ちゃんねる
08/04/20 18:19:31 a/sg/Mv90
必レスのガイドラインスレに迷い込んだのかと思った。

364:動け動けウゴウゴ2ちゃんねる
08/04/20 18:41:36 nLYdFtzu0
専用ブラウザがどうのこうの言ってるけど
おいらのJDには関係ない
ついでにいうとNavi2chでも関係ない
つまりはどうでもいいってこった。

365:動け動けウゴウゴ2ちゃんねる
08/04/20 18:53:32 SICVUDUsO
>>362
フリーソフトにどんだけスケーラビリティ求めてんだ。ww
頭悪いの?それとも常識がないの?

366:動け動けウゴウゴ2ちゃんねる
08/04/20 19:58:54 OWZ6WVMR0
2chサーバ側の仕様なんて、これまでも結構変わっているわけで、
専ブラ作者もそれに追従してきている。
(gzip圧縮とか、EUCとか、バーボン回避のウエイト挿入とか)

今回の場合、暫定回避策を作るとすればliveb1.2ch.netみたいのを
ベースに変換Proxyを用意して、未対応の専ブラはそこを経由させる
ような対応もあるだろう。

もちろん「表示不能な文字が出る」「更新が遅延する」等の制限も
あるわけで、それを回避したい作者はUTF-8の本格対応をしてくる
だろう。

ま、実験サーバで様子見ながら進めるのが良いだろうね。

367:動け動けウゴウゴ2ちゃんねる
08/04/20 20:59:57 glaB1xWs0
ていうかそもそもUTF-8にするメリットってあんの?
専ブラとかトリップとかデメリットははっきりしてるけど

368:動け動けウゴウゴ2ちゃんねる
08/04/20 22:29:35 OWZ6WVMR0
UTF-8のメリットと言うよりも、SJISのデメリットの方が大きかったり。
SJISのままだとまともに検索処理できなかったりするしなあ。

findがEUCなのもこの辺が理由だろうし。

369:動け動けウゴウゴ2ちゃんねる
08/04/20 22:33:59 AfSvaIcn0
>>352
んなこたあない

370:動け動けウゴウゴ2ちゃんねる
08/04/21 03:35:19 L/X3LHo3O
>>368
そりゃ設計が甘いだけであって文字コードの問題じゃないだろ、jk。

371:動け動けウゴウゴ2ちゃんねる
08/04/21 08:34:06 B3naUrlS0
こんなことグダグダ言ってる体質だから、お前ら童貞なんだよ

372:動け動けウゴウゴ2ちゃんねる
08/04/21 10:30:04 SsWHcakdO
ティンコねえよばーか

373:動け動けウゴウゴ2ちゃんねる
08/04/21 20:25:58 aKzPBjG80
ほうほうwそれで?




・・・・えっ?

374:動け動けウゴウゴ2ちゃんねる
08/04/21 22:25:50 fSMi00ydO
同鯖なんだから、iframeでSJISのテキストひっぱってきて、
JSで整形すればいいジャマイカ
IE6どころかそれ以前でも問題ない

Ajaxにこる必要はないですよ、と。。。

375:動け動けウゴウゴ2ちゃんねる
08/04/22 01:51:28 ANEjSamR0
UTF8にすんの?ハングルとか中国語で蹂躙されそうでこわいんですけど

376:動け動けウゴウゴ2ちゃんねる
08/04/22 06:42:01 yL4lzVkx0
>>375
バカなんだから、黙ってろバカウヨ

377:動け動けウゴウゴ2ちゃんねる
08/04/22 08:03:32 uY/iJg580
半島、大陸からはボボン行きにしちゃえばいいのだろうけど国内からの投稿はなあ

378:動け動けウゴウゴ2ちゃんねる
08/04/22 14:17:45 kM4VdlnL0
結局決まったのは「人大杉の時はread.js使ってね」だけか?

379:動け動けウゴウゴ2ちゃんねる
08/04/22 17:00:23 Cn13HtzZ0
そんでひろゆき満足してそう

380:動け動けウゴウゴ2ちゃんねる
08/04/22 17:05:15 rxRpnF6x0
じゃあもう要らないね

↓スレスト

381:▲ ◆SANUKI/VII
08/04/22 17:10:32 nZhF1lJIP BE:16308566-PLT(13132)
ひろゆきモンハンやろうぜ

382:動け動けウゴウゴ2ちゃんねる
08/04/23 04:42:43 syvdi/8X0
そもそも言語とはなんぞやという問題が云々

383:動け動けウゴウゴ2ちゃんねる
08/04/23 05:56:01 EDGasE+IP
いつかはやるべきだろうけど、「動いているモノはいじるな」でしょうか。
googlebot対策なんかやるのかな?

384:ひろゆき@どうやら管理人 ★
08/04/25 07:50:49 0 BE:170093-S★(1018222)
sports11もread.jsの設定お願いしますー。


385:動け動けウゴウゴ2ちゃんねる
08/04/25 09:56:53 deYgxNnf0
ぴろりん発見

386: 株価【830】 △△ ◆cZfSunOs.U
08/04/25 10:42:26 3m/nTh190
>>384 人大杉時に read.js に振る設定が FOX さんに override されて
「秘密の花園」に飛ばされてしまうのですが,とりあえずやっておきます.

# 再度 override されるようなら,↓あたりの話を FOX さんと詰める必要があるのではないかと......
# スレリンク(operate板:15-番)n

387:動け動けウゴウゴ2ちゃんねる
08/04/25 13:20:09 g1Y2XeLi0
ぴろり菌発見w

388:あぼーん
あぼーん
あぼーん

389:動け動けウゴウゴ2ちゃんねる
08/05/05 17:25:01 afyb9tX10
(´・ω・`)このスレ終わっちゃったの?

390:動け動けウゴウゴ2ちゃんねる
08/05/05 17:58:44 U3TbI2+30
>>389
「俺がUTF8化してやるぜ! utf.2ch.netという名前を付けて鯖よこせ! 」
みたいなことを言う人が現れなかったので終了しました。

391:動け動けウゴウゴ2ちゃんねる
08/05/06 20:48:45 ZGvvJhjr0
うお乗り遅れた

っつっても俺がやってやるから鯖よこせと言えるだけのパワーは無いけど

392:動け動けウゴウゴ2ちゃんねる
08/05/06 21:05:24 ztX/ckgM0
実際UTF8化した場合、簡単な設定変更で表示可能なブラウザって
IE以外だと何がありますか?(IEならエンコードは自動認識だったかな)

393:動け動けウゴウゴ2ちゃんねる
08/05/06 21:19:51 u8C45HHC0
ウェブブラウザのシェア統計に名前が出るブラウザなら特に設定の変更は無いです

394:動け動けウゴウゴ2ちゃんねる
08/05/06 22:11:05 ghDM9x940
navi2ch はすぐだな


395:動け動けウゴウゴ2ちゃんねる
08/05/06 22:42:03 V+cwX45t0
>>392
っていうか、むしろその IE(6) で問題が大有りなんだが… IE7 なら割と平気。

396:動け動けウゴウゴ2ちゃんねる
08/05/07 00:26:42 8uJffkUH0
>>394
emacs自体のユニコード処理が微妙だったり無かったり

397:動け動けウゴウゴ2ちゃんねる
08/05/07 00:43:11 FVQiW6yh0
今時、問題になるようなウェブブラウザはないかと。
(ウェブブラウザが見るのはhtmlだから、もし問題ならread.cgiが
SJISなhtmlを吐くようにすればいい)
対応が大変なのはdatを自分で読んでいる専ブラ。

398:委員長 ◆/DABoneCRY
08/05/07 05:20:13 QxFtrOUb0
専用ブラウザの場合、最悪IEコンポーネントを使っているなら
そのままUTF-8で吐き出せば表示されるかな?と思いますが
独自描画だとキツいでしょうねぇ。
内部でSJISにコンバートしてから表示ってことになるかな?

SUBJECT.TXTもUTF-8になるのなら、同じ感じですね。
スレッド一覧表示のところね。
上手く表示出来ない文字とか出るんでしょうねぇ。

SJISのままで行きましょうよ……。

399:動け動けウゴウゴ2ちゃんねる
08/05/07 05:59:47 YZj/IRfH0
もういいじゃないこのままで

400:動け動けウゴウゴ2ちゃんねる
08/05/07 10:37:11 FVQiW6yh0
ご時世を考えるとむしろ内部UTF-8な専ブラもあったりするんじゃないかと
思わないでもなかったり。

ところでトリップの話が出てますけど、トリップだけはSJISに変換して
計算すればいいんでない?
あと、トリップの強度を上げる話は、キーはSJIS8バイト以内なら現トリップ、
それよりキーが長ければ次世代トリップというように、互換性をもたせたまま
拡張する手もある。

401:動け動けウゴウゴ2ちゃんねる
08/05/07 17:07:17 swK7kCX6O
今こそおいらロビーインターナショナルの復活の時

402:動け動けウゴウゴ2ちゃんねる
08/05/07 18:05:49 PHJOcw2w0
>>400
トリップの件… 多分この板の過去スレのどこかにソースがあるはずだけど(トリップ
統一スレだっけかな?)、2ちゃんねるの仕様としては、non-ASCII なキャラクタは
トリップコードしては不正なはず。

403:stream ◆PNstream2s
08/05/07 18:28:39 m32b509z0
>>188

404:動け動けウゴウゴ2ちゃんねる
08/05/11 10:29:19 3JPX5k+W0
管理人がそう言っていたとしても、
現実使ってる奴がいる以上需要はあるかと。

対応する理由が2ch側には無いのはわかってますけどね。

405:動け動けウゴウゴ2ちゃんねる
08/05/16 09:17:59 oK7aNu1R0
2NNはUTF-8なんだな

406:動け動けウゴウゴ2ちゃんねる
08/05/18 06:06:12 yWeFaP7n0
S-JISを通信の世界に出すなと言う20年以上昔の議論の結論が今頃出てきたなw わずかな期間のわずかなリソース節約の為にどれだけのパワーが削がれてきたのか、 そして、正しき状態に戻すためにどれだけのパワーを必要とされるのか、、、南無、、、

407:動け動けウゴウゴ2ちゃんねる
08/05/18 07:05:02 QBG0YZC80
正しき状態とかもうね

408:動け動けウゴウゴ2ちゃんねる
08/05/18 07:23:47 e9j/YDzI0
欠陥の多い間に合わせの文字コードだからな。

409:動け動けウゴウゴ2ちゃんねる
08/05/18 08:30:45 uwERh9TE0
>>406
20年以上前は80x40の端末しか存在しなかったから
改行して読みやすくするなどの
読み手のことなど全く考慮する必要がないということですね。

410:動け動けウゴウゴ2ちゃんねる
08/05/18 09:17:21 jVWe2BtW0
通信の世界で使えと言ってたのはISO-2022-JPなわけだが(今でも日本語メールにその名残がある)
datをISO-2022-JPにしろとでもおっしゃいますか
アホか

411:動け動けウゴウゴ2ちゃんねる
08/05/18 11:08:47 HxyQJ5j/0
>>410
名残もなにも、RFC 1468(ISO-2022-JP)は現役バリバリで obsolete されていないから、
text/plain での日本語環境 mail/netnews じゃ ISO-2022-JP しか使っちゃ駄目。

412:動け動けウゴウゴ2ちゃんねる
08/05/18 12:41:42 LZxEStfR0
mailとnetnewsではね
2chにはあまり関係のないお話

413:動け動けウゴウゴ2ちゃんねる
08/05/19 14:57:34 OHADN8NA0
そこまで言うならUTF-7でいいよ

414:動け動けウゴウゴ2ちゃんねる
08/05/19 19:36:53 CI88+YrjO
むしろUTF-18で

415:動け動けウゴウゴ2ちゃんねる
08/05/19 21:28:50 ETRrbr/x0
いっそのことUTF-9で

416:未承諾広告※ ◆TWARamEjuA
08/05/19 22:00:30 X4v1z3oV0 BE:5881469-2BP(7088)
うっとこはJST-9だよっ♪

417:動け動けウゴウゴ2ちゃんねる
08/05/19 22:56:52 ZQSwr6w90
>>413
全部実在するから始末に負えない

418:動け動けウゴウゴ2ちゃんねる
08/05/19 23:02:17 PaaKUwwi0
こんなにあるもんなのか

UTF-7
UTF-16 (後述)で表したUnicodeをBase64で変換して表す方式。
ただし、ASCIIのアルファベット範囲等については(ry

UTF-9
8ビット単位の可変長コード(1?5バイト)にエンコードする方式。
ISO-8859-1に対して一部互換である。
しかし、UTF-8が普及しつつあり、それと比べて欠(ry

UTF-18 (エイプリルフールネタだそうで)
Unicode符号位置を単一の18ビットによりエンコードする方式。
UTF-8に対するUTF-16のようなものだが、RFC公開時点のUnicodeで文字が定義されていた(ry

419:動け動けウゴウゴ2ちゃんねる
08/05/19 23:22:46 ACmPGLE70
ネタもあるから注意が必要だ
有名どころではハトとか

420:動け動けウゴウゴ2ちゃんねる
08/05/19 23:50:08 PaaKUwwi0
HTCPCP/1.0とかもなw

421:動け動けウゴウゴ2ちゃんねる
08/05/20 08:32:07 Yq4y55V5O
実用的なところでは洗濯バサミとかなw
家庭内やSOHOぐらいだと意外と使えるぞ。

422:動け動けウゴウゴ2ちゃんねる
08/05/20 15:02:44 CxBd8N6S0
> 30 名前:止まない雨は名無しさん[sage] 投稿日:2008/04/11(金) 17:52:40 ID:3n18t16j0
> 狐は「もうずっと人大杉」にした。
>   ひろゆきは三度、専ブラを使え(で書き込め)なくした。
>     それを受け、むむむさんは静かにqb5・6を停止した。

ニュース実況++ / 2ちゃん人大杉拡大 行き場を失ったユーザーの荒らし行為が各地で続発★3
スレリンク(liveplus板:30番)
 嫌な予感がしてkakikomi.txt確認したら…>‎>1ネタをネタと(ry

423:動け動けウゴウゴ2ちゃんねる
08/05/23 20:07:51 7tXSpSoi0
よし、文字コード設計からやろう

424:動け動けウゴウゴ2ちゃんねる
08/05/24 01:23:43 m9uPvIcS0
datの先頭あたりで判別できるようにすればいいんじゃないかな

Shift_JIS:[名無し]さん(bin+cue).rar<>sage<>
UTF-8:[名無し]さん(bin+cue).rar><sage<>

ってみたいに


425:動け動けウゴウゴ2ちゃんねる
08/05/24 02:10:03 zjd3Cur70
判別するだけだったら1文字か2文字でいいんじゃない?

426:動け動けウゴウゴ2ちゃんねる
08/05/24 02:32:35 m9uPvIcS0
できそうなところがないじゃない

427:動け動けウゴウゴ2ちゃんねる
08/05/24 08:52:12 oBnQpL6S0
UTF-8なDATは、BOM付きUTF-8にすればいい
先頭を見てBOMならUTF-8、さもなくばSJIS

428:動け動けウゴウゴ2ちゃんねる
08/05/24 12:23:35 d7IdQZ8a0
専ブラは差分取得するのでdatの先頭にBOMを付けても役に立たない

429:動け動けウゴウゴ2ちゃんねる
08/05/24 12:46:32 oKxq3p9z0
ファイルの途中からUTF-8に変えるのかい?

430:動け動けウゴウゴ2ちゃんねる
08/05/24 12:49:22 PCPcTJ5b0
いわゆる BOM 付き UTF-8 は問題児なので反対。RFC 3626 でも基本的に
「使用を禁止すべき」扱いだし。ていうか、HTTP header の Content-Type の
charset で十分だべ。

431:動け動けウゴウゴ2ちゃんねる
08/05/24 15:28:00 jwQb16jz0
datファイルは2ちゃんねる専用フォーマットだから自由に設計していいんじゃね?
もちろん標準バリバリでXML化でも良いけど、標準ってのも移り変わるもんだからねぇ。

432:動け動けウゴウゴ2ちゃんねる
08/05/24 15:43:50 9dlsmaAP0
XMLは無駄にサイズ食うからなぁ。コードの見通しも悪いし。
賢明な選択肢とは思えん。

433:動け動けウゴウゴ2ちゃんねる
08/05/24 15:50:33 jwQb16jz0
圧縮とセットならXMLもそれほど容量に影響しないと思う。
同じようなキーワードが並ぶのなら全部符号化されちまう。

434:動け動けウゴウゴ2ちゃんねる
08/05/25 09:38:23 nr0ZnGPL0
XML化は利点が見えない。現状の1行1レコード、<>がフィールドセパレータ、で
困らないと思う。

435:動け動けウゴウゴ2ちゃんねる
08/05/25 13:45:49 U0RJgIvu0
このスレの主旨?とはまったく異なる視点で…

・read.cgi が吐くものを XML で再定義する
・それに食わせる dat?も XML で再定義する

ってのなら、まだ分からんでもないけど > dat?の XML 化

専ブラ開発者からみたら、メリットはないわな。

436:動け動けウゴウゴ2ちゃんねる
08/05/25 14:07:56 rNTH5CZP0
これ以上専用ブラウザ作者に迷惑をかけるのはやめてやれよ

437:動け動けウゴウゴ2ちゃんねる
08/05/25 15:57:25 nr0ZnGPL0
> ・read.cgi が吐くものを XML で再定義する

read.cgiの吐くhtmlにスキーマを付けるのには全く独立した話として賛成。

438:動け動けウゴウゴ2ちゃんねる
08/05/25 19:13:36 /yE7qfVJ0
>>430
> いわゆる BOM 付き UTF-8 は問題児なので反対。RFC 3626 でも基本的に
> 「使用を禁止すべき」扱いだし。

RFC 3626 Optimized Link State Routing Protocol (OLSR) って
Unicode 関係なくない?

439:動け動けウゴウゴ2ちゃんねる
08/05/25 19:23:33 foEE4xHPP
>>438
RFC 3629

440:動け動けウゴウゴ2ちゃんねる
08/05/25 19:43:12 nr0ZnGPL0
書き込みがちょん切れたorz

RFC3629的には、
datが、HTTPでやりとりされる物だと見るなら、HTTPのContent-Type
ヘッダがあるからBOMは禁止すべきということになるけど、
dat ファイル単体として見ると、エンコーディングを知る方法が
(なんらかの拡張をしない限り)ないから、BOMは禁止されるべきでない。

専ブラがローカルに持ってるdatについて、ファイル名を変えるとか、
専ブラ独自の形式にするとか、外部に情報ファイルを持つとか、
しなきゃいけなくなる。

441:動け動けウゴウゴ2ちゃんねる
08/05/26 16:51:29 ZKBghHLV0
うぁ… RFC の番号打ち間違えてたか、すまん orz

dat 単体で見たときは云々、ってのはあくまでローカルな環境、ユーザエンドで
ファイル単体として扱うときの話なんで、それは環境・アプリ依存。
2ch の素の dat のファイルがどうあろうと、それをユーザ・アプリがどう扱おうと
好きにすればいい。

意味的には、したらばの EUC-JP な dat を Winodws な専ブラがローカルに
Shift_JIS(CP932) で保存するようなもの。

442:動け動けウゴウゴ2ちゃんねる
08/05/26 18:51:20 xSM3vYZLO
DATをテキストだと考えるからややこしいんだ。
いっそoctet-streamとしてバイナリ扱いにでもすればいい。

443:動け動けウゴウゴ2ちゃんねる
08/05/26 23:05:42 4dBEta1n0
そもそも人間が読めるようにしてるのは誰かってことを考えればなんてことないわけで
作り直すのに時間とお金がかかるのが問題なのかなあとか思ったり
ご飯食べないで生きられて時間が無限にあれば全部解決

とか実も蓋もないことを書いてみる

444:動け動けウゴウゴ2ちゃんねる
08/05/29 00:47:21 ivI86OvK0
金も時間もあって2chの心臓部に触れられる人間というと一人しかいないな
飯のかわりにうまい棒で済むし

445:動け動けウゴウゴ2ちゃんねる
08/05/29 01:58:12 PsXz3U600
そのおっさんがどうだろうって言ってるわけでふりだしに戻る

446:動け動けウゴウゴ2ちゃんねる
08/05/29 11:44:06 0unnv0s00
いやもう結論でてるし

447:動け動けウゴウゴ2ちゃんねる
08/05/29 23:11:39 +LT7fBA+0
そうか
IDかっこいいな

448:動け動けウゴウゴ2ちゃんねる
08/05/31 11:35:12 m2txMOod0
おっさんの気が変わった時に備えて議論しておこうとか

449:あぼーん
あぼーん
あぼーん

450:kita159028.kitanet.ne.jp
08/09/10 19:41:26 3SVxHFXR0
てす

451:kita159028.kitanet.ne.jp テス
08/09/10 19:47:17 3SVxHFXR0
テステス

452:動け動けウゴウゴ2ちゃんねる
08/09/12 06:49:48 Yi4KG57V0
tes

453:,,・´∀`・,,)っ-○◎●
08/09/23 16:11:48 YDhzyxaB0
>>312
俺も国際標準になるんだぜ?

454:動け動けウゴウゴ2ちゃんねる
08/09/25 12:45:42 3T+dkcPm0
read.cgiをいじってみるよスレッド
スレリンク(operate板)

455:動け動けウゴウゴ2ちゃんねる
08/11/04 19:47:09 TFZ/W06V0
sjisをブラウザでutf8に変換してread.js使えばおkじゃねの?


456:動け動けウゴウゴ2ちゃんねる
08/11/04 20:58:01 FoqwzlC20
>>455
何周遅れだw

457:動け動けウゴウゴ2ちゃんねる
08/11/05 00:22:36 X27+ADGy0
sjisをブラウザでutf8に変換とかある意味凄い発想ではある(わらい

458:動け動けウゴウゴ2ちゃんねる
09/02/11 21:18:57 qUTVryWc0 BE:689577293-PLT(18613)
DBの容量食うけどutf8でよいよ。
???????がなくなるな。

459:動け動けウゴウゴ2ちゃんねる
09/04/11 11:27:06 0wma4iid0
おっさんがまたその気にならないかなぁ

460:動け動けウゴウゴ2ちゃんねる
09/05/25 16:07:09 ZveJmHBs0
utf8にしたらrockの方もutf8にする必要あるんじゃないの?

現在のshift-jisに無い文字はhtmlで使われてる&~; で対応可能だけど
utf8になったら生を扱う事になって(ry

461:未承諾広告※ ◆TWARamEjuA
09/05/25 20:47:18 L9EDgs7/0 BE:1524672-BRZ(10072)
その方がごっつぅ都合良かったりします♪

462:動け動けウゴウゴ2ちゃんねる
09/05/30 17:31:30 WUEb7YiBP
SJISはダメ文字がうざいな。
管理人の主眼はread.jsのようだが。

専ブラの対応は、文字コード処理なんてどの言語も
関数なりライブラリなりがあるから大した手間じゃないでしょ。
と、スクリプト程度しか作れない身で思ったら、
Delphiはめんどいのか>>361


切り替えは、ある時期に旧鯖は新スレ禁止、
utf鯖に全てスレを立て直して、keyの前後で区別すればいいよ。
鯖での区別はリスト保持がめんどい>>15

463: [―{}@{}@{}-] 動け動けウゴウゴ2ちゃんねる
09/06/03 13:22:42 64ScwrmkP
>>462
Delphiは2009からネイティブUnicode、
それ以前のでも表示させるのは可能だ
いまんとこJane系はNidaはUTF8も読める

スレタイにSJIS範囲外の文字が入ると化けるけど

464:動け動けウゴウゴ2ちゃんねる
09/07/08 08:20:48 /VI8w+Vs0
dat + read.js

XML + XSLT
は、ブラウザはどっちが軽いんだろう。


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch