SJIS撲滅運動at UNIX
SJIS撲滅運動 - 暇つぶし2ch350:名無しさん@お腹いっぱい。
03/11/02 01:48.net
丸付き数字系は全て追加されました。


351:名無しさん@お腹いっぱい。
03/11/02 01:55.net
>>349-350
つーことは一部を覗いてほとんど入れられてるって事ですか。
ありがとうございました。

352:名無しさん@お腹いっぱい。
03/11/02 01:56.net
sage忘れた…すいません。

353:名無しさん@お腹いっぱい。
03/11/02 01:59.net
確か追加されてないのはひらがなとアクセント付きの発音記号だけだったと思う。


354:名無しさん@お腹いっぱい。
03/11/03 13:58.net
Unicodeでの外字の扱いってどうなってんの?
使えんの?

355:名無しさん@お腹いっぱい。
03/11/03 16:55.net
PUAでいいんじゃね?

356:名無しさん@お腹いっぱい。
03/11/03 22:55.net
>>353
ひらがなってのは、'ん'+'゛'みたいなやつのこと?

357:名無しさん@お腹いっぱい。
03/12/06 17:00.net
>>353
Unicode側の言い分では「全部入れた」ことになっているんだろうけどね。
「合成で済むだろゴルァ」って感じで。


358:名無しさん@お腹いっぱい。
03/12/08 11:28.net
結局混乱を増しただけだと思うんだけどなー。
あぁ、日本以外じゃ困らんから、テキトーな国際化には役に立っとるんか。

359:名無しさん@お腹いっぱい。
04/02/25 00:35.net
スレリンク(software板)
>>874
格納がしっかりしてれば文字コードが必ずSJISになり
どの文字コードで格納するか調べる必要も無いでしょう。

>>875
予想だろうがそれが根拠で問題だと『俺は』思う。
俺の思う理由を聞いておいてそれは無いだろう。

360:名無しさん@お腹いっぱい。
04/02/25 00:47.net
>>876
その必要が有る人のみ守ってるだけでは?
普通は日本語使わないけどね。

>>877
殆どはASCIIで書かれてるからな。ASCIIはSJISで無いぞ。
稀に見かける日本語を使った書庫ではeucを使ってる。
でもSJISを使ってるのは見たこと無いとも書いたが。

>>878
作者は仕様を守るべきなんじゃない?
それが出来ないなら作らなければ良いだけ。
仕様を制定するのが自分なら殆ど負担は無いだろう。

361:名無しさん@お腹いっぱい。
04/02/25 01:19.net
>UNIX上でも SJIS 使ったのしか見たこと無いね。
俺は無いな、少なくとも配布されてるものに関しては。

>仕様を制定したのと、UNIX版作ってる人は別人。
>同一人物でも仕様をコロコロ変えるのはどーかと思われ。
これは誤解を生んじゃったな。
lhaの事じゃなくソフトウェア作者の苦労の事を書いただけだから
その辺の事は分かってるし同意。

>仕様が無い場合という仮定の話なので文字コードは SJIS とは限らない。
格納をしっかりすれば仮定の話は何の意味も無い。



362:名無しさん@お腹いっぱい。
04/02/25 01:35.net
>それらの書庫はファイル名に関する仕様を守ってる。
日本語ファイル名を格納してる書庫の話でしょうが。
ASCIIファイル名は日本語扱うときはSJISでって仕様を満たしている訳じゃない。

>必要がある人は自力で実装すれば良い、
>という事のどこに問題があるのかサッパリわからん。
それじゃぁ自力で実装する力の無い人、そもそもそんな事考えて無い人が作った
書庫は不正書庫になってしまうじゃないか。
大抵の人はlhaにそんな仕様が有る事すら知らないだろう。
何べんも書くけど守られない仕様は仕様の機能を果たさない。
仕様がしっかり守られるならば解凍時の文字コードも気にしなくて良い。

363:名無しさん@お腹いっぱい。
04/02/25 01:38.net
>ファイル名に関する仕様が無い場合、
>UTF-8 でも SJIS でも EUC でも仕様的に問題なく「しっかり格納」できる。
lhaはSJISで格納すると言う仕様が有るんでしょ。勝手になくさないで。

364:名無しさん@お腹いっぱい。
04/02/25 01:59.net
>ファイル名に関する仕様は満たしてる。
日本語のファイル名の話をしてるんだから・・・。
関係ない話を持ち出さない。

>何べんも書くけど仕様は概ね守られてる。
>例えば、信号無視する人間が延べで 5%居た場合、信号は機能を果たしてないのか?

たとえ話は嫌いだが、、、この場合その5%は必ず事故るわけだから信号の機能を果たしてるとは言いがたい。


365:名無しさん@お腹いっぱい。
04/02/25 16:30.net
向こうで暴れてる困ったちゃんをどうにかしろよ

366:名無しさん@お腹いっぱい。
04/02/25 16:44.net
lhaの書庫はパス名にShift JISを使うって仕様だったのか。知らなかった。
どこに書いてあるんだろう。

367:名無しさん@お腹いっぱい。
04/02/25 17:57.net
>>365
ここで暴れてる困ったちゃんもどうにかしてください。

368:名無しさん@お腹いっぱい。
04/02/26 08:55.net
>>366
昔のlhaのドキュメント

369:名無しさん@お腹いっぱい。
04/02/26 09:36.net
>>368
Vectorにある吉崎氏の実行ファイルとソースのアーカイブ内には
そういう記述はみあたらなかった。
URLリンク(www.vector.co.jp)
「昔のlha」は持ってないしなぁ。

ただ、UTIL.Cにiskanji(c)というマクロがあって、それはShift JISを
想定しているっぽい。

#define iskanji(c) ((uchar)(c) >= 0x80 && (uchar)(c) <= 0x9f || \
(uchar)(c) >= 0xe0 && (uchar)(c) <= 0xfd)


370:名無しさん@お腹いっぱい。
04/02/26 11:18.net
>>369
lha for UNIXの方だったかもしれん。
だったらそんなに昔じゃないなスマソ


371:名無しさん@お腹いっぱい。
04/02/26 15:56.net
詳しくは知らんが、YosshiがSysopやってたflaboでは
過去ログ(LZHで固めた奴)にSJISファイル名使ってたような…

372:名無しさん@お腹いっぱい。
04/02/26 16:35.net
いや、当初はMS-DOSしかっていうか何も考えなくて生SJISにしたはずなんだけど、
どっかでそれを仕様として確定したと思うんだよ。
それがlha for UNIX以前か以後かがよー分からん。

373:名無しさん@お腹いっぱい。
04/02/26 16:40.net
よーわからんけどlha for UNIX以前か以後かって区分は重要なの?

374:名無しさん@お腹いっぱい。
04/02/26 16:57.net
>>372
> いや、当初はMS-DOSしかっていうか何も考えなくて生SJISにしたはずなんだけど、
だろうね。

> どっかでそれを仕様として確定したと思うんだよ。
これが、「誰が」「どこで」確定したのか情報希望。

375:名無しさん@お腹いっぱい。
04/02/26 18:46.net
よーわからんけど「誰が」はともかく「どこで」は重要なの?

376:名無しさん@お腹いっぱい。
04/02/26 23:01.net
         ☆ チン     マチクタビレタ~
                         マチクタビレタ~
        ☆ チン  〃  ∧_∧   / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
          ヽ ___\(\・∀・) <  「誰が」「どこで」確定したのか情報まだ~?
             \_/⊂ ⊂_ )   \________
           / ̄ ̄ ̄ ̄ ̄ ̄ /|
        | ̄ ̄ ̄ ̄ ̄ ̄ ̄|  |
        | .愛媛みかん.  |/

377:名無しさん@お腹いっぱい。
04/02/26 23:06.net
>>375
> よーわからんけど「誰が」はともかく「どこで」は重要なの?
必ずしも吉崎氏が策定する必要は無いんだよ。
仮に「LHA Open Group」でもいいわけだし。
そういう意味の「どこで」ってこと。

378:名無しさん@お腹いっぱい。
04/02/27 00:38.net
>>377
> 仮に「LHA Open Group」でもいいわけだし。
それは「誰が」だと思うんだが…
まぁどっちでも良いけど。

ところで「LHA Open Group」って実在する組織なん?

379:名無しさん@お腹いっぱい。
04/02/27 00:40.net
>>378
> ところで「LHA Open Group」って実在する組織なん?
いやー俺の脳内団体だよ。「誰が」だけだと「吉崎氏に決まってるだろ」と
なりかねないので書いたのだけれど、よけい混乱させちゃったみたいで
申し訳ない。

380:名無しさん@お腹いっぱい。
04/03/01 10:58.net
過去の経緯としてはShift JISが仕様だったのかもしれないが、
# 補助漢字や第三/四水準はどうなっているのだ?
それだとASCIIな人と日本語な人以外は困るから、
アーカイブ内のパス名はUTF-16で保存することにして、
システムごと、あるいはロケールごとに、iconvして展開するのがいいんじゃないの?
アーカイブ形式に形式のバージョンを持てないの?

大体、今やWindowsやMac OS Xだって、
UTF-8のパス名持てるんだから、Shift JISのままじゃ困るんじゃないの?

381:名無しさん@お腹いっぱい。
04/03/01 11:06.net
>>380
そこでなぜUTF-16。こういう場合はUTF-8だろう。

lhaは圧縮形式としてlh5, lh6, lh7などが選べたはず。
これが規定するレイヤーによっては、「lh8はUTF-8」という風にも
出来るだろうね。多分やらないだろうけど。

382:380
04/03/01 11:16.net
>>381
追記。なぜ「やらない」かというと、lhaは歴史的な経緯では小型の
システム(DOS)で使われてきたし、現在もそういう風に使われている
(マザーボードのBIOSとかね)。ここでUnicodeをサポートために巨大な
変換テーブルを持たせるのは、lhaの方向性にあわないだろう。
そういうのが必要なら、もっと富豪なアルゴリズムを持つ書庫の仕様に
含めればいいのだ。

383:名無しさん@お腹いっぱい。
04/03/02 03:34.net
>>380
> それだとASCIIな人と日本語な人以外は困るから、
日本人以外は使ってないので困らない。

> アーカイブ形式に形式のバージョンを持てないの?
持てません。

384:名無しさん@お腹いっぱい。
04/03/02 03:41.net
>>381
> これが規定するレイヤーによっては、「lh8はUTF-8」という風にも
面白いアイデアだと思うけど、
全く問題無しってわけにもいかないと思うよ。

例えば この新仕様に対応してないバージョンで、
書庫->書庫で圧縮されたファイルコピーする際に
SJIS(元書庫)->EUC(中間処理用)->SJIS(先書庫) みたいな変換
食らった場合、元書庫で UTF-8 使ってると化ける可能性がある。

385:381
04/03/02 09:04.net
おっと、382を書いたのは381だ。名前欄は間違い。

386:名無しさん@お腹いっぱい。
04/03/02 09:27.net
>>384
「規定するレイヤー」っていうのは、「lh5, lh6, lh7などが書庫の形式のレイヤーを
規定しているなら」って意味で書いた。でもどうやらファイル一つ一つの圧縮方法
にしかすぎないようだね。というわけで俺の案は没。理由は384の言うとおり。

387:( ゚Д゚)<ボクメーツ ◆uhiboKUMEQ
04/03/05 10:17.net
( ゚Д゚)<呼ばれた気がした

388:名無しさん@お腹いっぱい。
04/03/05 20:23.net
>今現役でSJISつかってるのMSくらいだし。

NTはunicodeだろ。
むしろsjisもjisもeucも無くなれ
uncode以外のコードは要らん

389:名無しさん@お腹いっぱい。
04/03/05 20:57.net
>>388はMarkus Kuhn

390:名無しさん@お腹いっぱい。
04/03/06 14:12.net
Markus キター。
アイツは頭がオカシイとしか思えん。

391:名無しさん@お腹いっぱい。
04/03/06 20:10.net
388 が欲しいのは
「うんこーど」。
Markus とベクトルは違えど頭がオカシイのです。

392:名無しさん@お腹いっぱい。
04/03/08 08:40.net
>>388
普通のプリンタの内部コードはJISだろ。そうじゃないのもあるのかな?

393:名無しさん@お腹いっぱい。
04/03/08 11:51.net
>>389
Markus KuhnとMarkus Scherer(@IBM)は別人なんだね。混同してた。
Markus Kuhnのいかれたエピソード希望。語ってください。

394:名無しさん@お腹いっぱい。
04/03/08 12:27.net
i18n@XFree86.orgで「UTF-8以外のlocaleを廃止してしまえ。」とか言ってた。
この人の辞書にはsoft landingという言葉はないと思われ。


395:名無しさん@お腹いっぱい。
04/03/08 12:33.net
>>394
> i18n@XFree86.orgで「UTF-8以外のlocaleを廃止してしまえ。」とか言ってた。
> この人の辞書にはsoft landingという言葉はないと思われ。

なんだその程度か。いいんでない? 俺もそう思ってるし。
「漢字なんて絵文字。使ってる奴らはバカ」くらい言ってるのかと思ってた。

396:名無しさん@お腹いっぱい。
04/03/08 13:52.net
> なんだその程度か。いいんでない? 俺もそう思ってるし。

今は随分状況が改善されてるけど、3年くらい前にこんなこと言われたら
正直たまらんですよ。まあそれはそれとしてこんなのもあった。

URLリンク(slashdot.jp)
URLリンク(slashdot.jp)


397:名無しさん@お腹いっぱい。
04/03/08 14:00.net
返す返すも中国がうらやましい

398:名無しさん@お腹いっぱい。
04/03/08 14:09.net
>>396
昔の i18n-ML 読めないんだな。
特に 4.0.2 リリースの頃の発言とか、迷言ばかりだったと思うんだが。

> 今は随分状況が改善されてるけど、3年くらい前にこんなこと言われたら
> 正直たまらんですよ。
改善?
本質を理解せずに、国際化・多言語化はとりあえず Unicode にしとけ、
なんて間違った認識が広まりすぎただけだと思うが。


399:名無しさん@お腹いっぱい。
04/03/08 14:13.net
>>396
おー、ありがとう。読んでみた。
まぁ気持ちは分かる。
そもそもターミナルエミュレータは右から左に書くことを想定して作られて
いないんだから、もっとリッチな環境でのみサポートしろってことだよな。
「不合理な宗教的な理由で使われている」っていうのは滅茶苦茶だが。
関係ないけど、縦書きターミナルエミュレータってあるのかなぁ。

400:名無しさん@お腹いっぱい。
04/03/08 14:29.net
mlterm は縦表示できますよ。

401:名無しさん@お腹いっぱい。
04/03/08 15:45.net
>>398
日本語のロケールとしてUTF-8を採用するかという話では
ないのですか

402:名無しさん@お腹いっぱい。
04/03/08 15:57.net
>>401
(゚Д゚)?

403:名無しさん@お腹いっぱい。
04/03/08 16:03.net
>>401
XUtf8*系のAPIを突っ込もうとしていたときの話。(*1)
つか、UTF-8以外のlocaleを捨てるなら、そもそもそんなものを突っ込む
必要あるのかよと小一時間(ry

*1) 結局4.0.2というマイナーリリースに駆け込みで突っ込まれた。
正直「XFree86のリリースマネージメント終わってるな」と思ったが。




404:名無しさん@お腹いっぱい。
04/03/08 21:45.net
禿げどう

405:名無しさん@お腹いっぱい。
04/03/08 23:49.net
うにこん最強

406:名無しさん@お腹いっぱい。
04/03/09 11:07.net
>>401みたいな的外れなレスが付くあたり、原理主義者の布教は上手く行ったんだろうな。

407:401
04/03/12 15:37.net
> 今は随分状況が改善されてるけど、
についてだったんだが

408:名無しさん@お腹いっぱい。
04/03/13 15:09.net
誰か XF86 fork して Xutf8* 消して CSI xterm 入れてくれYO。


409:名無しさん@お腹いっぱい。
04/03/13 15:25.net
>>408
それってまんまOpenI18Nじゃね?

410:名無しさん@お腹いっぱい。
04/03/13 21:24.net
>>409
openi18n.orgって規格団体みたいのじゃないの?
他に同名のがあるの?


411:名無しさん@お腹いっぱい。
04/03/16 16:27.net
>>410
openi18n.orgでXLib-I18Nとitermが開発されている。
XLib-I18NはXFree86のクライアントライブラリのfork。
itermはCSIなターミナルでフレームバッファ版とX11版がある。


412:名無しさん@お腹いっぱい。
04/03/16 21:31.net
debian では xiterm って名前なのか。
今まで探してもなかったわけだ…

413:名無しさん@お腹いっぱい。
04/03/17 09:09.net
それと fbiterm とにわかれてるからなあ。


414:410
04/03/18 06:32.net
>>411
thx


415:名無しさん@お腹いっぱい。
04/03/23 18:55.net
SJIS2000ってのが有るんだな。
これってどうよ?

416:名無しさん@お腹いっぱい。
04/03/23 21:05.net
>>415
それってJIS X 0213をねじ込んだShift JISのこと?
何年前の話題だ……。

417:名無しさん@お腹いっぱい。
04/03/24 00:43.net
2000つーぐらいだから少なくとも4年以上前?

418:\
04/04/16 18:22.net
\

419:名無しさん@お腹いっぱい。
04/04/17 00:09.net
>>417
2000は、JIS X 0213 2000の2000ね。
JIS X 0213をJIS2000って言う人もいるらしい。(俺は聴いたことないけど)
URLリンク(seclan.dll.jp)

JIS X 0212(補助漢字)の方の埋め込みを使っていたシステムあるのか?


420:名無しさん@お腹いっぱい。
04/04/17 09:38.net
つーかOS Xのクリップボードのテキストはまさに
JISX0213をねじ込んだShift_JISなわけだが

421:名無しさん@お腹いっぱい。
04/04/17 17:18.net
OS X って UTF-8 じゃなかったっけ ?
それともクリップボードだけ Shift JIS なん ?

422:名無しさん@お腹いっぱい。
04/04/18 10:53.net
>>419
JIS X 0213は今年2月に改正されたんで、今後はJIS2004とでも呼ぶのかな?

でもってシフトJIS方式の符号化は Shift_JIS-2004 てな名前になったわけ
ですが。(附属書1)


423:名無しさん@お腹いっぱい。
04/04/18 16:42.net
JISX0213イラネ

424:名無しさん@お腹いっぱい。
04/04/18 21:12.net
まあしかし国内で規格化しておいた方が、
その中の文字がUnicode.orgで採用されやすいし。

425:名無しさん@お腹いっぱい。
04/04/23 12:37.net
>>422
IANAへの登録マダー? (AAry

426:名無しさん@お腹いっぱい。
04/04/23 14:33.net
まず厨房mohtaをどうにかしないと。

427:名無しさん@お腹いっぱい。
04/04/24 07:38.net
登録申請ってRFC2978の手続きに従ってietf-charsetsにメールを投げれば
誰でもできるんじゃないの?

428:名無しさん@お腹いっぱい。
04/04/24 18:09.net
その手続きを踏むこともロクにできなかったmohta氏って・・・

429:名無しさん@お腹いっぱい。
04/04/25 01:01.net
mohtaなんか無視して必要だと思う奴が登録申請すればいいじゃん。
漏れはUnicodeでいいと思うからやらないけど

430:名無しさん@お腹いっぱい。
04/05/07 15:22.net
ねぇねぇ、なんでいつまでも文字コードだけ貧乏くさい発想の元でやってるの?

431:名無しさん@お腹いっぱい。
04/05/07 15:54.net
>>430
貧乏くさい発想ってのは何をさしてるの?

432:名無しさん@お腹いっぱい。
04/05/08 03:03.net
一文字に 32bit なり 64bit なりをババーンと割り当ててしまえってことだろ。

433:名無しさん@お腹いっぱい。
04/05/08 05:46.net
とりあえずおれが今まで書いた文章全部ババーンと変換してよ。

434:名無しさん@お腹いっぱい。
04/05/08 11:20.net
重複符号化や異体字検索のデータベースもババーンと作ってよ
空間だけならISO 10646はすでに31ビットあるし

435:名無しさん@お腹いっぱい。
04/05/12 05:09.net
S-JIS・EUCなんて糞

今後はGB2312だ

436:名無しさん@お腹いっぱい。
04/05/12 13:07.net
大陸でも捨てられたものを使えとは…

437:名無しさん@お腹いっぱい。
04/05/13 01:48.net
ISO 2022もTRONも中国語に関してはGB2312に毛が生えたレベル

438:名無しさん@お腹いっぱい。
04/05/17 03:24.net
1文字64bit固定
1言語につき100,000,000文字分のスペース
後はお好きに

これでどこからも異論の声は上がらない

439:名無しさん@お腹いっぱい。
04/05/17 11:42.net
> これでどこからも異論の声は上がらない
誰も実装しないまま消えていくおかげでな(w

440:名無しさん@お腹いっぱい。
04/05/17 19:46.net
誰も実装できないのか
駄目だな

441:名無しさん@お腹いっぱい。
04/05/20 00:10.net
「たった」47000字くらいのExtension Bすらろくに実装されてないもんな

442:名無しさん@お腹いっぱい。
04/05/21 06:03.net
42711字だった

443:名無しさん@お腹いっぱい。
04/06/18 16:03.net
>>438
これいいな。採用!

444:名無しさん@お腹いっぱい。
04/06/19 01:33.net
少しは過去ログ嫁よ。
これだから漢字文化圏の連中は(ry

445:
04/06/22 15:54.net
.

446:名無しさん@お腹いっぱい。
04/07/08 23:41.net
EUC使いたがるプログラマは目的と手段が入れ替わった発想しかできなくなってる

447:名無しさん@お腹いっぱい。
04/08/02 11:13.net



448:名無しさん@お腹いっぱい。
04/09/02 13:13.net
.

449:
04/11/05 18:39:19.net



450:
05/01/07 12:57:00.net



451:名無しさん@お腹いっぱい。
05/01/17 16:39:56 .net
>>125
># 中国語だと今度は発音の違いもcollationの対象かぁ(w

ウリナラのKSコードは同じ字体でも発音ごとに違うコードを割り当ててる<丶`∀´>ニダ
そのへんがチョッパリの文字コードやメリケンのユニコードとは違う。

452:名無しさん@お腹いっぱい。
05/01/18 16:04:56 .net
全角チルダ化け何とかしてくれ

453:名無しさん@お腹いっぱい。
05/02/20 02:28:59 .net
>>451
フィッシング詐欺にはもってこいですね

# 実際には統合漢字と正規等価だから使えないけど

454:名無しさん@お腹いっぱい。
05/02/20 02:32:24 .net
あーあと北チョソが、今のUnicodeのハングルの並びは科学的じゃないから
より合理的なウリナラの配列に変更するニダとか超愉快な要求も出してたなあ。
もちろん却下されたけど

455:名無しさん@お腹いっぱい。
05/07/14 11:55:46 .net
保守

456:名無しさん@お腹いっぱい。
05/07/18 23:33:56 .net
nihonjin kanji tukauna!
hirakana katakana only.
The great country is China!

457:名無しさん@お腹いっぱい。
05/09/20 16:44:11 .net
KPS9566にすりゃいいじゃん

458:名無しさん@お腹いっぱい。
05/09/20 17:09:47 .net
( ゚∀゚)アハハ八八ノヽノヽノヽノ \ / \ /  \ /  \ /  \ /  \

459:名無しさん@お腹いっぱい。
06/05/24 19:48:34 .net
今や、世界の標準になりつつある。
URLリンク(en.wikipedia.org)


460:ISO2022原理主義者
06/05/29 18:21:43 .net
UTFやめてiso-2022-jp-*復活希望。
UNICODEの文字セットも呼出せるESCシーケンスも定義すれば良い。

461:名無しさん@お腹いっぱい。
06/05/31 00:23:28 .net
>>460
すでにあるんだけど...ちゃんと仕様書読みな。

コーラン読まないイスラム原理主義者はただのDQNテロリストだよん。

462:名無しさん@お腹いっぱい。
06/05/31 02:49:35 .net
共産党員は全員共産党宣言だのなんだのを読んでるんだよもん?


463:名無しさん@お腹いっぱい。
06/05/31 05:35:08 .net
>>462
頭悪そうな突っ込みw

464:名無しさん@お腹いっぱい。
06/05/31 10:21:40 .net
どこがどう頭悪そうか書かない奴も同程度。


465:名無しさん@お腹いっぱい。
06/06/02 16:52:15 .net
>>438
人類の生活圏が全宇宙に広がった頃には足りなくなります

466:名無しさん@お腹いっぱい。
06/06/02 20:20:03 .net
2ちゃんねるって SJIS だよな。
てか、Windows-31j かな。


467:名無しさん@お腹いっぱい。
06/06/09 02:35:13 .net
SJISって嫌われてるの?
自作printf作った時は2byte文字コードが追っかけやすくて便利だった記憶があるんだけど?

468:名無しさん@お腹いっぱい。
06/06/09 06:25:50 .net
0x5cが2byte文字中に入る時点で嫌だ。

469:名無しさん@お腹いっぱい。
06/06/14 22:28:57 .net
つうか、Unicode でいいじゃん

470:名無しさん@お腹いっぱい。
06/06/15 06:59:54 .net
だから、SJISを撲滅するんだろ?

471:名無しさん@お腹いっぱい。
06/06/16 10:28:11 .net
UTF-8/UTF-16/UTF-32
があるのだから

UTF-64が出てもおかしくないな。

472:名無しさん@お腹いっぱい。
06/06/16 23:04:28 .net
>>471はUTF-5を使ってください。

473:名無しさん@お腹いっぱい。
06/06/20 09:58:48 .net
SJIS撲殺天使

474:名無しさん@お腹いっぱい。
06/07/19 23:43:22 .net
UTF-65536

475:名無しさん@お腹いっぱい。
06/07/23 22:49:52 .net
UTF-37564

476:名無しさん@お腹いっぱい。
08/04/01 23:40:15 .net
まあまあ、そうあわてなさんな。
今にSJISを拡張して、4バイトコードにするから。

エスケープシーケンスの候補は 0xFD, 0xFE, 0xFF。



477:名無しさん@お腹いっぱい。
08/04/11 09:33:40 .net
エスケープシーケンスって何
キーボードで入力できないの?

478:名無しさん@お腹いっぱい。
08/04/12 00:13:00 .net
もう、日本語禁止な!><;

479:名無しさん@お腹いっぱい。
08/04/12 20:22:59 .net
おいおい、エスケープシーケンスも知らずにマルチバイト文字の話かよ。
まったくゆとり教育ってやつぁ...


480:名無しさん@お腹いっぱい。
08/04/26 12:20:47 .net
SJIS 2.0 スペック
0xFD [0xA1-0xFC] [0xA1-0xFC]
0xFE [0xA1-0xFC] [0xA1-0xFC] [0xA1-0xFC]
0xFF [0xA1-0xFC] [0xA1-0xFC] [0xA1-0xFC] [0xA1-0xFC]
を基本路線とし、2バイト目に 0x5C が入らないようにする


481:名無しさん@お腹いっぱい。
08/04/27 11:24:19 .net
まずはSJISを撲滅する。話はそれからだ

482:名無しさん@お腹いっぱい。
08/04/28 07:07:00 .net
eyeD3 --help | grep "\--set-encoding"

--set-encoding=latin1|utf8|utf16-BE|utf16-LE

ざまあ

483:名無しさん@お腹いっぱい。
08/04/28 23:18:02 .net
>>482
eyeD3だからだろ...常識的に考えて。
どうせSJIS突っ込む奴は latin1 に突っ込むし。

484:名無しさん@お腹いっぱい。
08/07/13 22:27:05 .net
>>481
ほぉう、それをSJISで書くのか君は。



485:名無しさん@お腹いっぱい。
08/07/14 22:49:01 .net
ス、ヲ、ハ、ホ、ォ?サ釥キ、ヒMozilla1.7b、ホハクサ妺ウ。シ・ノタ゚ト熙TF-8、ヒ、ケ、□ネクタ、ヲヒスオヒスミ、ニ、゚、□」
、ヌ、□、チ、网タ、ネ。ヨSJIS、ヌチテ、ニ、ッ、タ、オ、、。ラ、テ、ニ・ィ・鬘シ、ヒ、ハ、□ク、网ハ、、?
(、ヒ、キ、ニ、篦セ、ャイス、ア、ケ、ョ、ニクォカ□キ、ケ、ョ、□ト)

486:名無しさん@お腹いっぱい。
08/07/22 21:56:14 .net
>>485
もっかいSJISで頼む。



487:名無しさん@お腹いっぱい。
08/08/03 16:18:05 .net
タイ語だのBiDiだので苦労している人達から見れば、
0x5cがどうの、包摂がどうのなんてあまりに贅沢な悩みだろ。
Markus Kuhnが>>396みたいなことを言い出すのも非常にうなずける。
ヨーロッパ人もMとiが同じ幅になるとかハイフネーション出来ないとかを
我慢しながら使っているわけだし。

488:名無しさん@お腹いっぱい。
08/08/04 21:29:09 .net
SJISっていつの時代も現実解でいいよね


489:名無しさん@お腹いっぱい。
08/08/08 03:43:43 .net
>>487

すまそ。Mとiが同じ幅になることとSJIS(ないしSJIS撲滅運動)
との関係が分からんが、SJIS万歳でOK?

490:名無しさん@お腹いっぱい。
08/08/08 07:10:06 .net
いまさら文字コードなんか気にする必要ないじゃーん

491:名無しさん@お腹いっぱい。
08/08/08 10:47:33 .net
>>487
> ヨーロッパ人もMとiが同じ幅になるとかハイフネーション出来ないとかを
> 我慢しながら使っているわけだし。

1950年代にタイムスリップかよ

492:名無しさん@お腹いっぱい。
08/08/09 18:31:30 .net
もしかしてヨーロッパ人は今でもダム端使って、2chとかみてんの?



493:名無しさん@お腹いっぱい。
10/01/31 14:50:00 .net
文字コードの問題は今後30年たっても解決していない。

494:名無しさん@お腹いっぱい。
10/01/31 14:56:08 .net
文字コードはさらに増えるね

495:名無しさん@お腹いっぱい。
10/02/07 16:28:12 .net
世界の文字コードを統一することに失敗したので、今度は
世界中の単語に統一したコードを振ってみるのはどうだろう?

もちろん同じ意味の単語に同じ値を割り振るわけだ。
多義語の場合はどういう意味で使っているのかを選択する
必要がある。多義語は多値になることもある。

今度は最初から32ビットでいくけどいいよね?


496:名無しさん@お腹いっぱい。
10/02/07 21:24:07 .net
PSOのワードセレクトみたいなものだね
日常で使う単語なら32ビットもあれば十分だろうね

497:名無しさん@お腹いっぱい。
10/02/07 21:33:12 .net
16x16のイメージととみなした256ビットをそのままコードにして必要な時は
on the flyでOCR処理しよう。これで全て解決。

498:名無しさん@お腹いっぱい。
10/02/07 22:49:36 .net
非字形文字はどうすんの?

499:名無しさん@お腹いっぱい。
10/02/07 22:50:18 .net
非図形だった。
制御文字とか各種スペース類とか。

500:名無しさん@お腹いっぱい。
10/02/08 14:15:25 .net
16x16 で全ての文字が表せると思っている時点で
16ビットもあれば充分と思ってたのと同程度


501:名無しさん@お腹いっぱい。
10/02/17 00:57:45 .net
>>497

で、そのやり方の場合、OCR 結果は何コードにするの?

# まるでうちの社長レベルだな

502:名無しさん@お腹いっぱい。
10/02/17 13:31:26 .net
>>501
え?UTF-256 じゃないの?


503:名無しさん@お腹いっぱい。
10/03/20 22:15:41 .net
>>502

いいえ。シフトJISです。


504:名無しさん@お腹いっぱい。
10/03/22 13:25:24 .net
撲滅マダー

505:名無しさん@お腹いっぱい。
10/05/23 03:24:10 .net
>>495
lojban の1200の基礎語彙のことか.

lojban:
・文化的に中立の人工言語
・語彙は1200の語根の合成語としていくらでも拡張できる
・同音異義語が存在しえないよう構成されている

いいアイディアをもらった.

506:名無しさん@お腹いっぱい。
10/09/26 21:31:38 .net
撲滅マダー

507:名無しさん@お腹いっぱい。
10/10/23 15:16:26 .net
大手プロバイダのトップページは大多数がshift_jisだね。
まだまだ安泰だ。

ちなみにyahooはトップはutf-8に変えたけど、
その他ほとんどのページやwebメールはeuc_jpのまま。

508:名無しさん@お腹いっぱい。
10/10/24 15:29:05 .net
>>1

つ Samba

509: 忍法帖【Lv=40,xxxPT】(1+0:8) 【37.8m】 電脳プリオン ◆3YKmpu7JR7Ic
12/10/20 14:20:16.04 BE:121623326-PLT(12079).net
撲滅されそうにないな

510:名無しさん@お腹いっぱい。
13/04/13 02:48:10.27 .net
UnicodeでもUTF-16は廃止してもいいと思うな。
UTF-16はUCS-4に置き換えたほうがいい。

511:名無しさん@お腹いっぱい。
13/04/13 16:09:47.04 .net
合成文字あれば、UTF-32(UCS-4)でも64bit以上必要になるぜ?

512:名無しさん@お腹いっぱい。
13/04/21 04:16:11.83 .net
正規化すると64bitでも足りないということか

513:名無しさん@お腹いっぱい。
14/10/22 13:51:16.97 .net
>>495
遊方僧とか来ちゃったよ?

514:名無しさん@お腹いっぱい。
14/11/05 08:51:56.10 .net
半角カナさえ無ければSJISも出てこなかった

515:名無しさん@お腹いっぱい。
15/02/16 07:37:16.99 .net
今日すごいのかなー。1000円へ

516:名無しさん@お腹いっぱい。
15/02/21 22:35:51.38 .net
よく歴史を知らないんだが、SJISが初期の頃にすぐさま圧倒的シェア取ったのに、
なんでUNIXではEUCに固執した馬鹿たちが大勢いたの?

517:名無しさん@お腹いっぱい。
15/02/24 10:12:42.43 .net
ほぼ無改造で大半のソフトが動いたから。SJISはそうはいかなかった。

518:名無しさん@お腹いっぱい。
15/02/26 18:49:35.33 .net
昔の人は日本語テキストを英語しか想定してないソフトで処理しようとしたのか。
今も昔も日本のUinxerは自分でコードが書けないんだな。

519:名無しさん@お腹いっぱい。
15/02/27 07:41:27.33 .net
しかしsendmailみたいな8ビット目を落とすソフトウェアまで出てきたりして、
ISO-2022-JPを制定してメールはそちらを使うようになった。
結果として多くの日本語を扱うソフトは3種類のエンコーディングをサポート
する羽目になった。
今はそれに加えてUTF-8もあるし大変だ。

520:名無しさん@お腹いっぱい。
15/02/27 09:54:28.60 .net
Sendmailが悪いわけじゃないし
「8ビット目を落とすソフトウェアが出てきた」わけじゃない。
7ビットがデフォルトだったところに
8ビットも使えるソフトウェアが出てきた。

521:名無しさん@お腹いっぱい。
15/02/27 18:34:09.85 .net
それに比べてとMSの対応は素晴らしい。
早期にOS内部はunicodeで統一し、APIを二つ用意して、マクロでラップ。
あらゆる言語をターゲットにしてたOSだけはあるな。

522:名無しさん@お腹いっぱい。
15/07/23 11:23:39.14 .net
あとはwindowsとともに滅びゆくのみ
長く苦しい戦いだった

523:.
15/08/26 12:22:34.09 .net
EUCも撲滅しろ

524:名無しさん@お腹いっぱい。
15/08/26 13:30:24.73 .net
自分でやれ


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch