文字コードの種類は何故複数あるのでしょうか?at TECH
文字コードの種類は何故複数あるのでしょうか? - 暇つぶし2ch2:デフォルトの名無しさん
04/08/23 18:00.net
そんなことでスレを立てないで下さい。

3:デフォルトの名無しさん
04/08/23 18:35.net
>>1
アニメの世界であれば、そういう迷惑なことをするのは悪の組織ですよね?
現実の社会ではどうでしょう?
クリーンなイメージのあの組織も、もしかすると悪の組織なのかもしれませんね。

私は、大義名分を振りかざすこと、常に勝つことが重要であると考えています。

4:デフォルトの名無しさん
04/08/23 18:59.net
>>1
それが資本主義。

5:デフォルトの名無しさん
04/08/23 19:11.net
じゃあ共産圏は一つに統一されているのか。

6:マイク ◆yrBrqfF1Ew
04/08/23 19:14.net
宗教戦争の為だ。

7:デフォルトの名無しさん
04/08/23 19:34.net
統一されてないから。

8:デフォルトの名無しさん
04/08/23 20:21.net
なら、>>1 が新しい統一した文字コードを作れ。


9:デフォルトの名無しさん
04/08/23 20:33.net
>>8
また増えるからもういいよ

10:デフォルトの名無しさん
04/08/23 20:55.net
2バイト文字を使わなけりゃいいべや。

11:デフォルトの名無しさん
04/08/23 21:11.net

おまえら、まだ文字コード使ってるの?
俺はだいぶ前から文字しか使ってないよ。

12:デフォルトの名無しさん
04/08/23 21:36.net
あめれか人が悪いに決まってるだ

13:デフォルトの名無しさん
04/08/23 21:48.net
もう全部ビットマップでいいよ。

14:デフォルトの名無しさん
04/08/23 21:54.net
>>12
欧米人は頭足りないからな

15:デフォルトの名無しさん
04/08/23 22:24.net
UNICODE がもう少しまともだったらなぁ。

16: ◆Z0vd5w812U
04/08/23 23:09.net
>>15
所詮は「なんでアルファベット以外が存在してんだよ」と思ってる連中が作った規格。

17:デフォルトの名無しさん
04/08/23 23:23.net
1.0と比べると3.2はずいぶんマシになってるし
あと20年もすれば納得いくものになるんじゃないの

18:デフォルトの名無しさん
04/08/24 14:16.net
Unicode1は所詮ローカライズ用

19:デフォルトの名無しさん
04/08/29 03:15.net
アルファベットの文字コードも複数あるわけですが…

20:デフォルトの名無しさん
04/09/24 18:55:46.net
ここを見れ!

URLリンク(www.pahoo.org)

21:デフォルトの名無しさん
04/10/12 18:24:05.net
URLリンク(www005.upp.so-net.ne.jp)
本来神聖なる日本国憲法を記載するに当たり一字一句変える
ことなく記載しなければならないところですが、コンピューター
通信上の禁則文字(JISコードに含まれていない文字)があり、
読み方は一緒なのですが例えば「わゐうゑを」2番目の「ゐ」を「い」
に4番目の「ゑ」を「得」に変更させていただきました。
あしからずご了承下さい。


「ゐ」「ゑ」はJISコードに無い文字なのか?

22:デフォルトの名無しさん
04/10/12 18:35:39.net
改行コードの種類は何故複数あるのでしょうか?

23:デフォルトの名無しさん
04/10/12 19:52:02.net
大人の事情

24:デフォルトの名無しさん
04/10/12 23:11:08.net
>>21
「禁則文字」の用語にも誤解があるようでつね


25:デフォルトの名無しさん
04/10/14 00:12:52.net
>>22
昔々、テレタイプという通信機には
プラテンを1行分進めるラインフィードという制御コードと
印字ヘッドを左に戻すキャリッジリターンという制御コードが別々にあった
そんでこいつは初期のコンピュータにつないで端末として使ったりもした。

それが今の改行コードの元になったわけだが

MS-DOS,->Windows系列では律儀に上記二つペアを改行コード
としてそのまま引き継いだ

UNIX系だとニューライン(ラインフィード)LFだけになり

Mac系はキャリッジリターンだけを改行コードとして採用した。

ネットワークプロトコルではCRLFが今でも
改行コードの標準だが、
これは

テレタイプ->ダム端末->telnet,rloginの流れで改行コードも
引き継がれたからだ。

26:デフォルトの名無しさん
04/10/16 22:39:45.net
>>25
答えキタ━━━(゚∀゚)━━━ !!!!
ありがとう
UNIXがLFなのになんでネットワークがCRLFになっちまったのかと思ってたんだよ

27:デフォルトの名無しさん
04/10/16 23:36:27.net
URLリンク(satosan.jp)
> 遠隔地同士の通信手段としてテレタイプ(通信機能をもった
> タイプライター) が使われていた頃は、ヘッドが行の端まで
> 行ったとき次の行の先頭に戻るま で、2文字分通信するのと
> 同じ時間がかかった。
> そこで改行の文字コードをCR(復帰:キャリッジリターン '\r')と
> LF(改行: ラインフィード '\n')の2つに割り当てた。


28:デフォルトの名無しさん
04/10/18 20:43:35.net
エンディアンの種類は何(ry

29:デフォルトの名無しさん
04/11/30 13:59:22.net
age

30:デフォルトの名無しさん
05/02/10 22:10:51 .net
TRONコード

31:デフォルトの名無しさん
05/02/10 22:25:42 .net
>>27
理由になってないし

32:デフォルトの名無しさん
05/02/17 00:28:22 .net
「qwerty配列はタイピングが早すぎてキーが絡まないようにわざと打ちにくくした」
って都市伝説もあったな

33:デフォルトの名無しさん
05/02/17 01:19:18 .net
キーが絡むなら都市伝説だな。
絡むのはハンマーだから。


34:デフォルトの名無しさん
05/02/18 01:04:22 .net
>>32
適度に打ちにくくしたのは確かだよ。

最悪に打ちにくくしたわけではない。
最高に打ちやすくしたわけでもない。
最適に打ちにくくしたんだよ。

機械とセールスの拮抗点で。

35:デフォルトの名無しさん
05/02/18 19:00:00 .net
文字コードと関係ないぞ

36:デフォルトの名無しさん
05/02/19 00:20:50 .net
そもそも、自然言語が複数あるんだから、
文字コードが複数出来るのも自然な流れだと思われ

37:デフォルトの名無しさん
05/02/23 17:40:30 .net
>>1
すべて Unicode Consortium が悪い。
そうに決まってる。

38:デフォルトの名無しさん
05/02/23 19:12:17 .net
>>28
普通の答えは、big-endian と little-endianの2種類だが、

3-4-1-2 や 2-1-4-3 など順序になる不可解なシステムが、過去のミニコン時代にありますた。
それらは、middle-endian と呼ばれている。

よって、32ビットでのエンディアンの種類は4種類という事になる。


39:デフォルトの名無しさん
05/02/23 19:26:44 .net
24種類じゃないの。

40:デフォルトの名無しさん
05/02/23 19:49:20 .net
実在が確認されているのが4種類、可能性としては24種類、ということで。

41:デフォルトの名無しさん
05/02/23 21:09:47 .net
XMLの仕様書に書かれてる3-4-1-2や2-1-4-3って実在したのか
>>37
ワロス

42:デフォルトの名無しさん
05/02/23 22:23:06 .net
>>1
容量制限のため用途に応じた使い分けをせざるを得なかった歴史があるからだよ。
たしかに文字コードの乱立はうざい。
こんなに大容量化が進んでマシンのスペックも向上しているにもかかわらず
文字コードが未だに乱立している原因として考えられることは
面倒くさがり屋、変化を恐れる愚かな老人達が我々の行動を阻もうとしていることがあげられる。
日本国内でオブジェクト指向が普及しない原因も、自分の立場を維持したい愚かな老人が
妨害しているのが原因かもしれない。

かつて、ある企業が独自規格を作って大儲けを
たくらんだために文字コードが乱立した可能性もありうる。

今ではUnicodeがあるというのにほとんどの新しい言語、OSは
Unicodeが標準だというのに
頭の古い連中は大したコストパフォーマンスにならないにもかかわらず
容量制限が・・・
既存のリソースが・・・・
などといってUnicodeを採用しようとしない。
既存のリソースならUnicodeに変換すればいいことだろう。
まったく愚かだ。Unicodeに鞍替えできない老舗顧客も老舗プログラマも。


43:デフォルトの名無しさん
05/02/23 22:32:12 .net
お前が愚かだ。

44:デフォルトの名無しさん
05/02/23 22:46:26 .net
キーボードは乱立しなくてよかったw

45:デフォルトの名無しさん
05/02/24 10:05:30 .net
乱立してるだろ

46:デフォルトの名無しさん
05/02/24 15:47:01 .net
「俺たちはどうして何でもUnicodeのせいにするのだろう?」
 文字鏡関係者とTRON関係者とGTプロジェクト関係者が何人か集まって考えた。
しかしいくら考えても結論が出ない。その時、一人がひらめいた。
「それもUnicodeのせいだ!」
 関係者は全員それで納得した。

47:デフォルトの名無しさん
05/02/24 18:11:09 .net
Windowsもとっととunicodeに移行して欲しいよ

48:デフォルトの名無しさん
05/02/24 19:13:03 .net
してるじゃん
出来てないのはiniファイルくらいだろ?

49:デフォルトの名無しさん
05/02/25 06:57:00 .net
どうか教えてください。

[1] 授業単元:プログラム概論
[2] 問題文(含コード&リンク):
   シフトJISからEUCへの文字コード変換プログラムを作りたい(余裕があればその逆も)
   URLリンク(tokyo.cool.ne.jp)
[3] 環境
 [3.1] OS: WindowsXP,NT Solaris2.0
 [3.2] コンパイラ(バージョン):富士通fcc,Cygwin(gcc)
 [3.3] 言語:C
[4] 期限:2005年2月28日12:00まで
[5] その他の制限: この問題文の意図だと引数をunsigned int型にするべきかどうか分からない

50:デフォルトの名無しさん
05/02/25 09:58:13 .net
>>49

#include <stdlib.h>
main()
{
return system("nkf -e from > to");
}

つーかスレ違い

51:デフォルトの名無しさん
05/02/25 11:22:52 .net
>>41
3-4-1-2ってのは、最小アクセス単位が16 bitでbig-endianなCPU
(3-4)-(1-2) 別名middle endian
wordにpackするとこの形になった。(Cの先祖のBCPL、初期のpascal等)

>>27
それは嘘。(そもそも復帰は物凄く時間がかかる)
タイプライター時代から、(行先頭に)復帰して文字を進めて重ね打ち、例えば _ を、
ってのがあって、それをプリンタにも持ち込んだのが最初。



52:デフォルトの名無しさん
05/02/25 11:26:29 .net
>>50

ワラ
幾らなんでもそれはないから

> return system("iconv -f shift_jis -t euc-jp < from > to");

でどうだ?

53:デフォルトの名無しさん
05/02/25 15:51:32 .net
簡単な質問かもしれませんが、分からないので教えてください。

以下のプログラム、核は出来ています。このまま使用しても目的は達成できます。が、
URLリンク(tokyo.cool.ne.jp)
URLリンク(tokyo.cool.ne.jp)
この2つのソースコードをJISを経過させずに直接変換させるにはどうしたらいいでしょうか?

54:デフォルトの名無しさん
05/02/25 16:02:46 .net
>>53
何故一つの質問をあっちこっちで聞きまくるんだ
頭おかしいんじゃないか?

55:デフォルトの名無しさん
05/02/25 19:04:25 .net
あちこちで聞けば、たくさんの人が並行して考えてくれるので、
答えが早くでると思いました。
どこか答えが出てるスレッドがありましたら教えてください。

56:デフォルトの名無しさん
05/02/25 19:36:43 .net
だから、テーブルを使えよ。

57:デフォルトの名無しさん
05/02/25 19:46:47 .net
>>48
コマンドプロンプトとか無理だろ

58:デフォルトの名無しさん
05/02/25 19:55:45 .net
無理じゃ無いよ
ちゃんとユニコードなファイル名も表示されるし

59:デフォルトの名無しさん
05/02/25 22:43:07 .net
> あちこちで聞けば、たくさんの人が並行して考えてくれるので、
> 答えが早くでると思いました。
> どこか答えが出てるスレッドがありましたら教えてください。

・・・こういう心理をどう表現すればいいのだ?

自己中心的か
ゲーム脳か

60:53@愛宕山
05/02/25 23:13:03 .net
ちなみに55はボクではありません。今さらどうでもいいけど

61:デフォルトの名無しさん
05/02/26 01:45:06 .net
>>59
全員から同時に返事が来たらどうするつもりなんだろうね

62:デフォルトの名無しさん
05/03/01 21:40:00 .net
そこで超漢字

63:デフォルトの名無しさん
05/04/30 21:51:28 .net
うにこーど

64:デフォルトの名無しさん
05/05/01 11:20:17 .net
>>57
localeモデルにしとけば、Shift_JIS→UTF-8移行も楽だったね。

65:デフォルトの名無しさん
05/05/03 05:47:35 .net
UNICODEだってごちゃごちゃの固まりジャン
こんな気味悪い文字コードにしなくちゃいけないのはいやだ

66:デフォルトの名無しさん
05/05/03 07:29:57 .net
UTF-8は使用するメモリが1.5倍になるからいやだ

67:?デフォルトの名無しさん
05/05/03 20:19:22 .net
UTF-8で1.5倍とはしらなかった。

68:デフォルトの名無しさん
05/05/04 00:05:00 .net
漢字のコードポイントのとこなら1文字3バイトだけどね。



69:デフォルトの名無しさん
05/05/04 00:05:32 .net
あ、3オクテットというべきかにゃ?


70:デフォルトの名無しさん
05/05/05 17:46:59 .net
4オクテットの箇所もあるでよ。


71:デフォルトの名無しさん
05/11/19 21:54:11 .net
そこでシフトJISですよ。JIS第3水準、第4水準も難なく扱えるし、な。


72:デフォルトの名無しさん
05/11/19 22:22:21 .net
つうか、そろそろJIS廃止してくれんかの。
シフトコードウザイ。

73:デフォルトの名無しさん
05/11/19 22:27:05 .net
UCS-4ってのが最後のUnicode?
Javaだとint型なんだっけ?よーわからんけど、早く統一して欲しい。

74:デフォルトの名無しさん
05/11/19 22:43:03 .net
>>73
1文字8バイトなんて世界が来るのかね。


75:デフォルトの名無しさん
05/11/19 22:44:51 .net
UTF-8でいいんでしょ?~とか①とか大丈夫なんでしょ?

76:デフォルトの名無しさん
05/11/19 22:53:34 .net
>>75
いまのWord、ExcelはUCS-2だから、その世界に収まっている
仕事ならUTF-8でおけですよ。

でもオヤクソとかは…

77:デフォルトの名無しさん
05/11/20 01:29:07 .net
やっぱり生き残るのはシフトJIS系。
将来的には半角カナの領域を1バイト目にして可変長のコードにして
UnicodeやTRONコード、JEF、KEISを丸呑み。

絶対そうなる。


78:デフォルトの名無しさん
05/11/20 01:31:35 .net
>>76
じゃあUCS-4でいいから今すぐ統一して( ノ><)ノ

79:デフォルトの名無しさん
05/11/24 02:30:44 .net
常用漢字とJISが食い違ってるというのもそもそもどんな縦割り行政
しちょるのかと

80:デフォルトの名無しさん
05/11/24 13:11:35 .net
何か食い違ってたっけ?

81:デフォルトの名無しさん
05/11/25 21:34:50 .net
龍の旧字体?

82:デフォルトの名無しさん
05/11/25 21:35:24 .net
竜の旧字体? だった
龍じゃそのまんまじゃんorz

83:デフォルトの名無しさん
05/11/28 16:44:09 .net
「龍」の点の向きのこと?
そんなもん包摂の範囲内だしどっちだっていいやん。
表外漢字字体表にがちがちにあわせたJIS X 0213:2004のほうが異常。

84:デフォルトの名無しさん
05/11/29 08:28:23 .net
大体、印刷標準字体とかうざいんじゃ!

85:デフォルトの名無しさん
06/02/06 15:57:56 .net
だって常用漢字の数とJIS漢字の数とそもそもぜんぜん違うじゃん
たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
それより写植の文字がJISに入ってないせいで電話記号とか
ポゲムタとかが簡単に出せなくてラムちゃん語も満足に表記できやしない。


86:デフォルトの名無しさん
06/02/06 16:36:04 .net
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?


87:デフォルトの名無しさん
06/03/13 10:43:01 .net
いま試しに数えてみたら24個くらいあった

88:デフォルトの名無しさん
06/03/25 09:27:36 .net
>>87 夜に数えると増えてるよ。
うちの家の階段も昼間は12段だけど
夜数えると13段ある。

89:デフォルトの名無しさん
06/03/26 12:55:29 .net
たしかJISにあって常用漢字にない漢字とか結構なかったっけ?

90:デフォルトの名無しさん
06/03/27 02:43:17 .net
ない。

91:デフォルトの名無しさん
06/05/01 11:42:30 .net
お前ら大嘘つきだ。みんな嫌いだ。

92:デフォルトの名無しさん
06/05/04 13:03:48 .net
文字コードが増える前に、俺らが使う言葉の数を減らせばいいんじゃね?

93:デフォルトの名無しさん
06/05/05 07:04:34 .net
たしかに。英語だけあれば世の中困ること無いよな。

94:デフォルトの名無しさん
06/05/30 02:39:01 .net
そうだ。

95:デフォルトの名無しさん
06/06/16 19:34:55 .net
>>66
UTF-8って英数字に対して使うなら容量はそんなに増えなかったかと。

96:デフォルトの名無しさん
06/07/06 04:23:37 .net
戦争中、敵方の兵士により領土が侵略されると、必ず略奪やレイプがおこなわれる。ルワンダもその例外ではなかった。 
  
大統領の暗殺から2週間ほどたったころ、ルワンダ北西部のルヘンゲリ県のある村で14歳のツチ族少女がフツ族民兵に誘拐された。 
当時すでに虐殺の嵐はルワンダ全土を激しく吹き荒れ、各地で次々とツチ族が殺されていた。しかし幸いなことにその村ではまだ一人の死者も出さず、ツチ族とフツ族が微妙なバランスの上で共生していた。 
 誘拐された少女は、「気立てが良くかわいい娘だ」と村で評判だったらしい。その日も夕食の準備をする母を手伝うため、水を汲みに村外れの井戸へ行き、そこで待ち伏せていた数人の男に拉致されてしまったのだ。 

何人かの村人がその様子を目撃し、すぐさま家族に知らせた。家族は娘の身に起こりうる最悪の事態(レイプされた後、殺害される)を考え、血眼になって探したが、1週間たっても少女の行方はわからなかった。 
さらに数日が過ぎ家族があきらめかけたころ、隣村から連絡が届いた。 
「娘さんらしき少女を保護した。重体ではあるものの生きてはいる」 
家族は押っ取り刀で隣村に駆けつけ、粗末なベッドの上で毛布に包まれ、横たわる少女の姿を見た。 
  体を包んでいる毛布に血がにじみ、見る影もなくやせ細った体は小刻みに震え、その瞳は輝きなく虚空を見つめていた。家族が声をかけても何も反応を示さない。脅えているのか寒いのか、ただ小さく震えるだけだ。

97:デフォルトの名無しさん
06/07/06 04:24:30 .net
少女は非常に奇異な姿で発見されたという。隣町の農夫は発見したときの様子をこう語る。 
「私がいつものとおり自分の畑を耕すためにあぜ道を歩いていると、ふと視界に見慣れないものが目に入ったのです。 
最初は『木の切り株か、大きな石なのかなあ』と思ったのですが、近づいてみると違いました。目を疑いましたよ。裸の少女が腰から下を土に埋められていたのですから……。 
私が発見したとき、彼女は焦点の定まらない目でぼんやりと遠くを見つめ、半開きになった口からよだれを垂れ流していました。 
インタラーメ(フツ族民兵)か政府軍が近くにいるのではと思ったので、慌てて村にいったん帰りました。人を集め武器を持ち、恐る恐るその場に戻って、彼女を掘り返したのです。 
目は開いていたのですが、すでに彼女の意識はありませんでした」 

変わり果てた姿の少女を、家族はすぐさま村から少し離れたところにあったフランスの緊急医療援助団体“国境なき医師団”の診療所へと運び込んだ。 
偶然、その少女の治療に日本人看護婦、山本珠江さんが立ち会っていた。

98:デフォルトの名無しさん
06/07/06 04:26:13 .net
「数人の男たちに、彼女は何日間にもわたり強姦され続けていたみたいなの。食事もろくに与えられていなかったようね。 
しかも土に埋められる前、女性器に木の棒か銃身のような細くて固いものを押し込まれ、こねくり返されたようなのよ。 
その傷口に雑菌が入ってしまったらしくて性器の一部が壊疽していたわ。 
命だけは助かったけど、当然もう子供は産めないし、あまりに大きなショックを受けたから精神障害がひどくて廃人になってしまったわ」 
山本さんは非常に悲しそうでいて、悔しそうな表情をしながらその時の状景を振り返った。 
1週間ほどその少女は「国境なき医師団」の診療所に入院していたそうだ。肉体的な治療が終了すると、少女は家族に連れられ家に戻っていった。虐殺の被害に遇った瀕死の患者が次々に運び込まれてくるため、生命の危機がなくなった患者を収容する場所がなかったためだ。 

「悲しいけど、これ戦争なのよね」 
山本さんは、苦しげに首を横に振りながら語った。

99:デフォルトの名無しさん
06/07/08 09:12:04 .net
>>97-98
よくあること
はいりょしてくれないと

100:デフォルトの名無しさん
06/10/31 17:47:09 .net
>>1
64ビットユニコードつかえばいいだろ


101:デフォルトの名無しさん
06/11/09 12:34:39 .net
JISの文字コードがあれなのはそもそもが朝日新聞が適当に定めた文字だから

102:デフォルトの名無しさん
07/01/06 11:43:23 .net
まず文字コードについてだが、コード云々の前に自然言語の整理が必要だと思う。
実際にはほとんど使われることがない文字のためにコード領域を使うのは無駄だから
そういう文字はどんどん淘汰してゆくべき。
あと、字体がそっくりな文字なんかもできるだけ1つに統合してしまったほうがいい。
そのあとで国(言語種別)ごとにコード領域を分けて、すべての文字を1つのコード体系に
収めるべき。

次に改行コードだが、全部LFで統一でOK。改行ごときに2バイトも必要ない。
既存のリソースは全部LFに変換してしまえばよい。
Windowsなんかでファイルの改行を勝手に変換する機能をサポートすれば、
CR+LFはいずれこの世から自然消滅するだろう。

最後にエンディアンについてだが、ビッグエンディアンに統一すべき。
人間が感覚的になじみやすいほうがいいから。

これらのことをやるにはそれなりの負担がかかるが、その結果得られるメリットを
考えたらすぐにでも取り掛かるべき。もちろん世界レベルで。

103:デフォルトの名無しさん
07/01/10 13:15:10 .net
バベルの塔で神の怒りに触れ文字コードの種類が沢山になった。
これは事実で、(ry

104:デフォルトの名無しさん
07/01/10 14:26:08 .net
JISとEUCはほぼ等価だから
漏れ的には扱い安さは
EUC > JIS >>> SJIS >>>>>>> UNICODE
だと思うよ

105:デフォルトの名無しさん
07/01/10 14:28:45 .net
判定のしやすさで言えばJISは・・
UNICODEもそうだな、代わりにUTF-8とか使うが

106:デフォルトの名無しさん
07/01/10 17:43:21 .net
援交ディングと門司セットの話がない交ぜに!

107:デフォルトの名無しさん
07/01/10 18:11:17 .net
UTF-128あれば大丈夫だろ?

108:デフォルトの名無しさん
07/01/10 18:15:07 .net
野球板 お約束その122
「しまってこーぜー」

「まずお前が社会の窓閉めろや」

109:デフォルトの名無しさん
07/01/10 18:15:43 .net
ミスッた

110:デフォルトの名無しさん
07/01/10 20:06:46 .net
言語は何故複数あるのでしょうか?
どうせなら言語も英語だけにしようよ。

パスがでたー

111:デフォルトの名無しさん
07/01/11 09:38:18 .net
主食は何故複数あるのでしょうか?
どうせなら主食も米だけにしようよ。

112:デフォルトの名無しさん
07/01/11 23:46:02 .net
>104
まさかとはおもうが、そのJISはCESとしてのISO-2022-JPの通称のことなのか?
それともCCSとしてのJISX208なのか。

113:デフォルトの名無しさん
07/01/24 23:51:46 .net
だいたい文字をコード(数字)に置き換えなければならない
現代のコンピュータアーキテクチャが問題。

やっぱ文字は文字として扱えなきゃダメでしょ。

114:デフォルトの名無しさん
07/01/25 09:34:43 .net
「文字を文字として扱う」っていうのは具体的にどういうことよ?

115:デフォルトの名無しさん
07/01/25 10:01:33 .net
0から9、AからFまでの文字しか使わない

116:デフォルトの名無しさん
07/01/25 11:25:11 .net
で、それらの文字を文字として扱うとはどういうこと?

117:デフォルトの名無しさん
07/02/10 22:58:13 .net
あいう・・・と書かずに
a01001a01002a01003・・・

118:デフォルトの名無しさん
07/03/16 03:44:15 .net
ベクトルデータとしてパターン認識させるとか?w

119:デフォルトの名無しさん
07/07/12 19:45:19 .net
【日本語を扱える主な文字コード(“x-” 付きのものは IANA 非登録)】

Shift_JIS
Windows-31J
x-Mac-Japanese

ISO-2022-JP
ISO-2022-JP-2
x-CP50220

EUC-JP
x-CP51932

UTF-8
x-UTF-8N
x-UTF-8-BOM

UTF-7

UTF-16
UTF-16BE
UTF-16LE

120:デフォルトの名無しさん
07/07/12 21:01:07 .net
UTF-32系は?

121:・∀・)っ-○◎●
07/08/09 02:10:09 .net
UTF-9は?

122:デフォルトの名無しさん
07/08/09 16:25:42 .net
UTF-18は?

123:デフォルトの名無しさん
07/08/09 23:52:07 .net
Punycodeは?

124:デフォルトの名無しさん
07/08/13 14:54:27 .net
Windows上でperlのCGIを作成していて、
ファイルの保存時に、漢字コードを指定しないと
保存できないのですが、
シフトJISと
JISと
EUCと、
どれを選択したらいいのでしょうか?
作成後はFFFTPでレンタルサーバーにアップロードしますが、
そのレンタルサーバーは当然UNIXなので、
UNIXで動かすということを考えればEUCで保存したほうが
いいのですか?
あと、C5の問題(表とか)を考えれば
シフトJISだと
表¥
っていちいち書かないと文字化けしますが、
EUCだったらそんな余計なこと考えないでいいと
いう記述も見つけました。
だったらEUCで保存しようかな?と思いましたが
それだとWindows上でソースコードの変更作業するときに
漢字が文字化けしないですか?
だってWindowsはシフトJISしか取り扱えないのだから。
結局何で保存すればいいのでしょうか?

125:デフォルトの名無しさん
07/08/13 23:34:09 .net
>>124
・ShiftJisで書いてffftpで変換する。
・まともなエディタでEUCで書く。

126:・∀・)っ-○◎●
07/08/15 03:02:00 .net
UNIXだからってサイトをEUCにしないといけないなんてことはない。
最近のLinuxは標準文字コードはUTF-8が多いよ。

XML対応とかも視野に入れるならできればUTF-8のほうがいい。
Shift-JISはね、HTMLだけならいいけどプログラム書くと何かとトラブルに遭いやすい。


127:デフォルトの名無しさん
07/08/15 03:08:05 .net
そしてベンダ毎の変換表の違いやらのUnicode特有の問題になやまされるわけですね。

SJISでも機種依存文字とか、2バイト目に0x5C使ってるとか問題あるけど、
Unicode使っても薔薇色の未来が待ってるわけじゃない。
どっちかっつーと、長いものには巻かれろ的な感じの方が強い。

128:デフォルトの名無しさん
07/08/15 10:36:44 .net
ハナからUnicode使ってれば変換表とか関係ないんじゃ?

129:・∀・)っ-○◎●
07/08/15 23:28:24 .net
それは言える。

tDiaryでうかつにrecent-rssプラグイン使って2chのRSSを表示しようとすると
機種依存文字の関係でUNICODEの変換失敗で全部転ける。

130:デフォルトの名無しさん
07/08/16 01:39:32 .net
>>128
ハナからUnicodeしか使って無くても、WAVE DASH使うと
Windowsのフォントでは汚くなるとかあるし無問題とはならない。

131:デフォルトの名無しさん
07/08/16 05:24:15 .net
世界が今すぐに全てUnicodeに変るわけじゃないから、
>>128は実現不可能な夢。

そもそも狂っている変換表があるから、
元の意味/意図と違うUnicodeのデータが溜っていっている状況。

132:デフォルトの名無しさん
07/08/16 10:12:50 .net
ダンゴさんの居るスレは活気があるな。

133:デフォルトの名無しさん
07/08/20 17:54:12 .net
普通の日本語のサイトならEUC-JPかISO-2022-JPでいいだろ
ちょいと外国の文字使うくらいなら実体参照でも十分だし
Unicodeなんて混乱の極みにある物を使う気にはなれん

134:デフォルトの名無しさん
07/08/20 20:15:12 .net
なんでウェブサイトの話になってるの?


135:デフォルトの名無しさん
07/08/26 08:04:08 .net
あげ

136:デフォルトの名無しさん
07/08/30 08:21:39 .net
ネットワークが一番文字コード問題が露呈しやすいからだろ

137:デフォルトの名無しさん
07/09/02 18:33:34 .net
>>1
なんで人の言葉は複数あるんでしょうか?


138:デフォルトの名無しさん
07/09/04 16:32:27 .net
バベルの塔を建てたから

139:デフォルトの名無しさん
07/09/08 10:08:44 .net
JEFとかKEISとかその先にある厚生省系、労働省系の外字コードなんかがUnicodeに反映されていないってのがあるな

140:デフォルトの名無しさん
07/11/25 16:28:52 .net
JISの文字コード表なんて
もうごちゃごちゃだな
80h~9Fhなんて制御文字には使わないんだから
1区1点~126区126点1つにまとめろよ

141:デフォルトの名無しさん
08/01/16 23:18:53 .net
>>135
あるよ。
以上。
↓次の方どうぞ

142:デフォルトの名無しさん
08/05/07 23:34:16 .net
age

143:デフォルトの名無しさん
08/05/12 22:00:30 .net
sage

144:デフォルトの名無しさん
08/07/09 23:50:48 .net
2208

145:デフォルトの名無しさん
08/12/23 07:49:06 .net
>>139
JEF KEIS IBM JIPS(E/J)
これらの拡張も含めた文字は全てUTF-8で表現できるんじゃないの?

146:デフォルトの名無しさん
08/12/25 21:09:50 .net
プライベートエリアを私用領域とか訳しちゃうセンスが在る限り文字コードは増え続けるさ


147:デフォルトの名無しさん
09/01/07 12:48:00 .net
だれか文字コード総合スレの新スレ立ててー。

148:デフォルトの名無しさん
09/01/07 21:23:47 .net
>>147
前スレ、一ヶ月書き込みなくて17レスで落ちてるみたいだけど、需要ないからじゃね?

149:デフォルトの名無しさん
09/01/07 21:31:34 .net
この板、即死に引っ掛からなければ、数か月書き込みないのはざらなほう。

150:デフォルトの名無しさん
09/01/08 00:03:07 .net
>>147
ここを乗っ取ればいいんじゃね?
>>148
誰もExt.Cには興味ないのか…
Unicodeメーリングリストも絵文字で絶賛炎上中だしな

151:デフォルトの名無しさん
09/01/08 22:13:20 .net
>>149
ああ、即死食らったのか

まぁ、このスレで充分な気もするけど

152:デフォルトの名無しさん
09/01/12 16:41:43 .net
URLリンク(www.unicode.org)
最近のUnicodeメーリングリストは顔が真っ赤で引くに引けなくなった人たちが
たくさんいるようだがこれはひどすぎる
日本では「犬」を「ケン」と読むこともあるなんて知らないんだろうな。
それとも「いぬ」と読む「犬」と「ケン」と読む「犬」は別字だとか言い出すんだろうか。
それ何てKS X 1001?

153:デフォルトの名無しさん
09/01/12 19:52:02 .net
文字コードって65000くらいあるの?

154:デフォルトの名無しさん
09/01/12 21:00:14 .net
100万くらいあります

155:デフォルトの名無しさん
09/01/15 00:13:07 .net
絵文字レビュー終了のお知らせ

156:デフォルトの名無しさん
09/01/18 23:15:58 .net
国ごとに専用の(速度重視の)エンコーディング一つとUnicodeだけにしてほしい

157:デフォルトの名無しさん
09/01/18 23:17:53 .net
>>157
日本は何にするの?

158:デフォルトの名無しさん
09/01/26 11:26:56 .net
URLリンク(twitter.com)

159:デフォルトの名無しさん
09/01/26 12:52:12 .net
>>157
JIS_X201で。

160:デフォルトの名無しさん
09/01/26 23:24:33 .net
URLリンク(smallbear.sakura.ne.jp)
まるで人ごとのように書いてますけど
TRONコードでは&T224C71;と&T224C72;のどっちなんですか?
ていうか「&T224C71;と&T224C72;の区別すらできない欠陥規格だ!」式の批判は
(JIS|Unicode)叩きの定番だったような気がするんですが。
ていうかTフォントマダー? (AAry

161:デフォルトの名無しさん
09/01/27 01:10:46 .net
「…お母さん?俺やけど…」
「…TRONか?…」
「うん…俺、包摂分離してしもて…」
「もう、包摂分離の事は気にせんでいいから、成仏して…」

162:デフォルトの名無しさん
09/01/27 08:05:57 .net
ちなみに今昔文字鏡では*****(検閲削除されました)番と*****(検閲削除されました)番。
いや実際には調べてないけど絶対分離されてるに違いないし

163:マイク ◆gZ6OoOjBU6
09/02/05 08:39:33 .net
UnicodeだかUTF16だか知らんが
サロゲート文字の処理に関する脆弱性が色々なブラウザで報告されたりしてた。
2001年頃に2chで西村博之が誰かに指摘されてたウニコードに関する問題ってそれのことだったのかな。

164:マイク ◆gZ6OoOjBU6
09/02/05 08:49:15 .net
これだわこれ。
blackhatコンファレンスで長谷川洋介って人だっけ?
それが発表してた文字コードに関する脆弱性に関する論文に近いもの。
見てない奴は見てみ
参考になんぞ

URLリンク(www.blackhat.com)

165:デフォルトの名無しさん
09/02/06 15:04:05 .net
Gmailが絵文字を全世界的に公式アナウンス。

URLリンク(mail.google.com)

> Emoticons - they're not just for chat anymore
> Express yourself with emoticons from to (小さい笑い顔) or (カニ) even (ハエうんこ).
> Click the (小さい笑い顔) button when composing a message
> in "Rich formatting" mode, or choose the new emoticons tab in chat,
> and express yourself to your ハートマーク)'s desire.
> Learn more (URLリンク(mail.google.com))

URLリンク(mail.google.com)
を絵文字アイコンに決定した模様。

「even ハエうんこ」ワロタ

166:デフォルトの名無しさん
09/02/07 08:19:39 .net
Sun-ExtBが更新されて、Extension Cの正式版に対応してた。
>>165
それはちょっと前に話題になってたUnicode絵文字じゃなくてリッチテキスト方式かな

167:デフォルトの名無しさん
09/02/07 09:20:45 .net
UTF-16サロゲートペアをUTF-8に変換出来ますか?

168:デフォルトの名無しさん
09/02/07 12:12:34 .net
>>167
いったんUnicode scalar valueを求めてからUTF-8に変換してください。
サロゲートのコードポイント(D800..DFFF)をそのままUTF-8にするのは不正です。

169:デフォルトの名無しさん
09/02/08 01:58:04 .net
日本人になまじ技術力があったから日本製PCが一時期国内でシェアを占め
独自のPC漢字文化が創られた。これがすべての始まり。

170:デフォルトの名無しさん
09/02/08 13:24:01 .net
で、ケータイの世界でもまったく同じようにガラパゴスケータイがシェアを占めて
独自の絵文字文化が発達したわけですね、わかります。

進歩しろよ

171:デフォルトの名無しさん
09/02/10 11:08:47 .net
絵文字はユニコードに入りますよ、たぶん。

172:デフォルトの名無しさん
09/02/11 01:08:00 .net
日本のケータイメーカーが音頭を取って入れたわけではないけどね。
漢字だってAdobeの活動でようやく異体字の使い分けが(原理上は)できるようになった

173:デフォルトの名無しさん
09/02/13 07:51:40 .net
URLリンク(www.kumikomi.net)
> 2009年の早い時期に,
もう出す出す詐欺はいいよ
> 第1期 236,025字の一般リリース(Webからの無償ダウンロード)を予定しているという.
GT78,675字×3書体を先に出すことにしたのか

174:デフォルトの名無しさん
09/02/17 21:04:27 .net
久しぶりにSMPのroadmapを見たらU+1B100あたりに「(Historic Kana)」というのがあった。
URLリンク(www.unicode.org)
歴史的仮名遣いに必要な文字はすべて収録済みのはずだから
変体仮名の追加提案かな

175:デフォルトの名無しさん
09/02/17 21:25:54 .net
"historical"じゃないのは何故だろう?

176:デフォルトの名無しさん
09/02/17 23:03:24 .net
この前提案されてたKATAKANA LETTER ORIGINAL E(片仮名の元々のア行の「エ」、「衣」に由来)もそこに入るのかも知れない。
同時に提案されてたHIRAGANA LETTER YE(平仮名ヤ行の「え」、「江」に由来)は平仮名ブロックの空きの内の一つU+3097にほぼ決定みたいだが、
片仮名ブロックはもう空きが無いからな。

177:デフォルトの名無しさん
09/02/22 18:58:47 .net
URLリンク(fezn.exblog.jp)
一太郎ってIVS対応してたの? マジ?

178:デフォルトの名無しさん
09/02/23 23:33:42 .net
> 今後は「出典をすべてscanデータで出すべし」という方針に。
> だが、律儀に守っているのは日本と中国ぐらい。。
> 未提出多数とか、「人名だから」出さずじまいとか、出典非明示→取り下げ、とか。
UCSがゴミまみれになるのを防ぐことに一定の効果を上げてるわけだな。いいことだ。

179:デフォルトの名無しさん
09/02/24 15:45:03 .net
>>177
今後の話だろ。

180:デフォルトの名無しさん
09/02/25 22:50:21 .net
今後の話だったら「ブラウザはまだ」って書いてるのが変だ

181:デフォルトの名無しさん
09/03/03 22:09:24 .net
U+1B000がKATAKANA LETTER ARCHAIC E(片仮名「衣」由来のア行の「エ」)になってた。
名前がORIGINAL E(元々の「エ」)からARCHAIC E(古代の「エ」)に変更されてた。
平仮名ヤ行の「え」と違ってBMP外になってしまうけどしょうがないか。
Historic KanaというブロックでU+1B000から256文字分予約されたけど今後変体仮名とか重要な昔の仮名をU+1B001以降にも追加していくつもりなのかな?

182:デフォルトの名無しさん
09/03/04 00:21:44 .net
256で足りるのw?
そこら辺の文字はよく知らないけど512から1024くらいあってもいいような。

183:デフォルトの名無しさん
09/03/04 00:29:59 .net
変体かなは良く分からないけど、ここのページを見る限り、平仮名だけでも軽く600以上ありそう。
URLリンク(www10.plala.or.jp)


184:デフォルトの名無しさん
09/03/04 12:43:59 .net
住基仮名だけなら256で足りるがな。

185:デフォルトの名無しさん
09/03/05 07:38:01 .net
1バイト目に文字種を表すもんだけいれて後は可変でよろしくやればいいと思った
最低2バイト~な感じで

186:デフォルトの名無しさん
09/03/05 17:50:02 .net
欧米人にはそれが理解できんのですよ。

たとえば、”うまれつき目の見えないひと” を想像してみてください。
その人に「海は青い」という事を、いったいどうやって教えればいいのか。
そのひとには、赤も青も黄色も無いんです。色という概念が全く無いんです。
だから理解不可能です。

3次元の世界で生活している我々が4次元の世界を理解できないのと同じく
1文字1バイト圏で生活している欧米人には、1文字が2バイト、3バイトになるのが
理解できんのです。ヤツらにとってマルチバイト文化は4次元の世界なのです。

187:デフォルトの名無しさん
09/03/05 18:06:53 .net
物理的に無理なのと一緒にされても。

188:デフォルトの名無しさん
09/03/05 19:19:15 .net
文字コード総合の次スレはここでござるな? しからば過去スレを貼り。

【UTF8】文字コード変換【SJIS】
スレリンク(tech板)
文字コード統一スレ 1文字目
スレリンク(tech板)
文字コード総合スレ part2
スレリンク(tech板)
文字コード総合スレ part3
スレリンク(tech板)


189:デフォルトの名無しさん
09/03/05 20:24:38 .net
>>185
いきなり可変でよろしくやってるのがUTF-8です。

190:デフォルトの名無しさん
09/03/05 21:44:14 .net
>>184
たとえば「安」から「あ」へ連続的に変化していく過程の文字の数々にどうやって包摂規準を
設定するのか、とか考えると住基仮名のようなclosed setしかありえない気がする

191:デフォルトの名無しさん
09/03/07 02:01:46 .net
変体でも「あ」なら「あ」なのだから、「あ」に対して異体字セレクタの対応を決めればいいだけなんじゃね?
256種類まで対応できるんだから、多分足りるでしょ。
足りなきゃ、異体字セレクタの方を増やせばいい。


192:デフォルトの名無しさん
09/03/07 14:29:53 .net
U+E0100~U+E01EFは漢字専用じゃなかったっけ?

193:デフォルトの名無しさん
09/03/07 15:36:34 .net
それよりアラビア文字みたいに前後の文字で字形を変えるのを
サポートする必要があるんじゃないか

194:デフォルトの名無しさん
09/03/07 19:27:11 .net
・縦書き
・前後の状況で字形を変える必要がある
・異体字セレクタに対応が必要
それなんてモンゴル文字?

195:デフォルトの名無しさん
09/03/07 22:28:59 .net
草書を標準化するところから始めないと…

196:デフォルトの名無しさん
09/03/08 11:10:41 .net
アラビア文字がまさに草書の電子化

197:デフォルトの名無しさん
09/03/09 02:11:40 .net
文字コード総合スレ part5
スレリンク(tech板)l50
作ってきた。 
即死回避に、だれか頼む。 
あと、テンプレがまだ(40行)残ってるので。現在連投規制(5回)で書き込めないのを何とかしないといけない。


198:デフォルトの名無しさん
09/03/09 02:23:53 .net
●かえ

199:デフォルトの名無しさん
09/03/09 02:36:52 .net
●持ってない
取り合えず見切り発車してくれ。

200:デフォルトの名無しさん
09/03/09 22:10:13 .net
>>197


どんだけ書けば即死回避するんだっけ

201:デフォルトの名無しさん
09/03/23 19:29:17 .net
>>192
あれって漢字専用なの?
漢字とモンゴル文字以外の場合はU+FE00~FE0Fを使わないといかんの?

202:デフォルトの名無しさん
09/08/11 15:28:27 .net
       ∧_∧
     ( ・∀・ )つ
     ( つ /
     | (⌒)どどど・・・
.       し' 三


       ∧_∧
    ⊂( ・∀・ )
.     ヽ ⊂ )
     (⌒) |どどどどど・・・・・
        三 `J

    メ\,_        ,メ゙\、
   .メ′ .゙゙アhr    _,zl||y,_ .゙∨
   .″       .y!^⌒ ¨\ .,,,,,,__ 
     .,yr=¬z  .l|  ◎  《 . ゙゙̄^へu,
 ,メ″,z厂◎  l|  ¥     il!      ゙ミ
il「  ミy   ..,ilト  ゙ミy_ ア ,メ       .∨
.ll′   干=冖″       ,,,yyyyy.   l|    / ̄ ̄ ̄ ̄ ̄
.l|     ,,,yvr=冖''''|リ|||》巛》ミ冖'li厂.l|   .,l!  <  薄型?!!!
.l!     《vvvr=冖¨ ̄      .゙干l!  .,メ′   \_____
.l|     .l|   .,,yrrvy_   ,,,,,,_   .《yrl″
\_   ,l|.,yzl^^゙゙^冖《《||7厂`゙リu_ .l|
  .゙\、 .r《l厂      .¨゙冖=vu,フhrト


203:デフォルトの名無しさん
09/12/12 15:53:19 .net
>>1
日本が世界を統一できなかったから

204:デフォルトの名無しさん
09/12/12 18:36:49 .net
>>47

むしろNTはいち早く海栗コードだっただろ
当時は処理コストの無駄とすら言われていた。

205:デフォルトの名無しさん
10/04/08 01:34:54 .net
もし、織田信長が生きていたら、日本が世界を支配するとか、テレビってマジ、アホだな。
あそこに出てた専門家も恥ずかしくないんだろうか?
(ひょっとして自称専門家かな)

206:デフォルトの名無しさん
10/06/27 00:46:08 .net
UTF8最強
ASCIIとの互換性は伊達じゃない。

207:デフォルトの名無しさん
10/06/27 00:57:46 .net
もし、織田信長が生きていたら、日本が世界を支配

208:デフォルトの名無しさん
10/06/30 13:16:56 .net
立ってないことろを見ると、ここが「文字コード総合スレ」の後継スレでつか?

209:デフォルトの名無しさん
10/06/30 13:28:51 .net
立てるか。
テンプレ面倒過ぎるな。1 だけでいい?

210:デフォルトの名無しさん
10/06/30 23:13:43 .net
VSネタまだやるなら分けてほしいな

211:デフォルトの名無しさん
10/07/02 17:37:12 .net
結局争点はなんだったのだろう?

212:デフォルトの名無しさん
10/07/02 23:59:40 .net
>>211
俺、utf8非万能説についてた人だが、俺の争点はそこだったんだが、相手の争点はそこじゃなかった気がするんだ。
一体何が争点だったのか、当事者にも分からない。

213:デフォルトの名無しさん
10/07/03 00:50:32 .net
>>211
もおたが飲み仲間なのか、それとも憎いかでしょう。

214:デフォルトの名無しさん
10/07/03 11:01:09 .net
それじゃ、争点を洗い出すスレが別に要る?それともここがそれ?

215:デフォルトの名無しさん
10/07/03 11:02:48 .net
>>214
もういらないだろ。

216:デフォルトの名無しさん
10/07/03 11:55:19 .net
文字コードのスレは何故複数あるのでしょうか?

217:デフォルトの名無しさん
10/07/03 11:57:49 .net
コードもスレも統合出来ないお馬鹿さんたちwww

218:デフォルトの名無しさん
10/07/03 12:18:09 .net
馬鹿が来たぞー

219:デフォルトの名無しさん
10/07/03 12:41:21 .net
>>211
争点は、UTF8はUTF16やUTF32よりも優れている。
特にASCIIとの互換性に優れており、
既存のソフト・・・多くはASCIIやEUC-JPなどの
ASCII互換用として作られているソフトや
そこで使われているライブラリの互換性がよく
ほとんど修正無しに動く。
UTF16やUTF32だと修正のコストが膨大になる。
ということ。

220:デフォルトの名無しさん
10/07/03 12:52:08 .net
wchar_tとロケールとファイルシステム(fopen)がごっちゃになってた気がするんだが。

221:デフォルトの名無しさん
10/07/03 13:01:26 .net
全部charをwchar_tに置き換えるだけでOKとかいう
能天気やろうもいたしな。

それが全ソースコード修正&再テストという
意味だというのを気づいていない。

その膨大さに気づいていないから、
置き換えるだけにコストがかかるというんですか?
なんてことを平気でいえてしまう。

222:デフォルトの名無しさん
10/07/03 13:06:11 .net
>>219
それは争点じゃなくて、君の意見。

そしてUTF16,UTF32に拘りすぎ。
それを最初に持ち出した人(同一人物かは知らんが)は、
UTF8でも修正コストが膨大だと主張していて、UTF16は別にどうでもいい感じだった。

>>220
その通り。ファイルシステムどころかOSの仕様まで混ざってきて、複雑になるばかりの泥仕合。

223:デフォルトの名無しさん
10/07/03 13:07:21 .net
>>222
お前の意見も、「君の意見」でしかないよ。

鏡見ろ

224:デフォルトの名無しさん
10/07/03 13:07:38 .net
>>221
置き換えずにそのまま使うのにコストがかかるんですか?というのと同レベルの話。

225:デフォルトの名無しさん
10/07/03 13:08:47 .net
>>223
俺は争点について話してない。>>219は争点について話しているはずなのに、君の意見しか入ってない。
自分の考え方に囚われるな。

226:デフォルトの名無しさん
10/07/03 13:10:12 .net
>>222
文字コードを変えるのにOSの仕様まで出てくるってこと自体が、
文字コード変えるのがいかに難しいかを示しているんだけどなぁ。

227:デフォルトの名無しさん
10/07/03 13:17:19 .net
この話は続ける必要はない。落ちたスレで既に話は終わっていたのだから。

999 名前:デフォルトの名無しさん [sage]: 2010/06/26(土) 22:19:28
>>972

>UTF-8にすると何もかも上手くいくよ派は、何を言いたいのかよくわからん

そんな奴いたか? wchar_tにすれば何もかもうまくいくよ派は居たけど。

---

UTF-8にすると何もかも上手くいくよ派がいないのなら、
>>212が争点にしてたことは、元々誰も否定してなかったことだし、
>>219が争点にしてたことは、元々誰も言っていなかったこと。
wchar_tにすることが全てを解決する方法じゃないのは自明。

結論は既に出ていた。

228:デフォルトの名無しさん
10/07/03 13:25:04 .net
>>219が争点にしてたことは、元々誰も言っていなかったこと。

言っていたレスはあった

229:デフォルトの名無しさん
10/07/03 13:30:08 .net
じゃあここは「文字コード総合スレ」がなぜ立たないのか、立てた場合のテンプレの話のスレにする?

230:デフォルトの名無しさん
10/07/03 13:38:28 .net
なにもなければ放置されるだけのスレの埋め草としてちょうどいいな。

231:デフォルトの名無しさん
10/07/03 14:35:47 .net
>>228
それよりも俺はwchar_tにすれば何もかもうまくいくよ派がいたのかどうかが気になるが。

>>229
いらないからだろ。

232:デフォルトの名無しさん
10/07/03 14:58:57 .net
さっさと次スレ立てろよボケ

233:デフォルトの名無しさん
10/07/03 15:13:49 .net
>>231
> >>228
> それよりも俺はwchar_tにすれば何もかもうまくいくよ派がいたのかどうかが気になるが。
>
WindowsかJavaしか知らなくて、Unixのロケールを知らなければそういう発想になるかも。

234:デフォルトの名無しさん
10/07/03 15:21:57 .net
>>233
意味が分からん。2chに書いてあったか書いてなかったかと、Unixのロケールがどう関係するんだ?

235:デフォルトの名無しさん
10/07/03 15:24:04 .net
情報の受け手側に理解する能力がなければ書かれてても気付かないってことだろう


236:デフォルトの名無しさん
10/07/03 15:26:22 .net
>>234
> >>233
> 意味が分からん。2chに書いてあったか書いてなかったかと、Unixのロケールがどう関係するんだ?
fopenのwchar_tは規格化されていない、から泥仕合が始まったのだが。

237:デフォルトの名無しさん
10/07/03 15:28:13 .net

知らないことは誰だってあるけど、いいやんとか言って違いも調べず思考停止するやつは向上心もう少し持とうぜ

238:デフォルトの名無しさん
10/07/03 15:43:18 .net
>>236
・fopenの話が出たことと、wchar_tにすれば何もかもうまくいくという人がいたことは関係がない
・fopenが出てくる前から、どうせ泥試合だった
・どっちにせよ、fopenでそのままutf8渡して(文字化けすらしないという意味で)うまくいくのはロケールもutf8のときのみ
と認識しているが。

239:デフォルトの名無しさん
10/07/03 16:01:26 .net
> ・どっちにせよ、fopenでそのままutf8渡して(文字化けすらしないという意味で)うまくいくのはロケールもutf8のときのみ
> と認識しているが。

ロケール間違ったまま使っていることなんてしょっちゅうあるが?
日本語化しないままOS使えるだろ。
文字がちゃんと表示されないだけで

240:デフォルトの名無しさん
10/07/03 17:02:38 .net
Linuxのext2,ext3でSJIS,EUC-JP,UTF-8のファイル名混在は時々ある。
LinuxでもCD-ROM,vfat,ntfs,smbfsをマウントできて、その時に文字コードを指定しないと痛い目にあう。

241:デフォルトの名無しさん
10/07/03 17:47:51 .net
>>239
日本語使えるロケールでも日本語がちゃんと表示されないんだったら、それは正常に動作してるとは言わない。
たとえ内部的にはちゃんと保持できていたとしても、関係ない。

>>240
それぞれのパーティションごとに文字コードが違うのは指定すればいいけど、
同一パーティションに複数の文字コードが混在してるのはやめてほしいが……

242:デフォルトの名無しさん
10/07/03 18:27:39 .net
LANG=Cでもきちんと表示できなかったらだめだって言い切っちゃうの?

243:デフォルトの名無しさん
10/07/03 19:37:56 .net
>>242
それは日本語使えるロケールじゃないだろ。

244:デフォルトの名無しさん
10/07/03 19:41:28 .net
つか、例えば仕様書に「ロケールはja_JP.eucjp」って明記してあっても、
utf8で書いてもなんにも問題はないからutf8で書いて、
utf8なら問題なくfopen使えるからutf8でfopen使って、
結果、表示が文字化けしていても、utf8なら問題なく読めるから問題ないって言いきるつもりなのか?

内部的にはutf8使ってもいいけど、必要に応じて変換しないとダメなんじゃないの。

245:デフォルトの名無しさん
10/07/03 19:44:47 .net
>>241
表示が化けるのはあくまで端末側の問題。
fopen自体はロケール関係なく正常に動作している。
まったく同じコードでね。
UTF8がASCII互換だからちゃんと動く。

246:デフォルトの名無しさん
10/07/03 19:52:48 .net
「日本語が使える」の定義が知りたい。

247:デフォルトの名無しさん
10/07/03 20:34:28 .net
>>245
ロケールがEUC-JPなのにファイルをUTF8で書き込むのは正常動作って言えるのか?
日本語ロケールでUIが全部韓国語になるのと同じくらい馬鹿げてると思うぞ。

248:デフォルトの名無しさん
10/07/03 20:38:42 .net
>>238

>・どっちにせよ、fopenでそのままutf8渡して(文字化けすらしないという意味で)うまくいくのはロケールもutf8のときのみ
>と認識しているが。

それはそうだけど、fopenの機能としてはちゃんと動作するよね。
wchar_tの渡した場合、fopenが正しく機能しない・・・というか渡せない つまりfopenでは動作しない

どちらもうまく動いてないといえるけど、その動かない箇所のレイヤーが違うんだよね。
それを同じ土俵で較べ合ってもしょうがないと思うんだが。

249:デフォルトの名無しさん
10/07/03 20:52:48 .net
>>248
1. 意図した通りの結果にならないのなら、どこで失敗しても五十歩百歩
2. wchar_tでもcharでも意図した通りの結果にしたければ、一旦ロケールに合わせて変換しないといけないという点で同じ
3. なんでそんなにwchar_tに拘ってるの?
   >>227
   > wchar_tにすることが全てを解決する方法じゃないのは自明。
   >>231
   > それよりも俺はwchar_tにすれば何もかもうまくいくよ派がいたのかどうかが気になるが。

250:デフォルトの名無しさん
10/07/03 20:59:31 .net
> 2. wchar_tでもcharでも意図した通りの結果にしたければ、一旦ロケールに合わせて変換しないといけないという点で同じ

意図したとおりの結果にするには表示するときにデータを整えれば良いだけの話。
それはfopenには関係ない話。


251:デフォルトの名無しさん
10/07/03 21:01:10 .net
>>247
> ロケールがEUC-JPなのにファイルをUTF8で書き込むのは正常動作って言えるのか?
普通にロケールがEUC-JPだけど、
UTF-8のファイルを読み書きしたり
データベースがUTF-8だったりするけど?

何を言いたいのかさっぱりわからん。

252:デフォルトの名無しさん
10/07/03 21:03:28 .net
fopen(3)はNULLを返さなければ、open(2)は-1を返さなければ正常。

253:デフォルトの名無しさん
10/07/03 21:26:40 .net
内部的にはutf8使う香具師なんているのか

254:デフォルトの名無しさん
10/07/03 21:28:50 .net
なぜ内部にこだわる?

255:デフォルトの名無しさん
10/07/03 21:29:09 .net
>>253
> 内部的にはutf8使う香具師なんているのか
Gtk+

256:デフォルトの名無しさん
10/07/03 21:36:31 .net
GTKは糞

257:デフォルトの名無しさん
10/07/03 21:47:40 .net
wchar_tが2バイト4バイト、エンディアンの違いを考えると、
gtkの内部utf-8はマルチプラットフォームって意味では合理的だと思うが。

258:デフォルトの名無しさん
10/07/03 22:45:00 .net
>>249

>1. 意図した通りの結果にならないのなら、どこで失敗しても五十歩百歩

結果で見ればそうだけど、ここはプログラム板。
システムで採用されているロケールの文字を使う限り文字化けはしないわけでしょ。
ASCIIでもShift_JISでもUTF-8でも。
それらに対してprintfはそのまんま使える汎用性がある。

wchar_tの場合は、そこまで汎用性が持たせられない。というかそこまで汎用的に
使える標準関数が整備されていない。

その違いによる(プラットフォーム間の移植などで)発生するコストをどう捉えるかの
問題じゃないの?


259:デフォルトの名無しさん
10/07/03 23:17:42 .net
ばかっ。
wchar_tとか不用意に持ち出すと今度はCSI vs UCS Normalizationで不毛な戦火の拡大が……

260:デフォルトの名無しさん
10/07/03 23:33:30 .net
>>250
eucjpロケールの環境で、ファイル名も全部eucjpで保存されてるのに、どっかの誰かがお構いなしにutf8で書いて文字化けしたら、
その人のためにわざわざlsをeucjpとutf8混在しててもちゃんと使えるように書き換えろって言うの?

> 結果で見ればそうだけど、ここはプログラム板。
関係がない。どこの板でも、表示上文字化けするかしないかは重要な基準。

261:247
10/07/03 23:36:12 .net
utf8の利点言いたい人がfopenなんて持ち出したのが間違いとしか思えない。
むしろ、俺ならそこに触れないわ。

>>251
ごめんよー、ファイル名の間違いだわ。

262:デフォルトの名無しさん
10/07/03 23:37:59 .net
>>260
文字化けするが書けるだろう?

それは違う文字コードでちゃんと書けていることを意味するんだよ。

263:デフォルトの名無しさん
10/07/03 23:38:59 .net
>>258
>>249の2.には異論ないのかな?
だったら、
fopenがそのまんま使えるには使えるけれども、意図した通りの結果にしたければ、一旦ロケールに合わせて変換しないといけない
が結論なわけだな。

264:デフォルトの名無しさん
10/07/03 23:41:19 .net
>>262
それでいいんだったら、utf8自体いらない。
UTF16をbase64エンコーディングしたらASCIIだけで事足りるんだから。

265:デフォルトの名無しさん
10/07/03 23:42:31 .net
意図した通りってなんだよ。

ファイル名が「テスト」だとしてEUC-JPで書き込んだ場合と
UTF-8で書き込んだ場合、文字コードが違うのだから
それをあらわすバイナリ列も違う。

だから違うファイル名として扱うのが意図した動作だが?

逆に言えば、fopenはバイナリ列しか見ておらず
それがEUC-JPかUTF-8なのかは気にしていない。
わざわざ文字コードを変換する機能を入れるのが意図した動作だと?

266:デフォルトの名無しさん
10/07/03 23:46:45 .net
>>265
そしたら、君は何のためにファイル名に非ASCII文字を使うの?

267:デフォルトの名無しさん
10/07/03 23:50:03 .net
酷い流れだ。もう結論これでいい?

表示上文字化けしないようにファイル作りたかったら、文字コード変換しろ。
表示上文字化けしてもバイナリ列が保存されていればどうでもいいなら、utf8使っても構わん。

268:デフォルトの名無しさん
10/07/03 23:52:27 .net
>>266
何のためにじゃなくて、Unixでは'/'と'\0'以外パス名に制限が無いから、
それ以外何を使っても良い、でしょ。

269:デフォルトの名無しさん
10/07/03 23:55:05 .net
>>268
何使ってもいいけど、そんなキーボードで入力しにくいファイル名使って何がしたいの?

270:デフォルトの名無しさん
10/07/03 23:55:48 .net
>>268
じゃあ、Windowsじゃutf8でfopenは残念なことになるって思っていい?

271:デフォルトの名無しさん
10/07/04 00:05:25 .net
>>270
cygwin

272:デフォルトの名無しさん
10/07/04 00:12:23 .net
>>269
確かにウムラウトとか入力しずらいね。

273:デフォルトの名無しさん
10/07/04 00:17:36 .net
>>270
はい。残念なことになっています。

fopenはワイド文字を扱う場合は、_wfopenを使うようにと
一時期は使えない関数とされ、今は一応使えるようになりましたが、
標準を満たしていない独自の引数をとるようになりました。

もはや互換性の無い別物です。

274:デフォルトの名無しさん
10/07/04 00:33:55 .net
>>272
うん。表示に拘らないのなら、半角英数だけで事足りる。ドットくらいは使うかもしれんが。
実際、人が読む必要がないキャッシュファイルやら一時ファイルはそういう風な名付け方になってることが多い気がする。

275:デフォルトの名無しさん
10/07/04 00:34:16 .net
WindowsでfopenでUNICODE文字列のファイル名って開けるのか?

276:デフォルトの名無しさん
10/07/04 00:36:42 .net
URLリンク(www.game-create.com)
>
> よく使う標準関数の UNICODE 対応表を作ってみました。
>
> Windows では UNICODE 対応時と UNICODE 未対応時で
> 呼び出す関数を振り分ける必要がありますが、 _t で始まる
> 標準関数を使っておくことで、コンパイル時に自動的に関数を振り分けることができます。

あー、これは残念だw

277:デフォルトの名無しさん
10/07/04 00:41:32 .net
TCHAR 型ってwww
URLリンク(www.ruche-home.net)

278:デフォルトの名無しさん
10/07/04 00:52:11 .net
>>275
言葉自体が曖昧。
まず、Windowsは内部ではファイル名をutf-16で管理してる。
そして、fopenは実装依存。とりあえずVC++のfopenで、日本語ロケールでの使用を想定する。
つまりfopenはcp932(sjisのMS拡張と思ってよし)でエンコードされたchar*をとって、内部でutf-16に変換してる。

そういう意味で、全ファイル名がUNICODE文字列であって、fopenではcp932を経由してUNICODE文字列のファイル名を開ける、と言える。

あるいは、cp932入れるべきところに強引にUNICODE文字列をねじこんで、
それをWindowsが内部でcp932のつもりでutf-16に変換したもの、という意味なら。

まず、それがファイル名として妥当なものになるのか(つまり、そんなファイル作れない。ないものは読めない)というのがひとつ。
次に、UNICODE文字列とはutf8か16か32か(あるいは7か...)。
16,32ならNULを含むことになって作れないだろうなぁ。
8なら、sjisのバックスラッシュ問題にコンパイラが対応してるか、ユーザが小細工してるか。
それによって別の文字になるので調整しないといけないが、うまくすれば読める。

279:デフォルトの名無しさん
10/07/04 00:52:15 .net
>>270
CP_UTF8ってのがあるよ。

280:デフォルトの名無しさん
10/07/04 01:02:09 .net
>>278
なんでファイル名にUNICODE使えるのかの話で
cp932を持ち出してるの?

281:デフォルトの名無しさん
10/07/04 01:09:25 .net
WindowsではfopenにASCII非互換のSJISなどを
認めてしまったため、ASCII互換のものならなんでも受け付けられる
なんて変更は出来なかった。

そのためUNICODEに対応するには、fopenではない
別の関数を使うしかない。それが_wfopen(MS独自関数)ただし
これはUNICODE(UTF-16)限定のためWin9xでは動かない。
そのために_tfopenというマクロが作られた。これを使っていると
define定数でfopen、_wfopenどちらを使うか自動的に変更できる。

これは関数だけではなく、文字列も一緒で、L”文字列"なんて書き方をすると
自動的に変換してくれるがなんか_Tマクロとか_TEXTマクロとかいろいろあって
誰か、きれいにまとめて書いてくれ。

めちゃくちゃすぎてわからん。あぁ、fopenだけでUTF-8で
もEUC-JPにもなんにでも対応できるLinux楽だよ。

282:デフォルトの名無しさん
10/07/04 01:54:02 .net
>>280
>>278を読んだのにその疑問が沸いたのなら、君でも分かるように説明するのはあまりに面倒だ。

>>281
で、Linuxに関しては>>267でいいの? あと>>274にも異論は無い?

283:デフォルトの名無しさん
10/07/04 07:56:21 .net
_Tマクロとか_TEXTマクロとかWindowsのマクロの種類は何故複数あるのでしょうか?

284:デフォルトの名無しさん
10/07/04 12:58:15 .net
TEXT("hoge") もあったな

285:デフォルトの名無しさん
10/07/04 13:23:16 .net
文字コード処理の種類はCSI方式とUCS normalization方式と何故複数あるのでしょうか?

286:デフォルトの名無しさん
10/07/04 14:37:25 .net
それは対になるものなのか?


287:デフォルトの名無しさん
10/07/06 12:42:48 .net
文字コードのスレは何故複数あるのでしょうか?

288:デフォルトの名無しさん
10/07/06 14:36:35 .net
あっちがうさげならばこっちはよそ?

289:デフォルトの名無しさん
10/07/08 13:59:28 .net
インテリジェント昆布

略して iconv

290:デフォルトの名無しさん
10/07/12 21:33:35 .net
文字コード総合スレ part6
スレリンク(tech板)

291:デフォルトの名無しさん
10/07/14 01:22:05 .net
文字の種類は何故複数あるのでしょうか?

292:デフォルトの名無しさん
10/07/14 01:50:03 .net
ローマ字では日本語を読みにくいからじゃないかしら

293:デフォルトの名無しさん
10/07/14 04:59:56 .net
世界は広いからだよ

294:デフォルトの名無しさん
10/07/14 05:46:37 .net
バベルの塔を作り始めたからです

295:デフォルトの名無しさん
10/07/15 20:19:48 .net
肉フライ

略してnkf

296:デフォルトの名無しさん
10/07/16 01:00:45 .net
>>295
正式にはnettowa-ku kanji firuta-の略だっけ。

297:デフォルトの名無しさん
10/07/16 02:24:52 .net
nurupo
kimuchi-E
fack

298:デフォルトの名無しさん
10/07/16 16:06:16 .net
>>296
nkf Network Kanji Filter
URLリンク(sourceforge.jp)
まさかのgit。
URLリンク(git.sourceforge.jp)


299:デフォルトの名無しさん
10/07/30 16:49:09 .net
ワロタ 本になっていたのね。

斎藤秀紀「構造化4バイトコードによる多言語漢字の符号化」
URLリンク(www.amazon.co.jp)

これでしょ。
URLリンク(www.horagai.com)

300:デフォルトの名無しさん
10/07/30 20:17:12 .net
>>299
ここも隔離スレっぽいよ。

301:デフォルトの名無しさん
10/08/05 08:30:33 .net
コードの種類は何故複数あるのでしょうか?
ストレートとクロスの見分けが付きません。

302:デフォルトの名無しさん
10/08/05 09:06:26 .net
ソースといえばブルドック?おたふく?
あなたはどちら?

303:デフォルトの名無しさん
10/08/05 09:06:55 .net
買ったらすぐにシール貼っとけよ

304:デフォルトの名無しさん
10/08/05 20:29:23 .net
>>301
両端のコネクタを並べてみて、色が同じ順ならストレート、違う順ならクロス。

305:デフォルトの名無しさん
10/08/10 12:56:48 .net
>>302
イカリソース

306:デフォルトの名無しさん
10/09/12 08:49:08 .net
>>302
カゴメ

307:デフォルトの名無しさん
10/09/12 11:38:54 .net
>>302
中部地方はコーミソースに決まってんだよ。ブルドッグ何それ。

308:デフォルトの名無しさん
10/09/12 11:49:50 .net
俺のホワイトソースでも飲んでろ
馬鹿どもめ

309:デフォルトの名無しさん
10/09/13 07:34:49 .net
ソースの種類は何故複数あるのでしょうか?
ソースを買ってくるように頼まれてソイソースを買ってきたら怒られました。

310:デフォルトの名無しさん
10/09/13 16:04:42 .net
そりゃ醤油はソースとは認められないからな。
次はちゃんとソースを買ってくるんだぞ。

311:デフォルトの名無しさん
10/09/13 16:38:52 .net
>>283 自分用メモ
WindowsSDKレベルではではTCHARとTEXTか__TEXTのみ有効
その他はCランタイムのもので混用すべきではない

312:デフォルトの名無しさん
10/09/13 22:48:14 .net
UNICODEがSDK用で_UNICODEがCRT用だっけ

313:デフォルトの名無しさん
10/09/13 23:10:52 .net
L()はどれだっけ

314:デフォルトの名無しさん
10/09/13 23:24:28 .net
そんなマクロあったっけ

315:デフォルトの名無しさん
10/09/14 01:03:17 .net
L""ならリテラルじゃね

316:デフォルトの名無しさん
10/09/14 07:45:04 .net
それは言語機能でMSは関係ないな
もっともMS以外ではワイド文字がUTF-16とは限らないけど

317:デフォルトの名無しさん
10/09/25 17:10:40 .net
もっとも、 <windows.h>の中のどこかのヘッダで以下のような旨の記述があり、
「_UNICODEとUNICODEのどちらか一方は定義してあるけど、もう片方は定義されていない」
という状況を排除しているので、_TとTEXTを混在させても問題ない。
#ifdef UNICODE
#ifndef _UNICODE
#define _UNICODE
#endif
#endif

#ifdef _UNICODE
#ifndef UNICODE
#define UNICODE
#endif
#endif

318:デフォルトの名無しさん
10/10/09 19:23:25 .net
>>302
どろソース

319:デフォルトの名無しさん
11/01/16 14:27:02 .net
そーすね

320:デフォルトの名無しさん
11/04/15 13:28:40.29 .net
>>302
オリバー

321:デフォルトの名無しさん
11/04/15 15:28:09.44 .net
>>302
イカリが多かったがカープも使う

322:デフォルトの名無しさん
11/04/15 21:32:56.00 .net
CP932の完成度は異常。

323:デフォルトの名無しさん
11/04/15 22:39:01.54 .net
同じ文字でコードが何種類もあるものが完全とな。

324:デフォルトの名無しさん
11/04/15 22:53:48.86 .net
スレ全体検索したけど完全なんて文字は>>323しかない件

325:森& ◆vjMeDi2lEM
11/06/24 00:06:15.57 .net
森鴎外の「鴎」は正しくは「鷗」である。
草なぎ剛
草彅剛

北朝鮮に文字コードは割り振られているのか?

マイクロソフトは、南朝鮮の町工場に北の象形文字をOSに実装してくれと
懇願されたが拒否したらしいが。直接北から要求しなかった。
北は南と文字が異なっているのか。

unicodeに北文字あったか?存在するなら規格票、文献を提示してくれ。



326:uy ◆hi.ht/Isu2
11/06/29 06:19:43.43 .net
>マイクロソフトは、南朝鮮の町工場に北の象形文字をOSに実装してくれと
>懇願されたが拒否したらしいが。直接北から要求しなかった。
>北は南と文字が異なっているのか。


日本語勉強しろよゴミカスが

マジでゴミなんだな

327:デフォルトの名無しさん
11/10/25 22:25:08.62 .net
      ∩___∩
      | ノ      ヽ
     /  ●   ● |
     |    ( _●_)  ミ
    彡、   丶 ノ  、`
   / __/ ⌒`\/⌒/
   (___)  .  /  ( )
    |   ⌒`\//⌒
    入_ へ  \_ へ  \_
 @三三三三 (____)三(____)三三)

328:デフォルトの名無しさん
11/10/25 22:39:19.15 .net
>>325
金正日を意味する特殊な文字が追加されてるらしいんだな。漢字で言うと「朕」みたいなもんだろ。


329:デフォルトの名無しさん
11/10/25 23:00:40.79 .net
斎藤、斉藤、齋藤、齊藤
おまえら少しは反省しろ

330:デフォルトの名無しさん
11/10/26 00:03:12.66 .net
「そ」を1筆で書くのか2筆で書くのかくらいの違いはある

331:デフォルトの名無しさん
11/10/26 14:40:03.49 .net
>>329
何を?

332:デフォルトの名無しさん
11/10/27 04:55:47.65 .net
山崎、山嵜、山﨑
やまざき? やまさき?

333:デフォルトの名無しさん
11/10/30 10:23:28.18 .net
     ∧_∧
 ピュー (  ^^ ) <これからも山崎を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎―◎                      山崎渉

334:デフォルトの名無しさん
11/12/13 16:57:33.87 .net
__∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉

335:デフォルトの名無しさん
11/12/13 18:21:01.09 .net
>>1
一番単純な答えは、JISの出来が悪かったから、というものだと思う。

336:デフォルトの名無しさん
11/12/14 22:02:31.30 .net
日本語の文字コードがいくつもある理由
URLリンク(qpon.at.webry.info)

337:デフォルトの名無しさん
12/01/04 00:38:14.32 .net
IVSというかUnicodeに見る日本政府のダメな感じ
URLリンク(wontfix.blogspot.com)

338:デフォルトの名無しさん
12/01/04 05:48:12.54 .net
この人の文字コードに対する理解力がダメな感じ

339:デフォルトの名無しさん
12/01/04 11:38:46.62 .net
IVSは同一字形でも包摂しない、という原則じゃなかったっけ?というか同一字形かどうか
わからないから、だったかも。そもそもIVSで区別されているのはグリフであって文字ではないわけで。

340:デフォルトの名無しさん
12/07/25 17:25:52.49 .net


341:デフォルトの名無しさん
12/08/22 23:46:05.05 .net
>>322
・文字集合はIBMホストコードに合わせてあって
・符号の順序はJIS順になっていて
・1978年版、1983年版、1990年版をそつなくこなし
・JISの水準外の文字はJISの区点内にも区点外のどちらにもある
とどめに
・半角カタカナと一緒に使える
ってことだな

342:デフォルトの名無しさん
12/10/07 12:14:01.29 .net


343:デフォルトの名無しさん
12/11/29 11:16:09.54 .net
空揚げ

344:デフォルトの名無しさん
12/11/30 12:55:47.17 .net
そんなこんなで本スレが落ちてしまったわけだが

345:デフォルトの名無しさん
12/11/30 13:22:07.85 .net
文字コード総合スレ part8
スレリンク(tech板)
文化の数だけ文字がある

346:デフォルトの名無しさん
12/12/01 00:25:34.28 .net
>>345


347: 忍法帖【Lv=3,xxxP】(1+0:5)
13/11/28 00:46:29.39 .net
あげ

348:デフォルトの名無しさん
14/08/29 21:47:32.66 q83myYC6.net
URLリンク(www.buzzword.jp)

349:デフォルトの名無しさん
14/11/19 16:18:55.03 JZ2oYyd9.net
ㄘんㄘんㄟ⁰ㄋㄟ⁰ㄋㄜㄝㄋ

350:デフォルトの名無しさん
14/11/19 18:54:03.45 g6yRyndh.net
だいたい1バイトのアスキーコードを、2バイトにして日本語を
表示できるようにしたり、それをさらに、3バイトとか4バイトに
増やすとか、チマチマそんなことしてきたから、いろんな文字コード
作られてワケワカメになったんだろ。
もうこの際、全ての言語や記号など全部表せるように、
文字コードは1文字16バイトくらいにして、
全ての文書にこのコードを使う事を強制すればいい。
16バイトもあれば、困ることは無いだろう。

351:デフォルトの名無しさん
14/11/19 19:53:15.84 0+0ozXC3.net
ㄘωㄘωㄟ⁰ㄋㄟ⁰ㄋㄜㄝㄋ

352:デフォルトの名無しさん
14/11/20 00:22:16.17 8wQd6afC.net
>>350
これ、釣りなのかな。

353:デフォルトの名無しさん
14/11/20 10:27:23.90 EmAWw9wC.net
(。☉౪ ⊙。)
(。◕ฺˇε ˇ◕ฺ。)
(。◕ิ_◕ิ。)
(。◕ˇдˇ​◕。)
(。◕ˇ_ˇ◕。)
(。╹ω╹。)
(。╹ω╹。)
(。≖ิ‿≖ิ);
(。•́︿•̀。)
(。ó .̫ ò。)
(。´ސު`。)
色々あるんやね

354:デフォルトの名無しさん
14/12/05 00:46:33.27 ddy5/aJe.net
>>350
データ容量が無駄

355:デフォルトの名無しさん
14/12/05 10:32:24.04 NyP973bT.net
将来ジャミング暗号化に使われそうなアルゴリズムだな

356:デフォルトの名無しさん
15/06/12 10:29:07.43 oHwTsYwMJ


357:デフォルトの名無しさん
15/06/12 10:29:46.56 oHwTsYwMJ
すばらし

358:デフォルトの名無しさん
16/03/29 09:28:41.71 /c8bAcK4.net
サッカーブッシュ日本代表日程ぷあたん(しゅっちょうまいくろ教育長交代)春文執行40代売上差額シュガーチョコ
URLリンク(www.youtube.com)宇ドナルドアナリストパワーストーンコーチングとしまえん
サッカーブッシュ日本代表日程古本屋よしたけしゅっちょうちょこしゅがー
ディーラー税務署天才開発者死亡詰みヨミドクターマイクロサービス不足
サッカーブッシュ日本代表日程ぷあたんシフト光金さかい強制バイト人権侵害問題
春分資源執行ニューヨーク低原価ぼったステーキソルトレイク福岡横浜新橋奴隷課金パチシフト強制バイト問題新潟米センター生残
コスメ24チャリティー隠れ40代生活保護プレイボーイバイトレードいたりあん接待問題
マスコミKARDローンケーオーサービス不足婚活パーティー寄付金執行原発ビジネス
FBIチャイニーズタイホテル売上事務所ガチャ決算ガチャキャンペーン(販売報道陣過激派組織向携帯最新情報提供終了
校長発言細心注意ノートン産廃エラー(著作権クレーム中国反応融資高額教育費)(中国捕鯨団体40代社員サッカーコメント
高額入学金ヤフウ新橋大学ヤフウ新橋理事長FX経費 おじや50代資産ガリバズフィード40代エリート

359:デフォルトの名無しさん
16/08/29 19:33:30.09 sf9PpAXO.net
1978年
JIS C 6226が成立。
1981年
当用漢字表が廃止されて常用漢字表が告示される。
それまでの1850字に95字が追加され1945字になる。
その95字が全てJIS第一水準。一体何があったのか。

360:358
16/08/29 19:39:42.82 sf9PpAXO.net
ここで勝手に憶測。
1.
78JISが成立した時点で、文部省が通産省に圧力をかけて、将来の常用漢字に
入れたくない字を無理やり第2水準に追いやった。
2.
常用漢字表を作る際に、第2水準の字を加える事を第2水準であるという理由で拒否。
何としてでもなるべく字を増やしたくないという口実にJISが利用された。

361:358
16/08/29 21:29:18.35 sf9PpAXO.net
2010年11月30日
常用漢字表改定
196字追加、5字削除、2136字となる。
1881年とは時代が違う社会が違う、という事か、JIS第2水準の字も多く追加された。
第3、第4水準の字すら入っている。
もしJISの83改定がなければ殆ど第2水準で済んでいた。

362:358
16/09/02 16:08:22.98 YK1p9+vc.net
文部科学省の常用漢字表にはJISコードが記載されていない。まさに縦割り行政だ。
常用漢字の通し番号も無い。
一般的にはこれで困る人はいない。だがそれでいいのか。
法律の如き、あるいは数学の如き厳密さを求めると、常用漢字表の字とJIS規格票の字が
同じ字であるとは見なせない。
民間の漢和辞典にはJISコードの記載があるが、その厳密な根拠はどこにも無いという事になる。
国が率先して論理的思考を実践してほしい。

363:デフォルトの名無しさん
16/12/07 00:05:59.62 34HNZ6/r.net
意味もなく Age。
JIS漢字にしても、まるぶん漢字にしても、日常生活に結構影響が出ている。
同級生のパパ、議員やっていたんだが、該当する漢字がなくて、全部当て字で済ましている。
姓の歴史を見ればわかる通り、明治の初めに姓が法制化された。
漢字が書けないことが多くて、近所(?、1泊で往復できるぐらいの距離)のエライ坊さんのところに行って漢字を教えてもらった。
これが、同音の文字を崩して、別の意味を持たせた。
地名も同様なものがある。
社名も、鉄を使わない(金を失う)ではなく、旧字を使うとロコがある。
Toron コードでは大体そろっていたはずなんだけど、見ていないからわからない。

364:デフォルトの名無しさん
16/12/08 21:34:23.40 5SK5WFdP.net
Toronコード

365:デフォルトの名無しさん
16/12/11 14:59:51.79 pm6ghExK.net
>>1
マイナーな文字コードは徹底的に無視して、淘汰すればいい
「サポートしなければならない」という糞みたいな固定観念を
捨てることが大事。

366:デフォルトの名無しさん
16/12/24 00:11:12.03 tCnPOkaj.net
漢字コードは浮動小数点数コードにしとけばよかったんだよな

367:デフォルトの名無しさん
16/12/24 06:02:44.63 NChqVw6n.net
現実世界の方言は好き

368:デフォルトの名無しさん
16/12/26 20:12:45.34 TRnwbnfO.net
まともなこと言ってる方が駆逐される不思議な国ニッポン
URLリンク(nukalumix.hateblo.jp)
URLリンク(www.taro.org)
URLリンク(nlab.itmedia.co.jp)

369:デフォルトの名無しさん
17/02/09 16:30:11.04 8bYRq8V4.net
最初5bitから始まった話とかロッキングシフトの話とかからの話から始まると思ったら、ここまで出てこないのは何なの?

370:デフォルトの名無しさん
17/08/29 22:15:11.99 MJTdI4fF.net
ローマ字で日本語の長音を表現するのにサーカムフレックスまたはマクロンの付いた
アルファベットが有ると便利。というか必要。
しかしこれが長い間JISに採用されなかった。
ローマ字主義者と反対派の血みどろの戦いが繰り広げられ、ローマ字主義者が
負け続けたのだろうか。

371:デフォルトの名無しさん
18/01/08 11:02:55.15 szpKYJOz.net
ユニコードですら絵文字で大混乱してるからな

372:デフォルトの名無しさん
18/01/08 12:10:38.61 g3wGVkXu.net
明らかに文字化けって判るような壊れ方ならまだいいけど
送信側が↑↑↑で送信してるのに
受信側で↓↓↓って表示されてたり
って普通にあるからなー

373:デフォルトの名無しさん
18/01/08 12:45:25.22 hdddIjmR.net
絵文字の正規表現に対応しているのは、Ruby 2.4 以降だけかも

374:デフォルトの名無しさん
18/01/09 03:13:02.13 69Y93T5M.net
うんこ騒動はなぜ起きた?

375:デフォルトの名無しさん
18/01/20 12:34:45.37 4AOaXNlF.net
本スレ落ちそう
URLリンク(www.gakkai.ne.jp)

376:デフォルトの名無しさん
18/01/22 23:21:50.19 UK/uqEp5.net
文字コード総合スレ Part11
スレリンク(tech板)
立てた。

377:デフォルトの名無しさん
18/01/24 05:29:19.56 PJ1wHVKm.net
>>376
おつん

378:デフォルトの名無しさん
18/01/28 15:12:12.86 Erw8GBm0.net
>>369
おお、同志よ。
たぶん、文字コードに詳しく無い人が多いからだろうね。
ここにいる人達はあまり詳しい人がいないみたい。
俺も詳しく無いけど。
混迷期の読み物を興味深く読むのは面白い。

379:デフォルトの名無しさん
18/05/23 20:36:26.50 Au5e7VGg.net
僕の知り合いの知り合いができたパソコン一台でお金持ちになれるやり方
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』
Z1BZ2

380:デフォルトの名無しさん
18/07/05 01:16:25.52 RfoszcD2.net
9Z7

381:デフォルトの名無しさん
18/11/23 10:17:55.52 e4GZHgy/.net
コードおしえて
URLリンク(twitter.com)
(deleted an unsolicited ad)

382:デフォルトの名無しさん
19/03/08 15:02:24.13 uMMKH+w1.net
URLリンク(gist.github.com)

383:デフォルトの名無しさん
19/03/08 15:12:45.64 Im37M35h.net
ハローワールド

384:デフォルトの名無しさん
19/04/06 20:46:36.38 v8Dss5L/.net
ディスクやメモリの容量に関してけちけちしなければならない時代ではもはやないから、
UTF32にさっさと統一してしまった方が良い。


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch