UnicodeとUTF-8の違いは?at TECH
UnicodeとUTF-8の違いは? - 暇つぶし2ch533:デフォルトの名無しさん
08/08/05 04:13:34
   【JISコード】
デコード↑/↓エンコード
     シフトJIS
      EUC

   【ユニコード】
デコード↑/↓エンコード
     UTF8
UTF16LE/UTF16GE
     UTF32

     【音声】
デコード↑/↓エンコード
      WAV
      MP3
      WMA

    【ビデオ】
デコード↑/↓エンコード
      AVI
      MPG
      FLV

534:デフォルトの名無しさん
08/08/05 05:55:43
全角で書く奴って、やっぱりアレだな…

535:デフォルトの名無しさん
08/08/05 06:28:39
ときに、UTF16GEってなんだろ。

536:デフォルトの名無しさん
08/08/05 07:17:57
デコードした先がコードとは何ともかんとも

537:デフォルトの名無しさん
08/08/05 09:48:19
>>535
ゲルググエンディアン

538:デフォルトの名無しさん
08/08/05 12:00:16
あまりの非の打ち所の無い完璧な説明なため
全角や誤字しかツッコミどころが無いな。

539:デフォルトの名無しさん
08/08/05 13:13:37
確かにゲルググエンディアンは完璧だ


540:デフォルトの名無しさん
08/08/05 14:10:58
コンテナはどうなんだ

541:デフォルトの名無しさん
08/08/05 23:19:58
>>533
おい大漁だなw
やったじゃねーかw

>>533-539
釣られまくり乙

542:デフォルトの名無しさん
08/08/06 02:34:28
全角と誤字以外のツッコミは無いのかい?

543:デフォルトの名無しさん
08/08/06 11:32:08
へんなのが住みついたね

544:デフォルトの名無しさん
08/08/06 13:00:18
夏だね。

545:デフォルトの名無しさん
08/08/06 16:11:48
そろそろ秋だよ

546:デフォルトの名無しさん
08/08/06 16:16:05
暦の上でどうだろうと、今は夏真っ盛りだ

547:デフォルトの名無しさん
08/08/07 02:01:12
では、全角と誤字以外には非の打ち所の無い
カンペキな「Unicode と UTF-8 の違い」の解答という事で
無事にこのスレを閉じたいと思います。
みなさん、長い間ごくろうさまでした。

548:デフォルトの名無しさん
08/08/07 02:16:28
お疲れさまでした。

549:デフォルトの名無しさん
08/08/07 02:35:31
先生の次回作にご期待ください。

550:デフォルトの名無しさん
08/08/07 04:19:12



    世 界 迷 作 劇 場


                おわり

551:デフォルトの名無しさん
08/08/07 21:56:12
思ったこと。
・広義の「ユニコード」はUTF-8等の規格を含めることがあるので不正確
>>536指摘済みだけど、音声のenc/decと、文字のenc/decを一緒にするのは
 違和感あり。JISコードは既に「符号(コード)化」されてるから。
 俺的には
  音楽→(量子化)→PCM→(各種圧縮)→MP3 の3段階が
  文字→符号化文字集合→テキストエンコーディング に対応する感じ
・AVIって格納形式の概要だけ決まってて、圧縮アルゴリズムは別じゃなかった?

552:デフォルトの名無しさん
08/08/07 22:59:54
狭義のユニコードっていうのはM$が決めつけたUnicodeのことか?
例えば、URLリンク(msdn.microsoft.com)
>Unicode 仕様は 2 バイトを使用して 1 つの文字をエンコードすることでこの問題を解決しました。2 バイトには 65,536 個のパターンがあるため


つーか、広義も狭義もねーよ。バーヤ。

553:デフォルトの名無しさん
08/08/08 00:08:21
まだやる気か?

554:デフォルトの名無しさん
08/08/08 01:50:13
>>552
MSが決めつけたというよりも、まだUTF-8もサロゲートペアもなかった昔を引きずっているだけ。

555:デフォルトの名無しさん
08/08/08 04:17:35
サロゲートペア厨必死だな。無視されてんのによw

556:デフォルトの名無しさん
08/08/08 09:21:22
サロゲートペアは、32bit wchar_tの入り口ですよ。

557:デフォルトの名無しさん
08/08/08 09:33:01
マイクロソフトで統一すれば市場に一致して解決

558:デフォルトの名無しさん
08/08/08 09:38:44
けど駄目仕様に駄目実装が蔓延ると思うよ
競合いてもあれだもん

559:デフォルトの名無しさん
08/08/08 10:57:45
結論
>>1みたいなのが現れるのはMSが糞だから

560:デフォルトの名無しさん
08/08/08 11:58:30
何でも他人のせい、日本のせいにする人たちみたいですね。

561:デフォルトの名無しさん
08/08/08 12:35:44
批判だけならパートのおばちゃんでも出来る。
問題は、どう改善すべきか、改善するに当たって
予算・人員・スケジュールをどう工面するのか、だ。
それを何一つ提示していない。
おまいら、パートのおばちゃん以下のクズ。

562:デフォルトの名無しさん
08/08/08 14:04:35
その理屈だとパートのおばちゃんと同等であって以下とは読み取れないが

563:デフォルトの名無しさん
08/08/08 22:59:01
少なくともパートのおばちゃんは働いてるからな
                   ^^^^^^^^^

564:デフォルトの名無しさん
08/08/09 00:51:35
>>552
マイクロソフトの言うUnicodeはエンコーディングの一つでしょ。>>533からの
流れからして
協議:符号化文字集合としてのUnicode
広義:符号化文字集合およびそのエンコーディング仕様。Unicode規格
以外の解釈はありえんと思うが。このスレ>>14ぐらいまで読み直せ。

565:デフォルトの名無しさん
08/08/09 04:22:32
だからわざと、マイクロソフトのUnicodeと区別するためにカタカナで【ユニコード】と書いたがな。

566:デフォルトの名無しさん
08/08/09 07:01:57
お前ら、紛らわしいと思わないのか?
MSは正義だからOKとか、思考停止杉。

567:デフォルトの名無しさん
08/08/09 08:34:38
え、誰か「MSは正義」とか言ってる?
その脳内設定が、お前の思考停止なんじゃないの?
思春期のオトコノコの「自分以外はみんなバカ症候群」みたい。

568:デフォルトの名無しさん
08/08/09 09:53:28
>>567
>>557

>思春期のオトコノコの「自分以外はみんなバカ症候群」みたい。

569:デフォルトの名無しさん
08/08/09 11:23:13
> お前ら

たった一人書いてただけで、「お前ら」か。
知ってる?「デフォルトの名無しさん」は全部同一人物なんだぞ。

570:デフォルトの名無しさん
08/08/09 13:07:27
以下でOK?

・(文字集合としての)Unicode
扱う文字の一覧を定めて、識別用に符号をつけたもの。
「あ」=U+3042、「A」=U+0041・・・

・UTF-8
Unicodeの文字列を電子データとして扱う際の表現を定める「エンコーディング」の一つ。
あA(U+3042 U+0041)→E3 81 82 41

エンコーディングの他の例としてシフトJIS・UTF-16 BE・マイクロソフトのUnicode 等がある。
よってUnicodeとは
 1. 符号化文字集合の一つ
 2. 文字コードの規格
 3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
の3つの意味があり、一方UTF-8は、エンコーディングの一つとしての意味しかない。

571:デフォルトの名無しさん
08/08/09 13:21:53
>>570
> よってUnicodeとは
>  1. 符号化文字集合の一つ

こんな使い方はない。

>  3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい

アホドキュメント、アホアプリは無視するのがいい。


572:デフォルトの名無しさん
08/08/09 13:24:33
×符号化文字集合
○文字集合
だよね?
MSは無視できないほど規模があるのが憎たらしくて困ったチャンなわけで。

573:デフォルトの名無しさん
08/08/09 13:39:23
「マイクロソフトの」と書いているが、
まともなドキュメントもあるわけで…
メモ帳の文字コード選択ウィンドウとかそういう部分的なことで、
>  3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
を言葉の定義の一つに同列に並べてるのは馬鹿っぽいね。

574:デフォルトの名無しさん
08/08/09 13:42:08
>>573
メモ帳もUnicode/Unicode big endianだけど。

575:デフォルトの名無しさん
08/08/09 13:52:08
とりあえず「UTF-8にBOM」という意味がわからん表現はやめて欲しいもんだ

576:デフォルトの名無しさん
08/08/09 15:01:15
>  3. マイクロソフトのエンコーディングの一つで、UTF-16 LEに等しい
典拠は?

>>552だけ?
これってSQL Server 2005のドキュメントだよね?

577:デフォルトの名無しさん
08/08/09 15:32:53
>>576
Office XP リソース キット
Unicode サポートと多国語ドキュメント
URLリンク(msdn.microsoft.com)
>Unicode では、どの文字に対しても 2 バイトからなる固有のエンコードが割り振られます。


578:デフォルトの名無しさん
08/08/09 15:51:22
やっぱりアプリ屋はフレームワーク屋よりレベル低くなるね。
周辺技術の知識については。

579:デフォルトの名無しさん
08/08/09 16:21:00
抱き合わせ販売禁止

というのが文字コード氾濫を招いた。

最初からOSとセットで組まれていれば文字コードはマイクロソフトのやつがスタンダードになって
ユーザーはいくつものコードに悩まされることがなかった

580:デフォルトの名無しさん
08/08/09 23:37:35
Shift JISで悩まされてた人って多いんじゃないの?

581:デフォルトの名無しさん
08/08/10 02:42:19
>>572
「符号化文字集合」でいいのでは?
文字の集合を定義して、各文字に対して符号化表現(例:A=U+41)を規定してるから。

582:デフォルトの名無しさん
08/08/10 02:59:24
「符号化文字集合」の定義はJIS/ISOとW3C/IETFですら違うからどちらのつもりなのか
くらいはっきりさせろ

583:デフォルトの名無しさん
08/08/10 05:13:31
>>580
それで悩むのはUNIX屋だけ。

584:デフォルトの名無しさん
08/08/10 07:29:26
>>579
えーっとどこから突っ込めば?(笑)

つーか貧弱な16bitマシンで日本語とかやろうとしてShiftJISなんてもんをつくったとこからおかしくなってるよなぁ、いろいろと。

585:デフォルトの名無しさん
08/08/10 07:57:24
>>583
携帯メール入れるとどのプラットフォームも悩ましいのでは?

586:デフォルトの名無しさん
08/08/10 09:20:58
>>584
しかも、SJIS作ったの誰だ?って話だよな。

587:デフォルトの名無しさん
08/08/10 10:57:11
当時の状況を考えれば仕方ないかんじだろ
一文字16bitなんて贅沢の極み

588:デフォルトの名無しさん
08/08/10 12:24:15
贅沢の極み。と言ってた人が、
年金記録問題を予見できなかったんだろうな~。
氏名をカナで管理ってありえねーよ。


589:デフォルトの名無しさん
08/08/10 14:08:27
むしろカナしかないだろ

590:デフォルトの名無しさん
08/08/10 22:24:23
仮に漢字を使っていたとしてもやっぱり年金問題は起こっていたと思う。
略字正字の入力がずさんだとか、読み方分かんなくてうやむやにデータ入力するとか。


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch