Ruby 初心者スレッド Part 29at TECHRuby 初心者スレッド Part 29 - 暇つぶし2ch■コピペモード□スレを通常表示□オプションモード□このスレッドのURL■項目テキスト101:デフォルトの名無しさん 09/07/06 11:12:29 結果的に正しく判断される確率が高い方がいい 102:デフォルトの名無しさん 09/07/06 12:04:51 そのためには文脈情報が要るんだよ HTML だったら charset 読んでみるとか 句読点が改行文字の直前にあったら日本語だと思ってみるとか 東欧辞書にマッチするバイト列が頻出したら Latin-2 だと思ってみるとか Iconv が guess に該当する機能を一切提供してないのは手抜きじゃなくて必然 多エンコーディングに対応すればするほど指数関数的に推測のコストは上がる 日本語だけ取っても Shift_JIS と CP932 と EUC-JP と EUC-JP-MS の4つを区別するのは至難 っていうか規格をちょっとずつ混ぜるなめんどくさいから あとケータイ絵文字入り文字列をキャリア情報なし端末情報なしの素で送ってくる奴は即死刑で 103:デフォルトの名無しさん 09/07/06 12:33:21 次の質問の人どうぞ 104:デフォルトの名無しさん 09/07/06 15:37:50 /usr/local/lib/ruby1.9/1.9.1/minitest/unit.rb:359:in `puke': incompatible character encodings: UTF-8 and ASCII-8BIT (Encoding::CompatibilityError) イライラ 次ページ最新レス表示レスジャンプ類似スレ一覧スレッドの検索話題のニュースおまかせリストオプションしおりを挟むスレッドに書込スレッドの一覧暇つぶし2ch