まちBBS東京23区板 自治スレッド 1at TOKYOまちBBS東京23区板 自治スレッド 1 - 暇つぶし2ch■コピペモード□スレを通常表示□オプションモード□このスレッドのURL■項目テキスト500:おまんた 10/10/16 23:54:49 U2zUyAdA 先日もいたが自称預言者みたいなものが出てくるから 問題ありだと思う。 日本みたいに毎日どこかで揺れている地震国で来週地震があるでしょう なんていい方はよくない。 501:東京都名無区 10/10/17 00:09:16 APBrsV4w ・・・いたな。 確かにそんな奴。 502:Ω 10/10/17 02:10:34 Ag4IxVfQ 文字化け {東・西・南・北・中}馬込スレッド (その30) http://tokyo.machi.to/bbs/read.cgi/tokyo/1244665561/ #935 503:東京都名無区 10/10/17 02:20:44 lL+LQCyg 文字化け 葛飾区青戸(青砥)ってどうなの?パート40 http://tokyo.machi.to/bbs/read.cgi/tokyo/1283425081/ #122 #128 #134 #135 504:東京都名無区 10/10/17 16:25:49 G8xCYDNg 文字化けしてる箇所についてちょっとバイナリエディタで覗いてみたんだけど ・大部分は C2 ?? C2 ?? になっててC2除去するとShift-JISで読める ・偶に C3 ?? の箇所があり、C3除去して??に40加算すると読める場合がある ・偶に C2 ?? ?? の箇所があり、その場合後の??は00-7Fの範囲 ・同じく00-7Fの1バイト文字は何も付加されていない って感じだった。 これってUTF-8のバイト列に似てるんだけどC2除去するだけでShift-JISになるからUTF-8への正常な変換ではない たぶんShift-JISの文字列をUTF-16としてUTF-8に変換するような処理が誤爆してるんだと思う。 例:Shift-JISの「東京都」(93 8C 8B 9E 93 73)を 93 00 8C 00 8B 00 9E 00 93 00 73 00 のUTF-16として読み込みUTF-8への変換を行うと C2 93 C2 8C C2 8B C2 9E C2 93 73(ツ督個仰楪都)になる 逆に、 1.datファイルから文字化け部分をバイナリエディタで切り出し新規ファイルに保存 2.そのファイルをUTF-8として開く(秀丸エディタで開いたらエンコードの種類でUTF-8&ファイルを読み込みし直す選択) 3.UTF-16として保存(秀丸エディタで名前をつけて保存&エンコードの種類でUTF-16選択) 4.3で保存したファイルをバイナリエディタで開き 00 を除去する 以上で投稿者が書き込もうとした文章が復元できる 文字化け発動条件はまだわからんけど 複数の文章復元すれば条件特定できるかもしれないし 書き込み処理のスクリプトから上記の誤爆しそうな処理呼び出してるところを見直せば何か見つかるかも 俺は今日は疲れたから復元処理からの特徴把握はやる気のある人に任せる 次ページ最新レス表示レスジャンプ類似スレ一覧スレッドの検索話題のニュースおまかせリストオプションしおりを挟むスレッドに書込スレッドの一覧暇つぶし2ch