くだすれPython(超初心者用) その4at TECHくだすれPython(超初心者用) その4 - 暇つぶし2ch■コピペモード□スレを通常表示□オプションモード□このスレッドのURL■項目テキスト600:594 09/08/20 19:51:48 ヒントありがとうございます。 色々試してみましたが、文字コード回りは今一つ良く分かりませんね。 みなさんのヒントとウェブ情報を参考にとりあえず次のようにしてみました。 html = urllib.urlopen(url).read() html_coding = chardet.detect(html)['encoding'].lower() soup = BeautifulSoup(unicode(html, html_coding, 'replace').encode('utf-8')) text = soup...... print text.encode('euc-jp', 'replace') 単純にprintの時に text.encode('euc-jp', 'replace')とかだと、何故か全体がわけわからないコードになりました。 2.5.4でやってるんですが、3.xになるとこの辺もっとスッキリするんでしょうか。 601:デフォルトの名無しさん 09/08/20 22:08:07 「Python 3.1.1」リリース http://pc11.2ch.net/test/read.cgi/pcnews/1250773470/ 602:デフォルトの名無しさん 09/08/21 07:36:16 >>600 html = urllib.urlopen(url).read() soup = BeautifulSoup(html) text = soup...... print text.encode('euc-jp', 'replace') 次ページ最新レス表示レスジャンプ類似スレ一覧スレッドの検索話題のニュースおまかせリストオプションしおりを挟むスレッドに書込スレッドの一覧暇つぶし2ch