C#, C♯, C#相談室 Part76at TECH
C#, C♯, C#相談室 Part76 - 暇つぶし2ch328:デフォルトの名無しさん
12/10/19 13:38:27.08
.NET 4.0 にて、HTMLのParseして遊ぼうと思い、いろいろ試していて、
LINQってのも使ってみたいから XDocument + SGMLReaderでと画策中。

ある程度ローカルで試して、さて対象のWEBページを、と挑むと、
「':' 文字、16 進数値 0x3A を名前に含むことはできません。」と…
どうやらSGMLReaderが「xml:lang」ってのは直接名前として扱えない、と怒っている模様。

[対象のWEBページの先頭]
-----------------------------------------------------------------
<!DOCTYPE html
PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
"URLリンク(www.w3.org)">
<html xmlns="URLリンク(www.w3.org)" xml:lang="ja" lang="ja">
<head>
:
-----------------------------------------------------------------

この箇所は特に収集対象ではないので、最悪読み飛ばしするかなーと思ってますが、
ちゃんとした回避策があるのでしょうか?
XML方面にとんと疎いので、調べてみても到達しません。
よろしくお願いします。


次ページ
続きを表示
1を表示
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch