HTMLパーサの素敵ライブラリ NekoHTML のパース結果を、XPathAPI でごにょごにょしようとしたら、上手くノードが取れない。なぜ。
Document doc = parser.getDocument(); NodeList nodelist = XPathAPI.selectNodeList(doc, "//input");
試しに Xerces2 の DOMParser を使ってみると、上手く行く。まさか相性とかじゃないし、何だろうと思ってログを眺めていたら、タグ名が大文字になって返ってきてるわけ。えー。
Element names are written in uppercase letters (e.g., BODY). Attribute names are written in lowercase letters (e.g., lang, onsubmit).
ということで、NekoHTML のパース結果に対してタグ名処理する場合は、大文字にしなくちゃいけない。
Document doc = parser.getDocument(); NodeList nodelist = XPathAPI.selectNodeList(doc, "//INPUT");
見事にハマりました。春だなあ。
このエントリーのトラックバックURL
http://www.deftrash.com/admin/mt4/mt-tb.cgi/421