以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 WORD to XML, HTML to XML 』  (http://bbs.xml.org.cn/list.asp?boardid=13)
----  怎样将任意网页转化成XML文件  (http://bbs.xml.org.cn/dispbbs.asp?boardid=13&rootid=&id=74970)


--  作者:samymsn
--  发布时间:5/20/2009 7:34:00 PM

--  怎样将任意网页转化成XML文件
急用!!之前在网上找了一些代码,用的是tidy,但只能转化一些十分简单的网页,许多复杂的网页都不能顺利转化成XML文件,请教各位高手,有没有什么方法,对任意网页都有效,
例如这个URL:http://www.da-ben.com/ArticleShow.asp?ArticleID=717&gclid=CL6d2PfzopUCFQoNewodwwNtjw

谢谢!!


--  作者:Qr
--  发布时间:5/21/2009 8:58:00 AM

--  
tidy没办法。要自己写代码,正则表达式是关键。


--  作者:redskywy
--  发布时间:8/17/2009 2:26:00 PM

--  
使用 perl可以方便的实现的
cpan上有 html2xhtml
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
46.875ms