新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 关于 XML 的一般性技术讨论,提供 XML入门资料 和 XML教程
    [返回] 中文XML论坛 - 专业的XML技术讨论区XML.ORG.CN讨论区 - XML技术『 XML基础 』 → [转帖]HTML如何向XML迁移 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 2552 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: [转帖]HTML如何向XML迁移 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     xiaohulihoho 美女呀,离线,快来找我吧!
      
      
      等级:大一新生
      文章:13
      积分:142
      门派:XML.ORG.CN
      注册:2007/11/30

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给xiaohulihoho发送一个短消息 把xiaohulihoho加入好友 查看xiaohulihoho的个人资料 搜索xiaohulihoho在『 XML基础 』的所有贴子 引用回复这个贴子 回复这个贴子 查看xiaohulihoho的博客楼主
    发贴心情 [转帖]HTML如何向XML迁移

    当Internet世界正迅速地把注意力聚焦到XML及其相关技术上时,一个问题产生了:以前用HTML构建的网站将怎么办?对于那些刚刚开始 进行信息化建设的企业来说,理所当然地可以采用XML技术来设计网页;但对于那些HTML文件已经非常丰富的传统企业来说,要重新构建网站,不仅耗资巨 大,而且拖的时间会很长。那么应该如何处理遗留下来的HTML资料呢?
      目前已经出现了一种新的技术——可扩展超文本标记语言(XHTML),它被认为是传统的HTML向XML迁移的理想工具。
      ■HTML要向XML迁移
      HTML是一种简单的标记语言。HTML包含许多专用的标记(tags),而这些标记并不被所有的浏览器所支持。一些用来得到视觉效果的元素, 如〈font〉标记,仅仅使得HTML文档体积变大。对于显示屏幕很小的PDA和手机等上网新设备, HTML也不能给予很好的支持。可以说,HTML不适合继续作为标准的页面和信息载体语言。
      怎样才能让以前积累下来的HTML文档在新的 环境下继续发挥作用呢?向XML的过渡是解决之道。XML文档包含了清晰的文档结构信息,可以为各种需要灵活地输出所需要的格式。XML不是一个简单的类 似HTML和WML(无线标记语言)那样的预定义标记语言,而是一个让用户根据不同的数据和文档内容而制定标记的语言标准。用户可以为自己的文档建立比 HTML更加准确而适当的标记。
      可扩展的样式表语言(XSL)提供了一种从存储的XML文件中输出各种所需的格式的途径。许多基于XSL 的产品都能通过选用特定的样式表来从XML文件中输出能在各种浏览器中正确显示的HTML文档,而且同一个XML文档还可以使用其它的样式表,创建出能在 无线设备中使用的WML格式的文档。设计者所要做的仅仅是创建这种格式文档的样式表,而对于文档的内容不需进行任何的修改,即“身体”是相同的,但“外 套”可以自由地进行选择。
      ■HTML如何改装成XHTML
      传统HTML要向XML迁移,最麻烦的就是不容易把HTML文档的内容和表现形式进行分离。那么怎样才能对HTML文档进行改装呢?一个可选择 的方案是采用XHTML。XHTML结合了HTML和XML的优点,由于它和HTML很相似,所以可以很容易地把以前的HTML进行简化和改装,形成新的 XHTML文档,实现HTML向XHTML的过渡,这要比直接重新构建XML文档简单得多。
      首先,XHTML对大小写标记敏感。在 XHTML中定义元素的属性必须使用小写,那些曾经在HTML中用来增强文档可读性的有些技巧都不能用了。例如以前在HTML中定义元素属性时使用大写的 字符,而具体的数值使用小写,这样可读性强一些,但是这种技巧在XHTML中就不能使用了。
      其次,XHTML严格地要求元素必须以标记开 始和标记结束。以前经常能在HTML中使用的先打开标记,然后作用于其它内容的手法,现在也必须加以修改。在XHTML中,所有非空的元素都要求被关闭。 以前经常被开发者使用的一个技巧就是在两个段落中使用〈p〉这个标记,而不是严格地按照在每一段的开始使用〈p〉而在结尾使用〈/p〉。另外,所有的 XHTML属性都需要使用引号来表示,即〈table border = 2〉这样的语句需要改写成〈table border = “2”〉。
      最后要指出的一点是,〈head〉 和〈body〉这样的元素在XHTML中都是必须的,而且〈title〉这个元素必须作为第一个元素放在〈head〉段中。
      通过对HTML文档进行了这些改变,原来的HTML文件不仅能在HTML的浏览器上得到正确的显示,而且能用支持XML的软件来进行处理。
      ■HTML转换工具
      如果你的站点仅仅有很少的文档需要进行转换,即使采用手工的方法也能处理;但如果有几年累计下来的HTML文档需要转换,那么就需要寻找一个工 具来帮助进行。在这方面有许多商业和免费的工具软件可以使用,它们既可以帮助进行转换而且可以直接编辑形成新型的XHTML格式的文件。
       HTML Tidy 是一个很基本但很有用的工具,可以运行在多种平台上。HTML Tidy可以用来清除HTML文件的标记错误(相对XHTML标准而言),并能重新格式化HTML文件,使之有更好的可读性。HTML Tidy已成为一个能把HTML向XHTML转换的多功能工具。
      HTML-Kit是一个免费的程序,能在许多平台上运行。它不仅能帮助进 行HTML的编辑、格式化输出、合法性检查、预览和发布,而且还能在图形界面上进行HTML向XHTML的转换。在其用户界面上,有一个窗口显示源文件, 另一个窗口显示转换后的标记语言结果,还有一个窗口显示出现的错误以及对XHTML进行改进的建议。
      ■直接向XML标准前进
      HTML经过改装后形成新的XHTML文档将不再有浏览和显示的麻烦。但是如果希望其内容能被运用到各个领域,那么可以考虑直接建立XML文档。这就需要在现存的HTML中把内容抽取出来,使得内容和表现形式的标记得到分离。
       XspLit是由Percussion Software公司推出的新工具。XspLit让Web开发者能把HTML文档转换成相应的XSL样式表。XspLit能创建一个包含格式定义的XML 的DTD(文件类型定义)文件,还能使用静态的内容来创建一个XML样本文档。

       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/11/30 21:09:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 XML基础 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/5/28 6:35:06

    本主题贴数1,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    46.875ms