新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> Cloud Computing(云计算), SaaS(软件即服务), Grid Computing(网格计算), OGSA, OGSI, WSRF, Globus Toolkit, Semantic P2P(语义P2P), Semantic Grid(语义网格), P2P Computing(对等计算),
    [返回] 中文XML论坛 - 专业的XML技术讨论区W3CHINA.ORG讨论区 - Web新技术讨论『 云计算,网格,SaaS,P2P 』 → 语义对等网研究[原创] 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 25624 个阅读者浏览上一篇主题  刷新本主题   平板显示贴子 浏览下一篇主题
     * 贴子主题: 语义对等网研究[原创] 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     luorenren 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:1
      积分:77
      门派:XML.ORG.CN
      注册:2005/1/28

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给luorenren发送一个短消息 把luorenren加入好友 查看luorenren的个人资料 搜索luorenren在『 云计算,网格,SaaS,P2P 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看luorenren的博客楼主
    发贴心情 语义对等网研究[原创]


    摘要 对等网络改变了传统的客户机/服务器网络模式,从一出现就得到了广发的应用。集中式对等网或分布式对等网在扩展性和高效性方面并不理想。本文提出一种语义对等网系统模型SemP2P,它用混合模式构造其拓扑结构,并利用本体语言对其共享知识聚集。在给出了SemP2P的层次模型图后,分析了SemP2P的实现技术,包括共享资源的表示、资源聚类、网络的动态调整以及资源请求的搜索。最后,对SemP2P的下一步工作进行了展望。
    关键词 语义 对等网 本体 混合模式

    1.问题提出
    对等网络(Peer-to-Peer network,简称P2P)来源于用户对互联网络驱动的应用程序软件的需求,从一出现开始,就得到了广泛的应用。P2P网络是一种分布式的网络结构,它聚集Internet或者Ad-hoc网络的边界资源,其参与者共享部分硬件资源,如处理能力、存储空间、网络带宽、打印设备等。这些资源通过网络对其服务和内容进行共享,对等节点之间直接存取,不需经过中间仲裁实体;网络中的每个参与者既是资源提供者,也是资源请求者。
    根据网络的控制方式,P2P网络分为集中式、分布式和混合式三种系统模型。其中,集中式P2P模式由一个中心服务器来负责记录共享信息以及反馈对这些信息的查询;每一个对等实体要对它所需共享的信息以及进行的通信负责,根据需要下载它所需要的其他对等实体上的信息。在分布式P2P中,对等节点通过与相邻对等点之间的连接遍历整个网络。每个对等点在功能上都是相似的,没有专门的服务器,而对等点必须依靠它们所在的分布网络来查找文件和定位其他对等机。混合式模式是以上两种模式的结合,它在分布式模式的基础上,将用户节点按能力用集中式的方式进行聚集。
    典型的P2P应用包括及时消息通信、文件共享、协同合作与高性能计算。其中,及时消息通信技术在商业上取得了成功,包括很多产品,如QQ、ICQ、MSN等;文件共享也很受广大互联网用户欢迎,有很多文件共享系统,如Napster、Gnutella、eDonkey、BT下载等;协同合作与高性能计算也在发展中。
    P2P系统提供了自适应性、自组织性、负载平衡、容错、通过大量数据复制获得的可用性以及共享性,关键技术在于其拓扑结构的构建,以及在此基础上的路由或搜索算法。而传统的集中式模式过于依赖中央服务器,中央服务器的节点失效造成整个系统的瘫痪,该模式在稳定性和扩展性方面都不理想。分布式模式的搜索请求要经过整个网络或者至少是一个很大的范围才能得到结果,随着网络规模的扩大,通过扩散方式定位对等点及查询信息的方法将会造成网络流量急剧增加,从而导致网络拥塞。混合方式将中心目录服务器的稳定性同优化的分布式文件管理结合起来,是一种较好的模式选择。
    在混合模式中,如何将功能相似的节点聚集在一起,进而在此基础上制定完备的搜索算法,对这种P2P系统的性能与开销起着至关重要的作用。语义网技术用机器可理解的内容表示方式对网页进行说明,它通过元数据来对信息进行抽象的表式,对不同资源提供者的相关信息给出了一个方便的接口技术。本文通过语义网技术来聚集P2P网络中功能相似的对等节点,来对混合模式的对等网进行研究。第二部分介绍了相关的一些语义对等网研究工作;第三部分提出了混合模式的语义对等网模型SemP2P;在第四部分,分析了实现SemP2P的一些关键技术;最后,对未来工作做了一些展望。

    2.相关工作
    文献[]基于CAN提出了pGroup语义对等网的构造方法,提出的节点加入算法能使节点快速地加入到相应的SPN中,并且构造的SPN能够适应节点内容不断变化以及节点不断加入、离开和故障等事件的发生;针对用户图同的查询行为,提出了直接组扩散算法DGF、随机组扩散算法RGF和预测组扩散算法PGF,并基于Bloom过滤器通过简单的分布式算法构造了peer组过滤器,利用增大的背景来改进RGF算法。这些算法假定文档分类器和查询分类其可以由信息检索和数据挖掘领域中成熟的分类算法来实现,也可以让用户在安装P2P软件时自己对文档分类,查询时提交文档类别。
    文献[]针对Gnutella类型的P2P网络不能进行大规模扩展问题,提出了一个P2P网络模型,该模型通过P2P网络的动态和实时搜索功能来提高语义Web服务能力。该文构建了一个超立方体HyperCuP的P2P拓扑网络结构,并通过通用的本体概念将网络拓扑分割为概念聚类。该聚类能够进行特定的查询,使得网络能够应答由本体概念组成的查询请求。该算法通过语义Web服务使用本体来描述其功能,适合于配置大型的动态网络。但是,超立方体的构造较复杂,因而对节点的开销比传统的非语义方法大。
    文献[]基于P2P结构构建了一个开放式超媒体系统DDLS(Distributed Dynamic Link Service),它是一个补充的超媒体服务,根据该服务,客户可以查询一组链接库。通过将链接库和链接服务组件分布到节点当中,DDLS使得多个想共享连接资源的用户能够进行连接解析和链接库通信服务。链接库在本地进行维护,带有最小限制来提供数据灵活性;该库功过RDF(Resource Definition Framework)将信息编码,成为与元数据相关联的三元组集合,并在语义基础上进行语义搜索。
    文献[]描述了一个基于节点的知识共享和演变P2P系统架构,由知识组件层(HELLOS)和通信组件层(HERMES)组成。该架构提出在节点之间构造一个覆盖网络,每一个节点维护一个节点拓扑,描述自己的网络知识。对于查询路由,覆盖网络的拓扑给予节点所拥有的本体之中的语义关系,对节点的邻居进行镜像。网络中的节点通过本体描述来表示,并通过丰富的语义请求和查找策略对信息共享。
    本文提出构建一个基于混合模式的P2P系统SemP2P,该系统通过以语义方式聚集节点来构造覆盖网络,提供高度的网络自治能力,并在此基础上提出语义搜索算法。
    3.语义P2P构造
    如图1所示,SemP2P的参考结构模型是一个层次结构,包括索引结构层(Index)和自治节点组层。其中,索引层通过索引节点组IPG组成,每个索引节点组IPG是由参与索引功能的节点P聚集而成。每个自治节点组PG是由多个有相同语义的节点组SemP构成,而多个参与节点形成一个组PG,具有相同语义的多个PG在一起形成了一个语义节点组SemP。

    图1 SemP2P的拓扑图
    在SemP2P系统中,节点根据自身能力选择进入节点组PG或索引节点组IPG。PG提供一般意义上的资源共享,如内容共享、硬件资源共享等;IPG提供特殊的索引服务,一方面,对用户提供资源查找接口,接受用户的服务请求,另一方面,提供资源信息的基本映射信息,并将请求服务映射到与请求语义相关的语义节点组SemP之中。相比较而言,对SemP中的节点在稳定性和可靠性上要求比对PG中节点的要求高。节点P可以提供资源而参与PG,同时又可以提供索引功能加入IPG,这对节点P的性能要求较高。
    4.实现技术研究
    语义对等网SemP中的共享资源最终面向用户,通过考虑资源的语义属性,如何高效、快捷地查找请求内容,是SemP成功的关键。在构造SemP时,将主要包含以下几个部分:将共享资源通过语义的方式表示、对请求和共享资源进行分类、索引节点组IPG和资源节点组PG的聚集以及用户请求的搜索算法。
    4.1 共享资源的表示
    共享资源最终被用户使用,参与节点必须能够理解资源,经过SemP中的网络传输到达用户,被用户理解之后才能使用。在该过程中,这些共享资源如何才能够被用户和参与节点机理解,对SemP的性能起着基础构架作用。这即是共享资源的语义表示形式问题,在SemP中,通过本体(Ontology)语言来对这些共享资源进行表示,利用元数据对SemP提供给的资源进行刻画,以便应用程序理解共享的含义。
    本体是共享概念的规范、精确的描述,它具有映像和进化的功能。本体的映射就是重用已存在的本体,通过一定的方法对它们进行展开和组合,继承不同领域的本体以实现一个更大的信息和知识池,从而支持新的交流和使用。本体进化就是获得新的信息和知识时适当地维护和扩充已有本体。SemP通过本体语言OWL(Web Ontology Language)描述节点共享资源,将它们表示为节点机可理解的词和术语,从而形成一个术语知识库。由于P2P网络的动态性,SemP需要通过本体的映像和进化来对知识库进行扩展和更新。

    4.2 资源聚类
    对等网SemP中的参与节点根据自身的服务能力,可以选择地提供服务,如索引服务、资源共享服务或者两者兼有。首先,参与资源共享的节点P根据共享语义,通过在本体知识库中抽象出聚类实体,从而形成语义相同或者相似的节点组SemP;在SemP内部,各个节点选择它们能够聚集的粒度,然后进一步聚集为适当规模的节点组PG;一个SemP组由多个PG组成。然后,将节点组SemP的共享语义进一步抽象并提取,并把多个SemP的相同或相近语义连同其SemP信息,一起映射到索引节点P上,对应相同语义SemP的多个节点P按照适当粒度聚集,从而形成索引节点组IPG。
    共享资源节点聚集成PG进而聚集成SemP,是将资源进行层次分类的过程。该过程在知识共享的表示层上进行,要达到以下几个要求:首先,资源节点组PG的规模适度,每个节点组PG选举自己的组长负责与SemP中的其他PG进行通信。其次,SemP组本身的概念抽象要尽可能广泛,它是对共享知识的一级抽象分类,知识库中的每个知识都隶属于SemP中的一个。最后,资源的请求要能高效地到达节点P。请求通过索引节点处理后,映射到节点组SemP,并在SemP内的各个PG中进行广播,最终到达满足要求的节点P。
    索引节点组IPG的形成依赖于资源节点组SemP,SemP将共享概念抽象后连同SemP的组位置信息映射到索引节点。索引节点获得这些映射信息后,建立共享资源与资源节点组SemP的索引表。单个索引节点的可靠性差,因此,通过一组索引节点形成一个IPG,来共同为这些SemP提供索引服务,以致索引表在IPG内可以分块存放并进行复制。由于SemP的数量很大,因此,一个IPG对应多个SemP,从而提高查找能力。在索引节点不够形成一个IPG时,IPG组长向系统提出请求,要求更多的节点加入到索引节点组中来,从而形成IPG的动态调整。

    4.3 网络的动态调整
    对等网络中的节点可以根据意愿随时加入或离开系统,以致必须处理网络中节点的加入与离开事件,来对系统做动态调整。当节点加入系统时,首先根据用户的意愿以及节点的服务能力,将该节点归为索引节点或资源服务节点。若是索引节点,则进入Index层,并检查Index中是否有IPG需要索引节点,需要则根据索引代价加入相应的IPG,否则进入Index中的候选IPG队列,以便IPG索引节点不够时进行调整。即当某个索引节点离开系统而导致该IPG的索引能力不能满足要求时,则从候选IPG队列中找到最能满足该IPG队列索引能力的节点,并在该IPG内,对其索引表进行复制,让该新节点具有索引功能。若候选队列中没有节点,则将系统中服务能力最强的节点增强为索引节点而加入IPG。
    当资源服务节点加入系统时,首先对该节点的共享资源用本体语言进行描述,然后对其共享概念进行刻画,抽象出共享资源的类别,并将这些共享信息发送到系统中。系统根据这些共享信息,经过索引节点查找出该节点要加入哪些资源组SemP。在节点进入一个SemP中后,又根据进一步的抽象信息,进入相应的PG;若PG过于庞大,则将PG分裂为两个新的PG。如果由于节点加入而丰富了PG乃至SemP的语义,则需要将新的语义信息进行再调整,重新映射到相关的索引节点组IPG上。当PG中的节点离开系统时,则定时调整PG以及SemP的语义信息,并最终将该信息影射到相关的索引节点IPG上。同样,节点离开系统时,有可能使得PG过小而维护代价大,则将语义相近的两个PG组合为一个新的PG。

    4.4 资源请求的搜索
    用户要得到共享资源,必须将其请求信息发送给系统;系统将该请求信息用本体语言进行抽象,并根据系统的层次结构,首先将请求传送给索引节点层Index,并在Index中进行广播,进而找到包含相应资源的索引节点组IPG。该IPG处理请求的头信息后,根据其中的索引表,将给请求转发到对应的资源节点组SemP。在SemP内部,将给请求进一步广播,找到包含该请求的资源节点组PG,从而找到包含资源请求的节点。最后,该资源节点与用户直接通信,从而对用户提供资源共享服务。然而,包含资源请求的节点可能并不存在,且失败信息可能丢失,因而用户通过请求时间进行控制,若在该时间内返回服务信息,则进行相应的处理;否则,该请求失败,重新发送请求或断定系统中不存在所请求资源。

    5.总结与展望
    本文利用混合模式来构建对等网络SemP2P的拓扑结构,并利用本体概念将SemP2P中的共享资源用OWL语言描述。通过语义的方式,SemP2P被分为一个层次结构,即资源服务层和索引节点层。最后,本文从共享资源的表示、资源聚类、网络的动态调整以及资源请求的搜索这四个方面来研究SemP2P的实现过程。
    SemP2P目前还处于原型阶段,共享资源的本体描述工作还没有完成,因而整个系统还没有完全展开。在以后的工作中,将结合语义网的研究成果,对特定的共享资源用本体语言进行描述,从而构造一个语义对等网系统,并在此基础上,对语义对等网的性能进行评估。

    参考文献
    [1] 宋建涛,沙朝锋,杨智应,朱洪. 语义对等网构造及搜索机制研究. 计算机研究与发展, 41 (4), Apr. 2004. pp. 645-652
    [2] Mario Schlosser, Michael Sintek, Stefan Decker, Wolfgang Nejdl. A Scalable and Ontology-Based P2P Infrastructure for Semantic Web Services. In Proceedings of the Second International Conference on Peer-to-Peer Computing (P2P’02), 2002. pp.
    [3] Jing Zhou, Vijay Dialani, David De Roure, and Wendy Hall. A Semantic Search Algorithm for Peer-to-Peer Open Hypermedia Systems. In 1st Workshop on Semantics in Peer-to-Peer and Grid Computing, Budapest, Hungary. May 2003.


       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/1/28 10:51:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 云计算,网格,SaaS,P2P 』 的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/5/3 1:18:35

    本主题贴数9,分页: [1]

     *树形目录 (最近20个回帖) 顶端 
    主题:  语义对等网研究[原创](10872字) - luorenren,2005年1月28日
        回复:  p2p环境下实现Web服务集成的Petri网计算系统--语用网详情请参见语用网专业网站http..(7540字) - ygzw,2006年4月28日
        回复:  这是我的课程论文有幸得到大家的宠信。至于图,这个论坛上不能贴阿!不知道各位都是做这方面的研究..(126字) - luorenren,2006年4月27日
        回复:  大虾!图那?没图,看不懂啊(28字) - xiaotaluoluuo,2006年4月27日
        回复:  呵呵,“索引节点层Index”缓存本地信息吗?(41字) - davyfeng,2006年4月19日
        回复:  路过(4字) - 秋雨,2005年8月29日
        回复:  可惜文章中看不到你画的原型图,最近的进展如何?junhong.h@huawei.com..(66字) - junhong.h,2005年8月17日
        回复:  语义网目前的实现需要这样的网络结构,利用代理这样的载体来对需要推理/查询的数据进行消息模式的传输...(95字) - serva,2005年4月2日
        回复:  hao(5字) - s2s2,2005年2月18日

    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    94.238ms