以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 Semantic Web(语义Web)/描述逻辑/本体 』  (http://bbs.xml.org.cn/list.asp?boardid=2)
----  [求助]本体构建:WORDNET中抽取子本体,扩展,可视化工具方面的技术细节  (http://bbs.xml.org.cn/dispbbs.asp?boardid=2&rootid=&id=15757)


--  作者:风再起时
--  发布时间:3/17/2005 9:13:00 PM

--  [求助]本体构建:WORDNET中抽取子本体,扩展,可视化工具方面的技术细节
本人准备开题,题目是领域本体的构建。基本思路如下:
1.以领域数据字典为依据,从WORDNET中抽取一个子本体;
2.在抽取出的子本体基础上,对其进行扩展与分析;
3.专用可视化工具开发。

这方面起步较晚,许多知识都不清楚,请各位高手多提宝贵意见,多谢了!

这个思路是否合适?
WORDNETR的结构是怎样的?如何抽取子本体?算法情况?
如何尽可能的进行自动化或半自动化抽取、扩展?
编写本体的工具有哪些?优缺点如何?

请大家多帮忙,有什么文献向我介绍一下,再次表示衷心感谢!


--  作者:saleemlz
--  发布时间:3/25/2005 8:48:00 PM

--  
帮你把这些问题都解释了,你的论文也就做完了把。呵呵
--  作者:saleemlz
--  发布时间:3/25/2005 8:54:00 PM

--  
1、抽取子本体,就是概念发现的过程,但是在这之前,必须有本体雏形作为抽取子本体的基础。这就是middle-out的方法,当然你还可以玩top-down,bottom-up的方法。
2、wordnet是一部同义词典,其有jwordnet和JWNL API作为词典的访问函数,自己可以去看看。但是,wordnet只具有上下位等关系,没有objectproperty这种关系,因此尽管概念可以抽取出来,但是关系的获取,还有一定的困难。
3、本体的半自动或自动构建方法,很多人在研究,也有一些论文,但是现在看起来还是一个难点问题。

--  作者:风再起时
--  发布时间:3/28/2005 10:28:00 AM

--  
多谢楼上的两位,现在想来,以wordnet作为源本体来抽取子本体可能有些欠缺,wordnet还算不上一个完备的本体吧。
不论如何,从一个大的本体中抽取些概念及部分关系来半自动构建一个新的领域本体总算是一个思路吧。
如果wordnet不行,有什么别的大的本体可作为源本体么?请各位高手多指教,谢谢!
--  作者:海军中校
--  发布时间:3/28/2005 12:47:00 PM

--  
专用可视化工具开发。 是什么意思?是开发一个构建本体的工具吗?
如果是的话,可以在protege的基础上,它是开源的阿!
--  作者:风再起时
--  发布时间:3/29/2005 4:47:00 PM

--  
回楼上的:
就是一个专门的可视化工具,或者说重新开发一个能把本体可视化的工具。下一步再考虑开发构建本体的工具吧,反正我是做不完了。
protege刚安上,还不熟悉呢。开源的?哪有源码,能告诉我吗?多谢!
--  作者:aaaron
--  发布时间:3/30/2005 9:25:00 AM

--  
http://protege.stanford.edu/download/download.html
--  作者:风再起时
--  发布时间:4/19/2005 8:13:00 PM

--  
多谢楼上的,已下了,在看,多谢!
--  作者:jlpapple
--  发布时间:4/21/2005 10:55:00 AM

--  
我现在打算将wordnet应用到textmining上去,可是现在不知道如何将它(unix版的)融合到自己的程序中去,有哪位大虾有过类似的使用wordnet (unix)工具包的工作,可否告知一下?
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
62.500ms