以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 Web挖掘技术 』   (http://bbs.xml.org.cn/list.asp?boardid=69)
----  ICTCLAS 中文分词系统  (http://bbs.xml.org.cn/dispbbs.asp?boardid=69&rootid=&id=67065)


--  作者:haiboxu
--  发布时间:9/10/2008 10:17:00 AM

--  ICTCLAS 中文分词系统
中国科学院计算技术研究所研制的汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45%,API不超过200KB,各种词典数据压缩后不到3M,是当前世界上最好的汉语词法分析器。

官网www.ictclas.org


--  作者:suiyun0234
--  发布时间:10/18/2008 9:28:00 PM

--  
好东西啊,呵呵,现在还有免费下载吗?
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
31.250ms