联系hashgameCONTACT hashgame
地址:广东省广州市
手机:13988889999
电话:020-88889999
邮箱:admin@qq.com
查看更多
Rhashgamehashgame
你的位置: 首页 > hashgame > hashgames

面向大规模信息检索的中文分词技术HASH GAME - Online Skill Game ET 300研究

发布时间:2025-03-03 11:49:01  点击量:

  HASH GAME - Online Skill Game GET 300

面向大规模信息检索的中文分词技术HASH GAME - Online Skill Game GET 300研究

  – Precision:在检索到x篇文档时的准确率。x为5、10、15、20到1000 不等。例如Precision:At 30 docs(通常用P@30表示)的值为0.5784就 是表示前30篇文档中检索的准确率是0.5784。 – R-Precision:一个查询检索到R篇文档时的准确率。R为该查询真正相 关的文档数。如果一个查询的相关文档数为30,在检索系统检索出的 前30篇文档中相关文档数为18,则该查询的R-Precision为18/30=0.6。

  N元切分法(N-gram) :对一个字符串序列以N为一个切分单位进行切分。 – 如二元切分法: “ABCDEFG” →“AB\CD\EF\G” – 交叉二元切分法(Overlapping Bigram):“ABCDEFG” →“AB\BC\CD\DE\EF\FG” – 简单快速,但会产生大量无意义的标引词,导致标引产生的索引文件 的空间,以及检索和进行标引的时间都大大增加。同时,因为它的切 分单位并非语言学意义上的词语,所以也会导致检索的查准率下降。

【返回列表页】

顶部

地址:广东省广州市  电话:020-88889999 手机:13988889999
Copyright © 2018-2025 哈希游戏(hash game)官方网站 版权所有 非商用版本 ICP备案编: