发布时间:2025-03-03 11:49:01 点击量:
HASH GAME - Online Skill Game GET 300
– Precision:在检索到x篇文档时的准确率。x为5、10、15、20到1000 不等。例如Precision:At 30 docs(通常用P@30表示)的值为0.5784就 是表示前30篇文档中检索的准确率是0.5784。 – R-Precision:一个查询检索到R篇文档时的准确率。R为该查询真正相 关的文档数。如果一个查询的相关文档数为30,在检索系统检索出的 前30篇文档中相关文档数为18,则该查询的R-Precision为18/30=0.6。
N元切分法(N-gram) :对一个字符串序列以N为一个切分单位进行切分。 – 如二元切分法: “ABCDEFG” →“AB\CD\EF\G” – 交叉二元切分法(Overlapping Bigram):“ABCDEFG” →“AB\BC\CD\DE\EF\FG” – 简单快速,但会产生大量无意义的标引词,导致标引产生的索引文件 的空间,以及检索和进行标引的时间都大大增加。同时,因为它的切 分单位并非语言学意义上的词语,所以也会导致检索的查准率下降。