测试效果bad case

#40
by jwww123 - opened

query: ['动脉瘤是什么']
documents: ['腘窝囊肿是什么', '动脉瘤是什么?']
score: [[83.64187622070312, 48.1422119140625]]
为啥「腘窝囊肿是什么」的匹配度更高呢?

query: ['动脉瘤是什么?']
documents: ['腘窝囊肿是什么', '动脉瘤是什么?']
[[39.49958801269531, 99.9999771118164]]
query加了个问号后结果就正常了

使用的就是例子的代码,是使用姿势不对还是需要微调呢?


发现是后缀相同的文本,相似度会高很多,gte-Qwen2-1.5B-instruct也有同样的问题

Sign up or log in to comment