测试效果bad case
#40
by
jwww123
- opened
query: ['动脉瘤是什么']
documents: ['腘窝囊肿是什么', '动脉瘤是什么?']
score: [[83.64187622070312, 48.1422119140625]]
为啥「腘窝囊肿是什么」的匹配度更高呢?
query: ['动脉瘤是什么?']
documents: ['腘窝囊肿是什么', '动脉瘤是什么?']
[[39.49958801269531, 99.9999771118164]]
query加了个问号后结果就正常了
使用的就是例子的代码,是使用姿势不对还是需要微调呢?
发现是后缀相同的文本,相似度会高很多,gte-Qwen2-1.5B-instruct也有同样的问题