生成decode会有乱码

#1
by lucasjin - opened

中文偶尔会有乱码出现,为啥

推理框架用的是ctransformers,底层是exllama

模型本身用的是chatml模板,而lima-erp是用的alpaca格式的指令模板,所以需要将 \n### Reponse\n### Request 加到停止符中

我用awq推理正常了

Sign up or log in to comment