模型的llama-13b为啥对于问题没有反馈,70b对于数学题的解决能力欠佳

#2
by mawenju203 - opened

简单的数学题,就不能解决出来,基本的语义不能变换为公式的形式

image.png

等式变形的时候出现计算错误

语言模型的本质原理是预测下一个词的概率,所以不能期望它完成复杂的数学任务,尤其是在greedy模式采样的时候。

此外,我们训练集中的数学内容相对较少。

比较务实的方法是类似openai code interpreter的方式,让模型生成python代码后在沙盒里求解。

关于其它模型无法使用的问题:我们目前的全部gpu资源都用于运行70B了,所以目前demo里的其它模型都不可用。

@ff670 好的,谢谢了;
70b的模型, 这份工作主要的亮点是什么呢?亲,哪方面做了改进和提升呢?这个是我比较关心的

OpenBuddy org

70B模型在认知能力上有了显著的提升,可以让他做做阅读理解任务试试

阅读理解能力很强!

Sign up or log in to comment