Spaces:
Running
Running
模型的llama-13b为啥对于问题没有反馈,70b对于数学题的解决能力欠佳
#2
by
mawenju203
- opened
简单的数学题,就不能解决出来,基本的语义不能变换为公式的形式
等式变形的时候出现计算错误
语言模型的本质原理是预测下一个词的概率,所以不能期望它完成复杂的数学任务,尤其是在greedy模式采样的时候。
此外,我们训练集中的数学内容相对较少。
比较务实的方法是类似openai code interpreter的方式,让模型生成python代码后在沙盒里求解。
关于其它模型无法使用的问题:我们目前的全部gpu资源都用于运行70B了,所以目前demo里的其它模型都不可用。
@ff670
好的,谢谢了;
70b的模型, 这份工作主要的亮点是什么呢?亲,哪方面做了改进和提升呢?这个是我比较关心的
70B模型在认知能力上有了显著的提升,可以让他做做阅读理解任务试试
阅读理解能力很强!