Spaces:

OpenBuddy
/

ChatWithBuddy

Running

App Files Files Community

模型的llama-13b为啥对于问题没有反馈，70b对于数学题的解决能力欠佳

#2

by mawenju203 - opened Aug 25, 2023

Aug 25, 2023

简单的数学题，就不能解决出来，基本的语义不能变换为公式的形式

Aug 25, 2023

Aug 25, 2023

等式变形的时候出现计算错误

ff670

OpenBuddy org Aug 25, 2023

•

edited Aug 25, 2023

语言模型的本质原理是预测下一个词的概率，所以不能期望它完成复杂的数学任务，尤其是在greedy模式采样的时候。

此外，我们训练集中的数学内容相对较少。

比较务实的方法是类似openai code interpreter的方式，让模型生成python代码后在沙盒里求解。

关于其它模型无法使用的问题：我们目前的全部gpu资源都用于运行70B了，所以目前demo里的其它模型都不可用。

Aug 28, 2023

@ff670 好的，谢谢了；
70b的模型，这份工作主要的亮点是什么呢？亲，哪方面做了改进和提升呢？这个是我比较关心的

ff670

OpenBuddy org Aug 29, 2023

70B模型在认知能力上有了显著的提升，可以让他做做阅读理解任务试试

Aug 31, 2023

阅读理解能力很强！

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment