你好作者,15.3比起15.1和15.2的区别在哪呀?

#1
by JamePeng2023 - opened
JamePeng2023 changed discussion status to closed
OpenBuddy org

你好,我们目前主要在尝试提升模型的中文的能力,15.3比之前的版本在中文上要更加流畅一点,并且幻觉有所改善,具体可以比对Evaluation.txt

你好,我们目前主要在尝试提升模型的中文的能力,15.3比之前的版本在中文上要更加流畅一点,并且幻觉有所改善,具体可以比对Evaluation.txt

mistral 0.2版本和mixtral最大的结构改变就是增大了rope的base同时取消了sliding window的使用。你们还在沿用sliding window吗,这跟官方设置不一致啊

这个模型的基座模型是https://huggingface.co/mistralai/Mixtral-8x7B-v0.1 ,不是mistral,mistral和mixtral是两个不同的系列。

具体来说,是这个版本:https://huggingface.co/mistralai/Mixtral-8x7B-v0.1/commit/ccf7a6502058c82841f1be65cf7e35764be35318

此外,v15.3是指OpenBuddy微调方案的版本更新,而不是说基座版本是0.3。

这个模型的基座模型是https://huggingface.co/mistralai/Mixtral-8x7B-v0.1 ,不是mistral,mistral和mixtral是两个不同的系列。

具体来说,是这个版本:https://huggingface.co/mistralai/Mixtral-8x7B-v0.1/commit/ccf7a6502058c82841f1be65cf7e35764be35318

此外,v15.3是指OpenBuddy微调方案的版本更新,而不是说基座版本是0.3。

这个是设置错误,官方早就改了。如果你们文本长度不超过4096就问题不大,但是最好也跟官方最新配置保持一致

OpenBuddy org

这个模型的基座模型是https://huggingface.co/mistralai/Mixtral-8x7B-v0.1 ,不是mistral,mistral和mixtral是两个不同的系列。

具体来说,是这个版本:https://huggingface.co/mistralai/Mixtral-8x7B-v0.1/commit/ccf7a6502058c82841f1be65cf7e35764be35318

此外,v15.3是指OpenBuddy微调方案的版本更新,而不是说基座版本是0.3。

这个是设置错误,官方早就改了。如果你们文本长度不超过4096就问题不大,但是最好也跟官方最新配置保持一致

我看了一下,好像确实是官方的错误。目前这个版本是用4k语料训练的,所以应该不会有太大问题。后续我们会训练更长的版本。

Sign up or log in to comment