关于训练代码

#4
by PatrickStar1 - opened

不知道大佬的训练代码是否开源?想学习一下

aspire changed discussion status to closed

请教下 matryoshka 在训练期间用了哪些维度?

Owner

我使用的是[512, 768, 1024, 1536, 1792],权重也都是[1, 1, 1, 1, 1],这个并没有做大量的实践,如果有更好的维度方式,也可以互相交流。

aspire changed discussion status to open

我使用的是[512, 768, 1024, 1536, 1792],权重也都是[1, 1, 1, 1, 1],这个并没有做大量的实践,如果有更好的维度方式,也可以互相交流。

请问使用matryoshka能提升模型效果吗?

Sign up or log in to comment