试用了模型之后,发现和原生的qwen-vl-chat相比,模型输出的可靠性强了很多,不会像原生模型一样不按照指令输出,想请问下作者训练的方法是什么,是sft、lora或者其它,有无开源repo,感谢
有相应的论文嘛
· Sign up or log in to comment