用什么部署,可以像智普API那样传工具,VLLM和Llama.cpp,ollama的,有没有现成的Modelfile?

#85
by AubreyChen - opened

用什么部署,可以像智普API那样传工具,进行调用,或者有没有ollama的Modelfile,目前主流的部署ollama和vllm,llama.cpp,fast..有啥可以支持glm调用工具

Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University org

vLLM 在我们的github repos 有提供代码,部署成 OpenAI API,但是没有做成docker

Sign up or log in to comment