分类 LLM模型应用框架 适应场景需适配器连接核心模型并使用HuggingFace Agents,支持bitsandbytes、GPTQ 量化及LangChain 集成缺点缺乏批处理和分布式推理支持URLhttps://github.com/bentoml/OpenLLM