Xinference 是一个功能强大且灵活的库,专为在笔记本电脑上部署 LLM、语音识别模型和多模态模型而设计。通过 Xorbits Inference,只需一条命令即可轻松部署并提供你的模型或最先进的内置模型。
安装与设置
可通过 PyPI 使用 pip 安装 Xinference:LLM
Xinference 支持与 GGML 兼容的各种模型,包括 chatglm、baichuan、whisper、vicuna 和 orca。要查看内置模型,运行以下命令:Xinference 封装
可以通过以下命令启动本地 Xinference 实例:使用方法
有关更多信息和详细示例,请参阅 xinference LLM 示例嵌入
Xinference 还支持嵌入查询和文档。查看 xinference 嵌入示例以获取更详细的演示。安装 Xinference LangChain 合作伙伴包
通过以下方式安装集成包:聊天模型
LLM
通过 MCP 将这些文档连接到 Claude、VSCode 等以获取实时答案。

