llama.cpp python 库是@ggerganov的 llama.cpp 的简单 Python 绑定。 该包提供:
- 通过 ctypes 接口对 C API 的底层访问
- 用于文本补全的高层 Python API
- 类
OpenAIAPILangChain兼容性LlamaIndex兼容性- 兼容 OpenAI 的 Web 服务器
- 本地 Copilot 替代方案
- 函数调用支持
- Vision API 支持
- 多模型支持
安装与设置
对话模型
查看使用示例。LLM
嵌入模型
查看使用示例。将这些文档连接 到 Claude、VSCode 等,通过 MCP 获取实时答案。

