js-tiktoken
js-tiktoken 是
OpenAI 创建的 BPE 分词器的 JavaScript 版本。tiktoken 来估算使用 TokenTextSplitter 所使用的令牌。对于 OpenAI 模型,它可能更准确。
- 文本如何分割:按传入的字符分割。
- 块大小如何衡量:由
tiktoken分词器衡量。
tiktoken 合并块,请在初始化 TokenTextSplitter 时传入 encodingName(例如 cl100k_base)。请注意,此方法产生的分割可能大于 tiktoken 分词器衡量的块大小。
将这些文档通过 MCP 连接到 Claude、VSCode 等,以获取实时答案。

