min_chunk_size和max_chunk_size之间。
如果值不是嵌套的JSON,而是一个非常大的字符串,则该字符串不会被分割。如果您需要对块大小有硬性限制,可以考虑将此分割器与递归文本分割器组合使用。有一个可选的预处理步骤来分割列表,方法是先将其转换为JSON(字典),然后按此方式分割。
- 文本如何分割:按JSON值。
- 块大小如何衡量:按字符数。
基本用法
指定max_chunk_size 以约束块大小:
.split_json 方法:
.create_documents 方法:
.split_text 直接获取字符串内容:
如何管理来自列表内容的块大小
请注意,此示例中的一个块大于指定的max_chunk_size(300)。查看其中一个较大的块,我们发现其中有一个列表对象:
convert_lists=True 以预处理JSON,将列表内容转换为字典,其中 index:item 作为 key:val 对:
连接这些文档到Claude、VSCode等,通过MCP获取实时答案。

