Skip to main content
Oracle AI Database 支持 AI 工作负载,使您能够按语义(含义)而非关键词查询数据。它将对非结构化内容的语义搜索对业务数据的关系过滤整合在单一系统中——让您无需引入独立的向量数据库或在多个平台间分散数据,即可构建检索工作流(如 RAG)。 本指南演示如何使用 Oracle AI Vector Search LangChain 集成中的 OracleSummary 生成文档摘要。
为什么在这里使用摘要? 摘要是将长文档压缩为检索友好内容(预览、元数据或精简上下文)的实用方法,同时让治理和运营保障更贴近数据本身。
如果您刚开始使用 Oracle Database,可以探索免费的 Oracle 26 AI。端到端设置演练请参阅 Oracle AI Vector Search 演示 notebook。用户管理背景知识请参阅官方 Oracle 指南

前提条件

安装 langchain-oracledbpython-oracledb 驱动程序将作为依赖项自动安装。
pip install -qU langchain-oracledb

连接到 Oracle Database

以下示例代码展示了如何连接到 Oracle Database。默认情况下,python-oracledb 以”Thin”模式运行,直接连接到 Oracle Database,无需 Oracle Client 库。但使用 Oracle Client 库时可以获得一些额外功能,此时 python-oracledb 处于”Thick”模式。两种模式都全面支持 Python Database API v2.0 规范。请参阅以下指南了解各模式支持的功能。如果无法使用 Thin 模式,可以切换到 Thick 模式。
import oracledb

# Please update with your username, password, hostname, port and service_name
username = "<username>"
password = "<password>"
dsn = "<hostname>:<port>/<service_name>"

connection = oracledb.connect(user=username, password=password, dsn=dsn)
print("Connection successful!")

生成摘要

Oracle AI Vector Search LangChain 库提供了一套用于文档摘要的 API。它支持多种摘要提供商,如 Database、OCIGENAI、HuggingFace 等,用户可以选择最适合自己需求的提供商。要使用这些功能,用户必须按照指定方式配置摘要参数。有关这些参数的详细信息,请参阅 Oracle AI Vector Search 指南手册 注意: 如果用户希望使用 Oracle 内置默认提供商”database”以外的第三方摘要生成提供商,可能需要设置代理。如果不需要代理,请在实例化 OracleSummary 时移除代理参数。
# proxy to be used when we instantiate summary and embedder object
proxy = "<proxy>"
以下示例代码展示了如何生成摘要:
from langchain_oracledb.utilities.oracleai import OracleSummary
from langchain_core.documents import Document

"""
# using 'ocigenai' provider
summary_params = {
    "provider": "ocigenai",
    "credential_name": "OCI_CRED",
    "url": "https://inference.generativeai.us-chicago-1.oci.oraclecloud.com/20231130/actions/summarizeText",
    "model": "cohere.command",
}

# using 'huggingface' provider
summary_params = {
    "provider": "huggingface",
    "credential_name": "HF_CRED",
    "url": "https://api-inference.huggingface.co/models/",
    "model": "facebook/bart-large-cnn",
    "wait_for_model": "true"
}
"""

# using 'database' provider
summary_params = {
    "provider": "database",
    "glevel": "S",
    "numParagraphs": 1,
    "language": "english",
}

# get the summary instance
# Remove proxy if not required
summ = OracleSummary(conn=conn, params=summary_params, proxy=proxy)
summary = summ.get_summary(
    "In the heart of the forest, "
    + "a lone fox ventured out at dusk, seeking a lost treasure. "
    + "With each step, memories flooded back, guiding its path. "
    + "As the moon rose high, illuminating the night, the fox unearthed "
    + "not gold, but a forgotten friendship, worth more than any riches."
)

print(f"Summary generated by OracleSummary: {summary}")

端到端演示

请参阅我们的完整演示指南 Oracle AI Vector Search 端到端演示指南,了解如何借助 Oracle AI Vector Search 构建完整的 RAG 流水线。