Skip to main content
Telegram即时通讯是一项全球可用的免费增值、跨平台、加密、基于云的集中式即时通讯服务。该应用还提供可选的端到端加密聊天、视频通话、VoIP、文件共享及多项其他功能。
本笔记本介绍如何从Telegram加载数据到可被LangChain处理的格式。
from langchain_community.document_loaders import (
    TelegramChatApiLoader,
    TelegramChatFileLoader,
)
loader = TelegramChatFileLoader("example_data/telegram.json")
loader.load()
[Document(page_content="Henry on 2020-01-01T00:00:02: It's 2020...\n\nHenry on 2020-01-01T00:00:04: Fireworks!\n\nGrace 🧤 ðŸ\x8d’ on 2020-01-01T00:00:05: You're a minute late!\n\n", metadata={'source': 'example_data/telegram.json'})]
TelegramChatApiLoader直接从Telegram的任何指定聊天加载数据。要导出数据,您需要对Telegram账户进行身份验证。 您可以从my.telegram.org/auth?to=apps获取API_HASH和API_ID。 chat_entity—建议使用频道的实体
loader = TelegramChatApiLoader(
    chat_entity="<CHAT_URL>",  # 建议此处使用Entity
    api_hash="<API HASH >",
    api_id="<API_ID>",
    username="",  # 仅在缓存会话时需要。
)
loader.load()