Skip to main content
Mastodon 是一个联邦社交媒体和社交网络服务。
此加载器使用 Mastodon.py Python 包,从一系列 Mastodon 账户的“toots”(推文)中获取文本。 默认情况下,可以查询公共账户而无需任何身份验证。如果查询非公共账户或实例,您必须为您的账户注册一个应用程序以获取访问令牌,并设置该令牌和您账户的 API 基础 URL。 然后,您需要以 @account@instance 格式传入您想要提取的 Mastodon 账户名称。
from langchain_community.document_loaders import MastodonTootsLoader
pip install -qU  Mastodon.py
loader = MastodonTootsLoader(
    mastodon_accounts=["@Gargron@mastodon.social"],
    number_toots=50,  # 默认值为 100
)

# 或者设置访问信息以使用 Mastodon 应用程序。
# 注意,访问令牌可以传递给构造函数,
# 也可以设置环境变量 "MASTODON_ACCESS_TOKEN"。
# loader = MastodonTootsLoader(
#     access_token="<MASTODON 应用程序的访问令牌>",
#     api_base_url="<MASTODON 应用程序实例的 API 基础 URL>",
#     mastodon_accounts=["@Gargron@mastodon.social"],
#     number_toots=50,  # 默认值为 100
# )
documents = loader.load()
for doc in documents[:3]:
    print(doc.page_content)
    print("=" * 80)
<p>很难离开这里回到现实。而且有些人就住在这里!我肯定有缺点,但现在听起来对我来说相当不错。</p>
================================================================================
<p>我希望我们能在这里多待一会儿,但该回家了 🥲</p>
================================================================================
<p>蜜月的最后一天。而且今天是 <a href="https://mastodon.social/tags/caturday" class="mention hashtag" rel="tag">#<span>caturday</span></a>!这只可爱的虎斑猫来到餐厅乞讨食物,得到了一些鸡肉。</p>
================================================================================
推文文本(文档的 page_content)默认是 Mastodon API 返回的 HTML。