Apify
Apify 是一个用于网络爬取和数据提取的云平台,它提供了一个由一千多个预制应用程序(称为 Actors)组成的生态系统,用于各种爬取、抓取和提取用例。
此集成使您能够在 Apify
平台上运行 Actors,并将其结果加载到 LangChain 中,以便使用来自网络的文件和数据来馈送您的向量索引,例如,从包含文档、博客或知识库的网站生成答案。
安装和设置
- 使用以下命令安装 Python 的 LangChain Apify 包
pip install langchain-apify
- 获取您的 Apify API 令牌,并将其设置为环境变量 (
APIFY_API_TOKEN
) 或在构造函数中将其作为apify_api_token
传递。
工具
您可以使用 ApifyActorsTool
将 Apify Actors 与代理一起使用。
from langchain_apify import ApifyActorsTool
有关示例用法以及在 Apify LangGraph 代理 Actor 模板 中使用 LangGraph 的工具调用代理的完整示例,请参阅此 notebook。
有关如何使用此工具的更多信息,请访问Apify 集成文档。
包装器
您可以使用 ApifyWrapper
在 Apify 平台上运行 Actors。
from langchain_apify import ApifyWrapper
有关如何使用此包装器的更多信息,请参阅Apify 集成文档。
文档加载器
您还可以使用我们的 ApifyDatasetLoader
从 Apify 数据集中获取数据。
from langchain_apify import ApifyDatasetLoader
有关此加载器的更详细演练,请参阅此 notebook。
此集成的源代码可以在LangChain Apify 存储库中找到。