跳到主要内容
Open on GitHub

文档加载器

文档加载器旨在加载文档对象。LangChain 集成了数百种不同的数据源,可从中加载数据:Slack、Notion、Google Drive 等。

集成

您可以在文档加载器集成页面上找到可用的集成。

接口

文档加载器实现了 BaseLoader 接口

每个 DocumentLoader 都有其特定的参数,但它们都可以通过 .load 方法或 .lazy_load 以相同的方式调用。

这里有一个简单的示例

from langchain_community.document_loaders.csv_loader import CSVLoader

loader = CSVLoader(
... # <-- Integration specific parameters here
)
data = loader.load()
API 参考:CSVLoader

处理大型数据集时,可以使用 .lazy_load 方法

for document in loader.lazy_load():
print(document)

请参阅以下资源以获取更多信息