合并文档加载器
合并从一组指定的数据加载器返回的文档。
from langchain_community.document_loaders import WebBaseLoader
loader_web = WebBaseLoader(
"https://github.com/basecamp/handbook/blob/master/37signals-is-you.md"
)
API 参考:WebBaseLoader
from langchain_community.document_loaders import PyPDFLoader
loader_pdf = PyPDFLoader("../MachineLearning-Lecture01.pdf")
API 参考:PyPDFLoader
from langchain_community.document_loaders.merge import MergedDataLoader
loader_all = MergedDataLoader(loaders=[loader_web, loader_pdf])
API 参考:MergedDataLoader
docs_all = loader_all.load()
len(docs_all)
23