MongoDB
MongoDB 是一个 NoSQL、面向文档的数据库,支持具有动态模式的类似 JSON 的文档。
概述
MongoDB 文档加载器从 MongoDB 数据库返回一个 Langchain 文档列表。
加载器需要以下参数
- MongoDB 连接字符串
- MongoDB 数据库名称
- MongoDB 集合名称
- (可选)内容过滤器字典
- (可选)要包含在输出中的字段名称列表
输出采用以下格式
- pageContent= Mongo 文档
- metadata={'database': '[database_name]', 'collection': '[collection_name]'}
加载文档加载器
# add this import for running in jupyter notebook
import nest_asyncio
nest_asyncio.apply()
from langchain_community.document_loaders.mongodb import MongodbLoader
API 参考:MongodbLoader
loader = MongodbLoader(
connection_string="mongodb://localhost:27017/",
db_name="sample_restaurants",
collection_name="restaurants",
filter_criteria={"borough": "Bronx", "cuisine": "Bakery"},
field_names=["name", "address"],
)
docs = loader.load()
len(docs)
71
docs[0]
Document(page_content="Morris Park Bake Shop {'building': '1007', 'coord': [-73.856077, 40.848447], 'street': 'Morris Park Ave', 'zipcode': '10462'}", metadata={'database': 'sample_restaurants', 'collection': 'restaurants'})