向量存储
选择嵌入模型
选择 嵌入模型
pip install -qU langchain-openai
import getpass
import os
if not os.environ.get("OPENAI_API_KEY"):
  os.environ["OPENAI_API_KEY"] = getpass.getpass("Enter API key for OpenAI: ")
from langchain_openai import OpenAIEmbeddings
embeddings = OpenAIEmbeddings(model="text-embedding-3-large")
选择向量数据库
选择 向量存储
pip install -qU langchain-core
from langchain_core.vectorstores import InMemoryVectorStore
vector_store = InMemoryVectorStore(embeddings)
| 向量数据库 | 按 ID 删除 | 过滤 | 按向量搜索 | 带分数搜索 | 异步 | 通过标准测试 | 多租户 | 添加文档中的 ID | 
|---|---|---|---|---|---|---|---|---|
| AstraDBVectorStore | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ | 
| Chroma | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ | 
| Clickhouse | ✅ | ✅ | ❌ | ✅ | ❌ | ❌ | ❌ | ❌ | 
| CouchbaseSearchVectorStore | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | 
| DatabricksVectorSearch | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ | 
| ElasticsearchStore | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ | 
| FAISS | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ | 
| InMemoryVectorStore | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ | ❌ | 
| Milvus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | 
| MongoDBAtlasVectorSearch | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ | 
| openGauss | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ❌ | ✅ | 
| PGVector | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ | 
| PineconeVectorStore | ✅ | ✅ | ✅ | ❌ | ✅ | ❌ | ❌ | ❌ | 
| QdrantVectorStore | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | 
| Redis | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ | 
| Weaviate | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ❌ | 
| SQLServer | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ | ❌ | 
所有向量数据库
| 名称 | 描述 | 
|---|---|
| Activeloop Deep Lake | Activeloop Deep Lake 作为多模态向量数据库,存储嵌入数据... | 
| Aerospike | Aerospike Vector Search (AVS) 是一个 | 
| 阿里云 OpenSearch | 阿里云开放搜索是一个一站式平台,用于开发智能... | 
| AnalyticDB | AnalyticDB for PostgreSQL 是一个大规模并行处理(MPP)数据... | 
| Annoy | Annoy (Approximate Nearest Neighbors Oh Yeah) 是一个带有 P... 的 C++ 库。 | 
| Apache Doris | Apache Doris 是一个用于实时分析的现代数据仓库。 | 
| ApertureDB | ApertureDB 是一个存储、索引和管理多模态数据的数据库。 | 
| Astra DB 向量存储 | 本页提供了使用 Astra DB 作为向量数据库的快速入门指南。 | 
| Atlas | Atlas 是 Nomic 开发的一个平台,用于处理小型和... | 
| AwaDB | AwaDB 是一个用于嵌入式搜索和存储的 AI 原生数据库。 | 
| Azure Cosmos DB Mongo vCore | 本笔记本展示了如何利用这个集成向量数据库。 | 
| Azure Cosmos DB No SQL | 本笔记本展示了如何利用这个集成向量数据库。 | 
| Azure AI 搜索 | Azure AI Search(前身为 Azure Search 和 Azure Cognitive S...) | 
| Bagel | Bagel(AI 开放推理平台)就像 AI 数据的 GitHub。 | 
| BagelDB | BagelDB(AI 开放向量数据库)就像 AI 数据的 GitHub。 | 
| 百度云 ElasticSearch 向量搜索 | 百度云向量搜索是一个完全托管的企业级分布式... | 
| 百度 VectorDB | 百度向量数据库是一个健壮的企业级分布式数据库服务。 | 
| Apache Cassandra | 本页提供了使用 Apache Cassandra® 作为向量数据库的快速入门指南。 | 
| Chroma | 本笔记本介绍了如何开始使用 Chroma 向量数据库。 | 
| Clarifai | Clarifai 是一个提供完整 AI 生命周期范围的 AI 平台。 | 
| ClickHouse | ClickHouse 是最快、资源效率最高的开源数据库。 | 
| CloudflareVectorize | 本笔记本介绍了如何开始使用 CloudflareVectorize ... | 
| Couchbase | Couchbase 是一个屡获殊荣的分布式 NoSQL 云数据库,它... | 
| DashVector | DashVector 是一个完全托管的向量数据库服务,支持高维... | 
| Databricks | Databricks Vector Search 是一个无服务器相似性搜索引擎,它... | 
| IBM Db2 向量存储和向量搜索 | LangChain 的 Db2 集成(langchain-db2)提供了向量数据库和... | 
| DingoDB | DingoDB 是一个分布式多模态向量数据库,它结合了... | 
| DocArray HnswSearch | DocArrayHnswSearch 是一个轻量级的文档索引实现,提供... | 
| DocArray InMemorySearch | DocArrayInMemorySearch 是 Docarray 提供的一个文档索引,它... | 
| 亚马逊 Document DB | Amazon DocumentDB (与 MongoDB 兼容) 使设置...变得容易。 | 
| DuckDB | 本笔记本展示了如何将 DuckDB 用作向量数据库。 | 
| 中国移动 ECloud ElasticSearch 向量搜索 | 中国移动 ECloud VectorSearch 是一个完全托管的企业级... | 
| Elasticsearch | Elasticsearch 是一个分布式、RESTful 的搜索和分析引擎,... | 
| Epsilla | Epsilla 是一个利用先进技术...的开源向量数据库。 | 
| Faiss | Facebook AI Similarity Search (FAISS) 是一个用于高效相似性...的库。 | 
| Faiss (异步) | Facebook AI Similarity Search (Faiss) 是一个用于高效相似性...的库。 | 
| FalkorDBVectorStore | FalkorDB 是一个集成了对...支持的开源图数据库。 | 
| Gel | LangChain 向量数据库抽象的一种实现,使用 gel 作为... | 
| 谷歌 AlloyDB for PostgreSQL | AlloyDB 是一个提供高...的完全托管的关系型数据库服务。 | 
| 谷歌 BigQuery 向量搜索 | Google Cloud BigQuery Vector Search 允许您使用 GoogleSQL 进行语义... | 
| 谷歌云 SQL for MySQL | Cloud SQL 是一个提供...的完全托管的关系型数据库服务。 | 
| 谷歌云 SQL for PostgreSQL | Cloud SQL 是一个提供...的完全托管的关系型数据库服务。 | 
| Firestore | Firestore 是一个无服务器的面向文档的数据库,可扩展到... | 
| 谷歌 Memorystore for Redis | Google Memorystore for Redis 是一个由...支持的完全托管服务。 | 
| 谷歌 Spanner | Spanner 是一个高度可扩展的数据库,结合了无限的可扩展性... | 
| 谷歌 Vertex AI 特征存储 | Google Cloud Vertex Feature Store 简化了您的机器学习特征管理... | 
| 谷歌 Vertex AI 向量搜索 | 本笔记本展示了如何使用与 Google Cloud ...相关的功能。 | 
| Hippo | Transwarp Hippo 是一个企业级云原生分布式向量... | 
| Hologres | Hologres 是由...开发的统一实时数据仓库服务。 | 
| Infinispan | Infinispan 是一个开源键值数据网格,可以作为单个...运行。 | 
| Jaguar 向量数据库 | 1. 这是一个分布式向量数据库 | 
| KDB.AI | KDB.AI 是一个强大的基于知识的向量数据库和搜索引擎。 | 
| Kinetica | Kinetica 是一个集成了对向量相似性...支持的数据库。 | 
| LanceDB | LanceDB 是一个为向量搜索构建的开源数据库,具有持久性。 | 
| Lantern | Lantern 是一个用于 Postgres 的开源向量相似性搜索。 | 
| Lindorm | 本笔记本介绍了如何开始使用 Lindorm 向量数据库。 | 
| LLMRails | LLMRails 是一个用于构建 GenAI 应用程序的 API 平台。它提供... | 
| ManticoreSearch VectorStore | ManticoreSearch 是一个开源搜索引擎,提供快速、可扩展的... | 
| MariaDB | LangChain 的 MariaDB 集成(langchain-mariadb)提供了向量连接... | 
| Marqo | 本笔记本展示了如何使用与 Marqo 向量...相关的功能。 | 
| Meilisearch | Meilisearch 是一个开源、闪电般快速且高度相关的搜索... | 
| 亚马逊 MemoryDB | 向量搜索介绍和 LangChain 集成指南。 | 
| Milvus | Milvus 是一个存储、索引和管理大量嵌入的数据库。 | 
| Momento 向量索引 (MVI) | MVI:最高效、易用、无服务器的向量索引,用于... | 
| MongoDB Atlas | 本笔记本介绍了如何在 LangChain 中使用 MongoDB Atlas 向量搜索。 | 
| MyScale | MyScale 是一个针对 AI 应用和...优化的云数据库。 | 
| Neo4j 向量索引 | Neo4j 是一个集成了对向量...支持的开源图数据库。 | 
| NucliaDB | 您可以使用本地 NucliaDB 实例或使用 Nuclia Cloud。 | 
| Oceanbase | 本笔记本介绍了如何开始使用 Oceanbase 向量数据库。 | 
| openGauss | 本笔记本介绍了如何开始使用 openGauss VectorStore... | 
| OpenSearch | OpenSearch 是一个可扩展、灵活、可扩展的开源软件... | 
| Oracle AI 向量搜索:向量存储 | Oracle AI Vector Search 专为人工智能(AI)设计... | 
| Pathway | Pathway 是一个开放数据处理框架。它允许您轻松地... | 
| Postgres 嵌入 | Postgres Embedding 是一个用于 Pos... 的开源向量相似性搜索。 | 
| PGVecto.rs | 本笔记本展示了如何使用与 Postgres ...相关的功能。 | 
| PGVector | LangChain 向量数据库抽象的一种实现,使用 postgres... | 
| Pinecone | Pinecone 是一个功能广泛的向量数据库。 | 
| Pinecone (稀疏) | Pinecone 是一个功能广泛的向量数据库。 | 
| Qdrant | Qdrant(读作:quadrant)是一个向量相似性搜索引擎。它提供... | 
| Redis | 本笔记本介绍了如何开始使用 Redis 向量数据库。 | 
| Relyt | Relyt 是一个旨在...的云原生数据仓库服务。 | 
| Rockset | Rockset 是一个为云构建的实时搜索和分析数据库。 | 
| SAP HANA Cloud 向量引擎 | SAP HANA Cloud Vector Engine 是一个完全集成到...的向量数据库。 | 
| ScaNN | ScaNN (Scalable Nearest Neighbors) 是一种高效向量搜索的方法。 | 
| SemaDB | SemaDB from SemaFind 是一个用于构建...的简单向量相似性数据库。 | 
| SingleStore | SingleStore 是一个健壮、高性能的分布式 SQL 数据库解决方案。 | 
| scikit-learn | scikit-learn 是一个开源的机器学习算法集合。 | 
| SQLiteVec | 本笔记本介绍了如何开始使用 SQLiteVec 向量数据库。 | 
| SQLite-VSS | SQLite-VSS 是一个专为向量搜索设计的 SQLite 扩展,强调... | 
| SQLServer | Azure SQL 提供专用的向量数据类型,简化了... | 
| StarRocks | StarRocks 是一个高性能分析型数据库。 | 
| Supabase (Postgres) | Supabase 是一个开源的 Firebase 替代品。Supabase 建立在... | 
| SurrealDBVectorStore | SurrealDB 是一个为 AI 系统专门构建的统一多模型数据库。 | 
| Tablestore | Tablestore 是一个完全托管的 NoSQL 云数据库服务。 | 
| Tair | Tair 是由阿里巴巴开发的云原生内存数据库服务。 | 
| 腾讯云 VectorDB | 腾讯云向量数据库是一个完全托管、自主研发的企业级... | 
| ThirdAI NeuralDB | NeuralDB 是由...开发的 CPU 友好且可微调的向量数据库。 | 
| TiDB Vector | TiDB Cloud 是一个全面的数据库即服务(DBaaS)解决方案... | 
| Tigris | Tigris 是一个开源无服务器 NoSQL 数据库和搜索平台。 | 
| TileDB | TileDB 是一个用于索引和查询密集和稀疏...的强大引擎。 | 
| Timescale Vector (Postgres) | Timescale Vector 是用于 AI 应用的 PostgreSQL++ 向量数据库。 | 
| Typesense | Typesense 是一个开源的内存搜索引擎,您可以... | 
| Upstash Vector | Upstash Vector 是一个设计用于处理...的无服务器向量数据库。 | 
| USearch | USearch 是一个更小更快、单文件向量搜索引擎 | 
| Vald | Vald 是一个高度可扩展的分布式快速近似最近邻... | 
| VDMS | 本笔记本介绍了如何开始使用 VDMS 作为向量数据库。 | 
| Vearch | Vearch 是用于深度学习和 AI 的向量搜索基础设施。 | 
| Vectara | Vectara 是一个值得信赖的 AI 助手和代理平台,专注于... | 
| Vespa | Vespa 是一个功能齐全的搜索引擎和向量数据库。它支持... | 
| viking DB | viking DB 是一个存储、索引和管理大量嵌入的数据库。 | 
| vlite | VLite 是一个简单且极快的向量数据库,允许您... | 
| Weaviate | 本笔记本介绍了如何开始使用 Weaviate 向量数据库。 | 
| Xata | Xata 是一个基于 PostgreSQL 的无服务器数据平台。它提供... | 
| YDB | YDB 是一个多功能的开源分布式 SQL 数据库,结合了... | 
| Yellowbrick | Yellowbrick 是一个弹性、大规模并行处理(MPP)SQL 数据... | 
| Zep | 回忆、理解并从聊天记录中提取数据。支持个性化... | 
| Zep 云 | 回忆、理解并从聊天记录中提取数据。支持个性化... | 
| Zilliz | Zilliz Cloud 是一个基于云的完全托管服务,用于 LF AI Milvus®, |