向量存储
选择嵌入模型
选择 嵌入模型
pip install -qU langchain-openai
import getpass
import os
if not os.environ.get("OPENAI_API_KEY"):
os.environ["OPENAI_API_KEY"] = getpass.getpass("Enter API key for OpenAI: ")
from langchain_openai import OpenAIEmbeddings
embeddings = OpenAIEmbeddings(model="text-embedding-3-large")
选择向量数据库
选择 向量存储
pip install -qU langchain-core
from langchain_core.vectorstores import InMemoryVectorStore
vector_store = InMemoryVectorStore(embeddings)
向量数据库 | 按 ID 删除 | 过滤 | 按向量搜索 | 带分数搜索 | 异步 | 通过标准测试 | 多租户 | 添加文档中的 ID |
---|---|---|---|---|---|---|---|---|
AstraDBVectorStore | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
Chroma | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
Clickhouse | ✅ | ✅ | ❌ | ✅ | ❌ | ❌ | ❌ | ❌ |
CouchbaseSearchVectorStore | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ |
DatabricksVectorSearch | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
ElasticsearchStore | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
FAISS | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
InMemoryVectorStore | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ | ❌ |
Milvus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
MongoDBAtlasVectorSearch | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
openGauss | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ❌ | ✅ |
PGVector | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
PineconeVectorStore | ✅ | ✅ | ✅ | ❌ | ✅ | ❌ | ❌ | ❌ |
QdrantVectorStore | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ |
Redis | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
Weaviate | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ❌ |
SQLServer | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ | ❌ |
所有向量数据库
名称 | 描述 |
---|---|
Activeloop Deep Lake | Activeloop Deep Lake 作为多模态向量数据库,存储嵌入数据... |
Aerospike | Aerospike Vector Search (AVS) 是一个 |
阿里云 OpenSearch | 阿里云开放搜索是一个一站式平台,用于开发智能... |
AnalyticDB | AnalyticDB for PostgreSQL 是一个大规模并行处理(MPP)数据... |
Annoy | Annoy (Approximate Nearest Neighbors Oh Yeah) 是一个带有 P... 的 C++ 库。 |
Apache Doris | Apache Doris 是一个用于实时分析的现代数据仓库。 |
ApertureDB | ApertureDB 是一个存储、索引和管理多模态数据的数据库。 |
Astra DB 向量存储 | 本页提供了使用 Astra DB 作为向量数据库的快速入门指南。 |
Atlas | Atlas 是 Nomic 开发的一个平台,用于处理小型和... |
AwaDB | AwaDB 是一个用于嵌入式搜索和存储的 AI 原生数据库。 |
Azure Cosmos DB Mongo vCore | 本笔记本展示了如何利用这个集成向量数据库。 |
Azure Cosmos DB No SQL | 本笔记本展示了如何利用这个集成向量数据库。 |
Azure AI 搜索 | Azure AI Search(前身为 Azure Search 和 Azure Cognitive S...) |
Bagel | Bagel(AI 开放推理平台)就像 AI 数据的 GitHub。 |
BagelDB | BagelDB(AI 开放向量数据库)就像 AI 数据的 GitHub。 |
百度云 ElasticSearch 向量搜索 | 百度云向量搜索是一个完全托管的企业级分布式... |
百度 VectorDB | 百度向量数据库是一个健壮的企业级分布式数据库服务。 |
Apache Cassandra | 本页提供了使用 Apache Cassandra® 作为向量数据库的快速入门指南。 |
Chroma | 本笔记本介绍了如何开始使用 Chroma 向量数据库。 |
Clarifai | Clarifai 是一个提供完整 AI 生命周期范围的 AI 平台。 |
ClickHouse | ClickHouse 是最快、资源效率最高的开源数据库。 |
CloudflareVectorize | 本笔记本介绍了如何开始使用 CloudflareVectorize ... |
Couchbase | Couchbase 是一个屡获殊荣的分布式 NoSQL 云数据库,它... |
DashVector | DashVector 是一个完全托管的向量数据库服务,支持高维... |
Databricks | Databricks Vector Search 是一个无服务器相似性搜索引擎,它... |
IBM Db2 向量存储和向量搜索 | LangChain 的 Db2 集成(langchain-db2)提供了向量数据库和... |
DingoDB | DingoDB 是一个分布式多模态向量数据库,它结合了... |
DocArray HnswSearch | DocArrayHnswSearch 是一个轻量级的文档索引实现,提供... |
DocArray InMemorySearch | DocArrayInMemorySearch 是 Docarray 提供的一个文档索引,它... |
亚马逊 Document DB | Amazon DocumentDB (与 MongoDB 兼容) 使设置...变得容易。 |
DuckDB | 本笔记本展示了如何将 DuckDB 用作向量数据库。 |
中国移动 ECloud ElasticSearch 向量搜索 | 中国移动 ECloud VectorSearch 是一个完全托管的企业级... |
Elasticsearch | Elasticsearch 是一个分布式、RESTful 的搜索和分析引擎,... |
Epsilla | Epsilla 是一个利用先进技术...的开源向量数据库。 |
Faiss | Facebook AI Similarity Search (FAISS) 是一个用于高效相似性...的库。 |
Faiss (异步) | Facebook AI Similarity Search (Faiss) 是一个用于高效相似性...的库。 |
FalkorDBVectorStore | FalkorDB 是一个集成了对...支持的开源图数据库。 |
Gel | LangChain 向量数据库抽象的一种实现,使用 gel 作为... |
谷歌 AlloyDB for PostgreSQL | AlloyDB 是一个提供高...的完全托管的关系型数据库服务。 |
谷歌 BigQuery 向量搜索 | Google Cloud BigQuery Vector Search 允许您使用 GoogleSQL 进行语义... |
谷歌云 SQL for MySQL | Cloud SQL 是一个提供...的完全托管的关系型数据库服务。 |
谷歌云 SQL for PostgreSQL | Cloud SQL 是一个提供...的完全托管的关系型数据库服务。 |
Firestore | Firestore 是一个无服务器的面向文档的数据库,可扩展到... |
谷歌 Memorystore for Redis | Google Memorystore for Redis 是一个由...支持的完全托管服务。 |
谷歌 Spanner | Spanner 是一个高度可扩展的数据库,结合了无限的可扩展性... |
谷歌 Vertex AI 特征存储 | Google Cloud Vertex Feature Store 简化了您的机器学习特征管理... |
谷歌 Vertex AI 向量搜索 | 本笔记本展示了如何使用与 Google Cloud ...相关的功能。 |
Hippo | Transwarp Hippo 是一个企业级云原生分布式向量... |
Hologres | Hologres 是由...开发的统一实时数据仓库服务。 |
Infinispan | Infinispan 是一个开源键值数据网格,可以作为单个...运行。 |
Jaguar 向量数据库 | 1. 这是一个分布式向量数据库 |
KDB.AI | KDB.AI 是一个强大的基于知识的向量数据库和搜索引擎。 |
Kinetica | Kinetica 是一个集成了对向量相似性...支持的数据库。 |
LanceDB | LanceDB 是一个为向量搜索构建的开源数据库,具有持久性。 |
Lantern | Lantern 是一个用于 Postgres 的开源向量相似性搜索。 |
Lindorm | 本笔记本介绍了如何开始使用 Lindorm 向量数据库。 |
LLMRails | LLMRails 是一个用于构建 GenAI 应用程序的 API 平台。它提供... |
ManticoreSearch VectorStore | ManticoreSearch 是一个开源搜索引擎,提供快速、可扩展的... |
MariaDB | LangChain 的 MariaDB 集成(langchain-mariadb)提供了向量连接... |
Marqo | 本笔记本展示了如何使用与 Marqo 向量...相关的功能。 |
Meilisearch | Meilisearch 是一个开源、闪电般快速且高度相关的搜索... |
亚马逊 MemoryDB | 向量搜索介绍和 LangChain 集成指南。 |
Milvus | Milvus 是一个存储、索引和管理大量嵌入的数据库。 |
Momento 向量索引 (MVI) | MVI:最高效、易用、无服务器的向量索引,用于... |
MongoDB Atlas | 本笔记本介绍了如何在 LangChain 中使用 MongoDB Atlas 向量搜索。 |
MyScale | MyScale 是一个针对 AI 应用和...优化的云数据库。 |
Neo4j 向量索引 | Neo4j 是一个集成了对向量...支持的开源图数据库。 |
NucliaDB | 您可以使用本地 NucliaDB 实例或使用 Nuclia Cloud。 |
Oceanbase | 本笔记本介绍了如何开始使用 Oceanbase 向量数据库。 |
openGauss | 本笔记本介绍了如何开始使用 openGauss VectorStore... |
OpenSearch | OpenSearch 是一个可扩展、灵活、可扩展的开源软件... |
Oracle AI 向量搜索:向量存储 | Oracle AI Vector Search 专为人工智能(AI)设计... |
Pathway | Pathway 是一个开放数据处理框架。它允许您轻松地... |
Postgres 嵌入 | Postgres Embedding 是一个用于 Pos... 的开源向量相似性搜索。 |
PGVecto.rs | 本笔记本展示了如何使用与 Postgres ...相关的功能。 |
PGVector | LangChain 向量数据库抽象的一种实现,使用 postgres... |
Pinecone | Pinecone 是一个功能广泛的向量数据库。 |
Pinecone (稀疏) | Pinecone 是一个功能广泛的向量数据库。 |
Qdrant | Qdrant(读作:quadrant)是一个向量相似性搜索引擎。它提供... |
Redis | 本笔记本介绍了如何开始使用 Redis 向量数据库。 |
Relyt | Relyt 是一个旨在...的云原生数据仓库服务。 |
Rockset | Rockset 是一个为云构建的实时搜索和分析数据库。 |
SAP HANA Cloud 向量引擎 | SAP HANA Cloud Vector Engine 是一个完全集成到...的向量数据库。 |
ScaNN | ScaNN (Scalable Nearest Neighbors) 是一种高效向量搜索的方法。 |
SemaDB | SemaDB from SemaFind 是一个用于构建...的简单向量相似性数据库。 |
SingleStore | SingleStore 是一个健壮、高性能的分布式 SQL 数据库解决方案。 |
scikit-learn | scikit-learn 是一个开源的机器学习算法集合。 |
SQLiteVec | 本笔记本介绍了如何开始使用 SQLiteVec 向量数据库。 |
SQLite-VSS | SQLite-VSS 是一个专为向量搜索设计的 SQLite 扩展,强调... |
SQLServer | Azure SQL 提供专用的向量数据类型,简化了... |
StarRocks | StarRocks 是一个高性能分析型数据库。 |
Supabase (Postgres) | Supabase 是一个开源的 Firebase 替代品。Supabase 建立在... |
SurrealDBVectorStore | SurrealDB 是一个为 AI 系统专门构建的统一多模型数据库。 |
Tablestore | Tablestore 是一个完全托管的 NoSQL 云数据库服务。 |
Tair | Tair 是由阿里巴巴开发的云原生内存数据库服务。 |
腾讯云 VectorDB | 腾讯云向量数据库是一个完全托管、自主研发的企业级... |
ThirdAI NeuralDB | NeuralDB 是由...开发的 CPU 友好且可微调的向量数据库。 |
TiDB Vector | TiDB Cloud 是一个全面的数据库即服务(DBaaS)解决方案... |
Tigris | Tigris 是一个开源无服务器 NoSQL 数据库和搜索平台。 |
TileDB | TileDB 是一个用于索引和查询密集和稀疏...的强大引擎。 |
Timescale Vector (Postgres) | Timescale Vector 是用于 AI 应用的 PostgreSQL++ 向量数据库。 |
Typesense | Typesense 是一个开源的内存搜索引擎,您可以... |
Upstash Vector | Upstash Vector 是一个设计用于处理...的无服务器向量数据库。 |
USearch | USearch 是一个更小更快、单文件向量搜索引擎 |
Vald | Vald 是一个高度可扩展的分布式快速近似最近邻... |
VDMS | 本笔记本介绍了如何开始使用 VDMS 作为向量数据库。 |
Vearch | Vearch 是用于深度学习和 AI 的向量搜索基础设施。 |
Vectara | Vectara 是一个值得信赖的 AI 助手和代理平台,专注于... |
Vespa | Vespa 是一个功能齐全的搜索引擎和向量数据库。它支持... |
viking DB | viking DB 是一个存储、索引和管理大量嵌入的数据库。 |
vlite | VLite 是一个简单且极快的向量数据库,允许您... |
Weaviate | 本笔记本介绍了如何开始使用 Weaviate 向量数据库。 |
Xata | Xata 是一个基于 PostgreSQL 的无服务器数据平台。它提供... |
YDB | YDB 是一个多功能的开源分布式 SQL 数据库,结合了... |
Yellowbrick | Yellowbrick 是一个弹性、大规模并行处理(MPP)SQL 数据... |
Zep | 回忆、理解并从聊天记录中提取数据。支持个性化... |
Zep 云 | 回忆、理解并从聊天记录中提取数据。支持个性化... |
Zilliz | Zilliz Cloud 是一个基于云的完全托管服务,用于 LF AI Milvus®, |