向量存储
选择嵌入模型
选择 嵌入模型
pip install -qU langchain-openai
import getpass
import os
if not os.environ.get("OPENAI_API_KEY"):
os.environ["OPENAI_API_KEY"] = getpass.getpass("Enter API key for OpenAI: ")
from langchain_openai import OpenAIEmbeddings
embeddings = OpenAIEmbeddings(model="text-embedding-3-large")
选择向量存储
选择 向量存储
pip install -qU langchain-core
from langchain_core.vectorstores import InMemoryVectorStore
vector_store = InMemoryVectorStore(embeddings)
向量存储 | 按 ID 删除 | 筛选 | 按向量搜索 | 带评分搜索 | 异步 | 通过标准测试 | 多租户 | 在添加文档中包含 ID |
---|---|---|---|---|---|---|---|---|
AstraDBVectorStore | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
Chroma | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
Clickhouse | ✅ | ✅ | ❌ | ✅ | ❌ | ❌ | ❌ | ❌ |
CouchbaseVectorStore | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ | ❌ |
DatabricksVectorSearch | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
ElasticsearchStore | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
FAISS | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
InMemoryVectorStore | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ | ❌ |
Milvus | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ | ❌ |
MongoDBAtlasVectorSearch | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
PGVector | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
PineconeVectorStore | ✅ | ✅ | ✅ | ❌ | ✅ | ❌ | ❌ | ❌ |
QdrantVectorStore | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
Redis | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
Weaviate | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ❌ |
SQLServer | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ | ❌ |
所有向量存储
名称 | 描述 |
---|---|
Activeloop Deep Lake | Activeloop Deep Lake 作为一个多模态向量存储,用于存储嵌入... |
Aerospike | Aerospike 向量搜索 (AVS) 是一个 |
阿里云 OpenSearch | 阿里云 Opensearch 是一个一站式平台,用于开发智能... |
AnalyticDB | AnalyticDB for PostgreSQL 是一个大规模并行处理 (MPP) 数... |
Annoy | Annoy (Approximate Nearest Neighbors Oh Yeah) 是一个 C++ 库,具有 P... |
Apache Doris | Apache Doris 是一个用于实时分析的现代数据仓库。 |
ApertureDB | ApertureDB 是一个数据库,用于存储、索引和管理多模态... |
Astra DB 向量存储 | 此页面提供使用 Astra DB 作为向量存储的快速入门指南。 |
Atlas | Atlas 是 Nomic 的一个平台,用于与小型和大型数据集进行交互... |
AwaDB | AwaDB 是一个 AI 原生数据库,用于搜索和存储嵌入... |
Azure Cosmos DB Mongo vCore | 此笔记本展示了如何利用这个集成的向量数据库... |
Azure Cosmos DB No SQL | 此笔记本展示了如何利用这个集成的向量数据库... |
Azure AI 搜索 | Azure AI 搜索 (以前称为 Azure Search 和 Azure Cognitive S... |
Bagel | Bagel (用于 AI 的开放推理平台),就像 AI 数据的 GitHub。 |
BagelDB | BagelDB (用于 AI 的开放向量数据库),就像 AI 数据的 GitHub。 |
百度云 ElasticSearch VectorSearch | 百度云 VectorSearch 是一个完全托管的企业级分布式... |
百度 VectorDB | 百度 VectorDB 是一个强大、企业级的分布式数据库服务... |
Apache Cassandra | 此页面提供使用 Apache Cassandra® 作为向量的快速入门指南... |
Chroma | 此笔记本涵盖了如何开始使用 Chroma 向量存储。 |
Clarifai | Clarifai 是一个 AI 平台,提供从头到尾的 AI 生命周期... |
ClickHouse | ClickHouse 是最快且资源效率最高的开源数据... |
Couchbase | Couchbase 是一个屡获殊荣的分布式 NoSQL 云数据库,它... |
DashVector | DashVector 是一种完全托管的 vectorDB 服务,支持高维... |
Databricks | Databricks Vector Search 是一个无服务器相似性搜索引擎,它... |
DingoDB | DingoDB 是一个分布式多模式向量数据库,它结合了... |
DocArray HnswSearch | DocArrayHnswSearch 是一个轻量级文档索引实现,提供... |
DocArray InMemorySearch | DocArrayInMemorySearch 是 Docarray 提供的文档索引,它... |
Amazon Document DB | Amazon DocumentDB (与 MongoDB 兼容) 使您可以轻松设置 u... |
DuckDB | 此笔记本展示了如何使用 DuckDB 作为向量存储。 |
中国移动云 ElasticSearch VectorSearch | 中国移动云 VectorSearch 是一个完全托管的企业级... |
Elasticsearch | Elasticsearch 是一个分布式、RESTful 的搜索和分析引擎,... |
Epsilla | Epsilla 是一个开源向量数据库,它利用了先进的... |
Faiss | Facebook AI Similarity Search (FAISS) 是一个用于高效相似性... |
Faiss (异步) | Facebook AI Similarity Search (Faiss) 是一个用于高效相似性... |
FalkorDBVectorStore | FalkorDB 是一个开源图数据库,集成了对... |
Google AlloyDB for PostgreSQL | AlloyDB 是一种完全托管的关系数据库服务,提供高... |
Google BigQuery 向量搜索 | Google Cloud BigQuery Vector Search 让您可以使用 GoogleSQL 进行语义... |
Google Cloud SQL for MySQL | Cloud SQL 是一种完全托管的关系数据库服务,它提供... |
Google Cloud SQL for PostgreSQL | Cloud SQL 是一种完全托管的关系数据库服务,它提供... |
Firestore | Firestore 是一个无服务器面向文档的数据库,可扩展到 m... |
Google Memorystore for Redis | Google Memorystore for Redis 是一项完全托管的服务,它功能强大... |
Google Spanner | Spanner 是一个高度可扩展的数据库,它结合了无限的可扩展性... |
Google Vertex AI Feature Store | Google Cloud Vertex Feature Store 简化了您的 ML 特征管理... |
Google Vertex AI Vector Search | 此笔记本展示了如何使用与 Google Cl 相关的功能... |
Hippo | Transwarp Hippo 是一个企业级云原生分布式向量... |
Hologres | Hologres 是阿里云自研的统一实时数据仓库服务。 |
Infinispan | Infinispan 是一个开源键值数据网格,它可以作为单... |
Jaguar 向量数据库 | 1. 这是一个分布式向量数据库 |
KDB.AI | KDB.AI 是一个强大的基于知识的向量数据库和搜索引擎... |
Kinetica | Kinetica 是一个数据库,集成了对向量相似性搜索的支持... |
LanceDB | LanceDB 是一个开源数据库,用于向量搜索,构建于持久性... |
Lantern | Lantern 是一个用于 Postgres 的开源向量相似性搜索 |
Lindorm | 此笔记本涵盖了如何开始使用 Lindorm 向量存储。 |
LLMRails | LLMRails 是一个用于构建 GenAI 应用程序的 API 平台。它提供... |
ManticoreSearch VectorStore | ManticoreSearch 是一个开源搜索引擎,提供快速、可扩展... |
Marqo | 此笔记本展示了如何使用与 Marqo 向量相关的功能... |
Meilisearch | Meilisearch 是一个开源、闪电般快速且高度相关的搜索... |
Amazon MemoryDB | 向量搜索介绍和 langchain 集成指南。 |
Milvus | Milvus 是一个数据库,用于存储、索引和管理海量嵌入... |
Momento Vector Index (MVI) | MVI:最高效、最易于使用、无服务器的向量索引,用于... |
MongoDB Atlas | 此笔记本涵盖了如何在 LangChain 中使用 MongoDB Atlas 向量搜索,... |
MyScale | MyScale 是一个针对 AI 应用程序和 s 优化的云数据库... |
Neo4j 向量索引 | Neo4j 是一个开源图数据库,集成了对 ve 的支持... |
NucliaDB | 您可以使用本地 NucliaDB 实例或使用 Nuclia Cloud。 |
Oceanbase | 此笔记本涵盖了如何开始使用 Oceanbase 向量存储... |
OpenSearch | OpenSearch 是一个可扩展、灵活且可扩展的开源软件... |
Oracle AI Vector Search:向量存储 | Oracle AI Vector Search 专为人工智能 (AI) 设计... |
Pathway | Pathway 是一个开放数据处理框架。它允许您轻松地... |
Postgres Embedding | Postgres Embedding 是一个用于 Pos 的开源向量相似性搜索... |
PGVecto.rs | 此笔记本展示了如何使用与 Postgres 相关的功能... |
PGVector | 使用 postgres 实现 LangChain 向量存储抽象... |
Pinecone | Pinecone 是一个功能广泛的向量数据库。 |
Qdrant | Qdrant (读作 quadrant) 是一个向量相似性搜索引擎。它提供... |
Redis | 此笔记本涵盖了如何开始使用 Redis 向量存储。 |
Relyt | Relyt 是一种云原生数据仓库服务,旨在... |
Rockset | Rockset 是一个为 cl 构建的实时搜索和分析数据库... |
SAP HANA Cloud Vector Engine | SAP HANA Cloud Vector Engine 是一个完全集成到 ... 的向量存储 |
ScaNN | ScaNN (Scalable Nearest Neighbors) 是一种高效向量 s 的方法... |
SemaDB | 来自 SemaFind 的 SemaDB 是一个简单的向量相似性数据库,用于构建... |
SingleStoreDB | SingleStoreDB 是一个强大、高性能的分布式 SQL 数据库 ... |
scikit-learn | scikit-learn 是一个开源机器学习算法集合... |
SQLiteVec | 此笔记本涵盖了如何开始使用 SQLiteVec 向量存储... |
SQLite-VSS | SQLite-VSS 是一个专为向量搜索设计的 SQLite 扩展,强调... |
SQLServer | Azure SQL 提供了一个专用的向量数据类型,简化了 c... |
StarRocks | StarRocks 是一个高性能分析数据库。 |
Supabase (Postgres) | Supabase 是一个开源 Firebase 替代方案。Supabase 构建于... |
SurrealDB | SurrealDB 是一个端到端云原生数据库,专为现代 ... 设计 |
Tablestore | Tablestore 是一种完全托管的 NoSQL 云数据库服务。 |
Tair | Tair 是阿里云自研的云原生内存数据库服务。 |
腾讯云 VectorDB | 腾讯云 VectorDB 是一种完全托管、自主研发的企业级... |
ThirdAI NeuralDB | NeuralDB 是 ThirdAI 开发的 CPU 友好且可微调的向量存储... |
TiDB Vector | TiDB Cloud 是一种全面的数据库即服务 (DBaaS) 解决方案... |
Tigris | Tigris 是一个开源无服务器 NoSQL 数据库和搜索平台... |
TileDB | TileDB 是一个强大的引擎,用于索引和查询密集和稀疏 ... |
Timescale Vector (Postgres) | Timescale Vector 是用于 AI 应用程序的 PostgreSQL++ 向量数据库。 |
Typesense | Typesense 是一个开源的内存搜索引擎,您可以... |
Upstash Vector | Upstash Vector 是一个无服务器向量数据库,专为处理 ... 而设计 |
USearch | USearch 是一个更小更快的单文件向量搜索引擎 |
Vald | Vald 是一个高度可扩展的分布式快速近似最近邻 ... |
VDMS | 此笔记本涵盖了如何开始使用 VDMS 作为向量存储。 |
Vearch | Vearch 是用于深度学习和 A 的向量搜索基础设施... |
Vectara | Vectara 是值得信赖的 AI 助手和代理平台,专注于 ... |
Vespa | Vespa 是一个功能齐全的搜索引擎和向量数据库。它支持... |
viking DB | viking DB 是一个数据库,用于存储、索引和管理海量嵌入... |
vlite | VLite 是一个简单且极速的向量数据库,允许您... |
Weaviate | 此笔记本涵盖了如何开始使用 Weaviate 向量存储... |
Xata | Xata 是一个基于 PostgreSQL 的无服务器数据平台。它提供 ... |
Yellowbrick | Yellowbrick 是一个弹性的、大规模并行处理 (MPP) SQL 数... |
Zep | 从聊天记录中回忆、理解和提取数据。强大的个人... |
Zep Cloud | 从聊天记录中回忆、理解和提取数据。强大的个人... |
Zilliz | Zilliz Cloud 是云上针对 LF AI Milvus® 的完全托管服务 |