跳至主要内容

Epsilla

Epsilla 是一个开源向量数据库,它利用先进的并行图遍历技术进行向量索引。 Epsilla 采用 GPL-3.0 许可。

您需要使用 pip install -qU langchain-community 安装 langchain-community 才能使用此集成

此笔记本展示了如何使用与 Epsilla 向量数据库相关的功能。

作为先决条件,您需要拥有一个正在运行的 Epsilla 向量数据库(例如,通过我们的 docker 镜像),并安装 pyepsilla 包。 在 docs 中查看完整文档。

!pip/pip3 install pyepsilla

我们想使用 OpenAIEmbeddings,因此我们必须获取 OpenAI API 密钥。

import getpass
import os

if "OPENAI_API_KEY" not in os.environ:
os.environ["OPENAI_API_KEY"] = getpass.getpass("OpenAI API Key:")

OpenAI API 密钥:·······

from langchain_community.vectorstores import Epsilla
from langchain_openai import OpenAIEmbeddings
API 参考:Epsilla | OpenAIEmbeddings
from langchain_community.document_loaders import TextLoader
from langchain_text_splitters import CharacterTextSplitter

loader = TextLoader("../../how_to/state_of_the_union.txt")
documents = loader.load()

documents = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0).split_documents(
documents
)

embeddings = OpenAIEmbeddings()

Epsilla 向量数据库正在使用默认主机“localhost”和端口“8888”运行。 我们有一个自定义数据库路径、数据库名称和集合名称,而不是默认名称。

from pyepsilla import vectordb

client = vectordb.Client()
vector_store = Epsilla.from_documents(
documents,
embeddings,
client,
db_path="/tmp/mypath",
db_name="MyDB",
collection_name="MyCollection",
)
query = "What did the president say about Ketanji Brown Jackson"
docs = vector_store.similarity_search(query)
print(docs[0].page_content)

在美国各州,新的法律不断出台,不仅是为了压制投票,更是为了颠覆整个选举。

我们不能让这种情况发生。

今晚,我呼吁参议院:通过《投票自由法案》。通过《约翰·刘易斯投票权法案》。趁着你们在做这些事情的时候,也请通过《披露法案》,以便美国人民能够知道是谁在资助我们的选举。

今晚,我想向一位将毕生奉献给服务这个国家的人致敬:斯蒂芬·布雷耶大法官——一位退役军人、宪法学者和美国最高法院退休大法官。布雷耶大法官,感谢您的服务。

总统最严重的宪法责任之一就是提名人员担任美国最高法院大法官。

四天前,我做到了这一点,我提名了上诉法院法官凯坦吉·布朗·杰克逊。她是我们国家最优秀的法律人才之一,将继续布雷耶大法官的卓越遗产。


此页面对您有帮助吗?


您也可以留下详细的反馈 在 GitHub 上.