跳到主要内容

MyScale

本页介绍了如何在LangChain中使用MyScale向量数据库。它分为两部分:安装和设置,然后是特定MyScale包装器的引用。

使用MyScale,您可以管理结构化和非结构化(向量化)数据,并使用SQL对两种类型的数据执行联合查询和分析。此外,MyScale基于ClickHouse构建的云原生OLAP架构即使在海量数据集上也能实现闪电般的数据处理。

简介

MyScale和高性能向量搜索概述

您现在可以在我们的SaaS上注册并立即启动集群!

如果您还对我们如何管理集成SQL和向量感兴趣,请参阅此文档以获取进一步的语法参考。

我们还在huggingface上提供现场演示!请查看我们的huggingface空间!它们可以在眨眼之间搜索数百万个向量!

安装和设置

  • 使用pip install clickhouse-connect安装Python SDK

设置环境

有两种方法可以设置myscale索引的参数。

  1. 环境变量

    在运行应用程序之前,请使用export设置环境变量:export MYSCALE_HOST='<您的端点url>' MYSCALE_PORT=<您的端点端口> MYSCALE_USERNAME=<您的用户名> MYSCALE_PASSWORD=<您的密码> ...

    您可以在我们的SaaS上轻松找到您的帐户、密码和其他信息。有关详细信息,请参阅此文档 MyScaleSettings下的每个属性都可以使用前缀MYSCALE_设置,并且不区分大小写。

  2. 使用参数创建MyScaleSettings对象

    from langchain_community.vectorstores import MyScale, MyScaleSettings
    config = MyScaleSettings(host="<your-backend-url>", port=8443, ...)
    index = MyScale(embedding_function, config)
    index.add_documents(...)

包装器

支持的功能

  • add_texts
  • add_documents
  • from_texts
  • from_documents
  • similarity_search
  • asimilarity_search
  • similarity_search_by_vector
  • asimilarity_search_by_vector
  • similarity_search_with_relevance_scores
  • delete

向量存储

存在一个围绕MyScale数据库的包装器,允许您将其用作向量存储,无论是用于语义搜索还是相似示例检索。

导入此向量存储

from langchain_community.vectorstores import MyScale
API 参考:MyScale

有关MyScale包装器的更详细的演练,请参阅此notebook


此页面有帮助吗?