MyScale#
本页面介绍如何在LangChain中使用MyScale向量数据库。分为两部分:安装和设置,以及对特定MyScale包装器的引用。
使用MyScale,您可以管理结构化和非结构化(向量化)数据,并使用SQL对两种类型的数据进行联合查询和分析。此外,MyScale的云原生OLAP架构,建立在ClickHouse之上,即使在大规模数据集上也能实现闪电般快速的数据处理。
介绍#
MyScale和高性能向量搜索概述 (opens in a new tab)
您现在可以在我们的SaaS上注册并立即启动一个集群 (opens in a new tab)!
如果您也对我们如何整合SQL和向量感兴趣,请参考此文档 (opens in a new tab)获取更多语法参考。
我们还提供有关Huggingface的实时演示!请查看我们的huggingface空间 (opens in a new tab)!他们可以在眨眼之间搜索数百万个向量!
安装和设置#
- 使用
pip install clickhouse-connect
安装Python SDK。
设置环境变量#
有两种方法可以设置myscale索引的参数。
- 环境变量
在运行应用程序之前,请使用export
设置环境变量:
export MYSCALE_URL='<your-endpoints-url>' MYSCALE_PORT=<your-endpoints-port> MYSCALE_USERNAME=<your-username> MYSCALE_PASSWORD=<your-password> ...
您可以在我们的SaaS上轻松找到您的帐户、密码和其他信息。有关详细信息,请参见此文档 (opens in a new tab)
MyScaleSettings
下的每个属性都可以用前缀MYSCALE_
设置,并且不区分大小写。
2. 使用参数创建MyScaleSettings
对象
from langchain.vectorstores import MyScale, MyScaleSettings
config = MyScaleSetting(host="<your-backend-url>", port=8443, ...)
index = MyScale(embedding_function, config)
index.add_documents(...)
包装器#
支持的函数:
-
add_texts
-
add_documents
-
from_texts
-
from_documents
-
similarity_search
-
近似相似度搜索
-
向量相似度搜索
-
近似向量相似度搜索
-
带相关度分数的相似度搜索
向量存储#
有一个MyScale数据库的包装器,允许您将其用作向量存储,无论用于语义搜索还是类似的示例检索。
要导入此向量存储:
from langchain.vectorstores import MyScale
有关MyScale包装器的更详细演示,请参见此教程