百川文本嵌入
截至今天(2024年1月25日),百川文本嵌入 (BaichuanTextEmbeddings) 在 C-MTEB(中文多任务嵌入基准测试)排行榜上排名第一。
排行榜(在“总体”->“中文”部分下):https://hugging-face.cn/spaces/mteb/leaderboard
官方网站:https://platform.baichuan-ai.com/docs/text-Embedding
使用此嵌入模型需要 API 密钥。您可以在 https://platform.baichuan-ai.com/docs/text-Embedding 注册并获取密钥。
百川文本嵌入 (BaichuanTextEmbeddings) 支持 512 个令牌窗口,并生成 1024 维的向量。
请注意,百川文本嵌入 (BaichuanTextEmbeddings) 仅支持中文文本嵌入。多语言支持即将推出。
from langchain_community.embeddings import BaichuanTextEmbeddings
embeddings = BaichuanTextEmbeddings(baichuan_api_key="sk-*")
API 参考:BaichuanTextEmbeddings
或者,您可以通过以下方式设置 API 密钥
import os
os.environ["BAICHUAN_API_KEY"] = "YOUR_API_KEY"
text_1 = "今天天气不错"
text_2 = "今天阳光很好"
query_result = embeddings.embed_query(text_1)
query_result
doc_result = embeddings.embed_documents([text_1, text_2])
doc_result