LASER 语言无关句子表示嵌入(由 Meta AI 提供)
LASER 是 Meta AI 研究团队开发的一个 Python 库,截至 2024 年 2 月 25 日,用于为 147 种以上语言创建多语言句子嵌入。
依赖项
要将 LaserEmbed 与 LangChain 一起使用,请安装 laser_encoders
Python 包。
%pip install laser_encoders
导入
from langchain_community.embeddings.laser import LaserEmbeddings
API 参考:LaserEmbeddings
实例化 Laser
参数
lang: 可选[str]
.>If empty will default
to using a multilingual LASER encoder model (called "laser2").
You can find the list of supported languages and lang_codes [here](https://github.com/facebookresearch/flores/blob/main/flores200/README.md#languages-in-flores-200)
and [here](https://github.com/facebookresearch/LASER/blob/main/laser_encoders/language_list.py)
# Ex Instantiationz
embeddings = LaserEmbeddings(lang="eng_Latn")
用法
生成文档嵌入
document_embeddings = embeddings.embed_documents(
["This is a sentence", "This is some other sentence"]
)
生成查询嵌入
query_embeddings = embeddings.embed_query("This is a query")