LlamaEdge

LlamaEdge 是在本地或边缘运行定制和微调大型语言模型 (LLM) 最简单快捷的方式。

轻量级推理应用程序。LlamaEdge 的大小以 MB 计，而非 GB

原生和 GPU 加速性能

支持多种 GPU 和硬件加速器

支持多种优化推理库

广泛的 AI / LLM 模型选择

安装与设置

from langchain_community.chat_models.llama_edge import LlamaEdgeChatService

这些文档随着 LangChain v1.0 在 2025 年 10 月的发布而弃用，并且不再维护。请访问 v1.0 文档