跳到主要内容
Open on GitHub

微软

Microsoft Azure 和其他 微软 产品相关的所有功能。

聊天模型

微软通过 Azure 提供了访问聊天模型的三种主要选项

  1. Azure OpenAI - 通过 Microsoft Azure 的安全企业平台,提供对 OpenAI 强大模型(如 o3、4.1 和其他模型)的访问。
  2. Azure AI - 通过统一的 API,提供对来自不同提供商(包括 Anthropic、DeepSeek、Cohere、Phi 和 Mistral)的各种模型的访问。
  3. Azure ML - 允许使用 Azure Machine Learning 部署和管理您自己的自定义模型或经过微调的开源模型。

Azure OpenAI

Microsoft Azure(通常简称为 Azure)是由 Microsoft 运营的云计算平台,通过全球数据中心提供应用程序和服务的访问、管理和开发。它提供一系列功能,包括软件即服务 (SaaS)、平台即服务 (PaaS) 和基础设施即服务 (IaaS)。Microsoft Azure 支持多种编程语言、工具和框架,包括微软专有软件和第三方软件及系统。

Azure OpenAI 是一项 Azure 服务,它包含来自 OpenAI 的强大语言模型,包括 GPT-3CodexEmbeddings model 系列,用于内容生成、摘要、语义搜索以及自然语言到代码的翻译。

pip install langchain-openai

设置环境变量以访问 Azure OpenAI 服务。

import os

os.environ["AZURE_OPENAI_ENDPOINT"] = "https://<your-endpoint.openai.azure.com/"
os.environ["AZURE_OPENAI_API_KEY"] = "your AzureOpenAI key"

请参阅使用示例

from langchain_openai import AzureChatOpenAI
API 参考:AzureChatOpenAI

Azure AI

Azure AI Foundry 通过 AzureAIChatCompletionsModel 类,提供对来自各种提供商(包括 Azure OpenAI、DeepSeek R1、Cohere、Phi 和 Mistral)的广泛模型的访问。

pip install -U langchain-azure-ai

配置您的 API 密钥和端点。

export AZURE_INFERENCE_CREDENTIAL=your-api-key
export AZURE_INFERENCE_ENDPOINT=your-endpoint
from langchain_azure_ai.chat_models import AzureAIChatCompletionsModel

llm = AzureAIChatCompletionsModel(
model_name="gpt-4o",
api_version="2024-05-01-preview",
)

请参阅使用示例

Azure ML 聊天在线端点

有关访问 Azure Machine Learning 托管的聊天模型,请参阅此处的文档。

LLM

Azure ML

请参阅使用示例

from langchain_community.llms.azureml_endpoint import AzureMLOnlineEndpoint

Azure OpenAI

请参阅使用示例

from langchain_openai import AzureOpenAI
API 参考:AzureOpenAI

嵌入模型

微软通过 Azure 提供了访问嵌入模型的两种主要选项

Azure OpenAI

请参阅使用示例

from langchain_openai import AzureOpenAIEmbeddings

Azure AI

pip install -U langchain-azure-ai

配置您的 API 密钥和端点。

export AZURE_INFERENCE_CREDENTIAL=your-api-key
export AZURE_INFERENCE_ENDPOINT=your-endpoint
from langchain_azure_ai.embeddings import AzureAIEmbeddingsModel

embed_model = AzureAIEmbeddingsModel(
model_name="text-embedding-ada-002"
)

文档加载器

Azure AI Data

Azure AI Studio 提供将数据资产上传到云存储以及从以下来源注册现有数据资产的功能

  • 微软 OneLake
  • Azure Blob 存储
  • Azure Data Lake Gen 2

首先,您需要安装几个 Python 软件包。

pip install azureml-fsspec, azure-ai-generative

请参阅使用示例

from langchain.document_loaders import AzureAIDataLoader
API 参考:AzureAIDataLoader

Azure AI 文档智能

Azure AI 文档智能(以前称为 Azure 表单识别器)是一项基于机器学习的服务,可从数字或扫描的 PDF、图像、Office 和 HTML 文件中提取文本(包括手写)、表格、文档结构和键值对。

文档智能支持 PDFJPEG/JPGPNGBMPTIFFHEIFDOCXXLSXPPTXHTML

首先,您需要安装一个 Python 软件包。

pip install azure-ai-documentintelligence

请参阅使用示例

from langchain.document_loaders import AzureAIDocumentIntelligenceLoader

Azure Blob 存储

Azure Blob 存储是微软的云对象存储解决方案。Blob 存储经过优化,用于存储海量的非结构化数据。非结构化数据是指不遵循特定数据模型或定义的数据,例如文本或二进制数据。

Azure 文件提供了云中完全托管的文件共享,可通过行业标准的服务器消息块(SMB)协议、网络文件系统(NFS)协议和 Azure 文件 REST API 进行访问。Azure 文件基于 Azure Blob 存储

Azure Blob 存储旨在用于

  • 直接向浏览器提供图像或文档。
  • 存储文件以供分布式访问。
  • 流式传输视频和音频。
  • 写入日志文件。
  • 存储数据以进行备份和恢复、灾难恢复和归档。
  • 存储数据以供本地或 Azure 托管服务进行分析。
pip install azure-storage-blob

请参阅Azure Blob 存储的使用示例

from langchain_community.document_loaders import AzureBlobStorageContainerLoader

请参阅Azure 文件的使用示例

from langchain_community.document_loaders import AzureBlobStorageFileLoader

微软 OneDrive

Microsoft OneDrive(以前称为 SkyDrive)是微软运营的文件托管服务。

首先,您需要安装一个 Python 软件包。

pip install o365

请参阅使用示例

from langchain_community.document_loaders import OneDriveLoader
API 参考:OneDriveLoader

微软 OneDrive 文件

Microsoft OneDrive(以前称为 SkyDrive)是微软运营的文件托管服务。

首先,您需要安装一个 Python 软件包。

pip install o365
from langchain_community.document_loaders import OneDriveFileLoader
API 参考:OneDriveFileLoader

微软 Word

Microsoft Word 是由微软开发的一款文字处理器。

请参阅使用示例

from langchain_community.document_loaders import UnstructuredWordDocumentLoader

微软 Excel

Microsoft Excel 是由微软为 Windows、macOS、Android、iOS 和 iPadOS 开发的一款电子表格编辑器。它具有计算功能、图表工具、数据透视表以及名为 Visual Basic for Applications (VBA) 的宏编程语言。Excel 是 Microsoft 365 软件套件的一部分。

UnstructuredExcelLoader 用于加载 Microsoft Excel 文件。该加载器适用于 .xlsx.xls 文件。页面内容将是 Excel 文件的原始文本。如果您在 "elements" 模式下使用此加载器,则 Excel 文件的 HTML 表示将在文档元数据中的 text_as_html 键下可用。

请参阅使用示例

from langchain_community.document_loaders import UnstructuredExcelLoader

微软 SharePoint

Microsoft SharePoint 是由微软开发的一种基于网站的协作系统,它使用工作流应用程序、“列表”数据库以及其他 Web 部件和安全功能,以赋能业务团队协同工作。

请参阅使用示例

from langchain_community.document_loaders.sharepoint import SharePointLoader
API 参考:SharePointLoader

微软 PowerPoint

Microsoft PowerPoint 是微软开发的一款演示文稿程序。

请参阅使用示例

from langchain_community.document_loaders import UnstructuredPowerPointLoader

微软 OneNote

首先,我们来安装依赖项

pip install bs4 msal

请参阅使用示例

from langchain_community.document_loaders.onenote import OneNoteLoader
API 参考:OneNoteLoader

Playwright URL 加载器

Playwright 是由 Microsoft 开发的开源自动化工具,可让您以编程方式控制和自动化网络浏览器。它旨在用于跨各种网络浏览器(如 ChromiumFirefoxWebKit)的端到端测试、网页抓取和任务自动化。

首先,我们来安装依赖项

pip install playwright unstructured

请参阅使用示例

from langchain_community.document_loaders.onenote import OneNoteLoader
API 参考:OneNoteLoader

向量存储

Azure Cosmos DB

AI 代理可以依赖 Azure Cosmos DB 作为统一的内存系统解决方案,享受速度、规模和简便性。这项服务成功地使 OpenAI 的 ChatGPT 服务能够以高可靠性和低维护成本进行动态扩展。它由原子记录序列引擎提供支持,是世界上第一个提供无服务器模式的全球分布式 NoSQL关系型向量数据库服务。

以下是两个可提供向量存储功能的 Azure Cosmos DB API。

适用于 MongoDB (vCore) 的 Azure Cosmos DB

适用于 MongoDB vCore 的 Azure Cosmos DB 让您轻松创建具有完整原生 MongoDB 支持的数据库。您可以运用您的 MongoDB 经验,并通过将应用程序指向适用于 MongoDB vCore 帐户的连接字符串来继续使用您喜欢的 MongoDB 驱动程序、SDK 和工具。在适用于 MongoDB vCore 的 Azure Cosmos DB 中使用向量搜索,可以无缝地将您的基于 AI 的应用程序与存储在 Azure Cosmos DB 中的数据集成。

安装与设置

请参阅详细配置说明

我们需要安装 pymongo Python 软件包。

pip install pymongo
在 Microsoft Azure 上部署 Azure Cosmos DB

适用于 MongoDB vCore 的 Azure Cosmos DB 为开发人员提供了完全托管的、与 MongoDB 兼容的数据库服务,用于以熟悉的架构构建现代应用程序。

借助适用于 MongoDB vCore 的 Cosmos DB,开发人员在迁移现有应用程序或构建新应用程序时,可以享受原生 Azure 集成、低总拥有成本 (TCO) 以及熟悉的 vCore 架构带来的好处。

立即免费注册开始使用。

请参阅使用示例

from langchain_community.vectorstores import AzureCosmosDBVectorSearch

Azure Cosmos DB NoSQL

适用于 NoSQL 的 Azure Cosmos DB 现在提供向量索引和搜索的预览版。此功能旨在处理高维向量,实现任何规模的高效精确向量搜索。您现在可以将向量直接存储在文档中,与您的数据并存。这意味着您的数据库中的每个文档不仅可以包含传统的无模式数据,还可以将高维向量作为文档的其他属性。这种数据和向量的共置允许高效的索引和搜索,因为向量与它们所代表的数据存储在同一个逻辑单元中。这简化了数据管理、AI 应用程序架构以及基于向量操作的效率。

安装和设置

请参阅详细配置说明

我们需要安装 azure-cosmos Python 软件包。

pip install azure-cosmos
在 Microsoft Azure 上部署 Azure Cosmos DB

Azure Cosmos DB 为现代应用程序和智能工作负载提供了一个解决方案,它具有动态和弹性自动缩放功能,响应速度非常快。它在每个 Azure 区域都可用,并且可以自动将数据复制到更靠近用户的位置。它具有 SLA 保证的低延迟和高可用性。

立即免费注册开始使用。

请参阅使用示例

from langchain_community.vectorstores import AzureCosmosDBNoSQLVectorSearch

适用于 PostgreSQL 的 Azure 数据库

适用于 PostgreSQL 的 Azure 数据库 - 灵活服务器是基于开源 Postgres 数据库引擎的关系数据库服务。它是一种完全托管的数据库即服务,能够以可预测的性能、安全性、高可用性和动态可扩展性来处理关键任务工作负载。

请参阅适用于 PostgreSQL 的 Azure 数据库的设置说明

请参阅使用示例。只需使用 Azure 门户中的连接字符串

由于适用于 PostgreSQL 的 Azure 数据库是开源 Postgres,因此您可以使用 LangChain 的 Postgres 支持来连接到适用于 PostgreSQL 的 Azure 数据库。

Azure SQL 数据库

Azure SQL Database 是一项强大的服务,结合了可扩展性、安全性和高可用性,提供了现代数据库解决方案的所有优势。它还提供专用的向量数据类型和内置函数,可直接在关系数据库中简化向量嵌入的存储和查询。这消除了对独立向量数据库和相关集成的需求,从而提高了解决方案的安全性,同时降低了整体复杂性。

通过利用您当前的 SQL Server 数据库进行向量搜索,您可以增强数据功能,同时最大限度地降低费用并避免迁移到新系统的挑战。

安装和设置

请参阅详细配置说明

我们需要安装 langchain-sqlserver Python 软件包。

!pip install langchain-sqlserver==0.1.1
在 Microsoft Azure 上部署 Azure SQL DB

立即免费注册开始使用。

请参阅使用示例

from langchain_sqlserver import SQLServer_VectorStore

Azure AI Search 是一项云搜索服务,为开发人员提供基础设施、API 和工具,用于大规模检索向量、关键词和混合查询信息。请参阅此处获取使用示例。

from langchain_community.vectorstores.azuresearch import AzureSearch
API 参考:AzureSearch

检索器

Azure AI Search

Azure AI Search(以前称为 Azure SearchAzure Cognitive Search)是一项云搜索服务,为开发人员提供基础设施、API 和工具,用于在 Web、移动和企业应用程序中构建基于私有异构内容的丰富搜索体验。

搜索是任何向用户显示文本的应用程序的基础,常见场景包括目录或文档搜索、在线零售应用程序或专有内容的数据探索。当您创建搜索服务时,您将使用以下功能:

  • 用于对包含用户拥有内容的搜索索引进行全文搜索的搜索引擎
  • 丰富的索引功能,包括词汇分析和可选的 AI 增强功能,用于内容提取和转换
  • 丰富的查询语法,用于文本搜索、模糊搜索、自动完成、地理搜索等
  • 通过 Azure SDK 中的 REST API 和客户端库实现可编程性
  • 数据层、机器学习层和 AI(AI 服务)的 Azure 集成

请参阅设置说明

请参阅使用示例

from langchain_community.retrievers import AzureAISearchRetriever

向量存储

适用于 PostgreSQL 的 Azure 数据库

适用于 PostgreSQL 的 Azure 数据库 - 灵活服务器是基于开源 Postgres 数据库引擎的关系数据库服务。它是一种完全托管的数据库即服务,能够以可预测的性能、安全性、高可用性和动态可扩展性来处理关键任务工作负载。

请参阅适用于 PostgreSQL 的 Azure 数据库的设置说明

您需要在数据库中启用 pgvector 扩展才能将 Postgres 用作向量存储。启用扩展后,您可以使用 LangChain 中的 PGVector 连接到适用于 PostgreSQL 的 Azure 数据库。

请参阅使用示例。只需使用 Azure 门户中的连接字符串

工具

Azure 容器应用动态会话

我们需要从 Azure Container Apps 服务中获取 POOL_MANAGEMENT_ENDPOINT 环境变量。请参阅此处的说明。

我们需要安装一个 Python 软件包。

pip install langchain-azure-dynamic-sessions

请参阅使用示例

from langchain_azure_dynamic_sessions import SessionsPythonREPLTool

请参阅此处的文档,获取该工具的详细说明和使用指南。

Bing Search 资源需要环境变量 BING_SUBSCRIPTION_KEYBING_SEARCH_URL

from langchain_community.tools.bing_search import BingSearchResults
from langchain_community.utilities import BingSearchAPIWrapper

api_wrapper = BingSearchAPIWrapper()
tool = BingSearchResults(api_wrapper=api_wrapper)

工具包

Azure AI 服务

我们需要安装多个 Python 包。

pip install azure-ai-formrecognizer azure-cognitiveservices-speech azure-ai-vision-imageanalysis

请参阅使用示例

from langchain_community.agent_toolkits import azure_ai_services
API 参考:azure_ai_services

Azure AI 服务独立工具

azure_ai_services 工具包包括以下工具:

Azure 认知服务

我们需要安装多个 Python 包。

pip install azure-ai-formrecognizer azure-cognitiveservices-speech azure-ai-vision-imageanalysis

请参阅使用示例

from langchain_community.agent_toolkits import AzureCognitiveServicesToolkit

Azure AI 服务独立工具

azure_ai_services 工具包包含查询 Azure 认知服务的工具

  • AzureCogsFormRecognizerTool:表单识别器 API
  • AzureCogsImageAnalysisTool:图像分析 API
  • AzureCogsSpeech2TextTool:语音转文本 API
  • AzureCogsText2SpeechTool:文本转语音 API
  • AzureCogsTextAnalyticsHealthTool:健康文本分析 API
from langchain_community.tools.azure_cognitive_services import (
AzureCogsFormRecognizerTool,
AzureCogsImageAnalysisTool,
AzureCogsSpeech2TextTool,
AzureCogsText2SpeechTool,
AzureCogsTextAnalyticsHealthTool,
)

微软 Office 365 电子邮件和日历

我们需要安装 O365 Python 软件包。

pip install O365

请参阅使用示例

from langchain_community.agent_toolkits import O365Toolkit
API 参考:O365Toolkit

Office 365 独立工具

您可以使用 Office 365 工具包中的单个工具:

  • O365CreateDraftMessage:在 Office 365 中创建草稿电子邮件
  • O365SearchEmails:在 Office 365 中搜索电子邮件
  • O365SearchEvents:在 Office 365 中搜索日历事件
  • O365SendEvent:在 Office 365 中发送日历事件
  • O365SendMessage:在 Office 365 中发送电子邮件
from langchain_community.tools.office365 import O365CreateDraftMessage
from langchain_community.tools.office365 import O365SearchEmails
from langchain_community.tools.office365 import O365SearchEvents
from langchain_community.tools.office365 import O365SendEvent
from langchain_community.tools.office365 import O365SendMessage

微软 Azure PowerBI

我们需要安装 azure-identity Python 软件包。

pip install azure-identity

请参阅使用示例

from langchain_community.agent_toolkits import PowerBIToolkit
from langchain_community.utilities.powerbi import PowerBIDataset

PowerBI 独立工具

您可以使用 Azure PowerBI 工具包中的单个工具:

  • InfoPowerBITool:获取 PowerBI 数据集的元数据
  • ListPowerBITool:获取表名
  • QueryPowerBITool:查询 PowerBI 数据集
from langchain_community.tools.powerbi.tool import InfoPowerBITool
from langchain_community.tools.powerbi.tool import ListPowerBITool
from langchain_community.tools.powerbi.tool import QueryPowerBITool

PlayWright 浏览器工具包

Playwright 是由 Microsoft 开发的开源自动化工具,可让您以编程方式控制和自动化网络浏览器。它旨在用于跨各种网络浏览器(如 ChromiumFirefoxWebKit)的端到端测试、网页抓取和任务自动化。

我们需要安装多个 Python 包。

pip install playwright lxml

请参阅使用示例

from langchain_community.agent_toolkits import PlayWrightBrowserToolkit

PlayWright 浏览器独立工具

您可以使用 PlayWright 浏览器工具包中的单个工具。

from langchain_community.tools.playwright import ClickTool
from langchain_community.tools.playwright import CurrentWebPageTool
from langchain_community.tools.playwright import ExtractHyperlinksTool
from langchain_community.tools.playwright import ExtractTextTool
from langchain_community.tools.playwright import GetElementsTool
from langchain_community.tools.playwright import NavigateTool
from langchain_community.tools.playwright import NavigateBackTool

图表

适用于 Apache Gremlin 的 Azure Cosmos DB

我们需要安装一个 Python 软件包。

pip install gremlinpython

请参阅使用示例

from langchain_community.graphs import GremlinGraph
from langchain_community.graphs.graph_document import GraphDocument, Node, Relationship

实用工具

Bing 搜索 API

Microsoft Bing(通常简称为 BingBing Search)是 Microsoft 拥有和运营的网络搜索引擎。

请参阅使用示例

from langchain_community.utilities import BingSearchAPIWrapper

更多

微软 Presidio

Presidio(源自拉丁语 praesidium,意为“保护、驻军”)有助于确保敏感数据得到妥善管理和治理。它为文本和图像中的私人实体(如信用卡号、姓名、位置、社会安全号码、比特币钱包、美国电话号码、财务数据等)提供快速识别和匿名化模块。

首先,您需要安装几个 Python 软件包并下载一个 SpaCy 模型。

pip install langchain-experimental openai presidio-analyzer presidio-anonymizer spacy Faker
python -m spacy download en_core_web_lg

请参阅使用示例

from langchain_experimental.data_anonymizer import PresidioAnonymizer, PresidioReversibleAnonymizer