微软
所有与Microsoft Azure
和其他Microsoft
产品相关的功能。
聊天模型
Azure OpenAI
Microsoft Azure,通常称为
Azure
,是Microsoft
运营的云计算平台,通过全球数据中心提供对应用程序和服务的访问、管理和开发。它提供了一系列功能,包括软件即服务 (SaaS)、平台即服务 (PaaS) 和基础设施即服务 (IaaS)。Microsoft Azure
支持多种编程语言、工具和框架,包括 Microsoft 特定的和第三方软件和系统。
Azure OpenAI 是一项
Azure
服务,提供来自OpenAI
的强大语言模型,包括用于内容生成、摘要、语义搜索和自然语言到代码翻译的GPT-3
、Codex
和嵌入模型
系列。
pip install langchain-openai
设置环境变量以访问Azure OpenAI
服务。
import os
os.environ["AZURE_OPENAI_ENDPOINT"] = "https://<your-endpoint.openai.azure.com/"
os.environ["AZURE_OPENAI_API_KEY"] = "your AzureOpenAI key"
查看使用示例
from langchain_openai import AzureChatOpenAI
Azure ML 聊天在线端点
请参阅此处的文档,了解如何访问使用Azure 机器学习托管的聊天模型。
大型语言模型
Azure ML
查看使用示例。
from langchain_community.llms.azureml_endpoint import AzureMLOnlineEndpoint
Azure OpenAI
查看使用示例。
from langchain_openai import AzureOpenAI
嵌入模型
Azure OpenAI
查看使用示例
from langchain_openai import AzureOpenAIEmbeddings
文档加载器
Azure AI 数据
Azure AI Studio 提供将数据资产上传到云存储以及从以下来源注册现有数据资产的功能
Microsoft OneLake
Azure Blob 存储
Azure Data Lake 第 2 代
首先,您需要安装几个 Python 包。
pip install azureml-fsspec, azure-ai-generative
查看使用示例。
from langchain.document_loaders import AzureAIDataLoader
Azure AI 文档智能
Azure AI 文档智能(以前称为
Azure 表单识别器
)是一种基于机器学习的服务,可以从数字或扫描的 PDF、图像、Office 和 HTML 文件中提取文本(包括手写)、表格、文档结构和键值对。文档智能支持
JPEG/JPG
、PNG
、BMP
、TIFF
、HEIF
、DOCX
、XLSX
、PPTX
和HTML
。
首先,您需要安装一个 Python 包。
pip install azure-ai-documentintelligence
查看使用示例。
from langchain.document_loaders import AzureAIDocumentIntelligenceLoader
Azure Blob 存储
Azure Blob 存储 是 Microsoft 用于云的存储解决方案。Blob 存储经过优化,可存储大量非结构化数据。非结构化数据是指不遵循特定数据模型或定义的数据,例如文本或二进制数据。
Azure 文件 在云中提供完全托管的文件共享,可以通过行业标准服务器消息块 (
SMB
) 协议、网络文件系统 (NFS
) 协议和Azure 文件 REST API
进行访问。Azure 文件
基于Azure Blob 存储
。
Azure Blob 存储
旨在用于
- 直接向浏览器提供图像或文档。
- 存储文件以进行分布式访问。
- 流式传输视频和音频。
- 写入日志文件。
- 存储用于备份和还原、灾难恢复和存档的数据。
- 存储用于本地或 Azure 托管服务分析的数据。
pip install azure-storage-blob
from langchain_community.document_loaders import AzureBlobStorageContainerLoader
from langchain_community.document_loaders import AzureBlobStorageFileLoader
Microsoft OneDrive
Microsoft OneDrive(以前称为
SkyDrive
)是 Microsoft 运营的文件托管服务。
首先,您需要安装一个 Python 包。
pip install o365
查看使用示例。
from langchain_community.document_loaders import OneDriveLoader
Microsoft OneDrive 文件
Microsoft OneDrive(以前称为
SkyDrive
)是 Microsoft 运营的文件托管服务。
首先,您需要安装一个 Python 包。
pip install o365
from langchain_community.document_loaders import OneDriveFileLoader
Microsoft Word
Microsoft Word 是 Microsoft 开发的文字处理器。
查看使用示例。
from langchain_community.document_loaders import UnstructuredWordDocumentLoader
Microsoft Excel
Microsoft Excel 是微软开发的一款电子表格编辑器,适用于 Windows、macOS、Android、iOS 和 iPadOS。它具有计算功能、绘图工具、数据透视表以及称为 Visual Basic for Applications (VBA) 的宏编程语言。Excel 是 Microsoft 365 软件套件的一部分。
UnstructuredExcelLoader
用于加载 Microsoft Excel
文件。加载程序同时支持 .xlsx
和 .xls
文件。页面内容将是 Excel 文件的原始文本。如果在 "elements"
模式下使用加载程序,则 Excel 文件的 HTML 表示形式将可在文档元数据中的 text_as_html
密钥下获得。
请查看 使用示例。
from langchain_community.document_loaders import UnstructuredExcelLoader
Microsoft SharePoint
Microsoft SharePoint 是一个基于网站的协作系统,它使用工作流应用程序、“列表”数据库以及其他 Web 部件和安全功能来帮助微软开发的企业团队协同工作。
请查看 使用示例。
from langchain_community.document_loaders.sharepoint import SharePointLoader
Microsoft PowerPoint
Microsoft PowerPoint 是微软开发的一款演示文稿程序。
请查看 使用示例。
from langchain_community.document_loaders import UnstructuredPowerPointLoader
Microsoft OneNote
首先,让我们安装依赖项。
pip install bs4 msal
请查看 使用示例。
from langchain_community.document_loaders.onenote import OneNoteLoader
Playwright URL 加载程序
Playwright 是微软开发的一个开源自动化工具,允许您以编程方式控制和自动化 Web 浏览器。它旨在用于端到端测试、抓取以及跨各种 Web 浏览器(如
Chromium
、Firefox
和WebKit
)自动化任务。
首先,让我们安装依赖项。
pip install playwright unstructured
请查看 使用示例。
from langchain_community.document_loaders.onenote import OneNoteLoader
AI 代理内存系统
AI 代理 需要强大的内存系统,这些系统支持多模态、提供强大的操作性能,并支持代理内存共享以及分离。
Azure Cosmos DB
AI 代理可以依靠 Azure Cosmos DB 作为统一的 内存系统 解决方案,享受速度、规模和简单性。此服务成功地 支持 OpenAI 的 ChatGPT 服务 以高可靠性和低维护成本动态扩展。它由原子记录序列引擎提供支持,是全球首个全球分布式 NoSQL、关系型 和 向量数据库 服务,提供无服务器模式。
以下是两个可用的 Azure Cosmos DB API,它们可以提供向量存储功能。
适用于 MongoDB 的 Azure Cosmos DB (vCore)
适用于 MongoDB 的 Azure Cosmos DB vCore 使创建具有完整原生 MongoDB 支持的数据库变得容易。您可以应用您的 MongoDB 经验并继续使用您喜欢的 MongoDB 驱动程序、SDK 和工具,方法是将您的应用程序指向适用于 MongoDB vCore 帐户的连接字符串。在适用于 MongoDB 的 Azure Cosmos DB vCore 中使用向量搜索,以将您的基于 AI 的应用程序与存储在 Azure Cosmos DB 中的数据无缝集成。
安装和设置
请查看 详细配置说明。
我们需要安装 pymongo
python 包。
pip install pymongo
在 Microsoft Azure 上部署 Azure Cosmos DB
适用于 MongoDB 的 Azure Cosmos DB vCore 为开发人员提供了一种完全托管的兼容 MongoDB 的数据库服务,用于使用熟悉的架构构建现代应用程序。
使用适用于 MongoDB 的 Cosmos DB vCore,开发人员可以在迁移现有应用程序或构建新应用程序时享受原生 Azure 集成、较低的总拥有成本 (TCO) 以及熟悉的 vCore 架构带来的优势。
免费注册 以立即开始。
请查看 使用示例。
from langchain_community.vectorstores import AzureCosmosDBVectorSearch
Azure Cosmos DB NoSQL
适用于 NoSQL 的 Azure Cosmos DB 现在提供预览版中的向量索引和搜索。此功能旨在处理高维向量,以便在任何规模下都能高效且准确地进行向量搜索。您现在可以将向量与数据一起直接存储在文档中。这意味着数据库中的每个文档不仅可以包含传统的无模式数据,还可以包含高维向量作为文档的其他属性。数据和向量的这种共存允许高效地进行索引和搜索,因为向量与它们表示的数据存储在同一个逻辑单元中。这简化了数据管理、AI 应用程序架构以及基于向量的操作的效率。
安装和设置
请查看 详细配置说明。
我们需要安装 azure-cosmos
python 包。
pip install azure-cosmos
在 Microsoft Azure 上部署 Azure Cosmos DB
Azure Cosmos DB 通过响应迅速、动态且弹性的自动缩放为现代应用程序和智能工作负载提供解决方案。它在每个 Azure 区域中都可用,并且可以自动将数据复制到更靠近用户的区域。它具有 SLA 保证的低延迟和高可用性。
免费注册 以立即开始。
请查看 使用示例。
from langchain_community.vectorstores import AzureCosmosDBNoSQLVectorSearch
Azure Database for PostgreSQL
Azure Database for PostgreSQL - Flexible Server 是一种基于开源 Postgres 数据库引擎的关系型数据库服务。它是一种完全托管的数据库即服务,可以处理关键任务工作负载,并提供可预测的性能、安全性、高可用性和动态可扩展性。
请查看 Azure Database for PostgreSQL 的设置说明。
请查看 使用示例。只需使用 Azure 门户中的 连接字符串。
由于 Azure Database for PostgreSQL 是开源 Postgres,您可以使用 LangChain 的 Postgres 支持 连接到 Azure Database for PostgreSQL。
Azure AI Search
Azure AI Search 是一种云搜索服务,它为开发人员提供基础设施、API 和工具,用于大规模检索向量、关键字和混合查询的信息。请查看 此处 以获取使用示例。
from langchain_community.vectorstores.azuresearch import AzureSearch
检索器
Azure AI Search
Azure AI Search(以前称为
Azure Search
或Azure Cognitive Search
)是一种云搜索服务,它为开发人员提供基础设施、API 和工具,用于在 Web、移动和企业应用程序中构建丰富的搜索体验,覆盖私有、异构内容。
搜索是任何向用户显示文本的应用程序的基础,常见的场景包括目录或文档搜索、在线零售应用程序或对专有内容进行数据探索。创建搜索服务时,您将使用以下功能
- 用于对包含用户拥有内容的搜索索引进行全文搜索的搜索引擎
- 丰富的索引,具有词法分析和可选的 AI 增强功能,用于内容提取和转换
- 用于文本搜索、模糊搜索、自动完成、地理搜索等的丰富查询语法
- 通过 Azure SDK 中的 REST API 和客户端库进行可编程性
- 数据层、机器学习层和 AI(AI 服务)的 Azure 集成
请查看 设置说明。
请查看 使用示例。
from langchain_community.retrievers import AzureAISearchRetriever
向量存储
Azure Database for PostgreSQL
Azure Database for PostgreSQL - Flexible Server 是一种基于开源 Postgres 数据库引擎的关系型数据库服务。它是一种完全托管的数据库即服务,可以处理关键任务工作负载,并提供可预测的性能、安全性、高可用性和动态可扩展性。
请查看 Azure Database for PostgreSQL 的设置说明。
您需要在数据库中 启用 pgvector 扩展 以将 Postgres 用作向量存储。启用扩展后,您可以使用 LangChain 中的 PGVector 连接到 Azure Database for PostgreSQL。
工具
Azure 容器应用动态会话
我们需要从 Azure 容器应用服务获取POOL_MANAGEMENT_ENDPOINT
环境变量。请参阅此处的说明。
我们需要安装一个 Python 包。
pip install langchain-azure-dynamic-sessions
查看使用示例。
from langchain_azure_dynamic_sessions import SessionsPythonREPLTool
必应搜索
请遵循此处的文档以获取此工具的详细说明和说明。
必应搜索资源需要BING_SUBSCRIPTION_KEY
和BING_SEARCH_URL
环境变量。
from langchain_community.tools.bing_search import BingSearchResults
from langchain_community.utilities import BingSearchAPIWrapper
api_wrapper = BingSearchAPIWrapper()
tool = BingSearchResults(api_wrapper=api_wrapper)
工具包
Azure AI 服务
我们需要安装几个 Python 包。
pip install azure-ai-formrecognizer azure-cognitiveservices-speech azure-ai-vision-imageanalysis
查看使用示例。
from langchain_community.agent_toolkits import azure_ai_services
Azure AI 服务单个工具
azure_ai_services
工具包包含以下工具
- 图像分析:AzureAiServicesImageAnalysisTool
- 文档智能:AzureAiServicesDocumentIntelligenceTool
- 语音转文本:AzureAiServicesSpeechToTextTool
- 文本转语音:AzureAiServicesTextToSpeechTool
- 医疗保健文本分析:AzureAiServicesTextAnalyticsForHealthTool
Microsoft Office 365 邮件和日历
我们需要安装O365
Python 包。
pip install O365
查看使用示例。
from langchain_community.agent_toolkits import O365Toolkit
Office 365 单个工具
您可以使用 Office 365 工具包中的单个工具
O365CreateDraftMessage
:用于在 Office 365 中创建邮件草稿的工具O365SearchEmails
:用于在 Office 365 中搜索邮件的工具O365SearchEvents
:用于在 Office 365 中搜索日历事件的工具O365SendEvent
:用于在 Office 365 中发送日历事件的工具O365SendMessage
:用于在 Office 365 中发送邮件的工具
from langchain_community.tools.office365 import O365CreateDraftMessage
from langchain_community.tools.office365 import O365SearchEmails
from langchain_community.tools.office365 import O365SearchEvents
from langchain_community.tools.office365 import O365SendEvent
from langchain_community.tools.office365 import O365SendMessage
Microsoft Azure Power BI
我们需要安装azure-identity
Python 包。
pip install azure-identity
查看使用示例。
from langchain_community.agent_toolkits import PowerBIToolkit
from langchain_community.utilities.powerbi import PowerBIDataset
Power BI 单个工具
您可以使用 Azure Power BI 工具包中的单个工具
InfoPowerBITool
:用于获取有关 Power BI 数据集的元数据的工具ListPowerBITool
:用于获取表名称的工具QueryPowerBITool
:用于查询 Power BI 数据集的工具
from langchain_community.tools.powerbi.tool import InfoPowerBITool
from langchain_community.tools.powerbi.tool import ListPowerBITool
from langchain_community.tools.powerbi.tool import QueryPowerBITool
PlayWright 浏览器工具包
Playwright 是微软开发的一个开源自动化工具,允许您以编程方式控制和自动化 Web 浏览器。它旨在用于端到端测试、抓取以及跨各种 Web 浏览器(如
Chromium
、Firefox
和WebKit
)自动化任务。
我们需要安装几个 Python 包。
pip install playwright lxml
查看使用示例。
from langchain_community.agent_toolkits import PlayWrightBrowserToolkit
PlayWright 浏览器单个工具
您可以使用 PlayWright 浏览器工具包中的单个工具。
from langchain_community.tools.playwright import ClickTool
from langchain_community.tools.playwright import CurrentWebPageTool
from langchain_community.tools.playwright import ExtractHyperlinksTool
from langchain_community.tools.playwright import ExtractTextTool
from langchain_community.tools.playwright import GetElementsTool
from langchain_community.tools.playwright import NavigateTool
from langchain_community.tools.playwright import NavigateBackTool
图
适用于 Apache Gremlin 的 Azure Cosmos DB
我们需要安装一个 Python 包。
pip install gremlinpython
查看使用示例。
from langchain_community.graphs import GremlinGraph
from langchain_community.graphs.graph_document import GraphDocument, Node, Relationship
实用程序
必应搜索 API
Microsoft 必应,通常称为
Bing
或Bing 搜索
,是由Microsoft
拥有和运营的网络搜索引擎。
查看使用示例。
from langchain_community.utilities import BingSearchAPIWrapper
更多
Microsoft Presidio
Presidio(源自拉丁语 praesidium“保护,驻军”)有助于确保敏感数据得到妥善管理和治理。它为文本和图像中的私人实体(例如信用卡号、姓名、位置、社会保险号、比特币钱包、美国电话号码、财务数据等)提供快速识别和匿名化模块。
首先,您需要安装几个 Python 包并下载一个SpaCy
模型。
pip install langchain-experimental openai presidio-analyzer presidio-anonymizer spacy Faker
python -m spacy download en_core_web_lg
查看使用示例。
from langchain_experimental.data_anonymizer import PresidioAnonymizer, PresidioReversibleAnonymizer