跳到主要内容
Open In ColabOpen on GitHub

Browserbase

Browserbase 是一个开发者平台,用于可靠地运行、管理和监控无头浏览器。

通过以下方式增强您的 AI 数据检索能力:

安装与设置

  • browserbase.com 获取 API 密钥和项目 ID,并将其设置为环境变量(BROWSERBASE_API_KEYBROWSERBASE_PROJECT_ID)。
  • 安装 Browserbase SDK
%pip install browserbase

加载文档

您可以使用 BrowserbaseLoader 将网页加载到 LangChain 中。您可以选择设置 text_content 参数,将页面转换为纯文本表示。

import os

from langchain_community.document_loaders import BrowserbaseLoader

load_dotenv()

BROWSERBASE_API_KEY = os.getenv("BROWSERBASE_API_KEY")
BROWSERBASE_PROJECT_ID = os.getenv("BROWSERBASE_PROJECT_ID")
API 参考:BrowserbaseLoader
loader = BrowserbaseLoader(
api_key=BROWSERBASE_API_KEY,
project_id=BROWSERBASE_PROJECT_ID,
urls=[
"https://example.com",
],
# Text mode
text_content=False,
)

docs = loader.load()
print(docs[0].page_content[:61])

加载器选项

  • urls 必需。要抓取的 URL 列表。
  • text_content 仅检索文本内容。默认为 False
  • api_key Browserbase API 密钥。默认为 BROWSERBASE_API_KEY 环境变量。
  • project_id Browserbase 项目 ID。默认为 BROWSERBASE_PROJECT_ID 环境变量。
  • session_id 可选。提供一个现有会话 ID。
  • proxy 可选。启用/禁用代理。