跳到主要内容
Open on GitHub

模型速率限制

您已达到模型提供商在给定时间段内允许的最大请求数,并被暂时阻止。通常,此错误是暂时的,您的限制将在一段时间后重置。

故障排除

以下内容可能有助于解决此错误

  • 联系您的模型提供商并请求提高速率限制。
  • 如果您的许多传入请求是相同的,请利用模型响应缓存
  • 如果您的应用程序允许,请将请求分散到不同的提供商。
  • 使用rate_limiter来控制对模型的请求速率。