AWS Bedrock Models 避坑指南:快速通往模型大富翁之路
目錄
- 1. Bedrock 的定位
- 2. Region 選擇與模型可用性
- 3. Claude 系列的存取限制
- 4. Cross-Region Inference 與 Model ID 問題
- 5. 使用 Bedrock Playground 進行模型測試
- 6. Quota 限制與 Too many tokens 錯誤
- 7. 透過 Support Case 提升 Quota
- Ref
1. Bedrock 的定位
年前討論了雲端飼料 Bedrock Models 的選擇推薦,過年期間實測了這些 models 以及 Bedrock 平台,這邊分享可能遇到的坑給大家參考。
可以簡單把 Bedrock 當作類似 OpenRouter 的多模型切換器。當然實務上它不僅僅這麼簡單,有機會再慢慢跟大家聊它的相關應用。
2. Region 選擇與模型可用性
在擁有 AWS 帳號後,當前預設情況下該有的 models quota 已經都開啟。此時第一個坑為 AWS 在各個 Region 的 Models 具有不一致性:
(1) us-east-1 (美東) 擁有的 Models 最齊全,價格上通常最優惠。
(2) Region 決定了模型調用上的延遲性,通常要盡可能選擇與調用伺服器最接近的 Region。
(3) 一些小 Region 能使用的模型相當有限,例如最新的台北區 ap-east-2。
詳細在各 Region 能使用的 Models 可參考 [1]。

3. Claude 系列的存取限制
確認好使用的 Region 後,第二步是進行模型測試。預設上當前已將所有 Models 權限開通,除了 Claude 系列模型。在首次使用時必須填寫表單。
這裡需要注意另一個坑:如果地理區域、電話、付款信用卡等相關資訊是在非 Anthropic 指定區域 [2],有可能無法使用。
4. Cross-Region Inference 與 Model ID 問題
Claude 最新系列模型預設都需要使用 CRIS (Cross-Region Inference,跨區域推論) 進行調用。好處在於提升模型調用上的穩定性,但另一個坑也隨之而來。
例如 Opus 4.6 以 anthropic.claude-opus-4-6-v1 填寫時會出現以下錯誤:
Invocation of model ID anthropic.claude-opus-4-6-v1 with on-demand throughput isn't supported.
Retry your request with the ID or ARN of an inference profile that contains this model.
查看 CRIS Models ID 的步驟如下:
(1) 進入 Bedrock Console。
(2) 點擊 跨區域推論。
(3) 輸入模型名稱,例如 anthropic.claude-sonnet-4-6。
(4) 複製設定推理檔 ID,得到 global.anthropic.claude-sonnet-4-6,取代原本 ID。

5. 使用 Bedrock Playground 進行模型測試
透過 Bedrock Playground 可快速篩選模型後進行對話測試。步驟如下:
(1) 進入 Bedrock Console。
(2) 左邊選單點擊 聊天/文字遊樂場。
(3) 選擇模型後可以看到一系列可用模型。
(4) 選擇套用後開始對話,確認能否正常對話。

6. Quota 限制與 Too many tokens 錯誤
如果是 AWS 新帳號用戶或過去不常使用的用戶,應該很快會在測試中踩到另一個坑:
Too many tokens per day, please wait before trying again.
或是
ThrottlingException
Too many tokens per day, please wait before trying again.
原因在於預設的新用戶 Quota 相當低,幾乎是 0 quota。
常用的 Bedrock Model Quota 類型包含:
- RPM:每分鐘請求數
- TPM:每分鐘 Token 數
- TPD:每日 Token 數
每個 Model 的 Quota 不同,詳細可透過 AWS Service Quotas 選擇 Bedrock 後進行查閱。