系列 14/15 Claude API生產環境 生產環境部署:錯誤處理、限流與可觀測性 開發環境跑得好,不代表生產環境沒問題。本章全面解析 Rate Limits、指數退避、錯誤分類、API Key 安全管理、Logging 策略,以及 OpenTelemetry 整合——附 10 項生產環境部署 checklist。 技術 2026-05-29 3min
系列 9/12 LLMOps可觀測性 生產級 LLM 可觀測性與評估:沒有 eval 的 agent,等於沒有測試的軟體 你改了一句 prompt、換了個模型,怎麼知道系統變好還是變壞?拆解 eval harness(黃金題庫、LLM-as-judge、回歸測試)、agent 的 tracing(每一步檢索/工具/模型的 span)、token 與成本監控,以... 技術 2026-05-23 2min