#生產環境

3 posts found

生產環境部署：錯誤處理、限流與可觀測性

系列 14/15 Claude API生產環境

生產環境部署：錯誤處理、限流與可觀測性

開發環境跑得好，不代表生產環境沒問題。本章全面解析 Rate Limits、指數退避、錯誤分類、API Key 安全管理、Logging 策略，以及 OpenTelemetry 整合——附 10 項生產環境部署 checklist。

技術 2026-05-29

生產級 LLM 可觀測性與評估：沒有 eval 的 agent，等於沒有測試的軟體

系列 9/12 LLMOps可觀測性

生產級 LLM 可觀測性與評估：沒有 eval 的 agent，等於沒有測試的軟體

你改了一句 prompt、換了個模型，怎麼知道系統變好還是變壞？拆解 eval harness（黃金題庫、LLM-as-judge、回歸測試）、agent 的 tracing（每一步檢索/工具/模型的 span）、token 與成本監控，以...

技術 2026-05-23

為什麼企業 AI Agent 卡在 PoC？從 demo 到 production 的六道鴻溝

系列 1/12 AI AgentLLM

為什麼企業 AI Agent 卡在 PoC？從 demo 到 production 的六道鴻溝

兩天就做出一個會查資料、會呼叫 API 的 AI agent demo，老闆很興奮——然後它在 production 待了六個月還上不了線。這篇拆解 demo 到 production 之間最容易被低估的六道鴻溝，以及為什麼「能動」離「能信...

技術 2026-04-21

查看收藏 →