系列 9/12 LLMOps可觀測性 生產級 LLM 可觀測性與評估:沒有 eval 的 agent,等於沒有測試的軟體 你改了一句 prompt、換了個模型,怎麼知道系統變好還是變壞?拆解 eval harness(黃金題庫、LLM-as-judge、回歸測試)、agent 的 tracing(每一步檢索/工具/模型的 span)、token 與成本監控,以... 技術 2026-05-23 2min
系列 11/18 Solo Builder監控 監控與維運:睡覺時產品也在跑 產品上線不是終點,而是維運的起點。用最小化但有效的監控告警 + self-healing 自動修復,搭配 AI 故障診斷與 Runbook,讓你的產品在你睡覺、甚至休假兩週時也能穩定運行。 技術 2026-04-19 1min