系列 10/12 系統設計成本優化 延遲、可靠性、成本:AI agent 系統設計的鐵三角 LLM app 還是個 distributed system,延遲、可靠性、成本這三件事會互相打架,你不可能三個都要到極致。談 streaming 降感知延遲、retry/timeout/circuit breaker、prompt 與結果... 技術 2026-05-27 2min
系列 8/12 Multi-AgentOrchestration 多代理協作:什麼時候真的需要 multi-agent,什麼時候那只是讓系統更貴 Multi-agent 聽起來很厲害,但大多數時候一個 agent 加好工具就夠了,而且更好 debug。談 supervisor/worker、pipeline、debate 等協作模式,handoff 怎麼傳 context,錯誤怎麼隔... 技術 2026-05-19 2min
系列 7/12 AI Agent記憶 Agent memory 與狀態管理:short / long / episodic,以及記憶也有權限 檢索是「公司的知識」,記憶是「這個使用者、這個任務的脈絡」,兩者不一樣。拆解短期、長期、episodic 三種記憶的用途與設計,context engineering 怎麼決定塞什麼進有限的視窗,以及一個最容易出包的點——A 使用者的記憶不... 技術 2026-05-15 2min
系列 3/12 RAG向量檢索 RAG 架構實戰:從文件 ingestion 到 source-cited 回答的每一步 企業 RAG 不是「把文件丟進向量庫然後問問題」這麼簡單。從 ingestion、chunking 策略、embedding、檢索、reranking 到 source citation,拆解每一步的設計取捨與最常見的翻車點,以及為什麼「答... 技術 2026-04-29 3min
系列 1/12 AI AgentLLM 為什麼企業 AI Agent 卡在 PoC?從 demo 到 production 的六道鴻溝 兩天就做出一個會查資料、會呼叫 API 的 AI agent demo,老闆很興奮——然後它在 production 待了六個月還上不了線。這篇拆解 demo 到 production 之間最容易被低估的六道鴻溝,以及為什麼「能動」離「能信... 技術 2026-04-21 2min