#LLM

5 posts found

LLM app 還是個 distributed system，延遲、可靠性、成本這三件事會互相打架，你不可能三個都要到極致。談 streaming 降感知延遲、retry/timeout/circuit breaker、prompt 與結果...

Multi-agent 聽起來很厲害，但大多數時候一個 agent 加好工具就夠了，而且更好 debug。談 supervisor/worker、pipeline、debate 等協作模式，handoff 怎麼傳 context，錯誤怎麼隔...

檢索是「公司的知識」，記憶是「這個使用者、這個任務的脈絡」，兩者不一樣。拆解短期、長期、episodic 三種記憶的用途與設計，context engineering 怎麼決定塞什麼進有限的視窗，以及一個最容易出包的點——A 使用者的記憶不...

企業 RAG 不是「把文件丟進向量庫然後問問題」這麼簡單。從 ingestion、chunking 策略、embedding、檢索、reranking 到 source citation，拆解每一步的設計取捨與最常見的翻車點，以及為什麼「答...

兩天就做出一個會查資料、會呼叫 API 的 AI agent demo，老闆很興奮——然後它在 production 待了六個月還上不了線。這篇拆解 demo 到 production 之間最容易被低估的六道鴻溝，以及為什麼「能動」離「能信...

符合「LLM」標籤的文章