系列 5/12 RAG資安 權限感知檢索:企業 RAG 最難、也最容易被略過的一關 個人玩 RAG 不會遇到這個問題,但企業一定會撞牆:當不同權限的人問同一個 agent,它怎麼確保每個人只檢索得到自己有資格看的東西?拆解 pre-filter vs post-filter、權限繼承、機密分級、來源歸屬與多租戶隔離——這是... 技術 2026-05-07 2min
系列 4/12 向量資料庫pgvector 向量資料庫與 embedding 策略:先別急著上 Pinecone,pgvector 可能就夠了 向量庫選型是 RAG 的地基,也是最容易過度工程的地方。pgvector vs 專用向量庫(Pinecone/Qdrant/Vectorize)怎麼選?embedding 模型與維度怎麼挑?什麼時候需要 hybrid search?HNSW... 技術 2026-05-03 2min
系列 3/12 RAG向量檢索 RAG 架構實戰:從文件 ingestion 到 source-cited 回答的每一步 企業 RAG 不是「把文件丟進向量庫然後問問題」這麼簡單。從 ingestion、chunking 策略、embedding、檢索、reranking 到 source citation,拆解每一步的設計取捨與最常見的翻車點,以及為什麼「答... 技術 2026-04-29 3min