把 Agentic Engineering 帶進團隊：從一個人的實驗到整個 team 的文化轉變

Agentic Engineering 實戰手冊第 13 / 14 篇

這是「Agentic Engineering 實戰手冊」系列的第十三篇。上一篇：Agent 安全網設計

「你能不能幫全 Team 導入？」——我以為這是好事

我在公司用了六個月 agent coding，效率翻倍，bug rate 沒有上升。主管注意到了，問我：「你能不能幫全 team 都導入這套工作流？」

我以為這是好事。以為只要開個 workshop、分享我的 CLAUDE.md、讓大家裝好 Claude Code，就搞定了。

結果第一週，10 個人裡有 3 個完全沒碰。2 個試了一次就放棄（「它改出來的 code 不是我想要的」）。3 個有在用但每次都來問我很基礎的問題。只有 2 個真的上手了。

技術從來不是問題，人才是。

讓一個人用 agent 很簡單，你只需要說服自己。讓十個人都開始用，你得同時處理恐懼、習慣、標準、流程，有時候還有辦公室政治。

為什麼 Adoption 這麼難

不同角色的阻力來源

角色	最擔心什麼	表面行為
Junior	「我還沒學會基礎，agent 就要取代我了」	不敢用，怕被發現自己不懂
Mid-level	「我的 coding 速度是我的價值」	用了但不信任，手動 rewrite agent 的 code
Senior	「我十年的經驗能被 AI 複製？」	聲稱不需要，或找到一個 agent 失敗的案例後拒絕
Manager	「怎麼衡量？會不會引入新風險？」	口頭支持但不給時間和預算

注意這些都不是「技術問題」，每一個都是心理層面和身份認同層面的挑戰。

Junior 的焦慮：「如果我都讓 agent 寫，我什麼時候才能自己學會？」這是合理的擔心。你可以這樣回：agent 不是取代你的練習，而是你的 pair programming partner。你寫 test、review code、做設計決策，這些才是真正建立能力的活動。Agent 幫你省掉的是 boilerplate，不是思考。

Mid-level 的焦慮：「我的價值就是寫 code 寫得快寫得好，agent 做得比我快怎麼辦？」這時候可以說：你的價值正在從「寫 code 的速度」轉變為「判斷什麼 code 該寫」。Post 2 聊過這個，在 new skill tree 裡，判斷力 > 打字速度。

Senior 的焦慮：「我的 expertise 會過時嗎？」這反而是最不需要擔心的群體，senior 的 judgment、architecture sense、domain knowledge 恰恰是 agent 最缺乏的。但 senior 通常也最固執。

挑選 Pilot Project 的標準

第一印象決定一切。選錯 pilot project，可能讓導入倒退六個月。

好的 Pilot 特徵

需求明確：有清楚的 spec 或 ticket，不需要大量 clarification
有測試覆蓋：agent 可以用 test 自我驗證，降低出錯風險
成果可量化：能具體比較 before/after（時間、code 品質、bug count）
風險低：不是 critical path，搞砸了不會影響 sprint delivery
有代表性：是團隊日常會做的任務類型，不是 edge case

Pilot 類型	為什麼好
新的 CRUD feature	需求明確、pattern 成熟、容易比較
Test coverage 補全	低風險、結果可量化（coverage %）、agent 非常擅長
Documentation 更新	零風險、立竿見影、所有人都討厭手動寫文件
小型 refactor	有 test 保護、scope 有限、容易 demo before/after

千萬不要選的 Pilot

Legacy codebase 的大型 migration
沒有 test 覆蓋的核心功能
跨團隊依賴的複雜 feature
需要大量 domain knowledge 的 business logic

核心原則是這樣：pilot 的目標是讓團隊對 agent 建立信心，不是展示 agent 的極限能力。

共享 CLAUDE.md 與團隊規範

從個人的 CLAUDE.md 到團隊的 CLAUDE.md，需要一個規範化的過程。

團隊 CLAUDE.md 該有什麼

# Team CLAUDE.md

## 技術棧（必填）

- 框架、語言、主要 dependency

## Build & Test（必填）

- 指令列表

## Coding Conventions（必填）

- 命名規則、檔案結構、設計模式

## Agent 使用規範（團隊新增）

- 哪些操作需要人工確認
- PR 上標注 AI-generated 的規則
- Agent-generated code 的 review 標準

PR 標注規範

建議的做法是讓 agent 產生的 PR 在 description 裡加上標注：

## AI Disclosure

- 🤖 This PR was primarily generated by AI agent (Claude Code)
- 👤 Human reviewed: architecture, security, business logic
- ✅ Verification: all existing tests pass + 3 new tests added

這不是「揭發」，而是透明度。讓 reviewer 知道這個 PR 需要特別注意的 review 重點（事實性檢查、hallucination patterns）。

CLAUDE.md 的版本控制

團隊的 CLAUDE.md 應該跟 code 一樣被 version control：

修改需要 PR review
重大改動需要 team 討論
每個月 review 一次是否需要更新

處理「AI 會取代我嗎」的焦慮

這不是理性問題。你不能用「根據統計，AI 導入後公司裁員率沒有上升」來說服一個害怕失業的人。

Acknowledge → Reframe → Demonstrate

Step 1: Acknowledge（承認恐懼是合理的）

「我理解你的擔心。AI 的確改變了工程師的工作內容。說不擔心是假的。」

不要立刻反駁。讓對方知道你理解他們的感受。

Step 2: Reframe（重新框架問題）

「Agent 不是取代你，是把你從低價值的工作中解放出來。你以前花 60% 的時間在寫 boilerplate、copy-paste、做重複的工作。Agent 做了這些，你可以把時間花在需要判斷力的事，像是架構設計、需求分析、code review。」

Step 3: Demonstrate（用事實示範）

不要用數據說服，用體驗說服。讓同事親自體驗一次「10 分鐘寫 spec → agent 自動完成」的流程。

第一次體驗的 wow moment 比任何論據都有效。但前提是你要選對 demo task，找一個那位同事正在做的、痛點明確的任務來 demo，不是你精心準備的表演。

不同層級的對話策略

對 Junior：「Agent 是你的學習加速器。你寫 test、review code、做設計——這些才是真正的學習。Agent 幫你省掉的是打字時間。」

對 Mid-level：「你最大的價值不是手速，是你知道什麼 code 該寫、什麼不該寫。Agent 放大了這個價值。」

對 Senior：不要硬推。找到他們真正的痛點（通常是 code review 太多、tech debt 清不完），用那個痛點做切入。

衡量指標：導入期該量什麼

不要量的指標

Code 行數 / commit 數量——agent 很容易產生大量 code，但量 ≠ 質
工時節省——前三個月可能不降反升（學習曲線）

建議量的指標

指標	為什麼重要	怎麼量
PR review 品質	Agent code 是否被 review 過	PR 有沒有 AI disclosure 標注
Bug rate	品質有沒有下降	Bug tickets per sprint
Dev satisfaction	團隊對新工作流的感受	匿名問卷（每兩週一次）
Time-to-deploy	從 ticket 到 production 的時間	Jira / GitHub metrics
Agent adoption rate	多少人在用	工具使用 analytics

前三個月不要期待效率提升，學習曲線是真的。期望值應該擺在「品質沒下降 + 大家開始養成習慣」，而不是「效率翻倍」。效率翻倍是六個月後的事。

12 週導入計畫

Phase 1（Week 1-4）：個人探索

每個人選一個 AI coding 工具（Claude Code / Cursor / Copilot）
在自己的 task 上自由使用
不設標準、不給壓力
每週 15 分鐘 sharing session：分享 tips 和踩過的坑

Success criteria：50% 的團隊成員每週至少用了一次 agent

Phase 2（Week 5-8）：Pair with Agent

每個 sprint 至少一個 task 用 agent 完成
Agent-generated PR 需要額外的 reviewer tag
開始建立共享的 CLAUDE.md
兩週一次 retrospective：什麼有用、什麼沒用

Success criteria：團隊共識「agent 在 X 類任務上有幫助」

Phase 3（Week 9-12）：Team Standard

正式版 team CLAUDE.md commit 進 repo
Agent code review 標準定義好
Metrics dashboard 上線
結案 retrospective：go / no-go / adjust

Success criteria：80% 的成員在日常工作中使用 agent，bug rate 沒有上升

Go / No-Go Decision

Phase 3 結束後，用數據做決策：

Bug rate 上升了？→ 調整 review 流程，回到 Phase 2
大家不想用？→ 調查原因，可能是工具選擇問題或 pilot 選錯
效率持平但大家有正面感受？→ Go，效率會在接下來幾個月自然提升

向上管理：怎麼 Pitch 給主管

主管在乎三件事：ROI、Risk、Timeline。

不要說

「AI 會讓我們快 10 倍。」

這種承諾只會反噬。第一個月效率可能不升反降，主管就會質疑你的判斷。

要說

「我提議做一個 12 週的 pilot。目標是在 X 類任務上驗證 agent-assisted workflow 的效果。量化指標是 [PR 品質、bug rate、time-to-deploy]。如果 12 週後指標沒改善，我們 rollback，成本可控。」

重點就是低風險 + 可量化 + 有退場機制。

Shopify 的參考案例

Shopify CEO Tobi Lutke 在 2025 年要求團隊的一個原則值得學習：

在要求增加人力之前，先證明 AI 做不到這件事。

這不是要「用 AI 取代人」，而是把 AI 視為團隊能力的一部分。就像你不會在提案新 feature 的時候忽略 CI/CD pipeline 的效率一樣，你也不該在規劃 capacity 的時候忽略 AI agent 的能力。

Takeaway

團隊導入的最大挑戰是人，不是技術：不同角色有不同的恐懼和阻力。先 acknowledge 恐懼，再用體驗（不是數據）說服。一次好的 demo 勝過十頁 slide。
好的 pilot project 決定第一印象：選需求明確、有 test 覆蓋、低風險的任務。千萬不要用 legacy migration 當 demo，那是讓整個團隊對 agent 失去信心的最快方式。
12 週 phased rollout 比「下週一所有人開始用」有效 100 倍：Phase 1 個人探索、Phase 2 pair with agent、Phase 3 team standard。每個 phase 有明確的 success criteria 和 go/no-go 決策點。

上一篇：Agent 安全網設計 下一篇：Agentic Engineering 的下一步

把 Agentic Engineering 帶進團隊：從一個人的實驗到整個 team 的文化轉變

「你能不能幫全 Team 導入？」——我以為這是好事