跳至主要內容
技術

把 Agentic Engineering 帶進團隊:從一個人的實驗到整個 team 的文化轉變

把 Agentic Engineering 帶進團隊:從一個人的實驗到整個 team 的文化轉變
Agentic Engineering 實戰手冊 第 13 / 14 篇

這是「Agentic Engineering 實戰手冊」系列的第十三篇。上一篇:Agent 安全網設計

「你能不能幫全 Team 導入?」——我以為這是好事

我在公司用了六個月 agent coding,效率翻倍,bug rate 沒有上升。主管注意到了,問我:「你能不能幫全 team 都導入這套工作流?」

我以為這是好事。以為只要開個 workshop、分享我的 CLAUDE.md、讓大家裝好 Claude Code,就搞定了。

結果第一週,10 個人裡有 3 個完全沒碰。2 個試了一次就放棄(「它改出來的 code 不是我想要的」)。3 個有在用但每次都來問我很基礎的問題。只有 2 個真的上手了。

技術從來不是問題,人才是。

讓一個人用 agent 很簡單,你只需要說服自己。讓十個人都開始用,你得同時處理恐懼、習慣、標準、流程,有時候還有辦公室政治。

為什麼 Adoption 這麼難

不同角色的阻力來源

角色最擔心什麼表面行為
Junior「我還沒學會基礎,agent 就要取代我了」不敢用,怕被發現自己不懂
Mid-level「我的 coding 速度是我的價值」用了但不信任,手動 rewrite agent 的 code
Senior「我十年的經驗能被 AI 複製?」聲稱不需要,或找到一個 agent 失敗的案例後拒絕
Manager「怎麼衡量?會不會引入新風險?」口頭支持但不給時間和預算

注意這些都不是「技術問題」,每一個都是心理層面和身份認同層面的挑戰。

Junior 的焦慮:「如果我都讓 agent 寫,我什麼時候才能自己學會?」這是合理的擔心。你可以這樣回:agent 不是取代你的練習,而是你的 pair programming partner。你寫 test、review code、做設計決策,這些才是真正建立能力的活動。Agent 幫你省掉的是 boilerplate,不是思考。

Mid-level 的焦慮:「我的價值就是寫 code 寫得快寫得好,agent 做得比我快怎麼辦?」這時候可以說:你的價值正在從「寫 code 的速度」轉變為「判斷什麼 code 該寫」。Post 2 聊過這個,在 new skill tree 裡,判斷力 > 打字速度。

Senior 的焦慮:「我的 expertise 會過時嗎?」這反而是最不需要擔心的群體,senior 的 judgment、architecture sense、domain knowledge 恰恰是 agent 最缺乏的。但 senior 通常也最固執。

挑選 Pilot Project 的標準

第一印象決定一切。選錯 pilot project,可能讓導入倒退六個月。

好的 Pilot 特徵

  1. 需求明確:有清楚的 spec 或 ticket,不需要大量 clarification
  2. 有測試覆蓋:agent 可以用 test 自我驗證,降低出錯風險
  3. 成果可量化:能具體比較 before/after(時間、code 品質、bug count)
  4. 風險低:不是 critical path,搞砸了不會影響 sprint delivery
  5. 有代表性:是團隊日常會做的任務類型,不是 edge case

推薦的 Pilot 類型

Pilot 類型為什麼好
新的 CRUD feature需求明確、pattern 成熟、容易比較
Test coverage 補全低風險、結果可量化(coverage %)、agent 非常擅長
Documentation 更新零風險、立竿見影、所有人都討厭手動寫文件
小型 refactor有 test 保護、scope 有限、容易 demo before/after

千萬不要選的 Pilot

  • Legacy codebase 的大型 migration
  • 沒有 test 覆蓋的核心功能
  • 跨團隊依賴的複雜 feature
  • 需要大量 domain knowledge 的 business logic

核心原則是這樣:pilot 的目標是讓團隊對 agent 建立信心,不是展示 agent 的極限能力。

共享 CLAUDE.md 與團隊規範

從個人的 CLAUDE.md 到團隊的 CLAUDE.md,需要一個規範化的過程。

團隊 CLAUDE.md 該有什麼

# Team CLAUDE.md

## 技術棧(必填)

- 框架、語言、主要 dependency

## Build & Test(必填)

- 指令列表

## Coding Conventions(必填)

- 命名規則、檔案結構、設計模式

## Agent 使用規範(團隊新增)

- 哪些操作需要人工確認
- PR 上標注 AI-generated 的規則
- Agent-generated code 的 review 標準

PR 標注規範

建議的做法是讓 agent 產生的 PR 在 description 裡加上標注:

## AI Disclosure

- 🤖 This PR was primarily generated by AI agent (Claude Code)
- 👤 Human reviewed: architecture, security, business logic
- ✅ Verification: all existing tests pass + 3 new tests added

這不是「揭發」,而是透明度。讓 reviewer 知道這個 PR 需要 特別注意的 review 重點(事實性檢查、hallucination patterns)。

CLAUDE.md 的版本控制

團隊的 CLAUDE.md 應該跟 code 一樣被 version control:

  • 修改需要 PR review
  • 重大改動需要 team 討論
  • 每個月 review 一次是否需要更新

處理「AI 會取代我嗎」的焦慮

這不是理性問題。你不能用「根據統計,AI 導入後公司裁員率沒有上升」來說服一個害怕失業的人。

Acknowledge → Reframe → Demonstrate

Step 1: Acknowledge(承認恐懼是合理的)

「我理解你的擔心。AI 的確改變了工程師的工作內容。說不擔心是假的。」

不要立刻反駁。讓對方知道你理解他們的感受。

Step 2: Reframe(重新框架問題)

「Agent 不是取代你,是把你從低價值的工作中解放出來。你以前花 60% 的時間在寫 boilerplate、copy-paste、做重複的工作。Agent 做了這些,你可以把時間花在需要判斷力的事,像是架構設計、需求分析、code review。」

Step 3: Demonstrate(用事實示範)

不要用數據說服,用體驗說服。讓同事親自體驗一次「10 分鐘寫 spec → agent 自動完成」的流程。

第一次體驗的 wow moment 比任何論據都有效。但前提是你要選對 demo task,找一個那位同事正在做的、痛點明確的任務來 demo,不是你精心準備的表演。

不同層級的對話策略

對 Junior:「Agent 是你的學習加速器。你寫 test、review code、做設計——這些才是真正的學習。Agent 幫你省掉的是打字時間。」

對 Mid-level:「你最大的價值不是手速,是你知道什麼 code 該寫、什麼不該寫。Agent 放大了這個價值。」

對 Senior:不要硬推。找到他們真正的痛點(通常是 code review 太多、tech debt 清不完),用那個痛點做切入。

衡量指標:導入期該量什麼

不要量的指標

  • Code 行數 / commit 數量——agent 很容易產生大量 code,但量 ≠ 質
  • 工時節省——前三個月可能不降反升(學習曲線)

建議量的指標

指標為什麼重要怎麼量
PR review 品質Agent code 是否被 review 過PR 有沒有 AI disclosure 標注
Bug rate品質有沒有下降Bug tickets per sprint
Dev satisfaction團隊對新工作流的感受匿名問卷(每兩週一次)
Time-to-deploy從 ticket 到 production 的時間Jira / GitHub metrics
Agent adoption rate多少人在用工具使用 analytics

前三個月不要期待效率提升,學習曲線是真的。期望值應該擺在「品質沒下降 + 大家開始養成習慣」,而不是「效率翻倍」。效率翻倍是六個月後的事。

12 週導入計畫

Phase 1(Week 1-4):個人探索

  • 每個人選一個 AI coding 工具(Claude Code / Cursor / Copilot)
  • 在自己的 task 上自由使用
  • 不設標準、不給壓力
  • 每週 15 分鐘 sharing session:分享 tips 和踩過的坑

Success criteria:50% 的團隊成員每週至少用了一次 agent

Phase 2(Week 5-8):Pair with Agent

  • 每個 sprint 至少一個 task 用 agent 完成
  • Agent-generated PR 需要額外的 reviewer tag
  • 開始建立共享的 CLAUDE.md
  • 兩週一次 retrospective:什麼有用、什麼沒用

Success criteria:團隊共識「agent 在 X 類任務上有幫助」

Phase 3(Week 9-12):Team Standard

  • 正式版 team CLAUDE.md commit 進 repo
  • Agent code review 標準定義好
  • Metrics dashboard 上線
  • 結案 retrospective:go / no-go / adjust

Success criteria:80% 的成員在日常工作中使用 agent,bug rate 沒有上升

Go / No-Go Decision

Phase 3 結束後,用數據做決策:

  • Bug rate 上升了?→ 調整 review 流程,回到 Phase 2
  • 大家不想用?→ 調查原因,可能是工具選擇問題或 pilot 選錯
  • 效率持平但大家有正面感受?→ Go,效率會在接下來幾個月自然提升

向上管理:怎麼 Pitch 給主管

主管在乎三件事:ROI、Risk、Timeline。

不要說

「AI 會讓我們快 10 倍。」

這種承諾只會反噬。第一個月效率可能不升反降,主管就會質疑你的判斷。

要說

「我提議做一個 12 週的 pilot。目標是在 X 類任務上驗證 agent-assisted workflow 的效果。量化指標是 [PR 品質、bug rate、time-to-deploy]。如果 12 週後指標沒改善,我們 rollback,成本可控。」

重點就是低風險 + 可量化 + 有退場機制。

Shopify 的參考案例

Shopify CEO Tobi Lutke 在 2025 年要求團隊的一個原則值得學習:

在要求增加人力之前,先證明 AI 做不到這件事。

這不是要「用 AI 取代人」,而是把 AI 視為團隊能力的一部分。就像你不會在提案新 feature 的時候忽略 CI/CD pipeline 的效率一樣,你也不該在規劃 capacity 的時候忽略 AI agent 的能力。

Takeaway

  1. 團隊導入的最大挑戰是人,不是技術:不同角色有不同的恐懼和阻力。先 acknowledge 恐懼,再用體驗(不是數據)說服。一次好的 demo 勝過十頁 slide。

  2. 好的 pilot project 決定第一印象:選需求明確、有 test 覆蓋、低風險的任務。千萬不要用 legacy migration 當 demo,那是讓整個團隊對 agent 失去信心的最快方式。

  3. 12 週 phased rollout 比「下週一所有人開始用」有效 100 倍:Phase 1 個人探索、Phase 2 pair with agent、Phase 3 team standard。每個 phase 有明確的 success criteria 和 go/no-go 決策點。


上一篇:Agent 安全網設計 下一篇:Agentic Engineering 的下一步

留言討論

esc
輸入關鍵字搜尋文章...
查看收藏 →