AI Agent Teams 到底怎麼運作?Subagent、Agent Teams、Dynamic Workflows 三種模式完整拆解
一個工程師,帶著 AI,把 75 萬行的專案整個翻寫掉,只花了 11 天。
這個案例在圈子裡傳開之後,大家開始認真討論一個問題:一個工程師帶著一支 AI 團隊,是不是真的可以抵過一整個工程團隊?
不過在回答這個問題之前,有一件事得先說清楚:那個 75 萬行的案例,到目前為止還沒有真正上線——它是一個漂亮的展示品,不是已經在跑的成品。
把這件事說在前面,不是要潑冷水,而是因為這個細節,正好說明了 AI Agent 團隊最重要的一件事:它能做的事很強,但「能做到」跟「穩定落地」之間,還有一段距離。
這篇文章,我想白話拆解三件事:AI Agent 團隊的三種模式是什麼、研究說多 Agent 在什麼情況下才真的有用、以及不會寫 code 的人要怎麼開始用。
AI Agent 團隊是什麼?和以前用的 AI 差在哪?
你平常用的 ChatGPT 或 Claude,就像是請了一個很強的助理——你問一句,他答一句。
AI Agent 團隊的玩法不一樣:與其只用一個 AI,乾脆同時開一群,讓他們各自顧一塊,一起把一件大事做完。
這個概念不是新的。2023 年爆紅的 AutoGPT 就在玩「讓 AI 自己分工」,後來的 AutoGen、Crew AI 也一個接著一個冒出來,業界其實已經摸索了好幾年。
真正讓它最近爆紅的,是兩件事:
第一是規模變大了。 Anthropic 在 2026 年 5 月推出的 Claude Opus 4.8 帶了一個新功能叫 Dynamic Workflows——可以讓 Claude 自己規劃一件大事,然後一口氣開出好幾百個 AI 分頭去做,做完自己驗收,最後才把結果交給你。官方說同時可以跑 16 個,一輪最多 1000 個。你一句話下去,後台真的有上千個分身在幫你做。
第二是它變老實了。 以前的 AI 常常自己寫的東西有問題,卻當沒事就交出去。Anthropic 自己測試,4.8 這種「出包還裝沒事」的情況比上一代少了非常多。這很重要,因為你要敢讓一群 AI 自己做、自己驗收,他們就不能互相唬爛對方。
三種模式的差別:Subagent、Agent Teams、Dynamic Workflows
這三個詞最常被混在一起,但它們是同一件事的三個等級,差別在於 AI 之間到底要不要說話。
Subagent:各自獨立,只回報給你
主控 AI 把工作切一切,分給幾個分身去跑,分身做完把結果回給主控,彼此之間完全不講話。
想像你用 email 叫三個同事各自去查一件事情,查完寄回給你——他們三個人不需要知道對方在做什麼。這就是 Subagent。
適合: 界定很清楚、又能同時做的事。比如說一次幫一百份履歷各自篩選,或者同時去爬好幾個網站收集資料。
不適合: Agent 之間有相依性,A 的結果會影響 B 的下一步。這種情況他們需要溝通,純 Subagent 就撐不住了。
Agent Teams:進群對齊,邊做邊更新
Agent Teams 不一樣的地方在於,AI 之間有一個內建的「群組聊天室」。他們各自有負責的工作,但可以互相傳訊息、共用一張代辦清單、自己去認領任務。
比較像是三個人進了同一間會議室,邊做邊更新白板——一個人有新的發現,其他人也會馬上知道。
適合: 任務彼此有交叉,一個人的方向會影響另一個人下一步的工作。比如設計師和工程師需要互相討論規格再交付,你沒辦法叫他們完全各自做,他們需要對話。
不適合: 彼此任務完全獨立不需要溝通——這種情況用 Subagent 反而更快更省。
Dynamic Workflows:你說目標,其他都不用管
Dynamic Workflows 再往前一步:你連團隊都不用自己組。你只需要說清楚目標,Claude 就會自己寫一份分工計劃,一口氣開出幾百個分身平行跑,做完自己驗收,最後才把結果交給你。
它能開這麼多又不卡,是因為那份計劃存在外部變數裡,不會一直佔用 Claude 的腦容量。主打的是超大規模、可以完全拆開來做的任務。
適合: 規模夠大、可以拆開平行的任務。研究報告生成、根據主題動態決定要查幾個子主題——查到一半發現還要更深入,系統可以自己動態增加分工。
不適合: 流程很固定、步驟很明確、不需要靈活調整的自動化任務。這種情況用前兩種,甚至用普通的自動化工具反而更快。
多 Agent 一定比較強嗎?研究說的不是這樣
很多人第一次聽到多 Agent,直覺是「多幾個 AI 一起做,當然比一個強」。但研究說的不是這樣。
有一篇論文標題寫得很直白,說的就是:算力給的一樣多的時候,單一 AI 贏過多 Agent。
那些說多 Agent 比較強的研究,其實是偷偷給了多 Agent 更多算力。一旦把思考的分量拉到一樣,單一 AI 在很多要一步步推理的任務上,反而打贏,甚至更好。
道理不難理解:AI 之間每傳一手話,資訊就掉一點。傳越多手,就掉越多。
Google 的研究也發現,那種「得一步接一步、有先後順序」的任務,幾乎每一種多 Agent 做都會退步,最多掉到只剩七成效果。
可以從多 Agent 受益的任務,是可以拆開來平行做的事。比如同一家公司的營收、成本、市場——這三塊各自調查,多 Agent 確實可以加速,研究裡這一類可以進步八成。但如果一件事得一步接一步,多 Agent 反而會卡。
多 Agent 的成本陷阱
成本這塊很容易被忽略。直覺覺得多開幾個 Agent 應該還好,但算起來差很多。
有人估算過:三個 Agent 一起跑,花的錢可能是一個的十倍。
為什麼會差這麼多?
每多一個 Agent,光它的系統設定、它能用的工具,每叫一次都要重算一次錢。Agent 之間每傳一次話也要錢。人一多,彼此要連的線就暴增——五個 Agent 之間就有十條線。再加上做到一半如果出錯重跑,它會把前面整段對話再帶一遍,越到後面越燒錢。
這些 AI 全部都是用量計費的,所以一群一起燒,帳單一定漲得更快。
多 Agent 最容易翻車的地方
除了成本,設計不好的多 Agent 系統,問題不是「沒用」,而是「把錯誤放大」。
研究裡有一個對比:同樣是多 Agent 結構,設計好的可以幫你加速,設計亂搞的卻會把錯誤放大 17 倍以上。
最常見的錯誤叫「滾雪球」:前面的 Agent 出了一點點小錯,後面也把它當正確答案接著做,就會越疊越歪。換最強的模型也救不回來——問題出在系統設計,不在模型本身。
還有一個很多人第一次組 AI 團隊就會踩的坑:直覺按角色分工,一個 Agent 去規劃、一個去寫 code、一個跑測試,看起來很有條理,但其實最容易出事。
因為工作在 Agent 之間交接的時候,資訊會一直掉。到最後就變成了一個傳話遊戲。
比較穩的做法是按 Context 分工——照誰需要看到哪些資料來分,而不是照頭銜。這個原則就算你不寫程式,只是在用工具叫 AI 幫你做事,也很有幫助,因為你會比較看得出來它有沒有把工作分工對。
不會寫 code,也可以開一支 AI 團隊
講了這麼多工程師的事,現在來說說沒有技術背景的人怎麼用。
像 Replit 這種工具,你直接用自然語言描述你要什麼,它就可以幫你把一個想法做出來。而且它本身就支援多 Agent 平行作業——Core 方案可以同時跑兩個 Agent,Pro 方案最多十個。
重點不是工具有多強,而是它讓你可以親眼看到多 Agent 分工是怎麼運作的。
比如你叫它做一個需要先設計再寫 code 的前端 App,它會先跑一個設計的 Subagent,設計確認之後,其他 Subagent 才開始 coding——因為它知道這個 Dependency,設計是後面所有工作的前提。這就是它在自動判斷什麼時候需要等、什麼時候可以平行跑。
但也不要期待它可以直接生出一個能上線收錢的成品。現在這類工具最強的,是把點子快速做出來看看。真的要做到能正式營運,你自己還是要學著補強很多東西。
怎麼判斷要不要開 AI 團隊?
根據上面這些,我的個人判斷框架是這樣的:
用單一 AI 就夠的情況:
- 任務需要一步接一步推理,前面的結果影響後面的決策
- 需要在同一個 Context 裡反覆修改(寫 code 常常是這種情況)
- 想省成本
考慮 Subagent 的情況:
- 有一批性質相同、互相獨立的工作(如大量文件各自處理)
- 只需要結果,不需要過程協調
考慮 Agent Teams 的情況:
- 任務之間有相依性,但需要動態溝通(設計交工程、研究交寫作)
- 中等規模、需要靈活性
考慮 Dynamic Workflows 的情況:
- 規模夠大、可完全拆開
- 有自動驗收機制(這一點非常關鍵,沒有驗收就不敢讓 AI 自己跑)
- 預算允許(因為成本會高很多)
2026 年最值錢的能力,不是會開 Agent
我自己的看法是,2026 年工程師真正值錢的,不是學會開一堆 Agent——那在之後已經是越來越基本的技能。
更重要的是兩件事:
判斷力——知道這件事到底需不需要 AI 團隊,一個就夠了的情況不要硬開。
當一個夠格的 Reviewer——AI 跑得再快,最後拍板的還是人。讓 AI 做完之後,你要有能力判斷結果對不對,而不是照單全收。
對於還不會寫 code 的人,現在其實是很好的下場時機。用 Replit 這種工具,你可以親身體驗一群 AI 協作是什麼感覺,也可以快速把一個想法做成能動的雛形。
一兩年後,帶一個 AI 團隊可能會變成跟今天會用 Google 一樣基本的能力——不再是什麼特殊技能。
但在那之前,能判斷什麼時候該開、什麼時候不該開,才是真正的差異。
本文方法與案例為本人實作,草稿由 AI 協助整理。