[AI 分享] Agent是什麼？一次搞懂LM、Workflow與Agent的差異

2026年6月13日星期六

[AI 分享] Agent是什麼？一次搞懂LM、Workflow與Agent的差異

[AI 分享] Agent是什麼？一次搞懂LLM、Workflow與Agent的差異

摘要 : 解析LLM、Workflow與Agent差別，並說明Agent的五大組成與自主工作核心能力。

內容:

今天的重點，是搞懂「Agent到底是什麼」。Agent通常可翻成智慧體或代理，但若想真正理解它，最好先從LM與Workflow開始看起。

首先，像DeepSeek、ChatGPT這類產品，本質上都是基於LLM的大語言模型聊天機器人。可以先把它理解成一個很強的百科全書。它最基本的工作方式很簡單，就是「輸入→模型處理→輸出」。例如你輸入「給我一份會議紀要模板」，模型就會直接產出一份模板。

但如果你進一步問「我上一次會議是什麼時候」，單靠LLM其實無法回答，因為它沒有你的個人資料。這時就需要替它接入工具，例如日曆。它才能先查詢日曆，再回覆你答案。若再進一步要求「幫我把上一次會議紀要總結後寄到我的信箱」，事情就不只是問答，而會變成一連串步驟：先取得上次會議紀錄，再用模型摘要，最後接入郵件系統發送。這種由多個步驟串起來的流程，就是Workflow，也就是工作流。

Workflow的核心特徵在於：不管中間有多少節點、流程多複雜，本質上都還是人事先設計好的固定路線，AI只是照著既定步驟執行。因此，即便流程有一百個節點，也不能直接稱為Agent。

Agent的不同之處，在於它不是照單全收地執行預設流程，而是會自己決定下一步該做什麼。舉例來說，當你要求它「幫我把上一次會議紀要總結後寄到我的信箱」，Agent會先自己思考：要取得會議紀要，得先知道上次會議時間。它可能先查日曆，若查不到，再改去連接騰訊會議或其他系統尋找記錄。找到資料後，它再呼叫模型進行摘要。接著它還會繼續判斷：使用者雖然說要寄信，但沒提供收件信箱，那是否應該先詢問確認？整個過程中，Agent會持續思考、決策並調整行動，這才是Agent的真正特徵。

一句話總結，Workflow是執行人預先規定好的步驟；Agent則是能根據目標，自主決定要執行哪些步驟。

接著談Agent的構成。最容易理解的方法，是把Agent想像成一位「數字員工」。就像公司裡有不同崗位一樣，Agent也是一種數字化崗位。它可以24小時待命、不用請假，成本通常也比真人低，因此現在很多企業都對這種數字勞動力非常感興趣。如果把打造Agent想成在招聘一位實習生，那麼一個完整的Agent大致由五個部分組成。

第一是LLM，也就是大腦。像ChatGPT、DeepSeek、豆包等，都可以作為這個大腦。它負責理解人類語言、分析任務、制定計畫。沒有這個核心，大部分功能都無法成立。

第二是Prompt，也就是提示詞。這可以理解成崗位說明書。你不會只對新進客服說「你去做客服吧」，而是會告訴他職責、規則、處理方式與回覆風格。Prompt就是在做這件事，它負責定義Agent的角色、限制條件與輸出風格。

第三是Memory，也就是記憶。如果一位實習生每隔30秒就失憶一次，那肯定無法工作。Memory的作用，就是幫助Agent記住上下文、追蹤任務進度，並逐步累積經驗。

第四是Knowledge，尤其是External Knowledge，也就是外部知識。模型可能具備通用知識，但不一定知道公司的內部資訊。因此，還需要把企業知識庫、產品文件、制度規範等資料提供給它，讓它能基於特定場景工作。

第五是Tools，也就是工具。這是非常關鍵的一部分。所謂工具，不是實體工具，而是各種可被調用的數位能力，例如發郵件、下訂單、製作Excel、做PPT、查詢系統資料等。當Agent擁有操作這些工具的權限後，它就不只是「會聊天」，而是真正開始「會做事」。

不過，要特別注意的是，擁有這五個部分，並不代表它一定就是Agent。真正決定它是不是Agent的，不是零件有沒有備齊，而是它有沒有「自主完成工作」的能力。這裡就要提到一個重要概念：Agent Loop，也就是智慧體迴圈。其中一個經典框架叫ReAct，意思不是前端框架React，而是Reasoning與Acting，也就是「推理」與「行動」。

例如你對普通聊天機器人說「幫我做競品分析」，它通常只會回你一段分析文字；但Agent會先自己打開網頁、搜尋競爭對手、蒐集資料、整理資訊、畫出圖表，然後再檢查結果是否符合要求。如果結果不理想，它還會自己修改並持續迭代，直到滿意為止。這個「思考→行動→檢查→再修正」的過程，就是Agent Loop。它最核心的能力，在於不只是執行，而是會自己驗證成果。如果結果不好，它不會直接交差，而是會繼續調整。這種圍繞目標持續迭代的能力，才是Agent最關鍵的本質。

最後總結來說，把Agent想成數字員工會非常好理解。LLM是它的大腦，Tools是它的手腳，Memory是記憶，Knowledge是資料庫，Prompt是崗位說明書。但真正讓它成為Agent的，不是元件數量，而是它是否能圍繞目標自主工作，具備推理、行動、檢查與持續迭代的能力。

另外，關於Agent的組成，市面上其實會看到很多不同版本。這並不代表誰對誰錯，而是因為Agent目前仍處於高速發展階段，尚未形成全行業一致的官方標準。不同的工程團隊、產品公司、寫作者與一般使用者，會從不同角度理解與定義Agent，因此出現多種說法是很正常的。

沒有留言:

張貼留言

訂閱：張貼留言 (Atom)

2026年6月13日 星期六