[AI 分享] Agent是什麼?一次搞懂LLM、Workflow與Agent的差異
摘要 : 解析LLM、Workflow與Agent差別,並說明Agent的五大組成與自主工作核心能力。
內容:
今天的重點,是搞懂「Agent到底是什麼」。Agent通常可翻成智慧體或代理,但若想真正理解它,最好先從LM與Workflow開始看起。
首先,像DeepSeek、ChatGPT這類產品,本質上都是基於LLM的大語言模型聊天機器人。可以先把它理解成一個很強的百科全書。它最基本的工作方式很簡單,就是「輸入→模型處理→輸出」。例如你輸入「給我一份會議紀要模板」,模型就會直接產出一份模板。
但如果你進一步問「我上一次會議是什麼時候」,單靠LLM其實無法回答,因為它沒有你的個人資料。這時就需要替它接入工具,例如日曆。它才能先查詢日曆,再回覆你答案。若再進一步要求「幫我把上一次會議紀要總結後寄到我的信箱」,事情就不只是問答,而會變成一連串步驟:先取得上次會議紀錄,再用模型摘要,最後接入郵件系統發送。這種由多個步驟串起來的流程,就是Workflow,也就是工作流。
Workflow的核心特徵在於:不管中間有多少節點、流程多複雜,本質上都還是人事先設計好的固定路線,AI只是照著既定步驟執行。因此,即便流程有一百個節點,也不能直接稱為Agent。
Agent的不同之處,在於它不是照單全收地執行預設流程,而是會自己決定下一步該做什麼。舉例來說,當你要求它「幫我把上一次會議紀要總結後寄到我的信箱」,Agent會先自己思考:要取得會議紀要,得先知道上次會議時間。它可能先查日曆,若查不到,再改去連接騰訊會議或其他系統尋找記錄。找到資料後,它再呼叫模型進行摘要。接著它還會繼續判斷:使用者雖然說要寄信,但沒提供收件信箱,那是否應該先詢問確認?整個過程中,Agent會持續思考、決策並調整行動,這才是Agent的真正特徵。
一句話總結,Workflow是執行人預先規定好的步驟;Agent則是能根據目標,自主決定要執行哪些步驟。
接著談Agent的構成。最容易理解的方法,是把Agent想像成一位「數字員工」。就像公司裡有不同崗位一樣,Agent也是一種數字化崗位。它可以24小時待命、不用請假,成本通常也比真人低,因此現在很多企業都對這種數字勞動力非常感興趣。如果把打造Agent想成在招聘一位實習生,那麼一個完整的Agent大致由五個部分組成。
第一是LLM,也就是大腦。像ChatGPT、DeepSeek、豆包等,都可以作為這個大腦。它負責理解人類語言、分析任務、制定計畫。沒有這個核心,大部分功能都無法成立。
第二是Prompt,也就是提示詞。這可以理解成崗位說明書。你不會只對新進客服說「你去做客服吧」,而是會告訴他職責、規則、處理方式與回覆風格。Prompt就是在做這件事,它負責定義Agent的角色、限制條件與輸出風格。
第三是Memory,也就是記憶。如果一位實習生每隔30秒就失憶一次,那肯定無法工作。Memory的作用,就是幫助Agent記住上下文、追蹤任務進度,並逐步累積經驗。
第四是Knowledge,尤其是External Knowledge,也就是外部知識。模型可能具備通用知識,但不一定知道公司的內部資訊。因此,還需要把企業知識庫、產品文件、制度規範等資料提供給它,讓它能基於特定場景工作。
第五是Tools,也就是工具。這是非常關鍵的一部分。所謂工具,不是實體工具,而是各種可被調用的數位能力,例如發郵件、下訂單、製作Excel、做PPT、查詢系統資料等。當Agent擁有操作這些工具的權限後,它就不只是「會聊天」,而是真正開始「會做事」。
不過,要特別注意的是,擁有這五個部分,並不代表它一定就是Agent。真正決定它是不是Agent的,不是零件有沒有備齊,而是它有沒有「自主完成工作」的能力。這裡就要提到一個重要概念:Agent Loop,也就是智慧體迴圈。其中一個經典框架叫ReAct,意思不是前端框架React,而是Reasoning與Acting,也就是「推理」與「行動」。
例如你對普通聊天機器人說「幫我做競品分析」,它通常只會回你一段分析文字;但Agent會先自己打開網頁、搜尋競爭對手、蒐集資料、整理資訊、畫出圖表,然後再檢查結果是否符合要求。如果結果不理想,它還會自己修改並持續迭代,直到滿意為止。這個「思考→行動→檢查→再修正」的過程,就是Agent Loop。它最核心的能力,在於不只是執行,而是會自己驗證成果。如果結果不好,它不會直接交差,而是會繼續調整。這種圍繞目標持續迭代的能力,才是Agent最關鍵的本質。
最後總結來說,把Agent想成數字員工會非常好理解。LLM是它的大腦,Tools是它的手腳,Memory是記憶,Knowledge是資料庫,Prompt是崗位說明書。但真正讓它成為Agent的,不是元件數量,而是它是否能圍繞目標自主工作,具備推理、行動、檢查與持續迭代的能力。
另外,關於Agent的組成,市面上其實會看到很多不同版本。這並不代表誰對誰錯,而是因為Agent目前仍處於高速發展階段,尚未形成全行業一致的官方標準。不同的工程團隊、產品公司、寫作者與一般使用者,會從不同角度理解與定義Agent,因此出現多種說法是很正常的。
沒有留言:
張貼留言