[AI 知識分享] AI從聊天到幹活的進化

2026年6月14日星期日

[AI 知識分享] AI從聊天到幹活的進化

摘要 : 用規劃案例，串起LLM、Prompt、RAG、MCP、Agent、Skill等概念，說明AI如何一步步從回答問題進化到真正執行任務。

內容:

這兩年 AI 領域出現了非常多熱門名詞，像是 LLM、Token、Prompt、RAG、MCP、Agent、Skill 等，常讓人一開始看得眼花撩亂。其實這些概念並不是憑空冒出的術語，而是 AI 發展過程中，為了解決一個又一個實際問題而誕生的工具與方法。

先從最基本的情境切入：如果你週末想去玩，隨口問 AI 該怎麼安排，AI 能很快回覆你。這背後的核心就是 LLM，也就是大語言模型。它會把人類輸入的文字拆解成 Token，並透過預測下一個最可能出現的 Token，逐步生成完整答案。你對 AI 所說的話，就是 Prompt，也就是提示詞。

如果只是隨口一問，AI 的回答通常比較泛泛；但當你把需求描述得更清楚，例如加入預算、天數、偏好等條件，AI 的回覆就會更精準、更實用。這種把需求說清楚、讓模型更好理解的方式，就叫做 Prompt Engineering，也就是提示詞工程。

接著， AI 為什麼能記住你前面說過的條件。原因在於每次對話時，系統通常會把之前的聊天內容一併傳給模型，這就是 Context，也就是上下文。不過模型能處理的上下文長度有限，對話一長，就可能忘記前面的重點。為了解決這個問題，系統會把先前的內容壓縮成關鍵資訊，這份被提煉過的內容就是 Memory，也就是記憶。

但即使如此，模型仍然無法憑空知道你私人收藏的旅遊攻略或內部資料。這時就需要 RAG，也就是檢索增強生成。RAG 會先把你的私有資料切分、存入知識庫，在你提問時再檢索出最相關的內容，與問題一起提供給模型，幫助它生成更真實、更有依據的回答。許多 AI 客服、AI 問答系統，其實都是建立在這種能力之上。

不過，RAG 仍然只是幫助模型「回答得更好」，還不代表它真的能替你做事。例如你叫 AI 幫你查高鐵票，它可能只會告訴你該去哪個網站查。這時就需要 Function Calling。這套機制讓模型能夠根據需求輸出結構化的工具呼叫指令，再由外部程式真正去執行查詢、搜尋、訂票等操作，最後把結果回傳給模型整合成答覆。

但如果每接一個工具都要重新寫一套對接方式，工程成本會很高，因此 MCP 就出現了。MCP 的作用，是統一第三方工具的接入方式，讓 AI 應用只要對接一種標準協議，就能使用多種工具。文章也特別強調，Function Calling 和 MCP 並不相同：前者是讓模型知道如何發出工具呼叫指令，後者則是讓工具本身採用統一規格，方便整體接入與複用。

當 AI 已經能理解上下文、讀取資料、呼叫工具之後，就進一步發展成 Agent。Agent 不只是被動回答問題，而是能在收到目標後，自行拆解任務、規劃步驟、使用工具、記錄過程，逐步完成工作。也就是說，Agent 是把大模型、記憶、檢索、工具使用等能力整合起來，變成一個可以獨立執行任務的系統。

現在市面上很多 AI 產品，本質上都能視為不同形式的 Agent。差別在於它們能自主規劃到什麼程度、能否直接操作系統、能否主動與人協作。像一些桌面助理之所以受歡迎，就是因為它們不只會聊天，還真的能操作電腦、定時執行工作、透過通訊軟體和使用者互動，更像是真正的數位助手。

然而，即使 Agent 已經很強，使用者往往還是需要反覆交代偏好與規則。於是 Skill 的概念就出現了。Skill 可以理解成可重複使用的任務規範或能力模組，你可以把自己常用的要求、流程、限制條件整理進去，讓 Agent 在面對類似任務時直接參考執行。它和一次性的 Prompt 不同，Skill 更像是可持續使用、結構化管理的能力資產，也能節省上下文與 Token 成本。

最後，一個很重要的問題：AI 能力越強，出錯時的風險也越高。當 Agent 能直接操作工具、下指令、甚至付款時，如果沒有約束，就可能造成嚴重後果。因此需要額外的控制與防護機制，為 Agent 設定清楚的邊界、提供完整上下文、加入任務驗收與修正流程，讓它在可控範圍內發揮最大效率，避免失控或造成損失。

總結來說，把一連串 AI 概念串成一條清楚的主線：從 LLM 的文字生成開始，到 Prompt 改善提問品質、Context 與 Memory 管理對話、RAG 讀取外部知識、Function Calling 與 MCP 接入工具，再到 Agent 自主執行任務、Skill 沉澱經驗與規則，最後再加上安全約束機制。這也讓人更容易理解，AI 是如何一步一步從「只會聊天」走向「真的能幫你做事」。

沒有留言:

張貼留言

訂閱：張貼留言 (Atom)

2026年6月14日 星期日