2026年6月14日 星期日

[AI 知識分享] AI從聊天到幹活的進化

 [AI 知識分享] AI從聊天到幹活的進化


摘要 : 用規劃案例,串起LLM、Prompt、RAG、MCP、Agent、Skill等概念,說明AI如何一步步從回答問題進化到真正執行任務。


內容:

這兩年 AI 領域出現了非常多熱門名詞,像是 LLM、Token、Prompt、RAG、MCP、Agent、Skill 等,常讓人一開始看得眼花撩亂。其實這些概念並不是憑空冒出的術語,而是 AI 發展過程中,為了解決一個又一個實際問題而誕生的工具與方法。


先從最基本的情境切入:如果你週末想去玩,隨口問 AI 該怎麼安排,AI 能很快回覆你。這背後的核心就是 LLM,也就是大語言模型。它會把人類輸入的文字拆解成 Token,並透過預測下一個最可能出現的 Token,逐步生成完整答案。你對 AI 所說的話,就是 Prompt,也就是提示詞。


如果只是隨口一問,AI 的回答通常比較泛泛;但當你把需求描述得更清楚,例如加入預算、天數、偏好等條件,AI 的回覆就會更精準、更實用。這種把需求說清楚、讓模型更好理解的方式,就叫做 Prompt Engineering,也就是提示詞工程。


接著, AI 為什麼能記住你前面說過的條件。原因在於每次對話時,系統通常會把之前的聊天內容一併傳給模型,這就是 Context,也就是上下文。不過模型能處理的上下文長度有限,對話一長,就可能忘記前面的重點。為了解決這個問題,系統會把先前的內容壓縮成關鍵資訊,這份被提煉過的內容就是 Memory,也就是記憶。


但即使如此,模型仍然無法憑空知道你私人收藏的旅遊攻略或內部資料。這時就需要 RAG,也就是檢索增強生成。RAG 會先把你的私有資料切分、存入知識庫,在你提問時再檢索出最相關的內容,與問題一起提供給模型,幫助它生成更真實、更有依據的回答。許多 AI 客服、AI 問答系統,其實都是建立在這種能力之上。


不過,RAG 仍然只是幫助模型「回答得更好」,還不代表它真的能替你做事。例如你叫 AI 幫你查高鐵票,它可能只會告訴你該去哪個網站查。這時就需要 Function Calling。這套機制讓模型能夠根據需求輸出結構化的工具呼叫指令,再由外部程式真正去執行查詢、搜尋、訂票等操作,最後把結果回傳給模型整合成答覆。


但如果每接一個工具都要重新寫一套對接方式,工程成本會很高,因此 MCP 就出現了。MCP 的作用,是統一第三方工具的接入方式,讓 AI 應用只要對接一種標準協議,就能使用多種工具。文章也特別強調,Function Calling 和 MCP 並不相同:前者是讓模型知道如何發出工具呼叫指令,後者則是讓工具本身採用統一規格,方便整體接入與複用。


當 AI 已經能理解上下文、讀取資料、呼叫工具之後,就進一步發展成 Agent。Agent 不只是被動回答問題,而是能在收到目標後,自行拆解任務、規劃步驟、使用工具、記錄過程,逐步完成工作。也就是說,Agent 是把大模型、記憶、檢索、工具使用等能力整合起來,變成一個可以獨立執行任務的系統。


現在市面上很多 AI 產品,本質上都能視為不同形式的 Agent。差別在於它們能自主規劃到什麼程度、能否直接操作系統、能否主動與人協作。像一些桌面助理之所以受歡迎,就是因為它們不只會聊天,還真的能操作電腦、定時執行工作、透過通訊軟體和使用者互動,更像是真正的數位助手。


然而,即使 Agent 已經很強,使用者往往還是需要反覆交代偏好與規則。於是 Skill 的概念就出現了。Skill 可以理解成可重複使用的任務規範或能力模組,你可以把自己常用的要求、流程、限制條件整理進去,讓 Agent 在面對類似任務時直接參考執行。它和一次性的 Prompt 不同,Skill 更像是可持續使用、結構化管理的能力資產,也能節省上下文與 Token 成本。


最後,一個很重要的問題:AI 能力越強,出錯時的風險也越高。當 Agent 能直接操作工具、下指令、甚至付款時,如果沒有約束,就可能造成嚴重後果。因此需要額外的控制與防護機制,為 Agent 設定清楚的邊界、提供完整上下文、加入任務驗收與修正流程,讓它在可控範圍內發揮最大效率,避免失控或造成損失。


總結來說,把一連串 AI 概念串成一條清楚的主線:從 LLM 的文字生成開始,到 Prompt 改善提問品質、Context 與 Memory 管理對話、RAG 讀取外部知識、Function Calling 與 MCP 接入工具,再到 Agent 自主執行任務、Skill 沉澱經驗與規則,最後再加上安全約束機制。這也讓人更容易理解,AI 是如何一步一步從「只會聊天」走向「真的能幫你做事」。

沒有留言:

張貼留言