C# .NET Blazor MAUI Xamarin Research

2026年6月16日星期二

[AI 分享] 一次看懂AI十個核心名詞

摘要 : 從Transformer到Agent、MCP、多模態與實體AI，快速建立AI技術全貌。

內容:

十個常見的AI名詞，幫大家建立一條清晰的理解路線。看似複雜的英文術語，其實都在說同一件事：AI正從單純的聊天工具，逐步進化成能理解任務、拆解問題、呼叫工具，甚至實際執行工作的系統。

首先，內容從Transformer講起。它的基本概念可以理解為，先把文字轉成電腦能處理的數字，再加入詞語的位置資訊，讓模型知道前後順序。接著透過多重關注機制，讓每個詞去判斷和其他詞之間的關係，層層運算後，最後預測下一個最可能出現的詞。也就是說，大語言模型本質上是一個非常強大的文字預測系統。

雖然模型本身很聰明，但它其實沒有真正的記憶能力。我們平常在聊天軟體中感覺AI記得前面說過的話，是因為每次對話時，系統都會把之前的內容重新讀取一次。因此，像OpenAI ChatGPT、Chat類應用的本質，仍然是在既有上下文中持續做文字生成。

接著，當人們不再滿足於「只會回答問題」的AI，就出現了Agent。Agent可以理解成是在模型外面加上一層客戶端外殼，讓AI不只會說，還能實際去操作工具，例如讀取檔案、寫程式、執行指令、處理表格等。模型負責思考與下達任務，Agent則負責連接電腦環境並完成具體執行。

而AI要能順利呼叫外部工具，就需要一套標準協議，這就是MCP。它像是AI和各種軟體之間的通用接口，規範模型如何發出請求、工具如何回傳結果。可以把它想像成AI世界裡的USB介面，讓不同工具都能被模型穩定調用。

另外，Skill則像是AI的工作說明書。當問題本身可能存在歧義時，若先替AI設定清楚角色、任務範圍與處理方式，就能大幅提升回答品質。從最早的系統提示詞，到後來將大綱、規則、角色設定拆分管理，本質上都是在用Skill讓AI更有方向、更懂你的工作流程。

當MCP與Skill搭配使用時，Agent的能力就會大幅提升。它不只是被動回答，而是能更準確地理解任務、選擇工具、執行步驟。對一般使用者來說，這也是目前最值得優先掌握的兩個AI應用關鍵。

再往上一步，就是Agent Tech。這代表AI不只是完成單一步驟，而是能圍繞目標，自己拆解任務、推進流程、遇到失敗再調整。它讓AI開始像一位初級同事，而不只是單一工具。像建立產品原型、經營帳號、完成一整套流程，背後都需要這種更複雜的執行機制。

如果任務再變得更大，就會延伸到Multi-Agent System，也就是多智能體系統。這個概念是讓多個Agent分工合作，例如有人查資料、有人寫腳本、有人審稿、有人做標題。理想上，這可以讓複雜任務拆解得更有效率。不過實務上，多Agent協作目前仍然容易混亂，距離成熟應用還有不少挑戰。

Reasoning Model，也就是推理模型。這類模型的重點不是回得快，而是想得更清楚。它會先拆解問題、規劃步驟、檢查條件，再輸出答案。像數學、寫程式、合約分析、投資判斷等需要多步驟思考的任務，就特別適合推理模型。這也是為什麼現在許多AI產品都開始強調深度思考能力。

除了推理能力，多模態也是AI的重要方向。真正理解世界不能只靠文字，人類是透過圖像、聲音、語言與環境一起判斷的。多模態AI就是朝這個方向發展，它可以同時處理文字、圖片、音訊、影片，甚至螢幕操作。像分析冰箱食材、整理會議錄音、辨識裝修風格，都屬於多模態能力的應用場景。

再來是context window，也就是上下文視窗。由於模型每次回答都需要重新讀取當前對話內容，當聊天越長、資訊越多時，計算成本會大幅增加，回答品質也可能下降。所以在實際使用上，如果對話太長，適時清理上下文或開新視窗，通常能讓AI表現更穩定。

第九個重點是RAG。當企業想讓AI結合內部知識庫時，不可能每次都把大量文件全部丟給模型處理。更好的方式是先讓AI判斷這次是否需要查資料，再去公司內部資料庫中檢索相關內容後回覆。這樣既能提升回答準確度，也能兼顧資料安全，不必把敏感資訊上傳到雲端。

最後提到的是Physical AI，也就是實體AI。這類AI不再只存在於螢幕中，而是進一步進入真實世界，控制機器人、自動駕駛車、機械臂、無人機等設備。它不只要會回答，還要能感知環境、理解現場狀況，並做出對應行動。這也代表AI的下一步，不只是數位世界中的助手，而可能成為現實世界中的執行者。

#AI

[AI 分享] OpenClaw雙軌自進化機制

摘要 : 解析Agent如何透過錯誤沉澱與成功模式封裝，持續學習並進化成更聰明的系統。

內容:

目前許多 Agent 在每次對話結束後，往往無法保留使用者偏好、糾錯紀錄或曾經犯過的錯誤，因此當下次遇到相同問題時，還是可能重複犯錯。這種情況不僅影響使用體驗，也讓 Agent 難以真正累積能力。

此外，傳統手動撰寫新技能的方式速度較慢，而單純依賴檢索知識的做法，雖然可以找回既有資訊，卻無法把新的經驗重新寫回系統中，因此無法形成真正可持續成長的技能庫。

針對這些問題，OpenClaw 提出了一種「雙軌進化」的設計。第一條軌道是 Self-improving，主要負責記錄失敗、糾正以及使用者回饋，並將這些內容沉澱成類似 Learnings.md 的文件，像是錯題本一樣幫助 Agent 逐步修正行為。

第二條軌道則是 AutoSkill，它聚焦在那些反覆成功的操作模式，將這些成熟的方法整理成 Skill.md 或可直接觸發的工作流。也就是說，Self-improving 負責從錯誤中學習，AutoSkill 則負責把成功經驗轉化成穩定技能，兩者可以同時運作。

在 Self-improving 的運作方式上，它會在每次對話中捕捉錯誤、修正與最佳實踐，並將內容存放在可編輯的 Markdown 文件中。這種方式的好處是透明、可審查、可手動調整，不像黑盒式記憶那樣難以維護。當某些經驗反覆出現後，系統便會依照規則，將它提升到 Agent.md 或獨立 Skill 中。

至於 AutoSkill，它的生命週期包括提取、維護、檢索與執行幾個階段。首先從執行軌跡中挖掘可複用步驟，再經過去重、合併與版本控制來維護技能庫。當新任務出現時，系統會利用檢索方法找出相關技能，交由執行流程使用；如果執行失敗，再回到 Self-improving 軌道做修正。

OpenClaw 社群中也有 Skill Evolution 機制，專門將對話過程蒸餾成候選 Skill。與其他方案相比，SkillCloud 更偏重真實對話蒸餾與跨端共享，而 SkillOS 則採取強化學習方式來管理技能庫，能進行新增、更新與刪除等操作。相較之下，OpenClaw 的特色在於輕量化、文件化，以及高度可審查與可直接修改。

在整合方式上，CloudHub 負責技能安裝，SkillBank 負責版本管理與索引，而 Hooks 則可在 Session 結束時觸發評估流程。這些升級後的規則會被寫入 Agent.md 或 DocIndex，確保下一次對話時就能直接套用新的經驗與能力。

OneContext 在這個閉環中則扮演流程控制的角色，會在每個 Session 結束後觸發評估，並將新的知識或技能更新回系統。它與 Self-improving 的關係可以理解為：OneContext 負責閉環運作，Self-improving 則負責經驗文件化與沉澱。

這種雙軌自進化模式特別適合長期使用的個人助手、運維任務，或內容生成流水線等高頻、可重複、可整理成 Markdown SOP 的場景。相對地，一次性腳本、合規要求極高且不允許自動寫入的環境，或完全沒有回饋機制的批次任務，就不太適合採用。

實際導入時，建議先啟用 Self-improving，先累積一到兩週的錯誤與經驗，再從中挑選最常出現、最穩定的成功模式，交由 AutoSkill 封裝成可重用技能。這樣的安排能讓 Agent 從「記住教訓」逐步走向「掌握方法」，建立真正可持續成長的自進化能力。

[AI 影響] AI知識庫：把企業隱形資產變成成長引擎

摘要 : AI知識庫能將企業分散資料與員工經驗系統化，快速查找、精準問答，提升效率並降低知識流失風險。

(若對這個產品有興趣的，請留言告知)

內容:

很多企業以為最大的成本來自設備、授權或系統建置，但真正最昂貴的，往往是那些沒有被整理、沒有被保存、只存在於員工腦中的知識。表面上看不見，實際上卻每天都在吞噬企業效率。根據內容指出，員工平均每天有1.8小時耗費在找檔案、確認版本、重複提問與等待回覆上。這不只是時間浪費，更像是企業在不知不覺中持續流血。

如果把視角拉高，你會發現這不是小問題，而是管理上的結構性黑洞。每位員工一年可能因此損失22個完整工作天；若公司有100位員工，就等同每年蒸發2200個工作天。這正是思維要我們看見的關鍵：不要只想著改善找資料的流程，而是重新定義企業知識的價值，把原本零散、沉睡、難以傳承的資訊，轉化成能推動組織前進的核心動能。

AI知識庫的價值，不只是更快搜尋，而是先點出痛點，再用簡單有力的方式給出新答案。過去，員工需要翻找Email、會議紀錄、雲端資料夾，甚至還要依賴資深同事口頭傳承；現在，只需要像聊天一樣提出問題，AI知識庫就能在30秒內提供精準答案，並附上清楚來源。這不是功能升級，而是工作模式的全面翻轉。

它的厲害之處，在於背後有一套可落地的知識轉換流程。從資料匯入開始，不論是PDF、Word、錄音還是影片，都能整合進系統；接著透過清洗、萃取與蒸餾，去除雜訊、保護敏感資訊，並把重點提煉成真正可用的知識內容。最後，透過自然語言查詢與持續評量回饋，讓整個知識庫不只會回答，還會愈來愈準、愈來愈新。這讓企業第一次有機會，把雜亂資料變成可追溯、可稽核、可複製的行動指南。

更重要的是，AI知識庫不是只有大型企業或IT部門才能使用的高門檻工具。它可以服務個人、部門到整個企業。對個人來說，它能幫助整理專案資料；對部門來說，它能統一SOP與對外回應品質；對企業來說，它則能打通部門資訊斷層，保留資深員工經驗，降低離職造成的知識斷裂。這種價值，不只是效率工具，更是企業文化與能力傳承的基礎設施。

當然，這也說明了為什麼一般聊天型AI不能直接取代企業知識庫。賈伯斯最擅長的，就是讓人理解「看似相似，其實完全不同」的差距。表面上都是AI問答，但一般AI常有權限控管不足、雲端資料外洩風險、答案無法追溯、甚至產生幻覺等問題；而企業級AI知識庫則強調地端私有部署、知識單元權限控管，以及每一則答案皆附來源依據。這不是多一個聊天視窗，而是多一套企業真正敢信任的知識基礎建設。

實際應用上，它能直接改變日常工作場景。像是跨部門會議結束後，錄音可自動匯入並生成逐字稿與摘要；想查一個月前的決議，只要一句提問，答案與出處立即呈現。新人報到時，也不必再戰戰兢兢問前輩基本問題，而是能即時取得最新SOP、法規指引與作業流程。這種改變不只是快，而是讓每一個人都能在更低壓、更高品質的環境中工作。

從導入角度來看，AI知識庫也不是遙不可及的龐大工程。依據內容，從需求評估、環境建置、資料清洗到試點上線，大約8到12週即可完成。最好的方式不是一次全面鋪開，而是先從企業最痛、最常發生的問題切入，做小規模試點，快速驗證成效，再逐步複製到全公司。這也是典型的賈伯斯式推進方法：不是先講龐大藍圖，而是先讓人看見第一個具體而驚豔的成果。

最後，真正值得企業思考的，不是要不要跟上AI，而是公司裡那些尚未被系統化的知識，究竟是在默默支撐成長，還是在拖慢每一個人的效率。當知識只停留在少數人腦中，它就是風險；當知識被整理、被萃取、被傳承，它才會成為企業無法被複製的護城河。現在開始規劃AI知識庫，不只是導入一套工具，而是替企業打造下一階段成長最關鍵的引擎。

#AI

#知識庫

[AI 分享] 從零開發AI Agent的十個核心模組

摘要 : 文章整理從零打造AI Agent所需的10項核心能力，涵蓋工具、技能、記憶、上下文等基礎架構。

內容:

分享從零開發一個完整 AI Agent 所需要具備的十個核心技能。這個專案定位為執行在客戶端上的個人 AI 助理，能夠聊天、建立文件、規劃任務，也具備記憶、能力擴展與權限限制等完整 Agent 特性。

一開始先說明，打造 Agent 的基礎不是單純接上一個大模型，而是建立一個 ReAct 迴圈，也就是 Reasoning（推理）與 Action（執行）的反覆流程。當使用者提出需求後，模型先進行判斷，如果需要呼叫工具，就透過工具取得外部資訊，再將結果回傳模型處理；若不需要工具，則直接回覆使用者。這個循環是現代 AI Agent 的基本核心。

第一個重要模組是 Tools。作者認為工具是 Agent 最基礎的能力，相當於讓大模型從只有「大腦」，變成同時擁有手腳與感官。像是讀寫檔案、執行命令、跑腳本、網頁搜尋與抓取網頁等，都是一個可用 Agent 必備的內建工具。沒有這些工具，Agent 只能算是展示型 Demo，難以真正落地使用。

第二個模組是 Skills。Skills 可以理解成技能手冊，目的是讓大模型按照預先定義好的流程、格式、輸入與輸出標準來執行任務，而不是完全自由發揮。這樣能提升結果穩定性，也更符合使用者預期。當 Skills 數量增加後，系統還需要支援技能載入、技能搜尋、技能安裝，甚至讓使用者自行創建 Skills。作者也提到，知Talk 專案會支援社群中常見的標準技能，例如 PDF 處理與內容創作類 Skills。

第三個模組是 Memory，也就是記憶。作者強調，若要做個人 AI 助理，記憶能力幾乎不可或缺。Agent 需要記住使用者的名字、興趣、職業、目標與計畫，不能只停留在單次對話。記憶又可分為短期記憶、長期記憶，以及使用者 Profile。短期記憶主要存在於當前對話，長期記憶則能跨對話保留重要資訊，而 Profile 則記錄使用者的穩定特徵。這些記憶的建立與提取，通常也會透過對應工具來完成，並搭配全文搜尋、語意相關性與時間衰減等策略來進行排序與召回。

第四個模組是 Context，也就是上下文。作者指出，大模型請求本質上是無狀態的，因此每一次請求都必須重新組裝完整上下文，才能讓模型理解當前情境。這裡面不只是單一句使用者輸入，還包括系統提示詞、歷史聊天記錄、工具資訊、技能描述，以及記憶內容等。也就是說，Context 是將 Agent 當下所需的一切資訊，打包後提供給模型，是保證回應品質的重要基礎。

整體來看，這篇內容是一份從實作角度出發的 AI Agent 架構整理。結合正在進行的專案重構經驗，試圖把 Agent 所需能力模組化、系統化，讓想從零開始開發 Agent 的人，能夠更清楚理解整體技術地圖。

[AI 普及] 2026紅杉資本看AI革命：服務化、加速化與個人機會

摘要：AI革命不只是工具升級，而是服務市場重構；關鍵機會在垂直用戶、極簡產品與AI普及落差。

內容:

2026年紅杉資本對AI產業革命的新觀察，以及普通人在這波浪潮中可能抓住的機會。核心觀點是：我們正處在一個「AI普及紅利」的時代，這不只是科技升級，而是一場比過去幾十年更深、更快的變革。

首先，這次AI革命和過去的晶片、網際網路、雲端、手機、新媒體平台等技術浪潮不太一樣。過去多數科技產品本質上是工具或軟體，使用者買回去自己操作；但AI不同，它不只是給你一個工具，而是直接給你一個「會做事的助手」。它可以逐步扮演律師、醫生、會計、助理等角色，因此AI所切入的不只是軟體市場，而是更龐大的服務市場，規模可能高達數兆甚至接近十兆美元。

第二個差異是速度。AI產業的成長與擴散遠比過去的科技公司更快。過去企業做到巨額營收需要多年，但在AI時代，產品、能力、估值與商業化速度都被大幅壓縮。這表示AI不只是重要，而且它正在以極快的節奏改寫產業競爭規則。

第三個差異是，AI不只是改善資訊傳遞，而是在改變「資訊如何被處理」。網際網路解決的是資訊怎麼流通，AI進一步處理的是資訊如何思考、組合、創造。換句話說，它不只是讓世界連得更快，而是讓系統開始具備一定程度的認知與執行能力，對工作方式的改變會更徹底。

AGI（通用人工智慧）其實可能已經在悄悄滲透進人們生活，只是大多數人還沒明確意識到。原因在於，現在的AI已經不再只是簡單問答，而是可以接收任務、從失敗中調整、自己調用工具、持續執行直到完成目標。這種遞迴、自主修正與任務導向能力，已經非常接近人類員工的核心功能。

舉了幾個案例來說明AI帶來的效率躍升：原本需要一個團隊做三年的專案，可能在AI輔助下，一個工程師用幾週到幾個月就能完成；原本要半年重寫核心程式碼的工作，可能一個人一個週末就能推進；甚至大型公司過去需要數百人多年完成的重構任務，如今也能在AI協助下，短短六週內完成。這些例子要說明的是：AI帶來的變化不是未來式，而是已經開始發生。

接著，把重點拉回到「你的機會在哪裡」。這麼大的市場不可能只由少數大公司完全吃下，真正的機會會存在於大公司難以覆蓋的縫隙之中。這裡提出了一個「MAD法則」。

M代表護城河（Moat）。真正的護城河不應建立在技術本身，因為AI技術更新太快，今天領先、明天可能就被淘汰。更穩固的護城河應該建立在用戶關係、信任與垂直場景上。也就是說，圍繞客戶需求打造產品，比圍繞技術本身更重要。尤其在AI時代，被使用者長期信任、理解使用者、持續和使用者互動，才是最不容易被取代的核心能力。

A代表直觀與簡單。好的AI產品不應該讓人感覺複雜，而是要像錘子一樣直覺，讓人一看就知道怎麼用。現在很多AI工具雖然能力強，但介面複雜、學習門檻高，普通使用者根本看不懂，這恰恰就是創業或產品設計的機會。誰能把強大的AI能力包裝成最簡單、最直觀的形式，讓不懂技術的人也能立刻上手，誰就更有機會把產品推向大眾市場。

D代表普及紅利（Distribution / Democratization的概念）。AI能力的進步速度，遠遠快過企業與普通人真正採用它的速度。大量中小企業可能還停留在數年前的數位化水平，因此在最新AI能力與真實市場應用之間，存在一條巨大的落差與鴻溝。這條鴻溝本身，就是最大的機會來源。誰能幫助這些企業與普通人跨過這道門檻，誰就有可能在這一波普及過程中受益最大。

整體來看，想傳達的不是單純的技術興奮，而是一種現實提醒：AI革命已經開始，而且不是只屬於巨頭公司。對個人、創作者、創業者與中小企業來說，真正值得把握的，不是去追逐每一項最前沿技術，而是找到用戶真正需要的場景，把AI變得更簡單、更實用、更容易被普及。這個時代最大的紅利，不只是發明能力，而是讓能力真正走進千家萬戶。

[AI 分享] Codex桌面Agent入門解析

摘要 : Codex不是桌面版ChatGPT，而是能在授權範圍內直接操作電腦檔案的AI Agent。

內容:

如果你平常有在使用 Claude 或 ChatGPT 這類主流 AI 工具，最近大概很難忽略 Codex 的討論熱度。社群上越來越多人在談它，相較之下，Claude 因為前陣子的降質爭議，聲量似乎稍微退了一些。

當團隊中有位完全不會寫程式的營運夥伴，剛開始接觸 Codex 時，第一個反應是：「這不就是放在桌面上的 ChatGPT 嗎？」，但實際上兩者差異很大。ChatGPT 的運作方式，通常是你先把檔案上傳給它，它修改後再由你下載、整理，真正執行工作的人還是你自己，因為它碰不到你的電腦。

Codex 則屬於另一種類型：住在你電腦裡的 Agent。當你提供一個工作環境並授權後，它就能在範圍內自己讀檔案、改檔案、執行工具、產生成品，不需要你反覆做上傳、下載、複製、貼上的中介流程。簡單說，ChatGPT 比較像線上回答問題的助手，Codex 則更像直接在你電腦裡幫你做事的執行者。

這類「住在電腦裡」的 Agent，還可分成桌面 App 與終端機 CLI 兩種。CLI 版本偏工程師使用，本文聚焦在對非技術使用者更友善的桌面 App。文中也提到，像 CloudCode、CloudCode Work 這類產品，本質上與 Codex 類似，都是 OpenAI 與 Anthropic 這兩大陣營推出的 AI Agent 方案。

如果你已經用過 Claude 那邊的相關產品，想單純試試 Codex，其實很適合入門，因為它有免費版本，只要有 ChatGPT 帳號就能使用。就作者個人體驗來說，Codex 在操作流暢度與使用額度上都比 Claude 的 App 更順手，也更划算。

介面方面，Codex 採用直觀的三欄式設計。左邊是對話、專案與設定區，中間是輸入指令的區域，右邊則是結果與預覽。左欄主要包含歷史對話、任務列表、專案資料夾、外掛與設定。如果只是一般提問，可以直接開新對話；但若是處理某個專案中的任務，就應該從專案資料夾旁開新對話，這樣 Codex 才能讀到正確的資料夾與上下文，例如 Agents Markdown 或事先整理好的專案背景資訊。

中間欄是與 Codex 溝通的主要場所。你可以像用 ChatGPT 一樣打字，也可以直接用語音輸入。作者特別強調語音輸入很好用，因為現代很多工作場景都在與 AI 共同寫作，長時間打字其實很容易疲勞，因此他自己大約有 80% 的時間都使用語音操作。

此外，若輸入「@」可以附加專案中的特定檔案給 Codex；輸入「/」則能檢視狀態或指定要用的 Skill。還有一個很實用的功能叫 Fork，也就是分支。每一則回覆下方都可以複製出一條新的對話分支，適合在已經提供完整背景後，針對不同方案同時展開測試。作者把它比喻成平行宇宙，也像是打電動前先存檔，之後不管哪條路走歪了，都能從原點重新開始。

右側區塊則是結果預覽區，你可以查看檔案、資料夾結構，也能預覽它生成的網頁或 HTML 報表。其中最方便的功能之一，是網頁預覽中的視覺化註解。當 Codex 幫你做出一個網頁時，你可以直接在畫面上點選某個元素，例如標題、圖片或區塊，然後直接告訴它「這個標題放大」、「這張圖換掉」、「這個區塊刪掉」。它會回頭修改底層程式碼，再把更新後的結果顯示出來。這讓不懂程式的人，也能透過所見即所得的方式和 AI 協作。

接著，真正關鍵的不只是會打開 Codex，而是要學會駕馭一個能碰你電腦的 Agent。要駕馭它，核心有四個基本功：專案、許可權、上下文，以及 Agents Markdown。

先談「專案」。Project 的概念很簡單：你在哪個資料夾中啟動 Codex，那個資料夾就會變成它的工作區。它只會在這個範圍內讀檔、改檔、新增或刪除內容。因此，若你要辦一場小型講座，就可以先建立一個「講座籌備」資料夾，把活動說明、報名名單、講者介紹、圖片素材、過去的簡報範本都放進去。這一步看似基本，卻是整件事的核心：你不是把整台電腦交給 AI，而是先劃出一塊明確範圍，讓它只在這裡做事。

當你要 Codex 處理某個檔案時，與其只給它一個關鍵字讓它自己去找，不如直接拖入資料夾、貼上完整路徑，或使用「@」附加檔案。否則它可能會在大量檔案中到處翻找，不只變慢，也會白白消耗許多 Token。讓 Codex 在特定專案資料夾中工作，不僅能讓它聚焦，也能降低誤改無關檔案的風險。

而專案資料夾內的整理，其實就是所謂的 Context Engineering，也就是上下文工程。聽起來很專業，但本質上就是把資料分類清楚、命名明確，讓任何剛加入的人——包含 AI——只看資料夾名稱就能快速找到東西。即使沒有 AI，這本來也是好習慣；到了 Agent 時代，這件事只會變得更重要。

第二個重點是「許可權」。這是新手最應該搞懂的地方，因為它直接決定 Codex 在你電腦上能做到什麼程度。文中把 Codex 的權限大致分成三種模式。

第一種是最保守的「要求核准模式」，也就是預設模式。這種情況下，Codex 可以讀檔案、和你討論，但只要它想真的修改檔案或執行指令，都必須先經過你的同意。

第二種是多數人常用的中間模式。它可以在你指定的工作資料夾中，自行讀檔、改檔、執行指令，不必每次都問你；但如果它想碰資料夾外的內容，或是需要連網，就會停下來向你確認。

第三種則是 Full Access，也就是完整存取權。這種模式下，AI 幾乎可以碰整台電腦與網路，不再逐一詢問。在 CLI 世界裡，這甚至有個別名叫 YOLO 模式，意思是「反正人生只有一次，直接衝」。作者明確提醒，不建議新手一開始就亂開，因為權限越高，雖然越省事，但如果你還不理解它的行為邏輯，風險也會成倍增加。

作者也建議，不必一開始就糾結該選哪一種模式。更聰明的做法，是先從保守模式開始，讓它多問你幾次。當你逐漸理解它會怎麼做、什麼情境下會跳出詢問視窗後，再視情況放寬權限。如果真的被提示視窗問到很煩，也可以在當下直接切換到更高權限，或選擇在這次工作階段中不再詢問。

等你熟悉之後，確實也可以直接開 Full Access 來換取流暢體驗，但前提是要搭配 Agents Markdown 做限制。例如可以明確寫下「不要刪除原始檔」這類規則，讓它即使擁有高權限，也不會隨意執行不可逆操作。

整體來看，這篇內容的重點不只是介紹 Codex 好不好用，而是幫非技術使用者建立一個正確觀念：Codex 不是單純的聊天機器人，而是一個可以直接進入工作環境、代你執行任務的 AI Agent。也因此，真正重要的不是會不會下指令，而是你能不能設好專案邊界、整理好上下文、理解權限風險，並用規則把它駕馭好。

2026年6月15日星期一

[AI 分享] Loop Engineering：AI程式設計的新範式

摘要：Loop Engineering強調用自動化閉環指揮AI工作，正逐步取代單純提示詞與harness思維。

內容:

近來矽谷AI圈開始出現一個新名詞：Loop Engineering。相較於過去大家熟悉的 prompt、context，甚至是近年熱門的 harness engineering，loop 更強調的是讓AI不只是被動執行指令，而是能在一個自動化閉環中持續工作、分派任務、檢查結果與自主改進。

從演進脈絡來看，Prompt 解決的是「如何一次把需求說清楚」；Context 解決的是「要提供AI哪些背景資訊」；Harness 則是替 agent 建立執行環境。如果說 harness 是為AI打造一台能開的車，那 loop engineering 就像是幫這台車裝上自動駕駛系統，讓它知道何時啟動、如何行動，以及怎麼驗收成果。

真正的 loop，不只是反覆執行而已，而是一套由「目標、度量、決策、行動」構成的自主改進閉環。它能根據當前觀察到的狀態，自行決定下一步該做什麼，甚至安排下一次何時再啟動。這也是它與一般自動化腳本最大的不同。

要搭建一個有效的 loop，需要五個核心元件，再加上一個記憶底座。第一是自動化，它是整個系統的心跳，不只能定時執行，更重要的是能依條件觸發，例如直到測試全數通過、程式碼規範檢查完成才停止。第二是 WorkTree，用來為多個AI提供各自獨立的工作目錄與分支，避免並行開發時發生檔案衝突。

第三是技能。由於AI每次啟動時都像重新開始，如果沒有事先定義的技能與規範，它每輪都可能重複摸索專案規則。技能就像是一份外掛式的員工手冊，能清楚寫出專案約定、建置步驟與操作方式。第四是聯結器，透過像 MCP 這樣的協議，AI得以接入資料庫、外部工具與通知系統，從只能處理本地檔案，升級為可以串連真實工作流程。

第五是 subagents，也就是將不同角色拆開處理。在無人值守的環境中，不能讓同一個AI既負責寫程式又負責審查，否則容易失去客觀性。較好的做法是由一個AI負責生成內容，另一個AI負責依照規格驗證與審核。第六個要素則是狀態記憶，這份記憶通常需要落在磁碟上，例如以 markdown 文件記錄待辦與已完成事項，讓系統在中斷後仍能無縫接續。

不過，loop engineering 並非萬能，最大的風險在於失控。如果你的系統缺少能夠對AI說「停止」的硬性機制，它就可能變成一座無情的 token 焚燒爐，在無限迴圈中持續產出看似合理、實則品質低落的垃圾程式碼。無人職守的系統，也可能無人職守地犯錯。

另一個值得警惕的問題是認知降級。當AI交付成果的速度越來越快，人類對程式碼實際狀態的理解卻可能逐漸落後。如果開發者只是全盤接受AI產出，卻不持續檢驗與思考，最終很可能導致程式碼品質惡化。無論流程多自動化，驗證責任始終還是在人的身上。

在實務上，最適合導入 loop 的任務，通常是 bug 修復或需求邊界明確的新功能開發。這類工作有清楚的驗收標準，適合形成可控的小閉環。相反地，像是「幫我優化整體系統架構」這類過於抽象的任務，若直接交給 loop 處理，往往只會讓專案快速失控。

總結來說，harness 是讓AI有工具可用，而 loop 則是讓AI工作流程真正自動運轉。未來AI程式設計的競爭力，可能不再只是誰更會下提示詞，而是誰更懂得設計高品質、可驗證、可持續運作的迴圈系統。與其當AI的打字員，不如成為 loop 的架構師。

2026年6月14日星期日

[AI 分享] RAG檢索最佳化全解析

摘要 : RAG效果關鍵不在模型本身，而在檢索設計。本文整理多種最佳化策略、原理、優缺點與適用場景。

內容:

很多人以為RAG只是「查資料＋生成答案」，只要接上 embedding 和 LLM 就算完成，但真正上線後常會遇到檢索不準、上下文斷裂、回答品質不穩定等問題。其實，RAG 系統之間 90% 的效果差距，往往就藏在檢索策略的設計裡。

這篇內容系統性整理了多種 RAG 最佳化方法，從最基礎的 Simple-RAG 開始，一路講到語意切分、重排序、文件增強、上下文壓縮、使用者回饋迴圈，以及知識圖譜等進階方案，幫助讀者理解工業級 RAG 系統到底是怎麼設計的，也能作為面試、競賽與實務落地的參考。

最基礎的方法是 Simple-RAG。它的邏輯很直接：先把原始文件切成多個 chunk，將每個 chunk 向量化後存入向量資料庫；當使用者提問時，再把 query 轉成向量，找出最相近的 chunk，交給模型生成答案。這種方法實作簡單、成本低，但常用的固定長度硬切分會直接把句子或段落攔腰截斷，破壞語意完整性，因此在真實場景中效果有限。

為了解決硬切分的問題，進一步有了語意切分（Semantic Chunking）。這種方法不是按固定字數分塊，而是根據相鄰句子之間的語意相似度來決定是否切分。當主題一致時就合併成同一塊，主題轉折明顯時再切開。這樣可以讓每個 chunk 的內部語意更完整，提升模型理解能力，但仍然可能因 chunk 太小而失去更大的上下文。

接著是 Small-to-Big Retriever，核心概念是「用小塊查、用大塊答」。系統先用細粒度的小塊做精準檢索，找到最相關的內容後，再映射回所屬的父段落或更完整的大塊，提供給模型生成答案。這種方式同時兼顧檢索精度與上下文完整性，是實務上非常有效的一種平衡方案。

另一種較輕量的做法是 Context-Enriched Retrieval，也就是上下文增強檢索。當系統找到最相關的 chunk 後，不只回傳它自己，也把它前後相鄰的 chunk 一起帶回。這能補足孤立句子的語境，幫助模型理解前因後果。它的優點是結構簡單、容易整合進現有流程，能有效降低資訊片段化的問題。

文件增強（Document Augmentation）則是換一個角度思考：既然最終都是要回答問題，那在建立索引時，不如就為每個 chunk 額外生成可能對應的問題。換句話說，除了存文本，也存「這段內容可能被怎麼問」。這能讓查詢和文件之間的匹配更貼近使用者真實提問方式，因此在高精度需求場景中特別有價值，雖然代價是需要更多計算資源。

如果相關資訊並不是散落在單一 chunk，而是分布在連續段落中，就可以使用基於滑動視窗的連續片段檢索策略。這種方法會先找出高分 chunk，再以它們為中心，向前後延伸一定範圍，用加權方式計算整段連續內容的綜合分數，最後回傳得分最高的完整片段。這對法律文件、科研論文、長篇報告等需要跨段理解的場景特別有效。

在實際檢索結果中，常常還會夾雜大量無關內容，因此上下文壓縮也是非常重要的一步。做法是利用大模型對召回內容進行篩選、提煉與壓縮，只保留與查詢直接相關的資訊。這樣不只可以減少 token 浪費，也能降低背景噪音對最終回答的干擾，讓生成更聚焦、更準確。

除了靜態最佳化，內容中也提到一個更動態的方向：基於使用者反饋的 Feedback Loop。系統在回答後收集使用者的評分與評論，再將這些反饋結構化儲存，逐步調整文件權重與排序方式。簡單說，就是讓系統記住哪些內容過去曾經幫助使用者獲得好答案，未來遇到類似問題時就優先召回。這種方法雖然設計較複雜，但代表了 RAG 從靜態檢索走向持續學習的重要方向。

Self-RAG 則進一步讓系統具備「先判斷、再檢索」的能力。當使用者提問時，模型會先評估自己是否能直接依靠內部知識回答；若不確定，再啟動檢索流程。檢索回來後，也不是直接使用，而是再評估哪些內容真正相關、哪些只是表面關鍵詞相似。這種方法能減少不必要的檢索成本，也能提升回答可靠性，特別適合對正確性要求高的場景。

最後，內容也談到了知識圖譜型的 RAG 設計。這種做法會把資訊轉換成節點與邊，構成圖結構來表示人物、概念、事件與它們之間的關係。當使用者提問時，系統不只是找文字片段，而是沿著關係圖進行查詢與推理，因此特別擅長處理跨文件、跨章節、具關聯性的複雜問題。這代表 RAG 不只是做文字匹配，而是朝向結構化知識理解與推理發展。

整體來看，這篇內容的核心觀點非常明確：RAG 的真正競爭力，不在於是否接上 LLM，而在於檢索策略是否足夠成熟。從硬切分到語意切分，從局部檢索到上下文補全，從靜態索引到反饋學習，從純文本搜尋到知識圖譜推理，每一種策略都在解決不同層面的檢索問題。

如果你正在做畢業設計、參加 AI 競賽、準備面試，或想打造可落地的企業級 AI 系統，這些 RAG 最佳化方法都不是可有可無的附加技巧，而是直接決定系統效果上限的核心能力。

[AI 分享] RAG知識客服原理拆解

摘要 : 解析RAG核心流程，從文件分片、向量化到召回生成，理解知識庫問答如何落地。

內容:

RAG 是 Retrieval Augmented Generation 的縮寫，中文通常翻成「檢索增強生成」。它的核心概念其實不複雜，就是先從資料中找出和問題相關的內容，再根據這些內容生成答案。因此，RAG 目前被廣泛用在知識助手、企業客服與智慧問答系統中。

如果想打造一個能回答公司產品問題的智慧客服，單靠大模型本身是不夠的。因為模型並不知道企業內部的產品資料、操作手冊或規範文件。乍看之下，好像只要把整本手冊連同問題一起丟給模型就行，但這樣做會遇到幾個明顯問題，包括模型的上下文視窗有限、輸入成本過高，以及推理速度會明顯變慢。尤其當文件長達上百頁甚至上千頁時，模型不但無法穩定吸收全部資訊，回答品質也會受到影響。

RAG 的價值就在這裡。它不會把整份文件全部交給模型，而是先將文件切成多個片段。當使用者提出問題時，系統會先在這些片段中找出最相關的內容，只把少量真正有用的片段連同問題一起交給模型。這樣一來，模型看到的資訊更聚焦，不但能降低成本，也能提升回答速度與準確率。

整體來看，RAG 流程大致可分成兩大部分。第一部分是提問前的資料準備，也就是先把文件處理好，這通常包含「分片」與「向量化儲存」。第二部分是提問後的回答流程，會依序經過「召回」、「重排」與「生成」等步驟。這些環節彼此配合，才能讓系統在大量知識中快速找到最適合回答問題的內容。

所謂分片，就是把一整份文件拆成多個小段落。切分方式可以很多元，例如依字數切分、依段落切分、依章節切分，甚至依頁碼切分。切分的目的，是讓後續檢索能更精準地定位內容，而不是每次都處理一整本文件。片段切得是否合理，會直接影響後續問答品質。

完成分片後，下一步就是把每個片段做 Embedding，也就是將文字轉換成向量。這個步驟會把文字內容映射成一組數值，讓電腦能從數學角度理解文本之間的語意關係。之後，系統會把原始片段內容以及對應的向量一起存進向量資料庫中，作為後續檢索的基礎。

向量本身是數學概念，可以理解為一串有方向與大小的數值。雖然在 RAG 中使用的向量通常維度很高，無法直接視覺化，但它能有效承載語意資訊。通常維度越高，向量所能表達的細節也越豐富，因此在語意理解與比對上會更可靠。

Embedding 的重點，在於讓語意相近的文本轉成彼此接近的向量。例如「馬克喜歡吃水果」與「馬克愛吃水果」意思很接近，因此轉換後的向量距離也會很近；而像「天氣真好」這類無關句子，其向量就會離得比較遠。正因如此，當使用者提出問題時，系統也能先把問題轉成向量，再透過向量相似度去找出語意最接近的知識片段。

而所謂向量資料庫，簡單來說，就是專門用來儲存文字片段與其向量，並支援快速相似度搜尋的資料庫。它的作用不是取代原始文本，而是幫助系統在龐大知識中快速找到相關內容。因此，實際儲存時，通常會同時保留文字內容與向量表示，方便後續召回與生成階段使用。

總結來說，RAG 的核心不是讓模型直接讀完所有資料，而是先把知識拆解、向量化、儲存起來，等到使用者發問時，再從大量片段中找出最相關的資訊交給模型回答。這樣的設計，正是現代高品質知識客服與企業知識庫系統能夠落地的關鍵。

[AI 分享] 三句話建立陌生客戶信任

摘要 : 用三句黃金溝通法，從推銷者轉為顧問，快速建立信任，提升陌生客戶成交與長期合作機會。

內容:

很多銷售都遇過一個常見問題：加了客戶好友、發完產品介紹後，對方就不再回應，整段溝通直接中斷。問題往往不在產品，而是在溝通方式。當銷售只是一味發資料、講產品，站在客戶角度看，這其實更像是沒有鋪墊的廣告推送，容易讓人產生防備，甚至直接忽略。

真正能持續成交、建立長期客戶關係的人，靠的不是硬推銷，而是思維上的轉變。關鍵在於，從「我想賣東西給你」的推銷者角色，轉換成「我能幫你解決問題」的顧問角色。當客戶感受到你不是來賺他錢，而是真心想幫助他，他才會放下戒心，願意交流，進而產生信任。

想快速和陌生客戶建立信任，可以運用一套「三句黃金溝通法」，讓對話自然推進，逐步完成破冰、認同與信任建立。

第一句話的重點，是讓客戶感受到你對他的專屬關注。不要一開口就用制式化的自我介紹，而是先透過客戶的動態、產業資訊、公司近況等公開內容，找到具體細節作為切入點。當你能說出你觀察到的內容，客戶會明顯感受到你不是群發廣告，而是有做功課後的針對性交流。這時再適度放低姿態，表明只是想交流、互相學習，就能有效降低對方的防備心。

第二句話的核心，是展現你的專業，幫客戶點出他可能尚未明確意識到的問題。很多客戶即使有困擾，也不一定會主動說出來，甚至他自己都還沒完全理清問題在哪裡。這時，優秀的銷售應該像顧問一樣，根據對方的行業、職位與情境，直接列出幾個常見的高頻痛點，讓客戶用選擇題的方式回應。這樣不但降低溝通成本，也更容易讓客戶產生共鳴。一旦你精準說中他的處境，對方就會開始認可你的專業，願意進一步打開話題。

第三句話的重點，是透過真實案例證明你有解決問題的能力。客戶不會因為你把產品功能講得多厲害就買單，他真正關心的是：你能不能幫我改善現況，能不能帶來實際成果。因此，比起空談優勢，更有效的方法是分享一個與客戶背景相似的真實案例。這個案例最好能清楚呈現客戶原本的困境、你採取的解決方法，以及最後得到的具體成果。當客戶從案例中看到和自己相似的情境，就更容易代入，也更能建立信任。

在這三句話之後，記得用開放式提問作為收尾，把選擇權交還給客戶。不要施壓，也不要急著成交，而是讓對方有空間思考，主動表達需求。這樣的溝通方式，會讓整個過程更自然，也更容易讓客戶產生合作意願。

整體來說，這套方法的邏輯很清楚：第一句先破冰，讓客戶願意聊；第二句展現專業，讓客戶願意信；第三句用案例佐證，讓客戶願意合作。當你不再只關注產品，而是開始關注客戶、問題與結果，你在客戶心中的角色就會從業務員，逐漸變成值得信任的合作顧問，陌生客戶也更有機會轉化為長期穩定的合作對象。

訂閱：文章 (Atom)

2026年6月16日 星期二

2026年6月15日 星期一

2026年6月14日 星期日

2026年6月16日星期二

2026年6月15日星期一

2026年6月14日星期日