C# .NET Blazor MAUI Xamarin Research: 7月 2026

2026年7月22日星期三

[AI 分享] Apple 憑證與描述檔設定流程

摘要 : 整理 Apple Developer 中 CSR、憑證、App ID 與 Profile 的建立與安裝流程。

內容:

本文主要整理 Apple Developer「Certificates, Identifiers & Profiles」的操作流程，目的是完成 iOS App 簽署所需的身分識別、憑證與描述檔設定。

首先需在 Mac 的「鑰匙圈存取」中建立 CSR（憑證簽署要求）。開啟「鑰匙圈存取」後，不要先選任何項目，從上方選單進入「憑證輔助程式」並選擇「從憑證授權要求憑證」。電子郵件可隨意填寫，一般名稱則建議填入易識別名稱，勾選「儲存到磁碟」後匯出 .certSigningRequest 檔案，通常會儲存在桌面。

接著可視情況處理 CSR 對應的本機憑證。雙擊剛建立的 CSR 後，系統會跳出憑證輔助程式視窗，可使用預設選項替自己製作憑證。完成後，可在「鑰匙圈存取」的「密鑰」頁籤看到公私鑰，在「憑證」頁籤看到憑證；若未立即顯示，可嘗試關閉後重新開啟鑰匙圈存取。

若使用的是院方或第三方提供的憑證，則需向對方索取 p12 私鑰檔與其開啟密碼，並匯入到鑰匙圈中。完成這些步驟後，才能取得可用的簽署身分識別。

在 Apple Developer 後台中，登入後切換到目標帳號，進入「Certificates」頁面新增憑證。依需求選擇 Development（開發用）或 Distribution（部署用）類型，接著上傳前面產生的 CSR 檔並完成建立。建立成功後下載 .cer 憑證檔，雙擊安裝至 Keychain Access，安裝後通常會顯示類似「iPhone Distribution: Name (Team ID)」的項目。

之後需在「Identifiers」中新增 App ID。進入該頁後按下新增，選擇 App IDs 與 App，填寫辨識名稱與 Bundle ID，並依 App 功能需求勾選對應能力，確認後註冊即可完成。最後到「Profiles」中新增描述檔，依用途選擇 Development、Distribution 或 In House，指定對應 App ID 與憑證；若為 Development，還需選取要加入的測試裝置。命名 Profile 時建議加上用途或開發工具名稱以利辨識，產生後下載 .mobileprovision 並安裝，即可供 Xcode 或其他開發工具使用。

[AI 分享] Google AI開發框架Day1重點

摘要 : Google將AI開發共識整理成框架：vibe coding、agentic engineering、context engineering與token成本思維。

內容:

現在有大量專業開發者已經在使用AI Coding Agent，甚至相當比例的新程式碼已由AI產生。但「vibe coding」與「agentic engineering」這些詞經常被混用，導致討論失焦。Google近期推出五天AI開發課程，嘗試把業界逐漸形成的共識整理成正式框架，而這段內容主要濃縮的是Day1的核心觀念。

首先，vibe coding與agentic engineering不是非黑即白，而是一條光譜。從低結構性的vibe coding，到中間的structured AI-assisted coding，再到高紀律的agentic engineering。差異不在於有沒有用AI，而在於AI輸出的規格化程度、驗證方式，以及人類是否設下邊界與判斷機制。像是原型開發可以偏向vibe coding，但若是金流、正式API等高風險場景，就必須走向agentic engineering。

這條光譜上最關鍵的分水嶺是「驗證」。Google強調，沒有tests與evals，再精緻的prompt本質上仍然只是vibe coding。tests用來驗證可確定的輸入輸出，evals則檢查agent的路徑、工具使用與最終品質是否符合標準。換言之，真正成熟的AI開發，不是讓AI一直試錯，而是把驗證系統先建立起來。

若想從vibe coding走向agentic engineering，真正該強化的不是prompt engineering，而是context engineering。這可以理解成替AI做完整的入職訓練：除了任務本身，還要提供角色邊界、領域知識、記憶、範例、可用工具與硬性約束。這些context又可分為static與dynamic兩種：前者穩定但昂貴，後者彈性且省token，但必須設計好何時載入，這本身就是架構決策。

在dynamic context管理上，課程特別強調agent skills的重要性。與其把所有知識都塞進system prompt，不如讓agent先保持通用，只有在任務匹配時才載入對應skill，這種做法稱為progressive disclosure。它能讓同一個agent帶著多種專業能力，但只在需要時支付token成本。同時skills也應持續迭代、模組化維護，避免過大、難追查，否則一旦輸出失準，很難找到是哪個skill造成偏差。

最後，AI正在重塑整個SDLC，也就是軟體開發生命週期。真正被大幅壓縮的是implementation，寫程式可能從數週縮到數小時；但需求訪談、架構決策與品質驗證，多數仍由人主導。因此，AI不是單純讓舊流程加速，而是讓流程邊界變模糊、迭代週期縮短，並把spec品質、context設計與驗證系統，推升為新的核心競爭力。越早建立這些工作系統的人，後續使用AI的效率與成本通常都會更有優勢。

2026年7月21日星期二

[AI 分享] GPT 5.6 模型選擇指南

摘要 : GPT 5.6 新增多層選項，重點是先選模型，再選思考深度，必要時才用 Ultra 與 Max。

內容:

GPT 5.6 發布後，許多人第一時間感到困惑，因為模型選項一下子變得很多。除了 Luna、Terra、Soul 這三種模型，還有 Low、Medium、High、XIGH、Max，以及 Ultra 等設定。過去使用 ChatGPT 時，多半只需要思考怎麼提問，現在則變成提問前還要先做一輪選擇。

首先可以把 GPT 5.6 的三種模型，理解成三種不同的交通工具。Luna 像電動車，速度快、成本低，適合大量且重複性的任務，例如翻譯、整理會議記錄、批次生成標題、提取表格資訊、客服分類，或快速回答簡單問題。這類任務重點在效率與規模，不需要模型花太多時間深度思考。

Terra 則像家用汽車，在效能、速度與成本之間取得平衡。大多數日常工作直接選 Terra 就足夠，例如撰寫一般文案、分析資料、製作方案、修改程式碼、處理工作文件等。這些工作需要一定思考，但還不到必須動用最強模型的程度，因此 Terra 是最適合多數場景的通用選擇。

Soul 像專業工程車，適合處理困難程式設計、複雜研究、重要決策，以及對成果品質要求很高的任務。例如排查隱藏很深的程式故障、分析大量資料、設計完整商業方案，或處理錯誤代價特別高的工作。簡單來說，第一層選擇可以記成：簡單大量選 Luna，日常多數任務選 Terra，複雜重要任務選 Soul。

第二層選擇是 Low、Medium、High、XIGH 和 Max。這些並不是不同模型，而是模型願意花多少時間思考的設定。可以把它想像成同一位員工，在五分鐘內交答案，和花一小時檢查資料後再交答案，品質自然可能不同。Low 適合簡單且追求速度的任務；Medium 是最均衡的預設檔位；High 和 XIGH 適合需要認真分析、檢查，以及多步推理的問題。

至於 Max，它代表讓模型盡可能多花時間處理任務，但並不適合長期開啟。因為思考時間越長，等待時間與使用成本通常也會增加。若只是簡單任務卻開 Max，就像找一個專家團隊開三小時會議，只為了修改一句標題，明顯不划算。OpenAI 的建議也是先從 Medium 開始，只有在實測發現 High 或 XIGH 能明顯提升品質時，再往上調整；Max 則留給最困難、且品質優先的任務。

第三層是 Ultra。Ultra 和 Max 並不是同一種概念。Max 是讓單一模型思考更久，而 Ultra 更接近同時派出多個 AI 智慧體並行工作。官方預設會協調四個智慧體，讓它們分別處理不同方向的內容，再整合成最終結果。舉例來說，如果要做一份行業研究，可以讓一個智慧體研究市場規模，一個分析競爭對手，一個整理技術趨勢，另一個負責檢查結論，最後統一生成報告。這種可以拆分成多個獨立部分的任務，Ultra 才能發揮價值。若只是翻譯一句話，或問明天穿什麼，使用 Ultra 幾乎就是浪費算力。

另外，也提醒開發者一個常見陷阱：在 API 中如果直接呼叫 GPT 5.6 這個名稱，實際上通常會指向 Soul，而不會依照任務自動幫你切換 Luna、Terra 或 Soul。也就是說，如果以為系統會自動選最划算的模型，實際上可能每個簡單任務都在用成本最高的 Soul。

在成本方面，若以相同輸入 100 萬 token、輸出 100 萬 token 來計算，Luna 大約是 7 美元，Terra 約 17.5 美元，Soul 約 35 美元。也就是說，Soul 的成本大約是 Luna 的 5 倍。雖然實際費用還會受到輸出長度與執行效率影響，但在大量任務情境下，選錯模型會帶來很明顯的成本差距。

最後，文中整理出一套簡單的選擇公式。第一步，如果什麼都不確定，就先選 Terra 加 Medium。第二步，如果任務需要更快、更便宜，或是批次處理，就改用 Luna。第三步，如果任務困難、重要，或做錯代價很高，就換成 Soul。第四步，如果模型能力足夠，但回答仍不夠深入，再把 Medium 提高到 High 或 XIGH。第五步，只有當任務可以拆成多個獨立方向並行處理時，才考慮使用 Ultra。至於 Max，則保留給那些願意多等一會，也一定要追求高品質結果的困難任務。

整體來看，GPT 5.6 增加的不只是模型能力，也增加了使用者的選擇成本。未來使用 AI，不只是問哪個模型最強，還要進一步思考兩件事：這個任務做錯的代價有多大，以及這個任務能不能拆開並行完成。只要先想清楚這兩點，Luna、Terra、Soul、Max 與 Ultra 的選擇其實就不會那麼複雜。

[AI 分享] ChatGPT全面升級

摘要 : 全新ChatGPT可串接工具、執行自動化、分析資料、產出內容並協助除錯，從問答進化為真正能代辦工作的助手。

內容:

OpenAI 發表全新版本的 ChatGPT，涵蓋網頁、桌面與手機平台，重點不再只是回答問題，而是能串接使用者常用工具，直接接手實際工作。像是讀取行事曆、Slack、雲端硬碟等資訊，幫忙整理當日重點與會議準備事項。

新版也支援外掛與自動化任務。外掛可連接各種應用程式，或提供銷售、數據分析、行銷等角色導向流程；同時，使用者可以設定固定任務，例如每天早晨自動提供工作簡報，或持續追蹤特定賽事比分，不必每天重新下指令。

在跨裝置使用上，ChatGPT 可於網頁、手機與桌面之間無縫延續工作。桌面版更可結合本機檔案與專案內容，讓使用者先交付任務、提供背景資料，再等待 ChatGPT 完成或回報進度，提升整體工作流效率。

展示案例中，ChatGPT 先被用於行銷場景：根據品牌 Logo 與規範生成視覺素材、發想廣告方向、建立 mood board，甚至整理成簡報供團隊檢視，大幅縮短創意探索與提案準備時間。

在資料分析場景裡，ChatGPT 能整合分散於不同來源的指標、用戶回饋、團隊對話與上市計畫，自動套用合適分析流程，找出關鍵問題，並進一步生成儀表板、加上摘要說明、發布成網站，還可設定每日自動更新後分享給團隊。

工程應用方面，整合進 ChatGPT 的 Codex 可協助定位並修復程式問題。若沒有專屬外掛，ChatGPT 甚至可直接操作電腦或瀏覽器，模擬使用流程、檢查錯誤、確認問題來源，最後提出修正程式碼 diff 與 PR。整體而言，這次升級將 ChatGPT 從對話工具推進為能在應用、專案、瀏覽器與電腦中實際執行工作的 AI 助手。

[AI 分享] ChatGPT Work重塑辦公流程

摘要 : ChatGPT Work不只是聊天工具，而是讓AI正式進入整理、起稿與跟進等日常辦公流程。

內容:

OpenAI推出的ChatGPT Work，不只是讓AI多回答幾個問題，而是進一步讓AI參與真實的辦公流程。如果只是把它當成聊天工具，其實沒有真正發揮它的價值。

對一般使用者來說，可以先從三類工作開始使用。第一類是整理資料，例如會議記錄、客戶回饋、產品資訊與行業文章，交給AI協助歸納重點，並整理成表格或文件。

第二類是生成初稿，像是方案彙報、電子郵件、PPT大綱等，都可以先讓AI產出第一版。重點不是要求AI一次完成，而是先幫你搭好初步框架，再由人進一步修改完善。

第三類是持續跟進，例如每週更新專案進度、整理新資訊、提醒哪些事項尚未處理。這類持續性工作，才是AI在辦公場景中真正能長期發揮價值的地方。

ChatGPT Work的意義，不在於一鍵取代所有工作，而是先接手那些重複整理、初稿搭建與進度追蹤等耗時工作，幫助使用者節省時間、提升效率。

因此，最值得關注的不只是OpenAI推出了一項新功能，而是它提醒了所有普通人：未來會使用AI辦公的人，與不會使用的人之間，效率差距只會越來越明顯。

2026年7月20日星期一

[AI 分享] 精簡Prompt反而更強

摘要 : OpenAI最新指南指出，面對新一代模型，Prompt不一定越長越好，清楚定義目標、邊界與輸出，往往比堆疊規則更有效。

內容:

許多人以為模型越強，Prompt就要寫得越複雜，但OpenAI最新官方指南反而提出相反觀點：對GPT5.6這類新模型來說，問題往往不是Prompt寫太少，而是寫太多。許多長期維護的System Prompt像不斷補丁的舊程式，累積了過時、重複甚至矛盾的規則，讓真正重要的資訊被埋沒，也增加模型理解與判斷成本。

OpenAI在內部Coding Agent評測中發現，改用更精簡的System Prompt後，模型評分提升約10%到15%，總token減少41%到66%，成本下降33%到67%。雖然這些結果不能直接套用到所有場景，但至少說明一件事：Prompt長度和效果並非正比，更多指令不一定帶來更好控制，反而可能製造噪聲。

這份指南的核心邏輯是：不要替模型規劃每一步，而要清楚說明你真正想得到的結果。對多數任務來說，只要交代四件事就夠了：目標、上下文、輸出與邊界。與其把任務拆成繁瑣流程，不如直接描述成品要給誰看、重點是什麼、哪些內容不能動。只有當過程本身會影響結果，例如合規、財務或實驗分析時，才需要明確規定步驟。

減少流程控制不等於放棄控制，真正該寫清楚的是成功標準與行動邊界。像是哪些資料只能讀不能改、郵件只能產生草稿不能直接寄出、預算和日期不能變更、資訊不足時要明確標示，這些具體限制比反覆強調「務必小心」更有效。因為模型有能力做某事，不代表使用者已授權它真的去做。

在工具與檢索方面，原則也相同：只提供當前任務真正相關的工具，說明要短而準，讓模型知道工具用途、適用場景、回傳內容與失敗意義。若需要最新資訊，就要求使用搜尋；若需要可驗證性，就要求保留來源。重點是告訴模型去哪裡找、找什麼，而不是替它寫死每一步搜尋流程，否則容易陷入不斷搜尋卻沒有增加有效成果的低效狀態。

對一般使用者來說，最實用的做法是先用自然語言提出需求，再根據結果逐步修正，而不是一開始就追求完美Prompt。長期偏好和單次任務需求也應分開管理；簡潔、友好、專業等抽象詞，最好改寫成具體要求。至於推理強度，也不是越高越好，如果目標、材料與驗證方式本來就不清楚，只會讓模型花更多成本思考一個模糊問題。最終，Prompt工程的核心不是堆疊術語，而是減少歧義，並在可能情況下加入實際驗證。

RAG 不只一種：一次看懂 16 種 RAG 架構與應用場景

談到生成式 AI，RAG（Retrieval-Augmented Generation，檢索增強生成）已經成為企業導入大型語言模型時的重要技術。它的核心概念並不複雜：在大型語言模型回答問題之前，先從外部資料來源檢索相關資訊，再將找到的內容與使用者問題一起交給模型生成答案。

這種「先找資料，再回答問題」的設計，可以補足大型語言模型知識過時、無法掌握企業內部資訊，以及容易產生幻覺等缺點。不過，RAG 並不是一套固定不變的架構。隨著資料型態、任務複雜度、即時性、隱私、產業規範與系統規模不同，RAG 已逐漸發展成一系列可以組合使用的設計模式。

本文整理 16 種常見的 RAG 類型，說明它們的核心機制、主要價值、適用情境與導入時應注意的問題。

需要先說明的是，這 16 種類型並不是業界統一認證的正式分類標準。其中有些屬於技術架構，有些是檢索策略，有些則是應用情境。實務上，它們通常不是互斥選項，而是可以疊加組合。

一、Standard RAG：最基礎的檢索增強生成

Standard RAG，也就是標準 RAG，是大多數企業建立知識庫問答系統時的起點。其基本流程是將文件切割成多個段落，轉換為向量後存入向量資料庫。當使用者提出問題時，系統先找出語意最相近的文件片段，再將這些內容交給大型語言模型產生答案。

早期 RAG 論文曾提出 RAG-Sequence 與 RAG-Token 等生成方式，但現代企業系統所稱的 Standard RAG，通常泛指單次查詢、單次檢索與單次生成的基本架構。

這種方式的優點是實作相對簡單，能快速建立概念驗證版本，也能讓模型回答企業內部文件、產品手冊、FAQ 或制度規章等問題。常見工具包括 Hugging Face Transformers、LangChain、LlamaIndex及各種向量資料庫。

不過，標準 RAG 對複雜問題的處理能力有限。如果問題需要多次查詢、跨文件推理、工具操作或權限判斷，單次檢索通常不足以產生可靠答案。

二、Agentic RAG：讓 AI 主動決定下一步

Agentic RAG 在傳統 RAG 之上加入 AI Agent 的自主決策能力。系統不再只是收到問題後直接搜尋，而是先分析使用者的意圖，再決定是否需要檢索資料、使用哪一個資料來源、呼叫哪些工具，以及是否需要進一步查證。

例如，使用者詢問某份維護合約今年應開立多少發票時，Agentic RAG 可以先查找合約文件，再擷取金額、履約期間與付款條件，接著呼叫計算工具完成分期與稅額計算，最後將結果整理成表格。如果資料不足，它還可以主動要求使用者補充。

Agentic RAG 適合研究助理、企業工作助理、進階客服、合約處理、財務分析及跨系統工作流程。不過，它的成本、延遲與系統風險也高於標準 RAG，因此必須加入工具權限、操作稽核、流程限制及人工覆核機制。

三、Graph RAG：從文件片段進一步理解知識關係

傳統向量檢索擅長找出語意相似的內容，卻不一定能掌握人物、組織、產品、事件與文件之間的關係。Graph RAG 透過知識圖譜建立實體與關聯，讓系統不只知道「哪些內容相似」，也能理解「哪些事物彼此有關」。

例如，在醫療情境中，可以建立病人、診斷、藥物、檢驗、手術與時間之間的關係；在合約管理中，則可以連結客戶、專案、合約、服務項目、付款期程與負責部門。

Graph RAG 特別適合法律、醫療、製造、工程與組織知識管理等關係複雜的領域。常見技術包括 Neo4j、Stardog、Apache Jena，以及結合知識圖譜與大型語言模型的 Graph RAG 框架。

它的主要挑戰是建置成本較高。實體抽取、關係定義、資料更新及圖譜治理都需要持續維護，並不是導入圖形資料庫就能自然獲得正確推理能力。

四、Modular RAG：將 RAG 拆成可替換的模組

Modular RAG 將文件解析、資料清洗、分段、索引、查詢改寫、檢索、重新排序、權限過濾、生成與結果驗證拆成不同模組。每個模組可以獨立調整或替換，不必將整套系統綁死在單一框架上。

這種設計適合大型企業、多人協作或需要長期演進的產品。例如，企業可以先使用一般向量模型，未來再替換成適合繁體中文或特定產業的模型；也可以針對不同資料來源使用不同解析流程。

微服務、Docker、Kubernetes與事件訊息平台可以支援模組化架構，但它們只是工程工具，並不等於 Modular RAG 本身。真正的重點在於介面標準化、模組邊界與可替換性。

模組化能提高擴充性，但也會增加部署、監控、版本管理與系統整合的複雜度。因此，小型概念驗證不一定需要一開始就採用完整微服務架構。

五、Memory-Augmented RAG：讓系統記得過去

Memory-Augmented RAG 加入外部記憶機制，使系統可以保存並檢索過去的對話、使用者偏好、任務狀態或重要決策。

記憶通常可以分成短期記憶與長期記憶。短期記憶用來維持目前對話的連續性；長期記憶則可能保存使用者習慣、過去專案、常用格式與重要背景資訊。

這種架構適合個人助理、客戶服務、長期專案協作與個人化推薦。常見儲存方式包括 Redis、關聯式資料庫、文件資料庫與向量資料庫。

但記憶不是保存得越多越好。系統必須處理資料過期、錯誤記憶、敏感資訊、使用者同意與刪除權等問題。如果沒有記憶治理，錯誤內容可能反覆影響後續回答。

六、Multi-Modal RAG：讓檢索不再侷限於文字

Multi-Modal RAG 將檢索範圍從文字擴展到圖片、音訊、影片、表格、工程圖與醫療影像。系統可以同時理解不同形式的資料，再將它們組合成回答。

例如，在工程審圖情境中，系統可以同時讀取二維 PDF 圖面、零件圖片與 Feature Graph JSON；在會議管理中，也可以結合錄音逐字稿、簡報與附件；在醫療領域，則可能同時參考影像、報告與結構化檢驗資料。

Multi-Modal RAG 適合影片摘要、圖像描述、文件審查、教育、製造與醫療應用。相關技術包括 CLIP、多模態嵌入模型、OCR、語音辨識與視覺語言模型。

其難點在於不同模態之間的對齊。單純將圖片轉成文字並不代表真正理解圖片，表格、座標、版面與物件關係也可能在轉換過程中遺失。

七、Federated RAG：從分散資料來源取得資訊

Federated RAG 的重點是資料不必全部集中到同一個知識庫。系統可以向不同部門、不同組織、不同地區或不同權限域的資料來源提出查詢，再將結果整合起來。

這種架構適合醫療、金融、政府與跨組織協作場景，尤其適用於資料不能任意搬移或集中儲存的環境。

不過，Federated RAG 不應直接等同於 Federated Learning。前者主要處理分散式檢索與答案整合，後者則著重於模型在不集中原始資料的情況下進行訓練。兩者可以搭配，但並不是同一種技術。

Federated RAG 的真正挑戰包括跨來源身分驗證、權限控管、資料格式一致性、延遲、結果去重、可信度排序及稽核追蹤。

八、Streaming RAG：讓最新資料即時進入回答

Streaming RAG 適合資料持續變動，而且答案必須反映最新狀態的場景。它會持續接收並處理即時事件，讓系統能夠檢索最新資訊。

常見應用包括金融行情、資安事件、設備監控、新聞追蹤、客服工單與社群媒體分析。Apache Kafka、Amazon Kinesis與 Spark Streaming 可以協助建立資料串流管線。

但 Streaming RAG 不只是資料進得快。企業還必須處理索引更新延遲、重複事件、事件順序、時間有效性與舊資料失效等問題。否則，系統可能同時檢索到互相矛盾的新舊資訊。

九、ODQA RAG：面向開放領域的問答系統

ODQA 是 Open-Domain Question Answering 的縮寫，代表系統需要回答跨領域、範圍廣泛的問題。它的資料來源可能包括搜尋引擎、百科資料、新聞、公開網站與大型文件庫。

這類系統重視廣泛覆蓋能力與動態檢索，適合通用搜尋、研究輔助與虛擬助理。Elasticsearch、Haystack、Hugging Face Transformers及搜尋 API 都可以成為實作的一部分。

相較於企業內部 RAG，ODQA 更難控制來源品質。系統需要處理網站可信度、資訊時效性、來源衝突、惡意內容與引用追蹤，否則即使成功找到資料，也不代表答案可靠。

十、Contextual Retrieval RAG：根據情境重新理解問題

Contextual Retrieval RAG 會參考對話歷史、使用者角色、目前任務與既有條件，重新理解使用者的問題，再執行檢索。

例如，使用者接著詢問「那第二年的金額呢？」如果系統只搜尋這句話，幾乎不可能找到正確答案。情境檢索會先將問題改寫成「某份兩年期維護合約第二年度應開立的發票金額」，再進行搜尋。

這種方式適合對話式 AI、客服機器人與長流程工作助理。它與 Memory-Augmented RAG 有關，但兩者重點不同：記憶增強著重保存過去資訊，情境檢索則著重利用目前脈絡改善查詢。

風險在於錯誤脈絡可能污染檢索。如果系統誤解「那份合約」指的是哪一份文件，後續回答即使計算正確，也會建立在錯誤對象之上。

十一、Knowledge-Enhanced RAG：結合結構化知識

Knowledge-Enhanced RAG 將一般文件檢索與結構化知識來源整合，例如知識圖譜、主資料、詞彙表、本體模型、規則庫或企業資料庫。

它能讓模型在回答問題時，同時參考非結構化文件與明確定義的知識。例如，醫療系統可以透過本體模型理解疾病、藥物與檢驗項目的分類；工程系統則可整合材料規格、公差標準與零件關係。

這種方法能提高事實準確性與領域一致性，適合法律、醫療、教育與製造等專業場景。常見技術包括 OWL、Apache Jena、知識圖譜與各類 Embedding 工具。

Knowledge-Enhanced RAG 和 Graph RAG 有部分重疊，但前者範圍更廣，不一定要使用圖形資料庫，也可以整合結構化資料表、規則或領域詞彙。

十二、Domain-Specific RAG：針對特定產業深度設計

Domain-Specific RAG 是針對特定領域建立的 RAG 系統。它不只是更換資料來源，而是從文件解析、術語、分段方式、Embedding、查詢策略、提示詞、驗證規則到輸出格式，都依照產業需求設計。

例如，醫療 RAG 必須處理縮寫、診斷代碼、時間軸與資料隱私；法律 RAG 必須辨識條文層級、版本效力與管轄區域；工程 RAG 則可能涉及 BOM、尺寸、公差、材料與圖面版本。

這類系統具有較高的相關性與可信度，也更容易符合產業規範。然而，導入成本通常高於通用型 RAG，並需要領域專家參與資料治理、測試與驗收。

十三、Hybrid RAG：結合關鍵字與語意檢索

Hybrid RAG 將多種檢索方法結合起來，最常見的是全文關鍵字檢索與向量語意檢索。

向量檢索擅長找到語意相近的內容，但對產品代碼、合約編號、醫療代碼與精確名稱不一定敏感；關鍵字檢索擅長精確匹配，卻可能找不到使用不同說法表達的相同概念。兩者結合後，可以兼顧精確度與召回率。

實作時通常還會加入 Metadata Filter 與 Reranker，先依權限、日期、部門及文件類型縮小範圍，再重新排序檢索結果。

Hybrid RAG 是企業知識庫中非常實用的選擇。Elasticsearch、OpenSearch及支援混合搜尋的向量資料庫都可以使用。它的難點在於如何調整不同檢索分數的權重，而不是單純把兩組結果合併。

十四、Self-RAG：讓模型檢查自己的回答

Self-RAG 在回答流程中加入自我反思與品質判斷。模型會評估是否需要檢索、找到的內容是否足以支持回答、答案是否符合來源，以及是否需要重新搜尋或修正。

這種架構可以改善答案的事實性與連貫性，適合教育、研究、內容生成與高準確度問答。

不過，模型的自我檢查不等於客觀驗證。模型可能對錯誤答案表現得非常有信心，因此高風險場景仍需搭配規則驗證、來源引用、第二模型檢查或人工覆核。

此外，Fine-tuning 與 Human-in-the-Loop 可以協助實作 Self-RAG，但它們並不是 Self-RAG 的必要條件或專屬工具。

十五、HyDE RAG：先假設答案可能長什麼樣子

HyDE 是 Hypothetical Document Embeddings 的縮寫。它的做法是先根據使用者問題產生一段「假設性文件」或可能的答案，再將這段內容轉換成向量，用來搜尋真正的相關文件。

它適合處理問題描述過短、用詞與文件差異很大，或隱含語意較強的查詢。因為假設性文件通常包含較完整的領域詞彙，所以有機會找到原始問題直接搜尋時無法命中的內容。

HyDE 可以提高召回率，但也可能受到假設內容誤導。如果模型一開始做出錯誤假設，檢索方向就可能偏離。因此，實務上通常會將原始查詢與 HyDE 查詢並行使用，再合併及重新排序結果。

十六、Recursive／Multi-Step RAG：將複雜問題拆成多次檢索

Recursive RAG 或 Multi-Step RAG 適合無法透過一次搜尋回答的問題。系統會將複雜問題拆成數個子問題，根據前一步取得的資訊決定下一步要搜尋什麼，最後再整合所有證據。

例如，要回答「哪些跨年度維護合約尚未完成請款，而且負責專案已有未結工單」，系統可能先搜尋合約與請款狀態，再查詢專案負責人，接著取得工單資料，最後才產生完整答案。

這種架構能處理比較、歸納、因果分析與跨資料來源推理。不過，多步驟流程也會累積錯誤，任何一步理解錯誤，都可能影響後續結果。因此，系統需要保留每一步的查詢、證據與判斷依據。

這 16 種 RAG 可以如何分類？

若從設計目的來看，這些 RAG 類型大致可以分成五個方向。

第一類是基礎檢索架構，包括 Standard RAG 與 ODQA RAG，適合建立基本問答與搜尋能力。

第二類是互動與自主性強化，包括 Agentic RAG、Contextual Retrieval RAG、Memory-Augmented RAG 與 Self-RAG，主要解決任務決策、對話連續性、個人化及答案檢查問題。

第三類是知識與推理強化，包括 Graph RAG、Knowledge-Enhanced RAG、HyDE RAG，以及 Recursive／Multi-Step RAG，重點是改善知識關係、召回能力與多步驟推理。

第四類是系統與工程能力強化，包括 Modular RAG、Streaming RAG、Federated RAG 與 Hybrid RAG，主要處理系統擴充、即時更新、分散資料來源與檢索品質。

第五類則是針對資料型態或產業特性進行強化，包括 Multi-Modal RAG 與 Domain-Specific RAG。

RAG 類型不是選擇題，而是組合題

企業在規劃 RAG 時，不必從 16 種類型中選出唯一答案。真正的系統通常會同時具備多種特徵。

例如，醫院內部知識庫可能採用 Domain-Specific RAG 處理醫療術語，以 Hybrid RAG 結合全文與向量搜尋，再透過 Federated RAG 查詢不同院區的資料。如果要處理影像與報告，還可以加入 Multi-Modal RAG。

企業合約管理系統則可能先使用 Modular RAG 建立可維護的架構，透過 Contextual Retrieval RAG 理解使用者目前正在處理的合約，再由 Agentic RAG 呼叫計算器、工作流或 ERP 系統。

因此，RAG 架構設計的核心並不是追求名稱最多或技術最複雜，而是確認目前要解決的是哪一個問題。

導入 RAG 時應該評估哪些指標？

評估 RAG 系統時，不應只看最後回答是否通順。更重要的是拆開檢索與生成兩個階段進行測量。

檢索層面應關注召回率、排序品質、來源涵蓋率、權限過濾正確性及索引更新時間。生成層面則應評估答案正確性、來源支持程度、引用準確性、幻覺率與拒答能力。

系統營運方面還要衡量回應延遲、模型成本、索引成本、資料更新成本、可用性與維護難度。若應用於醫療、法律、金融或企業機密資料，還必須加入權限、稽核、資料主權、保存期限與人工覆核機制。

換句話說，企業需要評估的不是「有沒有使用 RAG」，而是這套 RAG 是否能持續提供正確、可追溯、符合權限而且成本可控的答案。

結語：從知識問答走向企業工作系統

RAG 已經不再只是把文件放進向量資料庫，再交給大型語言模型回答問題。它正在逐步演進成一套整合資料、知識、推理、記憶、工具與工作流程的企業 AI 架構。

對剛開始導入的團隊而言，可以先從 Standard RAG 與 Hybrid RAG 建立可靠的搜尋基礎；當問題涉及長期互動、跨文件推理或系統操作時，再逐步加入 Memory、Graph、Multi-Step 或 Agentic 等能力。

最重要的是，RAG 的價值不在於採用了多少種技術名稱，而在於能否讓使用者更快取得可信答案，並將答案進一步轉化為可以執行、驗證與追蹤的企業工作流程。

一句話總結：RAG 不是單一技術，而是一個可以依照任務複雜度、資料型態、產業規範與工程條件持續組合、擴充及演進的架構家族。

2026年7月19日星期日

[知識庫 6] 當新人第一天，就能答出只有資深工程師才知道的答案

不是把檔案丟進 AI，而是把公司的經驗，煉成一座問得到、信得過、不外洩的知識庫。

那個只有王小明知道的答案

凌晨三點，客戶的主機服務掛了。運維工程師王小明趕到現場，翻日誌、發現是記憶體被批次作業吃光，調整排程後重開機，恢復。整件事處理得漂亮——然後解法被寫進他自己的筆記本裡。

三個月後，同樣的問題在另一個客戶端重演。這次值班的是剛報到兩週的新人。他查不到任何東西，只能打電話把王小明從床上挖起來。

這不是誰的錯。這是絕大多數企業的日常：公司最值錢的知識，存放的位置叫「某個資深員工的腦袋」。它不會出現在任何資產清單上，但它會離職、會請假、會在凌晨三點關機。

你其實不缺知識，你缺的是「找得到、敢用、敢信」

多數公司不是沒有累積知識，而是知識散在四個找不回來的地方。

一個 90 分鐘的客戶需求訪談錄音躺在硬碟裡，會後沒人想重聽；三週後大家對「客戶到底要不要那個匯出功能」各說各話。安裝 SOP 存在共用資料夾的第七層目錄，新人得靠運氣或爬 Line 群組的樓才翻得到。客戶的維護合約、SLA、報價單在業務的信箱裡，工程師想查「這個客戶保固到什麼時候」只能四處問人。

而那些真正重要的文件，往往含個資、含客戶 IP、含帳號密碼——所以乾脆不分享，或是人工塗黑，塗到自己也不確定乾不乾淨。就算現在把它們丟給 AI 工具，得到的答案也沒有依據，你不知道它從哪裡讀來的、對不對、能不能拿去跟客戶講。至於「誰能看什麼」，靠的是資料夾權限硬切，設錯一次就是一次外洩。

這四件事——找不到、不敢共享、不敢信、權限難維護——才是知識管理真正卡住的地方。

一段錄音，變成一個新人問得到的答案

以下用「鼎峰系統整合股份有限公司」第一系統開發部（示範情境）走一遍。這是王小明那次凌晨故障的現場交接錄音，逐字稿長這樣：

嗯…就是那個客戶 192.168.10.5 那台主機啊，帳號 admin 密碼 P@ssw0rd 那個，
半夜三點服務就掛掉，啊我看 log 是記憶體不夠，就…就先把那個排程改一下，
然後重開機就好了啦，啊王先生你記得跟李小姐講一下喔，下個月要去複查。

雜亂、口語、而且含著三樣絕對不該外流的東西：客戶 IP、帳號、密碼。

系統把它送進清洗程序——去重、遮罩、分類、摘要——出來的是這樣：

## 客戶主機服務半夜中斷處理

- **問題**：客戶主機（IP 已遮罩）每日凌晨服務中斷。
- **原因**：記憶體不足。
- **解法**：調整排程後重新開機即恢復。
- **待辦**：下個月安排複查。

再蒸餾一次，它變成一頁可被互相連結的知識概念頁：

# 記憶體不足導致服務中斷
當主機記憶體耗盡時，服務會被作業系統終止。常見於凌晨批次作業疊加。
處理方式參見 [[重新開機標準程序]] 與 [[排程調整]]。

於是三個月後的那個新人，不用再打電話。他在知識庫問答頁打一句話：

「客戶主機半夜服務掛掉怎麼辦？」

系統回答：

通常是記憶體不足造成。建議調整批次排程後重新開機即可恢復；並安排後續複查。
〔出處：客戶現場維運交接錄音 → 原始逐字稿〕

注意兩件事。第一，答案附出處，點下去可以一路鑽回當初匯入的原始檔——這是「敢信」的前提。第二，帳號、密碼、客戶 IP 一個都沒出現——它們在進入知識庫之前就被遮掉了。

為什麼你敢把合約也放進去

大部分企業卡在「不敢丟進去」，所以這套系統把安全做成兩條不可違反的鐵則。

第一條：遮罩失敗，整筆清洗就算失敗。不是「盡量遮」，而是遮不乾淨就整筆退回重跑。寧可多跑一次，也不讓沒遮乾淨的內容流向下游。

第二條：你無權看的，問答絕不會吐給你。權限不是綁在資料夾上，而是綁在「團隊」上，而且在每一次查詢當下即時驗證。實際跑起來是這樣的：王小明（運維組）問「客戶主機半夜服務中斷怎麼處理」，拿到附出處的完整答案；李四（開發組）問一模一樣的問題，系統回覆查無相關資料——因為那批運維知識不在他的可見範圍內，檢索階段就沒被撈出來。

同一個機制也延伸到公司外。當工程師想在自己慣用的 AI 工具（Claude、Codex 等）裡直接查公司知識時，系統開放一個標準端點；換一組憑證，就換成那個人能看的範圍，與網頁上完全一致。合約與 SLA 這種只有業務該看的東西，開發人員即使透過外部 AI Agent 也查不到、甚至查不出它存不存在。

那知識會過期，會不會變成一座檔案墳場？

會，如果沒有更新機制的話。所以更新被設計成一條可以重跑的產線。

客戶的維護合約續約了，承辦人對原檔案按「上傳新版本」，系統自動建立版本鏈：新版標成 v2，舊版標示「已被取代」，版本歷史可回溯稽核。接著重新清洗、重新蒸餾，索引自動跟著更新。下一次有人問合約相關問題，答到的就是新版內容，出處指向 v2。

你只要從「更新原料」開始，下游會自己刷新。

導入之後，具體會變成什麼樣子

以一般知識管理導入經驗為基準，這是合理的導入目標與期望值（並非實測保證值，實際成效取決於你餵入多少素材、清洗品質與團隊使用習慣）：

找答案的時間：從「半小時翻檔案＋問人」縮短到「1 分鐘問知識庫」，查詢效率約提升 10 倍。
新人上手週期：從 1～2 個月縮短到 2～3 週，約縮短 50%。
重複求助與重複犯錯：同類問題重複發問下降 60% 以上。
敏感資料外洩風險：因強制遮罩且「遮罩失敗＝整筆失敗」，外洩風險趨近於 0。

但比數字更重要的是：這些品質是可以被量出來的，不是喊口號。系統內建兩道評測——一道量「清洗到底乾不乾淨」（該遮的有沒有遮掉、該保留的重點有沒有被誤刪），一道量「檢索找不找得到、準不準，以及越權洩漏是不是等於 0」。你可以把它們當成知識庫的回歸測試：每次餵入新素材、每次調整設定，跑一次就知道品質有沒有退步。

知識管理最常見的失敗，是導入之後沒人知道它到底有沒有用。能被量測，才有辦法被改善。

如果你也有一個「只有某某某才知道」的答案

老手經驗難傳承、新人上手慢、敏感資料不敢共享——如果這三句話有一句戳中你，那你要的可能不是另一套文件管理系統，而是一條把散落素材煉成可信知識的產線。

[知識庫 5] 當場答不出來的那一句，就是丟單的那一句

「我回去確認一下再回覆您」——這句話說出口的那一刻，你已經把案子的主導權交出去了。

會議室裡那三秒鐘

黃振傑在鼎峰系統整合（示範情境）做業務六年，那天下午帶著售前工程師去客戶端做第二次簡報。

簡報講得很順。到了 Q&A，客戶的 IT 主管翻著手上的資料問了三個問題。

第一個：「你們這套跟我們現在用的門禁系統，之前有整合過嗎？」

有。三年前有一個案子做過幾乎一樣的整合。但黃振傑不確定是哪個客戶、也不確定當初用什麼方式接的，更不敢貿然說出客戶名稱。他說：「這個我回去確認一下。」

第二個：「同規模的案子，你們大概報多少？」

他心裡有個範圍，但不確定上一個類似規模的案子最後成交價是多少、有沒有含第一年維護。報高了對方會覺得貴，報低了回公司要被主管檢討。他說：「我整理一份給您。」

第三個最傷：「上次貴公司來提案的那位，說可以支援我們現有的資料格式，這個還算數嗎？」

上次來的不是他。他完全不知道同事答應了什麼。他說：「這個我要跟同事確認。」

三個問題，三次「回去確認」。

會議結束前，客戶的 IT 主管講了一句很客氣的話：「好，那你們整理好再給我，我們也還在看其他家。」

在提案現場，客戶問的不只是問題，還在量一件事：這家公司到底熟不熟。而你每說一次「回去確認」，那個刻度就往下掉一格。

你不是準備不足，是公司的經驗沒有站在你這一邊

如果你是業務或售前，你大概很清楚：這三個問題的答案，公司裡百分之百是有的。

第一個問題的答案，在三年前那個案子的結案報告裡，或是在當時售前工程師的信箱裡。

第二個問題的答案，在報價系統或某個人的 Excel 裡，但你不知道要比對哪一筆才算「同規模」。

第三個問題的答案，在上一次那場會議的錄音裡——如果有錄的話——或是在提案簡報 v5 的第 12 頁備註。

它們理論上都在公司，實際上等於不存在。因為你在客戶會議室，你有三秒鐘，而不是三小時。

更麻煩的是，這些經驗大部分綁在人身上。做過那個整合案的工程師去年離職了；知道成交底價的主管在開會；上次來提案的同事調去別的部門。你能問到誰、問得多快，決定了你這一單的勝率——而這件事完全靠運氣。

所以真正該問的不是「業務要怎麼準備得更充分」，而是「公司六年的專案經驗，能不能在會議室裡那三秒鐘被你叫出來」。

一場沒人聽第二次的售前錄音，變成你當場答得出的一句話

這正是知識庫系統在做的事。它不是雲端硬碟，也不是把檔案丟給 AI 就算數——它是一條把「原料」煉成「可查詢知識」的產線。

三年前那個門禁整合案，其實留下了一場售前技術會議的錄音。逐字稿裡有一段是這樣的：

…他們那個門禁是舊的那套，資料庫直接讀不到，所以我們最後是走
他們內部的 10.20.30.40 那台中介機，用排程每十五分鐘同步一次啦。
本來想接 API，但他們原廠不給。啊這個案子最後折到七九折成交，
含第一年維護，這個底價不要往外講喔。

系統把它送進清洗程序——去掉贅字、遮蔽敏感資訊、分類、摘要——出來是這樣：

## 舊版門禁系統整合方式

- **限制**：舊版門禁系統原廠不開放 API，資料庫無法直接存取。
- **採用方案**：透過客戶內部中介主機（位址已遮罩），以排程每 15 分鐘同步一次。
- **適用情境**：客戶既有門禁系統為舊版、且原廠不提供介接介面時。

再進一步蒸餾，它變成一頁可以互相連結的概念頁：

# 原廠不開放 API 時的整合路徑
當既有系統無法直接介接時，優先評估中介主機＋排程同步。
需向客戶說明資料非即時、同步間隔可調。
相關做法參見 [[排程同步間隔設定]] 與 [[整合可行性評估清單]]。

於是下一次有業務在客戶會議室被問到同一件事，手機或筆電上打一句話進系統：

「舊版門禁系統原廠不給 API，有做過嗎？」

當場得到的是：

有。做法是透過客戶內部中介主機、以排程每 15 分鐘同步，適用於原廠不開放介接的舊系統。需向客戶說明資料非即時。
〔出處：售前技術會議錄音 → 原始逐字稿〕

差別有多大？原本你會說「這個我回去確認一下」，現在你可以說：「有，我們做過。原廠不給 API 的狀況我們走中介機排程同步，十五分鐘一次，非即時這點要先跟您說清楚。」

同一個問題，第一種回答讓你變成傳話的人，第二種回答讓你變成懂的人。而客戶只買後面那一種。

底價、折扣、承諾過的話，敢不敢放進去

看到這裡你可能會想：整合做法可以放，但成交底價、折扣權限、上次答應客戶什麼——這些也放進去嗎？

這正是這套系統最關鍵的設計，兩條不能違反的鐵則。

一條是遮蔽失敗，整筆就算失敗。客戶內部主機位址、窗口私人號碼這類東西，不是「盡量遮」，而是只要沒遮乾淨，整筆內容直接退回重跑，絕不放行到下游。

另一條是權限綁團隊、每次查詢當下驗證。成交價、折扣底線這類商務資訊標成業務團隊可見，工程師查不到；反過來，工程師團隊的維運細節，業務問一模一樣的問題也會得到「查無資料」——不會出現「有資料但你無權查看」這種等於洩漏的提示。同一套規則也延伸到公司外：你想在自己慣用的 AI 工具裡查公司知識，換一組帳號就換成那個人能看的範圍，一模一樣。

這代表你可以在客戶面前，安全地帶著公司六年的成交經驗上談判桌。而業務最值錢的那些資訊，恰恰全部都在「本來不敢放」的那一區。

那三年前的做法，現在還算數嗎

好問題，而且是業務最不能出錯的地方——照著一個過期的答案對客戶承諾，比答不出來還糟。

所以更新被設計成一條可以重跑的產線。原廠後來開放 API 了、報價政策調整了、標準做法換了，承辦人對原檔案按「上傳新版本」，系統自動建立版本鏈：新版標成 v2，舊版標示「已被取代」，版本歷史可回溯稽核，接著自動重新清洗、重新蒸餾、重建索引。

下次你在客戶面前查到的，是現在有效的做法，不是三年前有效的做法。

三次「回去確認」的真正代價

以一般知識管理導入經驗為基準，找答案的時間可以從半小時翻檔案加問人，壓到一分鐘內問到，效率約提升十倍。這是合理的導入目標與期望值，並非實測保證值，實際成效取決於餵進多少素材與團隊的使用習慣。

但業務算的從來不是這種帳。你算的是這個：

三次「回去確認」，換來的是提案週期多拖一週，客戶在這一週裡又見了兩家；換來的是你回公司要追三個人、寫一封信、等一份報價；換來的是下次會議你得先花十分鐘把上次沒答的補完，而不是直接談合約條件。

最貴的那一項還沒算：客戶心裡把你歸類成「窗口」，而不是「顧問」。窗口只能比價，顧問才能談價。

黃振傑那個案子最後沒有輸在價格，是輸在對方選了一家「感覺比較熟這塊」的廠商。

你的公司做過的每一個案子，本來都該站在你身後

你們公司做過的案子不會比對手少。差別只在於，對手的業務可能在會議室裡叫得出那些經驗，而你叫不出來。

這不是誰比較認真的問題，是公司有沒有把六年的經驗煉成一個問得到的地方。

[知識庫 4] 別再說「我幫您查一下，稍後回覆」

客戶要的從來不是你查得認真，是你答得出來。

一個上午，這句話說了九次

林郁婷在鼎峰系統整合（示範情境）的客戶服務部，做技術支援第三年。她的工作台上開著五個視窗：工單系統、客戶名單、共用資料夾、公司內部群組，還有一份自己整理的 Excel，裡面是她這三年來慢慢抄下來的「常見狀況與處理方式」。

那份 Excel 是她最重要的資產，也是她最大的焦慮來源——因為它只有 137 列，而客戶的問題有無限多種。

那天上午九點到十二點，她說了九次「我幫您查一下，稍後回覆您」。

第一次，客戶問去年買的模組能不能相容新版系統。她翻工單，翻不到；問群組，沒人回；最後找到當初的售前工程師，對方在客戶端出差，晚上七點才回訊息。

第三次，客戶說設備顯示某個錯誤代碼。她印象中兩年前有人處理過一模一樣的，但那是在一個已經沒人用的舊聊天群組裡，往上滑了二十分鐘沒滑到。

第七次最傷。客戶在電話裡說：「你們上個月有另一位同事跟我講的不是這樣。」她當下答不出來，也查不到上個月那通電話的內容。掛掉電話之後她坐了三十秒，那三十秒她想的不是問題怎麼解，而是客戶剛剛是不是覺得這家公司不專業。

十二點的時候，她真正解決的問題是三個。其餘六個變成待辦，帶到下午，有兩個帶到明天。

在第一線工作的人都知道，最消耗人的從來不是難的問題，是那些「公司裡明明有人知道，但你就是問不到」的問題。

這不是你不夠努力，是答案根本沒被放在你找得到的地方

如果你也是客服或技術支援，你大概很熟悉這種感覺：明明是自己份內的事，卻總覺得自己在猜。

但問題真的不在你。你可以把公司裡「那個問題的答案」在哪裡，列出來看看：

它可能在一張三年前的工單裡，只是當初結案時只填了「已處理完成」四個字；可能在一封資深工程師寄給客戶的信裡，而那封信在他的個人信箱；可能在一場售前會議的錄音檔裡，檔名叫「錄音_20240311.m4a」；可能在一個已經沒人用的群組訊息裡；也可能誰都沒寫下來，只在某個人的腦袋裡，而那個人今天請假。

這些東西理論上都還在公司，實際上等於不存在——因為找不到、或是找到的成本高過重問一次。於是最有效率的做法變成「問人」，而問人這件事，會塞住兩個人的時間，還會隨著資深同事離職而斷掉。

你不缺資料，你缺的是一個問得到答案的地方。

第一線最需要的不是更完整的知識庫，是更快的那一句回答。

一張三年前的工單，變成一個你三秒查得到的答案

這正是知識庫系統要做的事。它不是雲端硬碟，也不是把檔案丟給 AI 就算數——它是一條把「原料」煉成「可查詢知識」的產線。

看一個實際的例子。這是一段客服電話的口語紀錄，雜亂、口語，而且夾著幾樣絕對不能外流的東西：

喂您好，那個…宏泰的張淑芬張小姐是不是，電話 0912-345-678 這支對嗎，
訂單編號 SO-2023-1147 那筆。啊她說那台設備一開機就跳 E-207，
我跟她講那個通常是韌體版本太舊，跟新的控制模組對不起來啦，
就先降回舊版韌體，然後排時間現場更新模組。她說好，那就下週三。

系統把它送進清洗程序——去掉贅字、遮蔽個資、分類、摘要——出來是這樣：

## 設備開機顯示 E-207 錯誤

- **現象**：設備開機後顯示錯誤代碼 E-207。
- **原因**：韌體版本過舊，與新版控制模組不相容。
- **緊急處置**：暫時降回舊版韌體，可恢復運作。
- **根本解法**：安排現場更新控制模組。

再進一步蒸餾，它變成一頁可以互相連結的概念頁，跟其他相關知識串在一起：

# E-207 韌體與控制模組版本不相容
當韌體版本低於控制模組要求時，開機自檢會中止並回報 E-207。
處置流程參見 [[韌體降版操作]] 與 [[控制模組現場更新排程]]。

於是下一次——不管是林郁婷，還是上週才報到的新同事——遇到同一個客戶問同一件事，只要打一句話進系統：

「客戶設備開機跳 E-207 怎麼處理？」

得到的是：

通常是韌體版本過舊，與新版控制模組不相容。可先降回舊版韌體讓設備恢復運作，再安排現場更新控制模組。
〔出處：客戶服務通話紀錄 → 原始逐字稿〕

請注意兩件事。第一，答案後面附著出處，點下去可以一路追回當初那通電話。這很重要——第一線敢不敢照著回客戶，差別就在這裡；主管事後要查你憑什麼這樣講，也查得到。第二，客戶姓名、電話、訂單編號一個都沒有出現，它們在進入知識庫之前就被遮掉了。

你不需要再記住 137 列 Excel。你只需要問得出問題。

那些「不敢放進系統」的內容，其實才是你最需要的

第一線的人最常遇到的狀況是：真正有用的資訊，剛好都是敏感的。客戶的報價邏輯、合約裡答應過的到場時效、上一次為什麼願意給那個折扣——這些才是客戶會追問的，偏偏也是最不敢隨便放的。

所以這套系統把安全做成兩條不能違反的鐵則。

一條是遮蔽失敗，整筆就算失敗。不是「盡量遮」，只要沒遮乾淨，整筆內容直接退回重跑，絕不放行到下游。寧可多跑一次，也不讓客戶的電話跟訂單編號流進一個誰都查得到的地方。

另一條是你無權看的，系統絕不會答給你。權限綁在「團隊」上，而且在每一次查詢的當下驗證。標成業務團隊的合約條款，客服查不到，甚至查不出它存不存在——不會出現「有這筆資料但你沒有權限」這種等於洩漏的提示。

這代表什麼？代表你的公司可以把合約、報價、客戶往來紀錄都煉進來，而不是只敢放那些本來就無所謂的東西。而對第一線來說，能不能答得出客戶的追問，決勝點恰恰就在那些「本來不敢放」的內容裡。

會不會過幾個月，又變成一堆沒人信的舊答案

會，如果沒有更新機制的話。所以更新被設計成一條可以重跑的產線。

韌體改版了、處理流程換了、客戶合約續約了，承辦人對原檔案按「上傳新版本」，系統自動建立版本鏈：新版標成 v2，舊版標示「已被取代」，版本歷史可回溯稽核。接著自動重新清洗、重新蒸餾、重建索引。下次有人問同一個問題，答到的就是新版內容，出處指向 v2。

對第一線來說，這件事的意義只有一句話：你查到的答案，是現在有效的答案，不是三年前有效的答案。

「稍後回覆」的成本，其實比你想的高

以一般知識管理導入經驗為基準，找答案的時間可以從「翻半小時檔案再問人」壓到「一分鐘內問到」，同類問題的重複發問下降六成以上。這是合理的導入目標與期望值，不是實測保證值，實際成效取決於餵進多少素材、清洗品質，以及團隊的使用習慣。

但如果你自己就在第一線，你其實不太需要看這些數字。你更清楚的是另一組帳：

一次「我幫您查一下」，是你多花二十分鐘，加上另一位同事被打斷的十分鐘，加上客戶多等的四個小時，加上他心裡多打的一個問號。乘以一天九次，乘以一年兩百多個工作天。

林郁婷那天下午收到客戶回信，只有一句：「所以到底可不可以？」

你不會希望這句話，是客戶對你們公司的最後印象。

如果你也有一份 137 列的 Excel

那份 Excel 不是問題，它是證據——證明你們公司真的累積了很多經驗，只是這些經驗現在得靠某幾個人用手抄、用記憶力、用「剛好我知道」來支撐。

這撐得住今天，撐不住那個人請假、離職，或是團隊要再進三個新人的時候。

[知識庫 3] 你接的是專案，不是考古

接手第一週，你應該在推進度，不是在解讀前任留下來的資料夾。

資料夾裡有兩百個檔案，沒有一個叫「這個案子到底怎麼回事」

週一早上九點，主管把一個共用資料夾的權限開給了周佩璇。

「宏泰那個案子交給你，小李下週五就走了，有問題趕快問他。」

她點進去。兩百多個檔案。命名大概是這樣：宏泰_需求確認_final.docx、宏泰_需求確認_final_v2.docx、宏泰_需求確認_最新版(客戶確認過).docx、會議_0311.m4a、會議_0325(補錄).m4a、報價_勿外流.xlsx、新增資料夾/。

她花了兩天，拼出了一個大概的輪廓：這個案子做了十四個月，換過一次客戶窗口，中間有一段改了規格，目前進度大約七成。

然後客戶打電話來了，問的是：「上次講好的那個報表格式，你們是照哪一版做？」

她答不出來。她知道有三份規格文件，但不知道哪一份是「講好的那一版」，也不知道那次是在哪一場會議「講好」的。她去問小李，小李想了五秒說：「喔那個啊，好像是三月的時候客戶口頭改的，我印象中有跟他們確認過。」

「有紀錄嗎？」

「應該在錄音裡吧。」

兩百個檔案，其實只回答得了一個問題：這個案子做過什麼。它回答不了那個真正要命的問題——為什麼要這樣做。

接手為什麼一定會卡，而且不是你或前任的錯

這件事值得說清楚，因為接手的人常常會覺得是自己不夠用心，或是前任交接不負責。兩個都不是。

一個專案交接得出來的，是狀態：做到哪、誰負責、檔案在哪、還欠什麼。

交接不出來的，是脈絡：為什麼這個功能後來被砍掉？為什麼報價要多加一成？為什麼這個客戶的窗口一定要先發信再打電話？為什麼那條整合方式明明比較快，我們卻沒有用？

這些沒有一條寫得成文件。它們是十四個月裡，一次一次的會議、電話、現場、爭執累積出來的判斷。要一個人在離職前一週把它們寫下來，物理上就做不到——他甚至不知道哪些是「你會需要知道的」。

而且脈絡並不是不存在，只是存放的位置很尷尬：一場 90 分鐘的客戶訪談錄音（會後沒人想重聽）、一封三月的往來信、一張現場拍的照片、一段記在筆記本上的口頭承諾、一份被改到 v7 的簡報。

所以問題不是「交接怎麼做得更完整」，而是「這個案子的脈絡，有沒有在它發生的當下就被留下來」。

一場沒人想重聽的會議錄音，變成一頁你查得到的決議

這正是知識庫系統要處理的事。它不是雲端硬碟，也不是把檔案丟給 AI 就算數——它是一條把「原料」煉成「可查詢知識」的產線。

回到那個報表格式的問題。那場三月的會議其實有錄音，長度 87 分鐘，沒有人聽過第二次。逐字稿的其中一小段長這樣：

…那個報表喔，客戶那邊王經理說，他們財務要的是每月一張、
不是每週，然後要含稅未稅分開列。啊他們窗口換成陳先生了，
chen@…那個信箱等下我再貼給你。這樣調的話工時會多，
不過我們這次先吸收啦，報價還是照原本的 168 萬走，不加價。

系統把它送進清洗程序——去掉贅字、遮蔽敏感資訊、分類、摘要——出來是這樣：

## 報表格式變更決議（客戶口頭確認）

- **變更內容**：報表出表頻率由每週改為每月一張，欄位需含稅、未稅分列。
- **提出方**：客戶財務單位需求，由客戶端主管於會議中提出。
- **商務處理**：本次追加工時由我方吸收，合約金額維持不變。
- **附帶異動**：客戶對接窗口已更換（聯絡資訊已遮罩）。

再進一步蒸餾，它變成一頁可以互相連結的概念頁：

# 宏泰案報表規格（現行版本）
出表頻率：每月一次。欄位需含稅／未稅分列。
本規格於專案期間經客戶口頭確認變更，未走書面變更單。
相關脈絡參見 [[口頭變更的認列原則]] 與 [[專案窗口異動紀錄]]。

於是周佩璇不必去猜哪一份 docx 才是對的。她打一句話進系統：

「宏泰案的報表格式最後是照哪一版？」

得到的是：

每月一張，含稅與未稅分列。此規格於專案期間由客戶口頭提出變更，我方吸收追加工時、合約金額未調整。
〔出處：宏泰案專案會議錄音（三月）→ 原始逐字稿第 41 分鐘〕

兩件事值得注意。第一，答案附著出處，而且可以跳回錄音的那個時間點——所以她敢直接回客戶，主管要查依據也查得到。第二，客戶窗口的聯絡方式在進入知識庫之前就被遮掉了，而「報價維持 168 萬、我方吸收工時」這種商務資訊，只有具備對應團隊權限的人查得到。

你接手的時候，需要的不是兩百個檔案的存取權，是兩百個檔案裡那三十句真正重要的話。

為什麼敢把報價跟合約也煉進去

接手專案最尷尬的一件事是：你最需要知道的，剛好都是最敏感的。報價怎麼算、合約承諾了什麼、上次為什麼願意讓步——不知道這些，你根本不敢對客戶開口。

這套系統把安全做成兩條不能違反的鐵則。

第一條，遮蔽失敗，整筆就算失敗。不是盡量遮，而是只要沒遮乾淨，整筆內容退回重跑，絕不放行到下游。客戶窗口的手機與信箱不會因為「這次沒抓到」就流進知識庫。

第二條，權限綁在團隊上，而且每一次查詢當下驗證。專案團隊查得到自己案子的商務脈絡，隔壁部門的人問一模一樣的問題，會得到「查無資料」——不是「你沒有權限查看這筆資料」，是連它存不存在都不會透露。

所以你的公司可以把合約、報價、客戶往來一起煉進來。而接手一個案子最需要的東西，恰恰全部都在那裡。

那過一陣子，它會不會又變成另一個「新增資料夾」

會，如果沒有更新機制的話。所以更新被設計成一條可以重跑的產線。

規格改版了、合約續約了、窗口又換人了，承辦人對原檔案按「上傳新版本」，系統自動建立版本鏈：新版標成 v2，舊版標示「已被取代」，版本歷史可回溯稽核。接著自動重新清洗、重新蒸餾、重建索引。

差別在這裡：final_v2_最新版 這種檔名要靠人記得誰是最新的；版本鏈是系統記得。你只要從更新原料開始，下游會自己刷新，而且答出來的一定是現行版本。

第一週應該長什麼樣子

以一般知識管理導入經驗為基準，接手者的上手週期可以從一到兩個月壓到兩三週，大約縮短一半；同一件事被重複問的次數下降六成以上。這是合理的導入目標與期望值，並非實測保證值，實際成效取決於餵進多少素材與團隊的使用習慣。

不過對接手的人來說，感受最直接的不是這些數字，而是一種姿態的改變。

沒有知識庫的第一週，你在對客戶說：「這個我要跟同事確認一下。」有知識庫的第一週，你在對客戶說：「這個部分我們三月確認過，是每月一張、含稅未稅分列，我先照這樣往下推。」

同樣是第一週，一個像實習生，一個像負責人。

下一個接手你案子的人，會拿到什麼

這件事最後會繞回你自己身上。

你現在正在做的案子，總有一天會交給別人——可能是你升遷、轉調，或只是休了個長假。到那時候，你留給對方的，是兩百個檔案跟一句「有問題再問我」，還是一座他問得到答案的知識庫？

訂閱：文章 (Atom)

2026年7月22日 星期三

2026年7月21日 星期二

2026年7月20日 星期一

RAG 不只一種：一次看懂 16 種 RAG 架構與應用場景

一、Standard RAG：最基礎的檢索增強生成

二、Agentic RAG：讓 AI 主動決定下一步

三、Graph RAG：從文件片段進一步理解知識關係

四、Modular RAG：將 RAG 拆成可替換的模組

五、Memory-Augmented RAG：讓系統記得過去

六、Multi-Modal RAG：讓檢索不再侷限於文字

七、Federated RAG：從分散資料來源取得資訊

八、Streaming RAG：讓最新資料即時進入回答

九、ODQA RAG：面向開放領域的問答系統

十、Contextual Retrieval RAG：根據情境重新理解問題

十一、Knowledge-Enhanced RAG：結合結構化知識

十二、Domain-Specific RAG：針對特定產業深度設計

十三、Hybrid RAG：結合關鍵字與語意檢索

十四、Self-RAG：讓模型檢查自己的回答

十五、HyDE RAG：先假設答案可能長什麼樣子

十六、Recursive／Multi-Step RAG：將複雜問題拆成多次檢索

這 16 種 RAG 可以如何分類？

RAG 類型不是選擇題，而是組合題

導入 RAG 時應該評估哪些指標？

結語：從知識問答走向企業工作系統

2026年7月19日 星期日

[知識庫 6] 當新人第一天，就能答出只有資深工程師才知道的答案

那個只有王小明知道的答案

你其實不缺知識，你缺的是「找得到、敢用、敢信」

一段錄音，變成一個新人問得到的答案

為什麼你敢把合約也放進去

那知識會過期，會不會變成一座檔案墳場？

導入之後，具體會變成什麼樣子

如果你也有一個「只有某某某才知道」的答案

[知識庫 5] 當場答不出來的那一句，就是丟單的那一句

會議室裡那三秒鐘

你不是準備不足，是公司的經驗沒有站在你這一邊

一場沒人聽第二次的售前錄音，變成你當場答得出的一句話

底價、折扣、承諾過的話，敢不敢放進去

那三年前的做法，現在還算數嗎

三次「回去確認」的真正代價

你的公司做過的每一個案子，本來都該站在你身後

[知識庫 4] 別再說「我幫您查一下，稍後回覆」

一個上午，這句話說了九次

這不是你不夠努力，是答案根本沒被放在你找得到的地方

一張三年前的工單，變成一個你三秒查得到的答案

那些「不敢放進系統」的內容，其實才是你最需要的

會不會過幾個月，又變成一堆沒人信的舊答案

「稍後回覆」的成本，其實比你想的高

如果你也有一份 137 列的 Excel

[知識庫 3] 你接的是專案，不是考古

資料夾裡有兩百個檔案，沒有一個叫「這個案子到底怎麼回事」

接手為什麼一定會卡，而且不是你或前任的錯

一場沒人想重聽的會議錄音，變成一頁你查得到的決議

為什麼敢把報價跟合約也煉進去

那過一陣子，它會不會又變成另一個「新增資料夾」

第一週應該長什麼樣子

下一個接手你案子的人，會拿到什麼

2026年7月22日星期三

2026年7月21日星期二

2026年7月20日星期一

2026年7月19日星期日