C# .NET Blazor MAUI Xamarin Research: 2026

2026年7月27日星期一

[AI 分享] Graph RAG讓知識庫更聰明

摘要 : 傳統RAG常把零散投訴直接拼貼成答案，難以做推理與總結；結合知識圖譜的Graph RAG可提升分析與結論品質。

內容:

當公司上線一套RAG知識庫後，大家通常會期待它能像聰明的分析助手一樣，從大量資料中整理出真正有價值的結論。但實際上，若直接拿所有客戶投訴去問「三個最根本的系統性問題是什麼」，傳統RAG很可能只會把客戶A、客戶B、客戶C各自說了什麼逐條列出，最後再補一句「總結完了」。這種結果本質上更像是複製貼上，停留在現象整理，還無法上升到系統性問題的歸納。

這也正是傳統RAG常見的短板：它擅長把相關片段找出來，卻不一定能真正理解片段之間的關聯，更不一定能完成深層推理與總結。因此，當問題從「某個人叫什麼名字」這類簡單查詢，升級成「產品與競品相比有何優劣」或「從投訴中總結根本原因」這類複雜分析時，效果往往就不理想。

傳統RAG的核心流程大致分成三個階段。第一是索引階段，也就是先把原始文件切成較小的文本塊，再透過embedding模型把文本轉成向量，最後存入向量資料庫。第二是檢索階段，當使用者提出問題時，系統會把問題也轉成向量，並在向量資料庫中尋找語義最相近的幾段內容，通常取Top K個文本塊作為參考資料。第三是生成階段，把問題與檢索出的片段一併交給大語言模型，讓模型根據這些上下文產生答案。

這種方法的優勢很明顯：它能有效補足大語言模型知識更新不即時的問題，也能降低模型憑空猜測、一本正經胡說八道的情況。不過，這個前提通常是問題本身相對直接、答案可以從少數片段中取得。若問題需要跨文件、跨段落整合資訊，甚至進一步推理與歸納，傳統RAG就會遭遇明顯限制。

其中第一個限制是多跳推理困難。很多複雜問題的答案並不直接存在於某一段文件裡，而是必須綜合多個片段後才能得出。例如某段歷史為何引發重大事件，或某產品為何持續收到某類抱怨，這些都需要模型跨多個資訊點建立邏輯鏈。傳統RAG通常只能抓到局部相似內容，卻難以把分散資訊串成完整推理脈絡。

第二個限制是關係資訊缺失。因為文本被切成獨立片段後，片段中的人物、事件、概念彼此之間的隱含關係，往往就被打散了。換句話說，系統知道某些內容出現過，卻不一定知道它們之間到底是什麼關係，因此難以形成更高層次的理解。

第三個限制是上下文冗長、重點被稀釋。檢索出來的文本塊通常不只包含關鍵資訊，也夾帶大量與問題無直接關聯的內容。這不僅浪費模型的Token資源，也可能讓模型在過長的上下文中忽略真正重要的訊息，出現所謂「大海撈針」效應，最終使答案不夠準確。

為了解決這些問題，引入知識圖譜就成了提升RAG智慧程度的重要方法。知識圖譜的價值，在於它能把原本非結構化的文本，轉化成結構化的知識表示，例如以「實體—關係—實體」這類三元組來描述知識之間的關聯。透過這種方式，原本只是散落在各段文字中的資訊，可以被整理成一張能清楚表達關係的知識網路。

也因此，結合知識圖譜的Graph RAG，不只是把資料找出來而已，而是更進一步幫助系統理解知識之間的連結，提升推理、歸納與總結能力。對於像「從所有客戶投訴中找出三個最根本的系統性問題」這類高階分析任務，這種方法比傳統RAG更有機會產出真正可用、可向老闆交代的結論，而不是只停留在表層現象的堆疊。

[AI 分享] Google AI課程重點整理 - MCP、Skill與多Agent協作

[AI 分享] Google AI課程重點整理

摘要 : 聚焦MCP、Skill與多Agent協作，說明AI進入真實工作場景時的串接、測試與安全重點。

內容:

Google AI 課程 Day 1 的核心：Agent = Model + Harness。也就是 AI Agent 的能力，不只取決於模型本身，還取決於你為它打造的工作環境。當 AI 要進入真實工作場景，通常會遇到三個瓶頸：碰不到私有資料、單一 Agent 能力有限，以及記不住公司的流程與 SOP。這次內容主要延伸 Day 2 與 Day 3，分別對應 MCP、A2A 與 Skill 落地的關鍵觀念。

Day 2 第一個重點是 MCP（Model Context Protocol）。它是由 Anthropic 提出的開源標準，目的不是取代像 Gmail API 這類底層服務，而是統一 AI 工具如何連接外部工具。你可以把它想成 AI 世界的通用插座，讓不同模型或平台都能用一致方式操作信箱、資料庫、設計工具等外部資源。以前每個 AI 工具都要各自接各自的程式，現在只要支援 MCP，就能共用同一套工具串接方式，讓 AI 真正碰得到工作資料與常用 App。

MCP 的價值很大，但也伴隨風險。文中特別提醒三點安全原則：第一，不要安裝來路不明的 MCP Server，否則等於把系統控制權交給陌生程式；第二，不要把 API Key、密碼直接貼給 AI，應改用本地環境變數或設定檔保存；第三，剛開始使用新 MCP 時，權限應先設為唯讀，避免 AI 因誤判操作而改動甚至刪除重要資料。若想開始使用，可以先盤點自己最常用的 App，再搜尋是否有官方或維護良好的 MCP 專案。

接著談到單一 AI Agent 的極限。當任務複雜度提高，如果把所有指令一次塞給 AI，很容易讓 context window 爆掉，導致判斷力下降。較好的做法是把工作指示拆成一份份 Skill markdown，在真正需要時才載入，這種方式稱為 progressive disclosure（漸進式介入）。但 Skill 一旦要進入正式環境，就不能再用「只是寫 prompt」的心態看待，而要當成軟體功能來設計、測試與維護。

文中整理了 Skill 上線常見的四大問題。第一是 Trigger Failure，description 寫得不清楚，導致該觸發時沒觸發，不該觸發時卻亂入；第二是 Token Budget Failure，把太多內容塞進單一 Skill，導致 AI 記憶空間被占滿；第三是 Execution Failure，雖然 Skill 被正確叫出，但執行過程或工具呼叫順序出錯；第四是 Regression，新 Skill 上線後與舊 Skill 邊界重疊，反而破壞既有系統穩定性。因此 Skill 不只要看最終結果對不對，也要檢查中間的工具使用軌跡是否正確。

為了降低這些風險，Google 提出評估驅動開發的概念，把評估案例當成單元測試來設計。也就是先定義不同情境下的輸入、應使用的工具，以及預期輸出，再開始寫 Skill。之後每次修改都必須重新跑這些案例，未通過就不能上線。當 Skill 越來越複雜，還要建立 Golden Dataset，蒐集大量經典情境與標準答案，讓整體系統能持續驗證穩定性。整體來看，這套方法的重點不是把 AI 當魔法，而是把它當成需要工程化、標準化與安全治理的基礎設施。

2026年7月26日星期日

[AI 影響] Bun用AI在11天內完成Rust重寫的啟示

摘要 : Bun以AI協作流程在11天內將53萬行Zig重寫為Rust，效能提升且更安全。

內容:

最近開源社群出現一個很受矚目的案例：JavaScript工具 Bun，將原本53萬行的 Zig 程式碼，在11天內重寫成超過100萬行的 Rust 程式碼。Bun本身是很流行的 JavaScript 執行與開發工具，能處理執行、安裝依賴、打包與編譯，每月下載量超過2000萬次。這種規模的重寫，過去通常需要一個小團隊投入約一年的時間。

這件事特別值得注意，不只是因為速度快，更因為它證明了大型程式碼庫的重構，未來可以在AI協助下變得可行。過去多數人即使會用AI寫功能，也很少接觸幾十萬、幾百萬行程式碼的重構，因為時間與成本太高；而 Bun 這次提供了一個實際樣本。

在重寫策略上，作者沒有選擇增量替換，而是採取一次性全量重寫。原因是增量重寫雖然看似穩妥，但在中短期內會造成雙語言或雙系統並存，維護成本反而更高。此外，這次重寫並不是先大幅改造設計，而是先盡量保持原有邏輯不變，將 Zig 程式碼直接翻譯為 Rust，等到正式上線後再逐步調整成更符合 Rust 習慣的寫法。

真正關鍵的，是作者採用了 loop engineering 的方式：先明確任務邊界，再讓 AI 在邊界內反覆循環執行。整個流程分成寫程式碼、評審程式碼、修復問題三個環節，並以約50個並行工作流持續跑了11天。作者主要負責監控流程，若發現問題，就去修改整個 loop，而不是手動修某一段程式碼，因為調整流程才能避免後續任務重複犯同樣錯誤。

在品質控制上，作者用了對抗式評審：讓獨立上下文中的另一個 AI 專門審查剛產生的程式碼，且預設立場是「這段程式碼可能是錯的，請找出問題」。這種做法模仿人類工程中的程式碼評審機制，讓實作者與評審者角色分離，避免同一個模型在同一脈絡裡傾向為自己辯護。這也帶來實務啟發：AI寫完程式碼後，應另外開新上下文，只提供改動內容，要求它從反方角度找錯，往往比自我檢查更有效。

最終結果是，Rust版本不僅通過全部測試，還帶來記憶體安全，從根本上減少 use-after-free 這類問題。作者形容這次上線是「boring is good」—— Rust版安靜、穩定地上線，幾乎沒人察覺。這個案例也說明，當多個 AI agent 能持續並行工作時，人的角色並沒有消失，而是從親自寫程式轉向設計、監控與優化整個系統流程；這或許正是 loop engineering 真正的價值。

[AI 分享] 反向提問讓AI變身戰略顧問

摘要 : 與其直接向AI要答案，不如讓AI主動提問，幫助理清思路並制定可落地行動方案。

內容:

最近有一個相當顛覆的研究觀點指出，直接向AI提問，未必是最高效的使用方式。相比一味追著AI要答案，更有效的方法可能是反過來操作，讓AI主動向人提問。

這種方式的核心在於角色互換。當一個人腦中資訊混亂、暫時沒有方向，或還沒釐清真正問題時，可以先給AI一段明確指令，讓它不再只是被動回答的工具，而是切換成主動引導的「專屬戰略顧問」。

在這個模式下，AI不再等著使用者發問，而是主導對話節奏，透過連續、高質量且有穿透力的提問，逐步協助使用者摸清現狀、拆解問題、找出關鍵線索。這樣的過程能有效啟動思考，將原本零散混亂的資訊重新整理清楚。

最終，AI不只是提供片段答案，而是能陪著使用者一步一步梳理思路，並共同形成一份具體、詳細且能實際落地的行動規劃。

簡單來說，這段提示詞的價值在於，能讓AI從被動回答模式，快速切換成主動拆解問題的專業顧問模式，特別適合在思路卡住、需要釐清方向時使用。

[AI 分享] 差異化定位

摘要 : 同質化市場中，品牌可透過競品分析、需求挖掘與心智標籤建立清晰差異化定位。

內容:

在產品功能與價格都相差不大的市場裡，差異化定位的核心，是讓品牌在使用者心中佔據一個清晰且有辨識度的位置。這種差異不是品牌自認為的不同，而是使用者能明確感知、理解，並願意為之付費的價值主張，也就是給使用者一個選擇你的明確理由。

判斷差異化定位是否有效，可看三個標準：第一，使用者能一眼看懂，並在實際使用中感受到；第二，和競品有明顯區隔，且不容易被快速複製；第三，能吸引願意付費的目標使用者，支撐長期經營。若只是做些表面功能微調、但使用者無感，就是典型的「自嗨式差異化」。

真正有效的做法，通常是從使用者真實需求出發，聚焦特定人群或場景，透過持續迭代的價值主張建立認知。許多成功品牌，往往不是什麼都做，而是專注解決某一類人、某一個場景中的關鍵問題，因此更容易被記住，也更容易形成共鳴。

在實操上，做差異化之前要先分清競爭對手，包括直接競品、間接競品、替代品類與潛在進入者。可透過表格動態整理競品清單，並結合行業報告、公開資料、使用者訪談、論壇社群討論與流量工具觀察，逐步建立競品畫像、競爭力雷達圖與差異化機會矩陣，看清市場空白與痛點。

進一步對標競品時，可以從產品功能、使用者體驗、技術能力與真實使用場景等層面拆解，找出哪些需求是使用者在意、但市場還沒做好或沒人深挖的。很多突破口，往往就藏在那些未被滿足的小需求裡，最後再回到自身優勢，提煉出具創新性的定位方向。

差異化定位落地的關鍵，是搶佔使用者心智：先評估自身市場位置與優劣勢，再挖掘未被滿足的需求空白，最後用極簡清晰的標籤去佔位，並持續在產品、傳播與服務中反覆強化。若再搭配STP模型、價值曲線、使用者分層與痛點分析等工具，並依市場回饋持續調整，品牌才能真正建立長期且穩固的認知壁壘。

[AI 分享] Claude Opus 5登場

摘要 : Anthropic推出Claude Opus 5，主打程式設計與企業應用，效能提升、成本降低，並登陸多個平臺。

內容:

Anthropic正式釋出Claude Opus 5，定位為面向程式設計與企業業務的高強度工作主力模型，並已登陸多個平臺。這次更新主打效能提升與實務應用能力強化，特別鎖定開發者與企業用戶需求。

在模型能力方面，Opus 5被視為Claude Pro系列中的最強版本，程式設計表現已接近Fable 5，但整體價格僅需對方的一半。相較前代Opus 4.8，Opus 5在多項能力上都有明顯升級，整體任務完成效率也大幅提升。

根據測試結果，Opus 5在軟體工程相關測試中的表現優於多數競品，任務完成能力更達到Opus 4.8的兩倍。在最高推理檔位下，Opus 5的成績已接近Fable 5，但成本控制更具優勢，展現出高性價比。

在ARC AGI 3測試中，Opus 5的得分達到第二名模型的三倍，顯示其在高階推理與複雜任務處理上的突出能力。即使在最低推理檔位下，Opus 5在自動化任務測試中的完成任務量，仍優於其他模型，代表其基礎效能同樣相當強勁。

Opus 5也支援百萬級上下文，定價則維持不變，進一步提高長文本與大型專案處理能力。另一方面，Opus 4.8新增Fast模式以提升速度，但目前尚未全面上架至部分雲平臺。

在實際工作表現上，Opus 5具備一定程度的自主檢查與糾錯能力，面對日常任務時可主動進行核驗，並持續最佳化輸出結果。它也能修復漏洞與處理部分邊緣場景，不過也因為過度校驗傾向，可能導致預設輸出內容變得更長。

安全性方面，Opus 5的安全約束相較Fable 5略弱，但對部分高風險安全相關操作仍然設有限制。整體來看，Opus 5觸發安全限制的情況更少，而在遇到限制時，系統也可自動切換至Opus 4.8，以維持任務處理的連續性。

2026年7月24日星期五

[AI 分享] Cursor 與 Claude Code 怎麼選

摘要 : 從介面、工作流、模型與擴充性比較 Cursor 與 Claude Code，並給出實際選型建議。

內容:

這篇內容聚焦比較 Cursor 與 Claude Code，幫助正在兩者間猶豫的人快速釐清差異。影片也先整理幾個常見概念，包括帶 AI 功能的程式碼編輯器、終端 CLI 助手、Agent 模式，以及上下文視窗等，方便理解後續比較。

Cursor 的核心特色是延續 IDE 的使用習慣，介面熟悉、上手自然。可透過 Composer 以自然語言生成與修改程式碼，並即時審查結果，維持流暢的編輯體驗。它也支援多種模型，並能利用 Cursor Rules 讓 AI 遵守專案規範，雖然彈性高，但需要一些前期配置。

在日常編碼體驗上，Cursor 的智慧補全表現亮眼。使用者可以透過快捷鍵接受多行建議，或逐步確認內容，大多數操作都能在不離開鍵盤的情況下完成，對熟悉 IDE 工作流的人來說相當順手。

Claude Code 則走完全不同的路線，主打終端操作與自然語言驅動。啟動後每一步指令都清楚可見，透明度高。它的 Agent 模式是強項，搭配 MCP 協議後，還能連接本地資料庫或 API，更適合執行複雜的自動化任務。

在記憶與上下文管理方面，Claude Code 也有明顯優勢。它可透過 Claude MD 自動載入專案背景，並以 Memory 機制在多次對話中保留關鍵資訊，減少重複說明的成本，特別適合長流程、多步驟的協作場景。

最後的選型建議很務實：若團隊工作方式以 IDE 為中心，Cursor 會是較穩妥的選擇；若偏好終端、自動化與代理式工作流，Claude Code 更貼近需求。也不必被單一功能綁住，兩者可以搭配使用，重點不是哪個最好，而是哪個最適合你的工作方式。

[AI 分享] 用巴甫洛夫效應賣出高價

摘要 : 產品想賣貴，關鍵不只講功能，而是讓顧客把產品與美好場景、情緒和身份感連結起來。

內容:

如果你想把產品賣得更貴，核心往往不只是提升品質，而是讓顧客在腦海中，將產品和某種美好的場景、情緒或生活方式建立連結。這背後對應的，就是巴甫洛夫效應在商業中的應用。

巴甫洛夫實驗說明的是，當某個訊號長期和某種感受綁定之後，人們即使只接收到訊號，也會自然喚起對應反應。放到銷售裡，顧客真正有反應的，常常不只是產品本身，而是產品所代表的場景、情緒、身份象徵，以及使用後的結果感受。

例如，同樣是賣牛排，如果只是說「原切黃牛肉、冷鏈配送、肉質緊實」，顧客通常只會想知道一斤多少錢；但如果換成「週五晚上不用訂餐廳，在家也能享受一場有儀式感的雙人晚餐」，顧客腦中浮現的就是燈光、餐盤、紅酒杯和兩人共享的氛圍。這時候賣的就不只是牛排，而是一種生活品質與體驗，因此價格也更容易被接受。

很多老闆的問題在於，只會老實地講功能和品質，結果顧客看到的只是成本與參數，接著自然進入比價模式。當產品無法在顧客心中形成「我願意多花一點錢」的具體畫面，再好的品質也很難支撐更高售價。

品牌打造也是同樣的原理。以可口可樂為例，如果只談功能，它不過是一瓶有氣的甜飲；但它長年透過紅色視覺、冰塊氣泡、漢堡、足球、聚會、聖誕節等元素，持續把品牌和快樂、分享、團聚這些積極情緒綁定在一起。所以消費者想到可口可樂時，想到的往往不是飲料本身，而是幸福、熱鬧與熟悉的集體記憶。它賣的其實是那些美好瞬間。

這種做法也適用在各類產品上。像兒童牙膏，如果只講低氟配方、水果味，家長就會拿去比較成分、容量和價格；但如果表達成「讓孩子晚上少一次抗拒刷牙，讓媽媽少一次睡前拉扯」，那賣的就是家庭和諧、媽媽的省心，還有睡前那十分鐘的安寧。

香氛產品也是一樣。只說留香久、味道自然，顧客還是在問價格和使用天數；但如果說「推開家門那一刻，就像回到一個乾淨、放鬆、有質感的空間」，那賣的就不只是香味，而是回家後的鬆弛感。

衝鋒衣如果只談防風、防水、透氣、耐磨，顧客會一直比規格；但如果換成「週末進山時，天氣突然變了也不慌」，顧客買到的就是戶外情境裡的一份安全感與安心感。

禮盒也是如此。若只介紹內容物、包裝設計，顧客仍然會計算值不值；但若說成「拜訪客戶放在前台不失禮，送長輩拿出手也不寒酸」，那賣的就不是食物，而是關係中的體面感與自己的形象。

因此，真正能讓產品價格站得住的，不是「高級」、「匠心」這類空泛標籤，而是能不能在顧客腦中刻畫出一個具體且有價值的畫面。畫面越清晰，顧客越能感受到產品價值，也越不容易只拿它去和別人比價。

總結來說，想讓顧客願意多付錢，靠的不是口號，也不是單純堆功能，而是把產品放進顧客已經認同的高價值場景裡。當產品和美好生活、放鬆感、安全感、體面感或幸福感建立了穩定連結，它的價格自然就更容易被接受。

2026年7月22日星期三

[AI 分享] Apple 憑證與描述檔設定流程

摘要 : 整理 Apple Developer 中 CSR、憑證、App ID 與 Profile 的建立與安裝流程。

內容:

本文主要整理 Apple Developer「Certificates, Identifiers & Profiles」的操作流程，目的是完成 iOS App 簽署所需的身分識別、憑證與描述檔設定。

首先需在 Mac 的「鑰匙圈存取」中建立 CSR（憑證簽署要求）。開啟「鑰匙圈存取」後，不要先選任何項目，從上方選單進入「憑證輔助程式」並選擇「從憑證授權要求憑證」。電子郵件可隨意填寫，一般名稱則建議填入易識別名稱，勾選「儲存到磁碟」後匯出 .certSigningRequest 檔案，通常會儲存在桌面。

接著可視情況處理 CSR 對應的本機憑證。雙擊剛建立的 CSR 後，系統會跳出憑證輔助程式視窗，可使用預設選項替自己製作憑證。完成後，可在「鑰匙圈存取」的「密鑰」頁籤看到公私鑰，在「憑證」頁籤看到憑證；若未立即顯示，可嘗試關閉後重新開啟鑰匙圈存取。

若使用的是院方或第三方提供的憑證，則需向對方索取 p12 私鑰檔與其開啟密碼，並匯入到鑰匙圈中。完成這些步驟後，才能取得可用的簽署身分識別。

在 Apple Developer 後台中，登入後切換到目標帳號，進入「Certificates」頁面新增憑證。依需求選擇 Development（開發用）或 Distribution（部署用）類型，接著上傳前面產生的 CSR 檔並完成建立。建立成功後下載 .cer 憑證檔，雙擊安裝至 Keychain Access，安裝後通常會顯示類似「iPhone Distribution: Name (Team ID)」的項目。

之後需在「Identifiers」中新增 App ID。進入該頁後按下新增，選擇 App IDs 與 App，填寫辨識名稱與 Bundle ID，並依 App 功能需求勾選對應能力，確認後註冊即可完成。最後到「Profiles」中新增描述檔，依用途選擇 Development、Distribution 或 In House，指定對應 App ID 與憑證；若為 Development，還需選取要加入的測試裝置。命名 Profile 時建議加上用途或開發工具名稱以利辨識，產生後下載 .mobileprovision 並安裝，即可供 Xcode 或其他開發工具使用。

[AI 分享] Google AI開發框架Day1重點

摘要 : Google將AI開發共識整理成框架：vibe coding、agentic engineering、context engineering與token成本思維。

內容:

現在有大量專業開發者已經在使用AI Coding Agent，甚至相當比例的新程式碼已由AI產生。但「vibe coding」與「agentic engineering」這些詞經常被混用，導致討論失焦。Google近期推出五天AI開發課程，嘗試把業界逐漸形成的共識整理成正式框架，而這段內容主要濃縮的是Day1的核心觀念。

首先，vibe coding與agentic engineering不是非黑即白，而是一條光譜。從低結構性的vibe coding，到中間的structured AI-assisted coding，再到高紀律的agentic engineering。差異不在於有沒有用AI，而在於AI輸出的規格化程度、驗證方式，以及人類是否設下邊界與判斷機制。像是原型開發可以偏向vibe coding，但若是金流、正式API等高風險場景，就必須走向agentic engineering。

這條光譜上最關鍵的分水嶺是「驗證」。Google強調，沒有tests與evals，再精緻的prompt本質上仍然只是vibe coding。tests用來驗證可確定的輸入輸出，evals則檢查agent的路徑、工具使用與最終品質是否符合標準。換言之，真正成熟的AI開發，不是讓AI一直試錯，而是把驗證系統先建立起來。

若想從vibe coding走向agentic engineering，真正該強化的不是prompt engineering，而是context engineering。這可以理解成替AI做完整的入職訓練：除了任務本身，還要提供角色邊界、領域知識、記憶、範例、可用工具與硬性約束。這些context又可分為static與dynamic兩種：前者穩定但昂貴，後者彈性且省token，但必須設計好何時載入，這本身就是架構決策。

在dynamic context管理上，課程特別強調agent skills的重要性。與其把所有知識都塞進system prompt，不如讓agent先保持通用，只有在任務匹配時才載入對應skill，這種做法稱為progressive disclosure。它能讓同一個agent帶著多種專業能力，但只在需要時支付token成本。同時skills也應持續迭代、模組化維護，避免過大、難追查，否則一旦輸出失準，很難找到是哪個skill造成偏差。

最後，AI正在重塑整個SDLC，也就是軟體開發生命週期。真正被大幅壓縮的是implementation，寫程式可能從數週縮到數小時；但需求訪談、架構決策與品質驗證，多數仍由人主導。因此，AI不是單純讓舊流程加速，而是讓流程邊界變模糊、迭代週期縮短，並把spec品質、context設計與驗證系統，推升為新的核心競爭力。越早建立這些工作系統的人，後續使用AI的效率與成本通常都會更有優勢。

2026年7月21日星期二

[AI 分享] GPT 5.6 模型選擇指南

摘要 : GPT 5.6 新增多層選項，重點是先選模型，再選思考深度，必要時才用 Ultra 與 Max。

內容:

GPT 5.6 發布後，許多人第一時間感到困惑，因為模型選項一下子變得很多。除了 Luna、Terra、Soul 這三種模型，還有 Low、Medium、High、XIGH、Max，以及 Ultra 等設定。過去使用 ChatGPT 時，多半只需要思考怎麼提問，現在則變成提問前還要先做一輪選擇。

首先可以把 GPT 5.6 的三種模型，理解成三種不同的交通工具。Luna 像電動車，速度快、成本低，適合大量且重複性的任務，例如翻譯、整理會議記錄、批次生成標題、提取表格資訊、客服分類，或快速回答簡單問題。這類任務重點在效率與規模，不需要模型花太多時間深度思考。

Terra 則像家用汽車，在效能、速度與成本之間取得平衡。大多數日常工作直接選 Terra 就足夠，例如撰寫一般文案、分析資料、製作方案、修改程式碼、處理工作文件等。這些工作需要一定思考，但還不到必須動用最強模型的程度，因此 Terra 是最適合多數場景的通用選擇。

Soul 像專業工程車，適合處理困難程式設計、複雜研究、重要決策，以及對成果品質要求很高的任務。例如排查隱藏很深的程式故障、分析大量資料、設計完整商業方案，或處理錯誤代價特別高的工作。簡單來說，第一層選擇可以記成：簡單大量選 Luna，日常多數任務選 Terra，複雜重要任務選 Soul。

第二層選擇是 Low、Medium、High、XIGH 和 Max。這些並不是不同模型，而是模型願意花多少時間思考的設定。可以把它想像成同一位員工，在五分鐘內交答案，和花一小時檢查資料後再交答案，品質自然可能不同。Low 適合簡單且追求速度的任務；Medium 是最均衡的預設檔位；High 和 XIGH 適合需要認真分析、檢查，以及多步推理的問題。

至於 Max，它代表讓模型盡可能多花時間處理任務，但並不適合長期開啟。因為思考時間越長，等待時間與使用成本通常也會增加。若只是簡單任務卻開 Max，就像找一個專家團隊開三小時會議，只為了修改一句標題，明顯不划算。OpenAI 的建議也是先從 Medium 開始，只有在實測發現 High 或 XIGH 能明顯提升品質時，再往上調整；Max 則留給最困難、且品質優先的任務。

第三層是 Ultra。Ultra 和 Max 並不是同一種概念。Max 是讓單一模型思考更久，而 Ultra 更接近同時派出多個 AI 智慧體並行工作。官方預設會協調四個智慧體，讓它們分別處理不同方向的內容，再整合成最終結果。舉例來說，如果要做一份行業研究，可以讓一個智慧體研究市場規模，一個分析競爭對手，一個整理技術趨勢，另一個負責檢查結論，最後統一生成報告。這種可以拆分成多個獨立部分的任務，Ultra 才能發揮價值。若只是翻譯一句話，或問明天穿什麼，使用 Ultra 幾乎就是浪費算力。

另外，也提醒開發者一個常見陷阱：在 API 中如果直接呼叫 GPT 5.6 這個名稱，實際上通常會指向 Soul，而不會依照任務自動幫你切換 Luna、Terra 或 Soul。也就是說，如果以為系統會自動選最划算的模型，實際上可能每個簡單任務都在用成本最高的 Soul。

在成本方面，若以相同輸入 100 萬 token、輸出 100 萬 token 來計算，Luna 大約是 7 美元，Terra 約 17.5 美元，Soul 約 35 美元。也就是說，Soul 的成本大約是 Luna 的 5 倍。雖然實際費用還會受到輸出長度與執行效率影響，但在大量任務情境下，選錯模型會帶來很明顯的成本差距。

最後，文中整理出一套簡單的選擇公式。第一步，如果什麼都不確定，就先選 Terra 加 Medium。第二步，如果任務需要更快、更便宜，或是批次處理，就改用 Luna。第三步，如果任務困難、重要，或做錯代價很高，就換成 Soul。第四步，如果模型能力足夠，但回答仍不夠深入，再把 Medium 提高到 High 或 XIGH。第五步，只有當任務可以拆成多個獨立方向並行處理時，才考慮使用 Ultra。至於 Max，則保留給那些願意多等一會，也一定要追求高品質結果的困難任務。

整體來看，GPT 5.6 增加的不只是模型能力，也增加了使用者的選擇成本。未來使用 AI，不只是問哪個模型最強，還要進一步思考兩件事：這個任務做錯的代價有多大，以及這個任務能不能拆開並行完成。只要先想清楚這兩點，Luna、Terra、Soul、Max 與 Ultra 的選擇其實就不會那麼複雜。

[AI 分享] ChatGPT全面升級

摘要 : 全新ChatGPT可串接工具、執行自動化、分析資料、產出內容並協助除錯，從問答進化為真正能代辦工作的助手。

內容:

OpenAI 發表全新版本的 ChatGPT，涵蓋網頁、桌面與手機平台，重點不再只是回答問題，而是能串接使用者常用工具，直接接手實際工作。像是讀取行事曆、Slack、雲端硬碟等資訊，幫忙整理當日重點與會議準備事項。

新版也支援外掛與自動化任務。外掛可連接各種應用程式，或提供銷售、數據分析、行銷等角色導向流程；同時，使用者可以設定固定任務，例如每天早晨自動提供工作簡報，或持續追蹤特定賽事比分，不必每天重新下指令。

在跨裝置使用上，ChatGPT 可於網頁、手機與桌面之間無縫延續工作。桌面版更可結合本機檔案與專案內容，讓使用者先交付任務、提供背景資料，再等待 ChatGPT 完成或回報進度，提升整體工作流效率。

展示案例中，ChatGPT 先被用於行銷場景：根據品牌 Logo 與規範生成視覺素材、發想廣告方向、建立 mood board，甚至整理成簡報供團隊檢視，大幅縮短創意探索與提案準備時間。

在資料分析場景裡，ChatGPT 能整合分散於不同來源的指標、用戶回饋、團隊對話與上市計畫，自動套用合適分析流程，找出關鍵問題，並進一步生成儀表板、加上摘要說明、發布成網站，還可設定每日自動更新後分享給團隊。

工程應用方面，整合進 ChatGPT 的 Codex 可協助定位並修復程式問題。若沒有專屬外掛，ChatGPT 甚至可直接操作電腦或瀏覽器，模擬使用流程、檢查錯誤、確認問題來源，最後提出修正程式碼 diff 與 PR。整體而言，這次升級將 ChatGPT 從對話工具推進為能在應用、專案、瀏覽器與電腦中實際執行工作的 AI 助手。

[AI 分享] ChatGPT Work重塑辦公流程

摘要 : ChatGPT Work不只是聊天工具，而是讓AI正式進入整理、起稿與跟進等日常辦公流程。

內容:

OpenAI推出的ChatGPT Work，不只是讓AI多回答幾個問題，而是進一步讓AI參與真實的辦公流程。如果只是把它當成聊天工具，其實沒有真正發揮它的價值。

對一般使用者來說，可以先從三類工作開始使用。第一類是整理資料，例如會議記錄、客戶回饋、產品資訊與行業文章，交給AI協助歸納重點，並整理成表格或文件。

第二類是生成初稿，像是方案彙報、電子郵件、PPT大綱等，都可以先讓AI產出第一版。重點不是要求AI一次完成，而是先幫你搭好初步框架，再由人進一步修改完善。

第三類是持續跟進，例如每週更新專案進度、整理新資訊、提醒哪些事項尚未處理。這類持續性工作，才是AI在辦公場景中真正能長期發揮價值的地方。

ChatGPT Work的意義，不在於一鍵取代所有工作，而是先接手那些重複整理、初稿搭建與進度追蹤等耗時工作，幫助使用者節省時間、提升效率。

因此，最值得關注的不只是OpenAI推出了一項新功能，而是它提醒了所有普通人：未來會使用AI辦公的人，與不會使用的人之間，效率差距只會越來越明顯。

2026年7月20日星期一

[AI 分享] 精簡Prompt反而更強

摘要 : OpenAI最新指南指出，面對新一代模型，Prompt不一定越長越好，清楚定義目標、邊界與輸出，往往比堆疊規則更有效。

內容:

許多人以為模型越強，Prompt就要寫得越複雜，但OpenAI最新官方指南反而提出相反觀點：對GPT5.6這類新模型來說，問題往往不是Prompt寫太少，而是寫太多。許多長期維護的System Prompt像不斷補丁的舊程式，累積了過時、重複甚至矛盾的規則，讓真正重要的資訊被埋沒，也增加模型理解與判斷成本。

OpenAI在內部Coding Agent評測中發現，改用更精簡的System Prompt後，模型評分提升約10%到15%，總token減少41%到66%，成本下降33%到67%。雖然這些結果不能直接套用到所有場景，但至少說明一件事：Prompt長度和效果並非正比，更多指令不一定帶來更好控制，反而可能製造噪聲。

這份指南的核心邏輯是：不要替模型規劃每一步，而要清楚說明你真正想得到的結果。對多數任務來說，只要交代四件事就夠了：目標、上下文、輸出與邊界。與其把任務拆成繁瑣流程，不如直接描述成品要給誰看、重點是什麼、哪些內容不能動。只有當過程本身會影響結果，例如合規、財務或實驗分析時，才需要明確規定步驟。

減少流程控制不等於放棄控制，真正該寫清楚的是成功標準與行動邊界。像是哪些資料只能讀不能改、郵件只能產生草稿不能直接寄出、預算和日期不能變更、資訊不足時要明確標示，這些具體限制比反覆強調「務必小心」更有效。因為模型有能力做某事，不代表使用者已授權它真的去做。

在工具與檢索方面，原則也相同：只提供當前任務真正相關的工具，說明要短而準，讓模型知道工具用途、適用場景、回傳內容與失敗意義。若需要最新資訊，就要求使用搜尋；若需要可驗證性，就要求保留來源。重點是告訴模型去哪裡找、找什麼，而不是替它寫死每一步搜尋流程，否則容易陷入不斷搜尋卻沒有增加有效成果的低效狀態。

對一般使用者來說，最實用的做法是先用自然語言提出需求，再根據結果逐步修正，而不是一開始就追求完美Prompt。長期偏好和單次任務需求也應分開管理；簡潔、友好、專業等抽象詞，最好改寫成具體要求。至於推理強度，也不是越高越好，如果目標、材料與驗證方式本來就不清楚，只會讓模型花更多成本思考一個模糊問題。最終，Prompt工程的核心不是堆疊術語，而是減少歧義，並在可能情況下加入實際驗證。

RAG 不只一種：一次看懂 16 種 RAG 架構與應用場景

談到生成式 AI，RAG（Retrieval-Augmented Generation，檢索增強生成）已經成為企業導入大型語言模型時的重要技術。它的核心概念並不複雜：在大型語言模型回答問題之前，先從外部資料來源檢索相關資訊，再將找到的內容與使用者問題一起交給模型生成答案。

這種「先找資料，再回答問題」的設計，可以補足大型語言模型知識過時、無法掌握企業內部資訊，以及容易產生幻覺等缺點。不過，RAG 並不是一套固定不變的架構。隨著資料型態、任務複雜度、即時性、隱私、產業規範與系統規模不同，RAG 已逐漸發展成一系列可以組合使用的設計模式。

本文整理 16 種常見的 RAG 類型，說明它們的核心機制、主要價值、適用情境與導入時應注意的問題。

需要先說明的是，這 16 種類型並不是業界統一認證的正式分類標準。其中有些屬於技術架構，有些是檢索策略，有些則是應用情境。實務上，它們通常不是互斥選項，而是可以疊加組合。

一、Standard RAG：最基礎的檢索增強生成

Standard RAG，也就是標準 RAG，是大多數企業建立知識庫問答系統時的起點。其基本流程是將文件切割成多個段落，轉換為向量後存入向量資料庫。當使用者提出問題時，系統先找出語意最相近的文件片段，再將這些內容交給大型語言模型產生答案。

早期 RAG 論文曾提出 RAG-Sequence 與 RAG-Token 等生成方式，但現代企業系統所稱的 Standard RAG，通常泛指單次查詢、單次檢索與單次生成的基本架構。

這種方式的優點是實作相對簡單，能快速建立概念驗證版本，也能讓模型回答企業內部文件、產品手冊、FAQ 或制度規章等問題。常見工具包括 Hugging Face Transformers、LangChain、LlamaIndex及各種向量資料庫。

不過，標準 RAG 對複雜問題的處理能力有限。如果問題需要多次查詢、跨文件推理、工具操作或權限判斷，單次檢索通常不足以產生可靠答案。

二、Agentic RAG：讓 AI 主動決定下一步

Agentic RAG 在傳統 RAG 之上加入 AI Agent 的自主決策能力。系統不再只是收到問題後直接搜尋，而是先分析使用者的意圖，再決定是否需要檢索資料、使用哪一個資料來源、呼叫哪些工具，以及是否需要進一步查證。

例如，使用者詢問某份維護合約今年應開立多少發票時，Agentic RAG 可以先查找合約文件，再擷取金額、履約期間與付款條件，接著呼叫計算工具完成分期與稅額計算，最後將結果整理成表格。如果資料不足，它還可以主動要求使用者補充。

Agentic RAG 適合研究助理、企業工作助理、進階客服、合約處理、財務分析及跨系統工作流程。不過，它的成本、延遲與系統風險也高於標準 RAG，因此必須加入工具權限、操作稽核、流程限制及人工覆核機制。

三、Graph RAG：從文件片段進一步理解知識關係

傳統向量檢索擅長找出語意相似的內容，卻不一定能掌握人物、組織、產品、事件與文件之間的關係。Graph RAG 透過知識圖譜建立實體與關聯，讓系統不只知道「哪些內容相似」，也能理解「哪些事物彼此有關」。

例如，在醫療情境中，可以建立病人、診斷、藥物、檢驗、手術與時間之間的關係；在合約管理中，則可以連結客戶、專案、合約、服務項目、付款期程與負責部門。

Graph RAG 特別適合法律、醫療、製造、工程與組織知識管理等關係複雜的領域。常見技術包括 Neo4j、Stardog、Apache Jena，以及結合知識圖譜與大型語言模型的 Graph RAG 框架。

它的主要挑戰是建置成本較高。實體抽取、關係定義、資料更新及圖譜治理都需要持續維護，並不是導入圖形資料庫就能自然獲得正確推理能力。

四、Modular RAG：將 RAG 拆成可替換的模組

Modular RAG 將文件解析、資料清洗、分段、索引、查詢改寫、檢索、重新排序、權限過濾、生成與結果驗證拆成不同模組。每個模組可以獨立調整或替換，不必將整套系統綁死在單一框架上。

這種設計適合大型企業、多人協作或需要長期演進的產品。例如，企業可以先使用一般向量模型，未來再替換成適合繁體中文或特定產業的模型；也可以針對不同資料來源使用不同解析流程。

微服務、Docker、Kubernetes與事件訊息平台可以支援模組化架構，但它們只是工程工具，並不等於 Modular RAG 本身。真正的重點在於介面標準化、模組邊界與可替換性。

模組化能提高擴充性，但也會增加部署、監控、版本管理與系統整合的複雜度。因此，小型概念驗證不一定需要一開始就採用完整微服務架構。

五、Memory-Augmented RAG：讓系統記得過去

Memory-Augmented RAG 加入外部記憶機制，使系統可以保存並檢索過去的對話、使用者偏好、任務狀態或重要決策。

記憶通常可以分成短期記憶與長期記憶。短期記憶用來維持目前對話的連續性；長期記憶則可能保存使用者習慣、過去專案、常用格式與重要背景資訊。

這種架構適合個人助理、客戶服務、長期專案協作與個人化推薦。常見儲存方式包括 Redis、關聯式資料庫、文件資料庫與向量資料庫。

但記憶不是保存得越多越好。系統必須處理資料過期、錯誤記憶、敏感資訊、使用者同意與刪除權等問題。如果沒有記憶治理，錯誤內容可能反覆影響後續回答。

六、Multi-Modal RAG：讓檢索不再侷限於文字

Multi-Modal RAG 將檢索範圍從文字擴展到圖片、音訊、影片、表格、工程圖與醫療影像。系統可以同時理解不同形式的資料，再將它們組合成回答。

例如，在工程審圖情境中，系統可以同時讀取二維 PDF 圖面、零件圖片與 Feature Graph JSON；在會議管理中，也可以結合錄音逐字稿、簡報與附件；在醫療領域，則可能同時參考影像、報告與結構化檢驗資料。

Multi-Modal RAG 適合影片摘要、圖像描述、文件審查、教育、製造與醫療應用。相關技術包括 CLIP、多模態嵌入模型、OCR、語音辨識與視覺語言模型。

其難點在於不同模態之間的對齊。單純將圖片轉成文字並不代表真正理解圖片，表格、座標、版面與物件關係也可能在轉換過程中遺失。

七、Federated RAG：從分散資料來源取得資訊

Federated RAG 的重點是資料不必全部集中到同一個知識庫。系統可以向不同部門、不同組織、不同地區或不同權限域的資料來源提出查詢，再將結果整合起來。

這種架構適合醫療、金融、政府與跨組織協作場景，尤其適用於資料不能任意搬移或集中儲存的環境。

不過，Federated RAG 不應直接等同於 Federated Learning。前者主要處理分散式檢索與答案整合，後者則著重於模型在不集中原始資料的情況下進行訓練。兩者可以搭配，但並不是同一種技術。

Federated RAG 的真正挑戰包括跨來源身分驗證、權限控管、資料格式一致性、延遲、結果去重、可信度排序及稽核追蹤。

八、Streaming RAG：讓最新資料即時進入回答

Streaming RAG 適合資料持續變動，而且答案必須反映最新狀態的場景。它會持續接收並處理即時事件，讓系統能夠檢索最新資訊。

常見應用包括金融行情、資安事件、設備監控、新聞追蹤、客服工單與社群媒體分析。Apache Kafka、Amazon Kinesis與 Spark Streaming 可以協助建立資料串流管線。

但 Streaming RAG 不只是資料進得快。企業還必須處理索引更新延遲、重複事件、事件順序、時間有效性與舊資料失效等問題。否則，系統可能同時檢索到互相矛盾的新舊資訊。

九、ODQA RAG：面向開放領域的問答系統

ODQA 是 Open-Domain Question Answering 的縮寫，代表系統需要回答跨領域、範圍廣泛的問題。它的資料來源可能包括搜尋引擎、百科資料、新聞、公開網站與大型文件庫。

這類系統重視廣泛覆蓋能力與動態檢索，適合通用搜尋、研究輔助與虛擬助理。Elasticsearch、Haystack、Hugging Face Transformers及搜尋 API 都可以成為實作的一部分。

相較於企業內部 RAG，ODQA 更難控制來源品質。系統需要處理網站可信度、資訊時效性、來源衝突、惡意內容與引用追蹤，否則即使成功找到資料，也不代表答案可靠。

十、Contextual Retrieval RAG：根據情境重新理解問題

Contextual Retrieval RAG 會參考對話歷史、使用者角色、目前任務與既有條件，重新理解使用者的問題，再執行檢索。

例如，使用者接著詢問「那第二年的金額呢？」如果系統只搜尋這句話，幾乎不可能找到正確答案。情境檢索會先將問題改寫成「某份兩年期維護合約第二年度應開立的發票金額」，再進行搜尋。

這種方式適合對話式 AI、客服機器人與長流程工作助理。它與 Memory-Augmented RAG 有關，但兩者重點不同：記憶增強著重保存過去資訊，情境檢索則著重利用目前脈絡改善查詢。

風險在於錯誤脈絡可能污染檢索。如果系統誤解「那份合約」指的是哪一份文件，後續回答即使計算正確，也會建立在錯誤對象之上。

十一、Knowledge-Enhanced RAG：結合結構化知識

Knowledge-Enhanced RAG 將一般文件檢索與結構化知識來源整合，例如知識圖譜、主資料、詞彙表、本體模型、規則庫或企業資料庫。

它能讓模型在回答問題時，同時參考非結構化文件與明確定義的知識。例如，醫療系統可以透過本體模型理解疾病、藥物與檢驗項目的分類；工程系統則可整合材料規格、公差標準與零件關係。

這種方法能提高事實準確性與領域一致性，適合法律、醫療、教育與製造等專業場景。常見技術包括 OWL、Apache Jena、知識圖譜與各類 Embedding 工具。

Knowledge-Enhanced RAG 和 Graph RAG 有部分重疊，但前者範圍更廣，不一定要使用圖形資料庫，也可以整合結構化資料表、規則或領域詞彙。

十二、Domain-Specific RAG：針對特定產業深度設計

Domain-Specific RAG 是針對特定領域建立的 RAG 系統。它不只是更換資料來源，而是從文件解析、術語、分段方式、Embedding、查詢策略、提示詞、驗證規則到輸出格式，都依照產業需求設計。

例如，醫療 RAG 必須處理縮寫、診斷代碼、時間軸與資料隱私；法律 RAG 必須辨識條文層級、版本效力與管轄區域；工程 RAG 則可能涉及 BOM、尺寸、公差、材料與圖面版本。

這類系統具有較高的相關性與可信度，也更容易符合產業規範。然而，導入成本通常高於通用型 RAG，並需要領域專家參與資料治理、測試與驗收。

十三、Hybrid RAG：結合關鍵字與語意檢索

Hybrid RAG 將多種檢索方法結合起來，最常見的是全文關鍵字檢索與向量語意檢索。

向量檢索擅長找到語意相近的內容，但對產品代碼、合約編號、醫療代碼與精確名稱不一定敏感；關鍵字檢索擅長精確匹配，卻可能找不到使用不同說法表達的相同概念。兩者結合後，可以兼顧精確度與召回率。

實作時通常還會加入 Metadata Filter 與 Reranker，先依權限、日期、部門及文件類型縮小範圍，再重新排序檢索結果。

Hybrid RAG 是企業知識庫中非常實用的選擇。Elasticsearch、OpenSearch及支援混合搜尋的向量資料庫都可以使用。它的難點在於如何調整不同檢索分數的權重，而不是單純把兩組結果合併。

十四、Self-RAG：讓模型檢查自己的回答

Self-RAG 在回答流程中加入自我反思與品質判斷。模型會評估是否需要檢索、找到的內容是否足以支持回答、答案是否符合來源，以及是否需要重新搜尋或修正。

這種架構可以改善答案的事實性與連貫性，適合教育、研究、內容生成與高準確度問答。

不過，模型的自我檢查不等於客觀驗證。模型可能對錯誤答案表現得非常有信心，因此高風險場景仍需搭配規則驗證、來源引用、第二模型檢查或人工覆核。

此外，Fine-tuning 與 Human-in-the-Loop 可以協助實作 Self-RAG，但它們並不是 Self-RAG 的必要條件或專屬工具。

十五、HyDE RAG：先假設答案可能長什麼樣子

HyDE 是 Hypothetical Document Embeddings 的縮寫。它的做法是先根據使用者問題產生一段「假設性文件」或可能的答案，再將這段內容轉換成向量，用來搜尋真正的相關文件。

它適合處理問題描述過短、用詞與文件差異很大，或隱含語意較強的查詢。因為假設性文件通常包含較完整的領域詞彙，所以有機會找到原始問題直接搜尋時無法命中的內容。

HyDE 可以提高召回率，但也可能受到假設內容誤導。如果模型一開始做出錯誤假設，檢索方向就可能偏離。因此，實務上通常會將原始查詢與 HyDE 查詢並行使用，再合併及重新排序結果。

十六、Recursive／Multi-Step RAG：將複雜問題拆成多次檢索

Recursive RAG 或 Multi-Step RAG 適合無法透過一次搜尋回答的問題。系統會將複雜問題拆成數個子問題，根據前一步取得的資訊決定下一步要搜尋什麼，最後再整合所有證據。

例如，要回答「哪些跨年度維護合約尚未完成請款，而且負責專案已有未結工單」，系統可能先搜尋合約與請款狀態，再查詢專案負責人，接著取得工單資料，最後才產生完整答案。

這種架構能處理比較、歸納、因果分析與跨資料來源推理。不過，多步驟流程也會累積錯誤，任何一步理解錯誤，都可能影響後續結果。因此，系統需要保留每一步的查詢、證據與判斷依據。

這 16 種 RAG 可以如何分類？

若從設計目的來看，這些 RAG 類型大致可以分成五個方向。

第一類是基礎檢索架構，包括 Standard RAG 與 ODQA RAG，適合建立基本問答與搜尋能力。

第二類是互動與自主性強化，包括 Agentic RAG、Contextual Retrieval RAG、Memory-Augmented RAG 與 Self-RAG，主要解決任務決策、對話連續性、個人化及答案檢查問題。

第三類是知識與推理強化，包括 Graph RAG、Knowledge-Enhanced RAG、HyDE RAG，以及 Recursive／Multi-Step RAG，重點是改善知識關係、召回能力與多步驟推理。

第四類是系統與工程能力強化，包括 Modular RAG、Streaming RAG、Federated RAG 與 Hybrid RAG，主要處理系統擴充、即時更新、分散資料來源與檢索品質。

第五類則是針對資料型態或產業特性進行強化，包括 Multi-Modal RAG 與 Domain-Specific RAG。

RAG 類型不是選擇題，而是組合題

企業在規劃 RAG 時，不必從 16 種類型中選出唯一答案。真正的系統通常會同時具備多種特徵。

例如，醫院內部知識庫可能採用 Domain-Specific RAG 處理醫療術語，以 Hybrid RAG 結合全文與向量搜尋，再透過 Federated RAG 查詢不同院區的資料。如果要處理影像與報告，還可以加入 Multi-Modal RAG。

企業合約管理系統則可能先使用 Modular RAG 建立可維護的架構，透過 Contextual Retrieval RAG 理解使用者目前正在處理的合約，再由 Agentic RAG 呼叫計算器、工作流或 ERP 系統。

因此，RAG 架構設計的核心並不是追求名稱最多或技術最複雜，而是確認目前要解決的是哪一個問題。

導入 RAG 時應該評估哪些指標？

評估 RAG 系統時，不應只看最後回答是否通順。更重要的是拆開檢索與生成兩個階段進行測量。

檢索層面應關注召回率、排序品質、來源涵蓋率、權限過濾正確性及索引更新時間。生成層面則應評估答案正確性、來源支持程度、引用準確性、幻覺率與拒答能力。

系統營運方面還要衡量回應延遲、模型成本、索引成本、資料更新成本、可用性與維護難度。若應用於醫療、法律、金融或企業機密資料，還必須加入權限、稽核、資料主權、保存期限與人工覆核機制。

換句話說，企業需要評估的不是「有沒有使用 RAG」，而是這套 RAG 是否能持續提供正確、可追溯、符合權限而且成本可控的答案。

結語：從知識問答走向企業工作系統

RAG 已經不再只是把文件放進向量資料庫，再交給大型語言模型回答問題。它正在逐步演進成一套整合資料、知識、推理、記憶、工具與工作流程的企業 AI 架構。

對剛開始導入的團隊而言，可以先從 Standard RAG 與 Hybrid RAG 建立可靠的搜尋基礎；當問題涉及長期互動、跨文件推理或系統操作時，再逐步加入 Memory、Graph、Multi-Step 或 Agentic 等能力。

最重要的是，RAG 的價值不在於採用了多少種技術名稱，而在於能否讓使用者更快取得可信答案，並將答案進一步轉化為可以執行、驗證與追蹤的企業工作流程。

一句話總結：RAG 不是單一技術，而是一個可以依照任務複雜度、資料型態、產業規範與工程條件持續組合、擴充及演進的架構家族。

2026年7月19日星期日

[知識庫 6] 當新人第一天，就能答出只有資深工程師才知道的答案

不是把檔案丟進 AI，而是把公司的經驗，煉成一座問得到、信得過、不外洩的知識庫。

那個只有王小明知道的答案

凌晨三點，客戶的主機服務掛了。運維工程師王小明趕到現場，翻日誌、發現是記憶體被批次作業吃光，調整排程後重開機，恢復。整件事處理得漂亮——然後解法被寫進他自己的筆記本裡。

三個月後，同樣的問題在另一個客戶端重演。這次值班的是剛報到兩週的新人。他查不到任何東西，只能打電話把王小明從床上挖起來。

這不是誰的錯。這是絕大多數企業的日常：公司最值錢的知識，存放的位置叫「某個資深員工的腦袋」。它不會出現在任何資產清單上，但它會離職、會請假、會在凌晨三點關機。

你其實不缺知識，你缺的是「找得到、敢用、敢信」

多數公司不是沒有累積知識，而是知識散在四個找不回來的地方。

一個 90 分鐘的客戶需求訪談錄音躺在硬碟裡，會後沒人想重聽；三週後大家對「客戶到底要不要那個匯出功能」各說各話。安裝 SOP 存在共用資料夾的第七層目錄，新人得靠運氣或爬 Line 群組的樓才翻得到。客戶的維護合約、SLA、報價單在業務的信箱裡，工程師想查「這個客戶保固到什麼時候」只能四處問人。

而那些真正重要的文件，往往含個資、含客戶 IP、含帳號密碼——所以乾脆不分享，或是人工塗黑，塗到自己也不確定乾不乾淨。就算現在把它們丟給 AI 工具，得到的答案也沒有依據，你不知道它從哪裡讀來的、對不對、能不能拿去跟客戶講。至於「誰能看什麼」，靠的是資料夾權限硬切，設錯一次就是一次外洩。

這四件事——找不到、不敢共享、不敢信、權限難維護——才是知識管理真正卡住的地方。

一段錄音，變成一個新人問得到的答案

以下用「鼎峰系統整合股份有限公司」第一系統開發部（示範情境）走一遍。這是王小明那次凌晨故障的現場交接錄音，逐字稿長這樣：

嗯…就是那個客戶 192.168.10.5 那台主機啊，帳號 admin 密碼 P@ssw0rd 那個，
半夜三點服務就掛掉，啊我看 log 是記憶體不夠，就…就先把那個排程改一下，
然後重開機就好了啦，啊王先生你記得跟李小姐講一下喔，下個月要去複查。

雜亂、口語、而且含著三樣絕對不該外流的東西：客戶 IP、帳號、密碼。

系統把它送進清洗程序——去重、遮罩、分類、摘要——出來的是這樣：

## 客戶主機服務半夜中斷處理

- **問題**：客戶主機（IP 已遮罩）每日凌晨服務中斷。
- **原因**：記憶體不足。
- **解法**：調整排程後重新開機即恢復。
- **待辦**：下個月安排複查。

再蒸餾一次，它變成一頁可被互相連結的知識概念頁：

# 記憶體不足導致服務中斷
當主機記憶體耗盡時，服務會被作業系統終止。常見於凌晨批次作業疊加。
處理方式參見 [[重新開機標準程序]] 與 [[排程調整]]。

於是三個月後的那個新人，不用再打電話。他在知識庫問答頁打一句話：

「客戶主機半夜服務掛掉怎麼辦？」

系統回答：

通常是記憶體不足造成。建議調整批次排程後重新開機即可恢復；並安排後續複查。
〔出處：客戶現場維運交接錄音 → 原始逐字稿〕

注意兩件事。第一，答案附出處，點下去可以一路鑽回當初匯入的原始檔——這是「敢信」的前提。第二，帳號、密碼、客戶 IP 一個都沒出現——它們在進入知識庫之前就被遮掉了。

為什麼你敢把合約也放進去

大部分企業卡在「不敢丟進去」，所以這套系統把安全做成兩條不可違反的鐵則。

第一條：遮罩失敗，整筆清洗就算失敗。不是「盡量遮」，而是遮不乾淨就整筆退回重跑。寧可多跑一次，也不讓沒遮乾淨的內容流向下游。

第二條：你無權看的，問答絕不會吐給你。權限不是綁在資料夾上，而是綁在「團隊」上，而且在每一次查詢當下即時驗證。實際跑起來是這樣的：王小明（運維組）問「客戶主機半夜服務中斷怎麼處理」，拿到附出處的完整答案；李四（開發組）問一模一樣的問題，系統回覆查無相關資料——因為那批運維知識不在他的可見範圍內，檢索階段就沒被撈出來。

同一個機制也延伸到公司外。當工程師想在自己慣用的 AI 工具（Claude、Codex 等）裡直接查公司知識時，系統開放一個標準端點；換一組憑證，就換成那個人能看的範圍，與網頁上完全一致。合約與 SLA 這種只有業務該看的東西，開發人員即使透過外部 AI Agent 也查不到、甚至查不出它存不存在。

那知識會過期，會不會變成一座檔案墳場？

會，如果沒有更新機制的話。所以更新被設計成一條可以重跑的產線。

客戶的維護合約續約了，承辦人對原檔案按「上傳新版本」，系統自動建立版本鏈：新版標成 v2，舊版標示「已被取代」，版本歷史可回溯稽核。接著重新清洗、重新蒸餾，索引自動跟著更新。下一次有人問合約相關問題，答到的就是新版內容，出處指向 v2。

你只要從「更新原料」開始，下游會自己刷新。

導入之後，具體會變成什麼樣子

以一般知識管理導入經驗為基準，這是合理的導入目標與期望值（並非實測保證值，實際成效取決於你餵入多少素材、清洗品質與團隊使用習慣）：

找答案的時間：從「半小時翻檔案＋問人」縮短到「1 分鐘問知識庫」，查詢效率約提升 10 倍。
新人上手週期：從 1～2 個月縮短到 2～3 週，約縮短 50%。
重複求助與重複犯錯：同類問題重複發問下降 60% 以上。
敏感資料外洩風險：因強制遮罩且「遮罩失敗＝整筆失敗」，外洩風險趨近於 0。

但比數字更重要的是：這些品質是可以被量出來的，不是喊口號。系統內建兩道評測——一道量「清洗到底乾不乾淨」（該遮的有沒有遮掉、該保留的重點有沒有被誤刪），一道量「檢索找不找得到、準不準，以及越權洩漏是不是等於 0」。你可以把它們當成知識庫的回歸測試：每次餵入新素材、每次調整設定，跑一次就知道品質有沒有退步。

知識管理最常見的失敗，是導入之後沒人知道它到底有沒有用。能被量測，才有辦法被改善。

如果你也有一個「只有某某某才知道」的答案

老手經驗難傳承、新人上手慢、敏感資料不敢共享——如果這三句話有一句戳中你，那你要的可能不是另一套文件管理系統，而是一條把散落素材煉成可信知識的產線。

[知識庫 5] 當場答不出來的那一句，就是丟單的那一句

「我回去確認一下再回覆您」——這句話說出口的那一刻，你已經把案子的主導權交出去了。

會議室裡那三秒鐘

黃振傑在鼎峰系統整合（示範情境）做業務六年，那天下午帶著售前工程師去客戶端做第二次簡報。

簡報講得很順。到了 Q&A，客戶的 IT 主管翻著手上的資料問了三個問題。

第一個：「你們這套跟我們現在用的門禁系統，之前有整合過嗎？」

有。三年前有一個案子做過幾乎一樣的整合。但黃振傑不確定是哪個客戶、也不確定當初用什麼方式接的，更不敢貿然說出客戶名稱。他說：「這個我回去確認一下。」

第二個：「同規模的案子，你們大概報多少？」

他心裡有個範圍，但不確定上一個類似規模的案子最後成交價是多少、有沒有含第一年維護。報高了對方會覺得貴，報低了回公司要被主管檢討。他說：「我整理一份給您。」

第三個最傷：「上次貴公司來提案的那位，說可以支援我們現有的資料格式，這個還算數嗎？」

上次來的不是他。他完全不知道同事答應了什麼。他說：「這個我要跟同事確認。」

三個問題，三次「回去確認」。

會議結束前，客戶的 IT 主管講了一句很客氣的話：「好，那你們整理好再給我，我們也還在看其他家。」

在提案現場，客戶問的不只是問題，還在量一件事：這家公司到底熟不熟。而你每說一次「回去確認」，那個刻度就往下掉一格。

你不是準備不足，是公司的經驗沒有站在你這一邊

如果你是業務或售前，你大概很清楚：這三個問題的答案，公司裡百分之百是有的。

第一個問題的答案，在三年前那個案子的結案報告裡，或是在當時售前工程師的信箱裡。

第二個問題的答案，在報價系統或某個人的 Excel 裡，但你不知道要比對哪一筆才算「同規模」。

第三個問題的答案，在上一次那場會議的錄音裡——如果有錄的話——或是在提案簡報 v5 的第 12 頁備註。

它們理論上都在公司，實際上等於不存在。因為你在客戶會議室，你有三秒鐘，而不是三小時。

更麻煩的是，這些經驗大部分綁在人身上。做過那個整合案的工程師去年離職了；知道成交底價的主管在開會；上次來提案的同事調去別的部門。你能問到誰、問得多快，決定了你這一單的勝率——而這件事完全靠運氣。

所以真正該問的不是「業務要怎麼準備得更充分」，而是「公司六年的專案經驗，能不能在會議室裡那三秒鐘被你叫出來」。

一場沒人聽第二次的售前錄音，變成你當場答得出的一句話

這正是知識庫系統在做的事。它不是雲端硬碟，也不是把檔案丟給 AI 就算數——它是一條把「原料」煉成「可查詢知識」的產線。

三年前那個門禁整合案，其實留下了一場售前技術會議的錄音。逐字稿裡有一段是這樣的：

…他們那個門禁是舊的那套，資料庫直接讀不到，所以我們最後是走
他們內部的 10.20.30.40 那台中介機，用排程每十五分鐘同步一次啦。
本來想接 API，但他們原廠不給。啊這個案子最後折到七九折成交，
含第一年維護，這個底價不要往外講喔。

系統把它送進清洗程序——去掉贅字、遮蔽敏感資訊、分類、摘要——出來是這樣：

## 舊版門禁系統整合方式

- **限制**：舊版門禁系統原廠不開放 API，資料庫無法直接存取。
- **採用方案**：透過客戶內部中介主機（位址已遮罩），以排程每 15 分鐘同步一次。
- **適用情境**：客戶既有門禁系統為舊版、且原廠不提供介接介面時。

再進一步蒸餾，它變成一頁可以互相連結的概念頁：

# 原廠不開放 API 時的整合路徑
當既有系統無法直接介接時，優先評估中介主機＋排程同步。
需向客戶說明資料非即時、同步間隔可調。
相關做法參見 [[排程同步間隔設定]] 與 [[整合可行性評估清單]]。

於是下一次有業務在客戶會議室被問到同一件事，手機或筆電上打一句話進系統：

「舊版門禁系統原廠不給 API，有做過嗎？」

當場得到的是：

有。做法是透過客戶內部中介主機、以排程每 15 分鐘同步，適用於原廠不開放介接的舊系統。需向客戶說明資料非即時。
〔出處：售前技術會議錄音 → 原始逐字稿〕

差別有多大？原本你會說「這個我回去確認一下」，現在你可以說：「有，我們做過。原廠不給 API 的狀況我們走中介機排程同步，十五分鐘一次，非即時這點要先跟您說清楚。」

同一個問題，第一種回答讓你變成傳話的人，第二種回答讓你變成懂的人。而客戶只買後面那一種。

底價、折扣、承諾過的話，敢不敢放進去

看到這裡你可能會想：整合做法可以放，但成交底價、折扣權限、上次答應客戶什麼——這些也放進去嗎？

這正是這套系統最關鍵的設計，兩條不能違反的鐵則。

一條是遮蔽失敗，整筆就算失敗。客戶內部主機位址、窗口私人號碼這類東西，不是「盡量遮」，而是只要沒遮乾淨，整筆內容直接退回重跑，絕不放行到下游。

另一條是權限綁團隊、每次查詢當下驗證。成交價、折扣底線這類商務資訊標成業務團隊可見，工程師查不到；反過來，工程師團隊的維運細節，業務問一模一樣的問題也會得到「查無資料」——不會出現「有資料但你無權查看」這種等於洩漏的提示。同一套規則也延伸到公司外：你想在自己慣用的 AI 工具裡查公司知識，換一組帳號就換成那個人能看的範圍，一模一樣。

這代表你可以在客戶面前，安全地帶著公司六年的成交經驗上談判桌。而業務最值錢的那些資訊，恰恰全部都在「本來不敢放」的那一區。

那三年前的做法，現在還算數嗎

好問題，而且是業務最不能出錯的地方——照著一個過期的答案對客戶承諾，比答不出來還糟。

所以更新被設計成一條可以重跑的產線。原廠後來開放 API 了、報價政策調整了、標準做法換了，承辦人對原檔案按「上傳新版本」，系統自動建立版本鏈：新版標成 v2，舊版標示「已被取代」，版本歷史可回溯稽核，接著自動重新清洗、重新蒸餾、重建索引。

下次你在客戶面前查到的，是現在有效的做法，不是三年前有效的做法。

三次「回去確認」的真正代價

以一般知識管理導入經驗為基準，找答案的時間可以從半小時翻檔案加問人，壓到一分鐘內問到，效率約提升十倍。這是合理的導入目標與期望值，並非實測保證值，實際成效取決於餵進多少素材與團隊的使用習慣。

但業務算的從來不是這種帳。你算的是這個：

三次「回去確認」，換來的是提案週期多拖一週，客戶在這一週裡又見了兩家；換來的是你回公司要追三個人、寫一封信、等一份報價；換來的是下次會議你得先花十分鐘把上次沒答的補完，而不是直接談合約條件。

最貴的那一項還沒算：客戶心裡把你歸類成「窗口」，而不是「顧問」。窗口只能比價，顧問才能談價。

黃振傑那個案子最後沒有輸在價格，是輸在對方選了一家「感覺比較熟這塊」的廠商。

你的公司做過的每一個案子，本來都該站在你身後

你們公司做過的案子不會比對手少。差別只在於，對手的業務可能在會議室裡叫得出那些經驗，而你叫不出來。

這不是誰比較認真的問題，是公司有沒有把六年的經驗煉成一個問得到的地方。

[知識庫 4] 別再說「我幫您查一下，稍後回覆」

客戶要的從來不是你查得認真，是你答得出來。

一個上午，這句話說了九次

林郁婷在鼎峰系統整合（示範情境）的客戶服務部，做技術支援第三年。她的工作台上開著五個視窗：工單系統、客戶名單、共用資料夾、公司內部群組，還有一份自己整理的 Excel，裡面是她這三年來慢慢抄下來的「常見狀況與處理方式」。

那份 Excel 是她最重要的資產，也是她最大的焦慮來源——因為它只有 137 列，而客戶的問題有無限多種。

那天上午九點到十二點，她說了九次「我幫您查一下，稍後回覆您」。

第一次，客戶問去年買的模組能不能相容新版系統。她翻工單，翻不到；問群組，沒人回；最後找到當初的售前工程師，對方在客戶端出差，晚上七點才回訊息。

第三次，客戶說設備顯示某個錯誤代碼。她印象中兩年前有人處理過一模一樣的，但那是在一個已經沒人用的舊聊天群組裡，往上滑了二十分鐘沒滑到。

第七次最傷。客戶在電話裡說：「你們上個月有另一位同事跟我講的不是這樣。」她當下答不出來，也查不到上個月那通電話的內容。掛掉電話之後她坐了三十秒，那三十秒她想的不是問題怎麼解，而是客戶剛剛是不是覺得這家公司不專業。

十二點的時候，她真正解決的問題是三個。其餘六個變成待辦，帶到下午，有兩個帶到明天。

在第一線工作的人都知道，最消耗人的從來不是難的問題，是那些「公司裡明明有人知道，但你就是問不到」的問題。

這不是你不夠努力，是答案根本沒被放在你找得到的地方

如果你也是客服或技術支援，你大概很熟悉這種感覺：明明是自己份內的事，卻總覺得自己在猜。

但問題真的不在你。你可以把公司裡「那個問題的答案」在哪裡，列出來看看：

它可能在一張三年前的工單裡，只是當初結案時只填了「已處理完成」四個字；可能在一封資深工程師寄給客戶的信裡，而那封信在他的個人信箱；可能在一場售前會議的錄音檔裡，檔名叫「錄音_20240311.m4a」；可能在一個已經沒人用的群組訊息裡；也可能誰都沒寫下來，只在某個人的腦袋裡，而那個人今天請假。

這些東西理論上都還在公司，實際上等於不存在——因為找不到、或是找到的成本高過重問一次。於是最有效率的做法變成「問人」，而問人這件事，會塞住兩個人的時間，還會隨著資深同事離職而斷掉。

你不缺資料，你缺的是一個問得到答案的地方。

第一線最需要的不是更完整的知識庫，是更快的那一句回答。

一張三年前的工單，變成一個你三秒查得到的答案

這正是知識庫系統要做的事。它不是雲端硬碟，也不是把檔案丟給 AI 就算數——它是一條把「原料」煉成「可查詢知識」的產線。

看一個實際的例子。這是一段客服電話的口語紀錄，雜亂、口語，而且夾著幾樣絕對不能外流的東西：

喂您好，那個…宏泰的張淑芬張小姐是不是，電話 0912-345-678 這支對嗎，
訂單編號 SO-2023-1147 那筆。啊她說那台設備一開機就跳 E-207，
我跟她講那個通常是韌體版本太舊，跟新的控制模組對不起來啦，
就先降回舊版韌體，然後排時間現場更新模組。她說好，那就下週三。

系統把它送進清洗程序——去掉贅字、遮蔽個資、分類、摘要——出來是這樣：

## 設備開機顯示 E-207 錯誤

- **現象**：設備開機後顯示錯誤代碼 E-207。
- **原因**：韌體版本過舊，與新版控制模組不相容。
- **緊急處置**：暫時降回舊版韌體，可恢復運作。
- **根本解法**：安排現場更新控制模組。

再進一步蒸餾，它變成一頁可以互相連結的概念頁，跟其他相關知識串在一起：

# E-207 韌體與控制模組版本不相容
當韌體版本低於控制模組要求時，開機自檢會中止並回報 E-207。
處置流程參見 [[韌體降版操作]] 與 [[控制模組現場更新排程]]。

於是下一次——不管是林郁婷，還是上週才報到的新同事——遇到同一個客戶問同一件事，只要打一句話進系統：

「客戶設備開機跳 E-207 怎麼處理？」

得到的是：

通常是韌體版本過舊，與新版控制模組不相容。可先降回舊版韌體讓設備恢復運作，再安排現場更新控制模組。
〔出處：客戶服務通話紀錄 → 原始逐字稿〕

請注意兩件事。第一，答案後面附著出處，點下去可以一路追回當初那通電話。這很重要——第一線敢不敢照著回客戶，差別就在這裡；主管事後要查你憑什麼這樣講，也查得到。第二，客戶姓名、電話、訂單編號一個都沒有出現，它們在進入知識庫之前就被遮掉了。

你不需要再記住 137 列 Excel。你只需要問得出問題。

那些「不敢放進系統」的內容，其實才是你最需要的

第一線的人最常遇到的狀況是：真正有用的資訊，剛好都是敏感的。客戶的報價邏輯、合約裡答應過的到場時效、上一次為什麼願意給那個折扣——這些才是客戶會追問的，偏偏也是最不敢隨便放的。

所以這套系統把安全做成兩條不能違反的鐵則。

一條是遮蔽失敗，整筆就算失敗。不是「盡量遮」，只要沒遮乾淨，整筆內容直接退回重跑，絕不放行到下游。寧可多跑一次，也不讓客戶的電話跟訂單編號流進一個誰都查得到的地方。

另一條是你無權看的，系統絕不會答給你。權限綁在「團隊」上，而且在每一次查詢的當下驗證。標成業務團隊的合約條款，客服查不到，甚至查不出它存不存在——不會出現「有這筆資料但你沒有權限」這種等於洩漏的提示。

這代表什麼？代表你的公司可以把合約、報價、客戶往來紀錄都煉進來，而不是只敢放那些本來就無所謂的東西。而對第一線來說，能不能答得出客戶的追問，決勝點恰恰就在那些「本來不敢放」的內容裡。

會不會過幾個月，又變成一堆沒人信的舊答案

會，如果沒有更新機制的話。所以更新被設計成一條可以重跑的產線。

韌體改版了、處理流程換了、客戶合約續約了，承辦人對原檔案按「上傳新版本」，系統自動建立版本鏈：新版標成 v2，舊版標示「已被取代」，版本歷史可回溯稽核。接著自動重新清洗、重新蒸餾、重建索引。下次有人問同一個問題，答到的就是新版內容，出處指向 v2。

對第一線來說，這件事的意義只有一句話：你查到的答案，是現在有效的答案，不是三年前有效的答案。

「稍後回覆」的成本，其實比你想的高

以一般知識管理導入經驗為基準，找答案的時間可以從「翻半小時檔案再問人」壓到「一分鐘內問到」，同類問題的重複發問下降六成以上。這是合理的導入目標與期望值，不是實測保證值，實際成效取決於餵進多少素材、清洗品質，以及團隊的使用習慣。

但如果你自己就在第一線，你其實不太需要看這些數字。你更清楚的是另一組帳：

一次「我幫您查一下」，是你多花二十分鐘，加上另一位同事被打斷的十分鐘，加上客戶多等的四個小時，加上他心裡多打的一個問號。乘以一天九次，乘以一年兩百多個工作天。

林郁婷那天下午收到客戶回信，只有一句：「所以到底可不可以？」

你不會希望這句話，是客戶對你們公司的最後印象。

如果你也有一份 137 列的 Excel

那份 Excel 不是問題，它是證據——證明你們公司真的累積了很多經驗，只是這些經驗現在得靠某幾個人用手抄、用記憶力、用「剛好我知道」來支撐。

這撐得住今天，撐不住那個人請假、離職，或是團隊要再進三個新人的時候。

訂閱：文章 (Atom)

2026年7月27日 星期一

2026年7月26日 星期日

2026年7月24日 星期五

2026年7月22日 星期三

2026年7月21日 星期二

2026年7月20日 星期一

RAG 不只一種：一次看懂 16 種 RAG 架構與應用場景

一、Standard RAG：最基礎的檢索增強生成

二、Agentic RAG：讓 AI 主動決定下一步

三、Graph RAG：從文件片段進一步理解知識關係

四、Modular RAG：將 RAG 拆成可替換的模組

五、Memory-Augmented RAG：讓系統記得過去

六、Multi-Modal RAG：讓檢索不再侷限於文字

七、Federated RAG：從分散資料來源取得資訊

八、Streaming RAG：讓最新資料即時進入回答

九、ODQA RAG：面向開放領域的問答系統

十、Contextual Retrieval RAG：根據情境重新理解問題

十一、Knowledge-Enhanced RAG：結合結構化知識

十二、Domain-Specific RAG：針對特定產業深度設計

十三、Hybrid RAG：結合關鍵字與語意檢索

十四、Self-RAG：讓模型檢查自己的回答

十五、HyDE RAG：先假設答案可能長什麼樣子

十六、Recursive／Multi-Step RAG：將複雜問題拆成多次檢索

這 16 種 RAG 可以如何分類？

RAG 類型不是選擇題，而是組合題

導入 RAG 時應該評估哪些指標？

結語：從知識問答走向企業工作系統

2026年7月19日 星期日

[知識庫 6] 當新人第一天，就能答出只有資深工程師才知道的答案

那個只有王小明知道的答案

你其實不缺知識，你缺的是「找得到、敢用、敢信」

一段錄音，變成一個新人問得到的答案

為什麼你敢把合約也放進去

那知識會過期，會不會變成一座檔案墳場？

導入之後，具體會變成什麼樣子

如果你也有一個「只有某某某才知道」的答案

[知識庫 5] 當場答不出來的那一句，就是丟單的那一句

會議室裡那三秒鐘

你不是準備不足，是公司的經驗沒有站在你這一邊

一場沒人聽第二次的售前錄音，變成你當場答得出的一句話

底價、折扣、承諾過的話，敢不敢放進去

那三年前的做法，現在還算數嗎

三次「回去確認」的真正代價

你的公司做過的每一個案子，本來都該站在你身後

[知識庫 4] 別再說「我幫您查一下，稍後回覆」

一個上午，這句話說了九次

這不是你不夠努力，是答案根本沒被放在你找得到的地方

一張三年前的工單，變成一個你三秒查得到的答案

那些「不敢放進系統」的內容，其實才是你最需要的

會不會過幾個月，又變成一堆沒人信的舊答案

「稍後回覆」的成本，其實比你想的高

如果你也有一份 137 列的 Excel

2026年7月27日星期一

2026年7月26日星期日

2026年7月24日星期五

2026年7月22日星期三

2026年7月21日星期二

2026年7月20日星期一

2026年7月19日星期日