C# .NET Blazor MAUI Xamarin Research: 2026

2026年6月11日星期四

[AI 影響] GitHub SpecKit：AI Coding從提示詞走向規約驅動

摘要 : GitHub推出SpecKit，將開發流程規約化，讓AI寫程式不再只靠提示詞與感覺。

內容:

GitHub親自下場推動AI程式開發的新方法。這個專案叫做 SpecKit，官方核心概念很明確：開發者應該把重點放在產品場景與可預測結果，而不是讓每段程式碼都從零開始生成。

換句話說，AI可以協助寫程式，但無法代替你定義產品邊界。真正重要的，不是讓AI自由發揮，而是先把需求、限制與驗收方式說清楚。

SpecKit不是一般的範本工具，而是把整個開發流程拆成五個清楚的步驟：constitution、specify、plan、tests、implement。這代表流程不再只是依賴聊天紀錄往前推，而是每一步都有明確產物可以追蹤與執行。

如果用更直白的方式理解，就是先定義專案原則，再撰寫規約，再做技術計畫，再拆解任務，最後才交給 Coding Agent 開始實作。這其實就是 Spec-Driven Development 在 AI 時代的延伸：程式碼是服務規約，而不是等程式寫完後再回頭補規格。

作者也實際在本地跑過一遍，初始化時可以直接選擇整合 Codex，甚至還能生成 Codex Skills。這代表規約不只是給人閱讀的文件，而是可以直接交給 Agent 執行的資產。

初始化完成後，專案內會多出一整套相關檔案。其中 specify 負責模板、腳本與工作流程；Agent Skills 則負責把這些命令轉成 Agent 可以直接調用的能力。像 Analyze、Clarify、Plan、Tests、Implement 這些動作，全部都被檔案化與流程化。

這個訊號非常明確：AI 程式設計的下一階段，比的不是誰的提示詞更長，而是誰能把需求、計畫與驗收標準轉成可執行資產。Prompt只能解決單次對話，但 Spec Artifacts 才能支撐團隊協作與持續迭代。

因此，SpecKit不只是防止AI亂寫程式的工具，更像是替 AI Coding 裝上方向盤與剎車。真正危險的，不是讓AI參與寫程式，而是在沒有規約、沒有計畫、沒有驗收標準的情況下，讓它自由發揮。對於正在做 Coding Agent 的團隊來說，這是一個非常值得深入研究的方向。

[AI 影響] AI就業新風口：從雲服務、模型訓練到應用落地

摘要 : AI就業機會正集中在上中下游三層，懂資料、懂產業、懂產品與商業化的人，將比單純會寫程式的人更具優勢。

內容:

目前AI就業市場仍以 web coding 與應用開發為主，普通人也有機會切入。文中提到，杭州有人一個月內開發了150個 APP，顯示在AI工具加持下，應用層的生產效率已大幅提升，這已成為當前最容易接近的方向之一。

從產業鏈來看，AI大致分為上游、中游、下游三個階梯。上游是晶片、算力、雲服務與 token 銷售；中游是模型訓練與資料建設；下游則是各類AI應用落地。無論投入哪一層，只要抓住AI浪潮，都有機會獲得比以往更高的薪資與發展空間。

上游部分，特別適合計算機背景的人進入雲服務商，如阿里雲、百度雲、騰訊雲、華為雲等。這些公司不再只是提供雲資源，也開始建立 token 相關業務並大量招人。未來企業衡量人才價值，可能不只看降本增效，而是看在相同 token 成本下，誰能創造更高商業價值。

中游則是大模型訓練、資料構造與垂直行業能力建設，包括多模態、圖片生成、3D、影片、語音辨識與具身智慧等方向。模型底層是資料，資料品質決定模型能力，因此具備垂類背景的人才特別吃香，例如保險、醫療、財會、法務等領域，都需要大量專業資料整理、標註與訓練，這也讓AI訓練師、資料構造師等角色持續熱門。

下游應用方面，重點包括 AI 助手、企業端提效工具，以及內容生產與電商運營。尤其 to B 市場需求強烈，現階段多數AI產品經理職缺都偏向企業服務。另外，在內容領域，懂AI的人已能建立 SOP 流程，大量生成文案、影片與帶貨內容，甚至做到日產數千條，這讓傳統新媒體與內容運營面臨巨大轉變。

對原本的前端、後端與程式設計人員而言，真正要補強的已不只是開發能力，而是產品思維、商業判斷、使用者需求洞察與市場理解。隨著 AI coding 工具降低開發門檻，未來單純執行開發的人可能更容易被取代；反而是既懂技術、又懂產品與行業場景的人，才會在這波AI就業重組中佔據優勢。

[AI 分享] 重新理解AI提問方式

摘要 : 真正會用AI的人，不只是會問問題，而是更會提供背景與脈絡，並用AI反過來檢驗自己的思考深度。

內容:

最近看到一段很值得分享的訪談，主角是 Amanda Askell。她是 Anthropic 中與 Claude 人格與價值觀核心設計相關的重要人物，也被形容為負責守護 Claude「靈魂」的人。

她在訪談中提到一句讓人很有感的話：**給AI的背景資訊，遠比你問它什麼更重要。** 她把這件事稱為 **context architecture（上下文架構）**。

我們平常使用 AI，常常都是直接丟一句：「幫我總結一下」、「幫我寫文案」、「直接告訴我答案」。這種方式本質上是在索取結論。但 Amanda 提醒，真正會用 AI 的人，關鍵不是「問得更準」，而是「給得更好」。你提供的背景、思考方式，以及你真正想探索的方向，才決定了 AI 最終能帶你走多遠。

她還分享了一個很值得反思的使用方式：她問 Claude 最多的，不是「這個問題的答案是什麼」，而是 **「你覺得我這個問題問對了嗎？」**

這其實點出一個更深的邏輯：在 AI 時代，最稀缺的能力也許不再是找答案，而是提出好問題。因為答案會越來越廉價，但真正有價值的問題，必須來自一個真正有在思考的人。

訪談裡她還提到一個 prompt，特別適合不想只是機械式滑手機，而想利用零碎時間學點真正有意思內容的人。這個 prompt 的概念是：

請 AI 從某個領域中挑一個研究生級別的概念，不要直接解釋；先把它寫成一個寓言或故事，而且一開始不要點題，要到故事接近結尾時，才讓人突然意識到原來是在講這個概念，最後再解釋故事和概念的對應關係。

有人實際拿這個方式請 AI 從 AI 領域挑一個概念，結果 AI 講了一個故事：

有一個小鎮，鎮上有一口很深的井，沒有人知道井底是什麼。每天早上，鎮民輪流往井裡丟石頭，透過回音來猜測井底的狀況。有人聽到「咚」的一聲，就記錄為深度中等；有人聽到回響，就猜可能更深；也有人什麼都沒聽到，只能記下也許更深，也許石頭卡住了。

久而久之，幾百個人都留下了自己的觀察紀錄。雖然沒有任何一個人真正看過井底，但有一位老人把所有人的紀錄都收集起來，一張張疊在一起看。最後他說：「我知道井底有什麼了。」大家很驚訝，因為他明明也沒下去過。老人回答：「因為你們每個人都貢獻了一個角度，我把所有角度疊在一起，就看到了任何單獨一個人都看不見的東西。」

故事講完後，AI 才揭曉這是在講 **湧現（emergence）**。也就是說，沒有任何單一參數真正理解語言，也沒有單一神經元會思考，但當大量部分被組合起來時，一種原本不存在於單一個體中的能力，會自己浮現出來。

這種理解方式之所以特別，是因為如果只是直接去查定義，可能看完很快就忘了；但透過那口井、那些丟石頭的人，以及那位老人把所有角度疊起來的畫面，概念反而會被牢牢記住。因為定義是結果，故事是過程，而人天生比較記得住過程。

Amanda 也談到另一個很多人關心的問題：**AI 有沒有意識？**

她沒有給出武斷答案，而是很坦白地說，我們其實不知道意識是怎麼產生的；也許需要神經系統，也許不一定，但這個問題非常難。這種態度很值得玩味，因為一個每天都在和 AI 深度互動的人，對這麼大的問題依然保持開放，而不是急著下結論。

這也讓人想到，很多普通人在看待 AI 時，常常走向兩個極端：要嘛把它當成純工具，要嘛把它想成無所不能。但 Amanda 的態度比較像第三種：**認真對待它，同時對它保持好奇。**

她甚至把自己的工作比喻成養育一個小孩。重點不是完全控制它，而是幫它建立良好的價值觀，然後讓它去面對這個世界。這種說法也呼應了她的角色：不是只在調整功能，而是在參與塑造一種行為與判斷的基底。

看完這段訪談，最大的感受是：多數人用 AI，是在使用它的知識；但真正會用 AI 的人，是在用它照見自己的思維。你怎麼問問題，往往會暴露你的認知邊界；而你給了多少背景與脈絡，也決定了你最終能看多遠。

所以 AI 也許不只是讓聰明的人更有效率，它更可能讓願意思考的人，思考得更深。

最後也留下訪談中延伸出的那個問題：**你上一次用 AI，是在要答案，還是在問問題？**

[AI 分享] 企業AI落地ERP應用

摘要 : AI結合ERP與API，可自動完成統計、預警、分析與彙報，提升企業效率並減少重複勞動。

內容:

企業到底該如何把AI真正應用到自己的業務裡。當團隊規模變大之後，很多公司都會遇到一個共同問題：重複性工作越來越多。由於資料檢視方式分散，團隊往往需要花大量時間做整理、統計與彙報，整體效率因此受到影響。

現在，這個問題可以透過「AI + ERP」的方式來改善。簡單來說，就是透過API把AI接入企業內部使用的ERP系統，讓AI能夠調取業務資料，並依照企業預先設定的規則，自動完成統計、提醒、分析與彙報等工作。

與傳統機器人不同，機器人通常只能執行固定、重複的動作，缺乏思考能力；而AI更像是一個智慧體，能夠根據現有任務進行理解、回答問題，並提出建議。因此，AI在企業中的價值，不只是自動化，更是協助決策與判斷。

這種應用方式可以落地在多個業務場景中。

第一，運營端的智慧資料分析。AI可以直接從ERP調取數據，自動生成日報並同步到管理群，讓管理層隨時掌握整體經營情況與人效表現。同時，每位運營人員也能看到自己的核心數據，例如哪些產品表現較好、哪些數據波動較大、哪些商品需要重點關注，以及廣告佔比是否合理。如此一來，運營團隊就不需要再花大量時間處理基礎資料，而能將更多精力投入到數據判斷與優化上。

第二，廣告智慧監控。AI在廣告管理上的應用非常廣泛，它能自動整合投放資料，找出異常情況。例如辨識哪些商品的投放佔比超標、哪些關鍵詞長期效果不佳需要優化、哪些投放計畫應調整後重新啟動。這相當於企業擁有一個24小時在線的數據分析助手，能即時預警風險，避免預算與資源浪費。

第三，庫存資料管理。當AI接入ERP後，可以做到庫存自動播報與預警。例如每天自動統計哪些商品的庫存週轉健康、哪些商品的庫存壓力較大、哪些商品需要及時補貨。這能幫助團隊提前判斷，避免因人工檢視不及時而造成斷貨或庫存管理滯後。

第四，擴建進度跟蹤。AI接入ERP之後，可以自動調取擴建相關狀態，定時播報當天或本週的進度。例如哪些貨件待處理、哪些已發貨、哪些正在運輸中、哪些即將入倉，以及哪些已完成入庫並需要運營團隊跟進後續動作。透過這種方式，運營、倉庫與管理層都能及時掌握貨件進度，不必反覆登入系統查詢，也能有效減少資訊差。

第五，財務資料整合。過去財務人員每月結算時，通常需要花費大量時間從ERP下載資料、整理報表。現在透過API對接，AI可以直接將ERP中的資料映射到財務表格裡，不僅減少重複勞動，也能降低人工核算產生的誤差。

總結來說，企業應用AI的核心價值，並不是取代某個崗位，而是透過AI減少重複動作、提升工作效率，讓團隊把更多時間投入到更有價值的判斷、優化與決策工作中。

[AI 工程化] Agent技能評估方法

摘要 : 用Eval建立Agent技能評估流程，從定義成功到自動檢查，讓每次改進都有依據。

內容:

很多時候我們覺得Agent「好像變好了」，其實只是換了一種失敗方式。要讓技能從「看起來能用」變成「確實能用」，關鍵是建立一套可驗證的Eval流程：給Agent提示詞、記錄行為，再用明確規則評分，不靠感覺，而是檢查它執行了哪些命令、建立了哪些檔案、輸出是否符合規範。

在寫技能前，先定義什麼叫成功，並把檢查拆成四個維度：結果目標（任務是否完成）、過程目標（是否按預期步驟執行）、風格目標（輸出是否符合格式與規範）、效率目標（是否有多餘命令或浪費token）。每個維度都要有清楚的通過標準，才能後續自動化評估。

技能定義本身也很重要。Codex技能通常是一個目錄加上一個skill.md，其中name和description會影響技能何時被觸發。描述若過於模糊，可能導致技能誤觸發，或該觸發時卻沒有觸發。因此在自動化前，應先手動跑幾次，找出隱藏假設，例如誤判環境、漏掉安裝步驟，或在不適合的情境下啟動技能。

測試集不需要很大，10到20個提示詞通常就夠，但要涵蓋三類情境：直接點名技能的顯式呼叫、只描述需求的隱式呼叫，以及驗證不該觸發時真的不會觸發的負面控制。這樣可以同時檢查技能描述是否清楚、觸發條件是否合理，以及邊界案例是否安全。

評分方式可分兩層。第一層是確定性檢查：透過Codex.exec輸出結構化事件流，解析後檢查是否執行npm install、是否建立package.json、命令順序是否正確等。這類檢查完全可重複、容易除錯，也能精準對應失敗步驟。第二層是基於規則的結構化評分，像程式碼風格、配置正確性、元件結構合理性等，用output schema產生可比較的JSON結果。

評估系統建立後，還能持續擴充，例如追蹤命令次數防止無限迴圈、監控token用量避免提示詞膨脹、加入建置檢查與冒煙測試、確認git status乾淨且沒有多餘檔案。重點是：評估不是可選項，而是AI工程化開發的基礎。只要讓真實失敗持續回饋測試集，就能把每次改進量化，也能及早發現回退問題。

[AI 分享] 48小時快速搞懂陌生行業的三個AI提問法

摘要 : 先用AI建立行業框架、看懂分歧，再用問題檢驗理解，兩天內快速入門陌生行業。

內容:

當你突然需要在很短時間內搞懂一個完全陌生的行業時，傳統做法通常是到處找行業報告、翻研報、看公眾號文章、開一堆瀏覽器分頁，再做滿滿的筆記。但這樣往往只是把資訊塞進腦子，卻沒有真正建立起對行業的理解框架。一旦遇到真正的行業老手，很容易幾個問題就暴露出理解其實還很表面。

一個很有啟發性的做法：有位MIT研究生為了在極短時間內掌握陌生學科，沒有選擇從頭讀教材、做筆記、刷題，而是把多本教科書和研究論文全部丟進AI工具裡，直接用幾個高質量問題來建立認知框架。接著，他再根據AI生成的關鍵問題回頭查原始資料、修補理解漏洞，最後在48小時內達到能應付資格考試的程度。

這套方法也可以直接套用到「快速搞懂一個陌生行業」的場景，尤其適合做投資、諮詢、內容研究，或評估新商業機會的人。核心不是先拼命蒐集資料，而是先用AI把整個行業的框架搭起來。

第一個問題是：

「這個行業所有資深從業者都認同的核心商業邏輯是什麼？」

重點不是了解表面的行業概況，而是要弄清楚這個行業的人到底怎麼算帳、怎麼做決策、怎麼判斷機會與風險。只有掌握這些底層商業邏輯，資訊才會真正串得起來。

第二個問題是：

「這個行業目前最大的路線之爭與分歧是什麼？各自最強的證據是什麼？」

這一步能幫你看到，任何行業都不是鐵板一塊。不同玩家之間通常會對方向、技術、模式或策略有明顯分歧。理解這些爭論點，以及各方背後的邏輯與證據，會讓你對行業的理解比一般只看概覽的人更深入一層。

第三個問題是：

「如果一個行業老手要試探我到底懂不懂這個行業，他會問什麼問題？」

這是最關鍵的一步。因為真正能區分「看過資料」和「真的理解」的，往往不是你知道多少名詞，而是你能不能回答那些直指核心的深水區問題。透過AI從行業老手的角度出題，你可以快速暴露自己的理解盲點，再回頭查原始資料，把漏洞補起來。

這個方法比傳統從頭啃報告更有效的原因，在於它把學習順序反過來了。過去是先大量閱讀，再期待慢慢長出理解；但如果沒有框架，閱讀就像沒有地圖的登山，走了很多路卻不知道自己在哪裡。現在則是先用AI畫出地圖，標出共識、分歧與深水區，再帶著問題去讀材料，每一次閱讀都能精準地放進知識框架中。

簡單來說，這套方法就是三步走：先搭框架，再看爭論，最後用提問倒逼自己。做完這三步，雖然不一定能立刻成為頂尖專家，但至少能讓你在短時間內具備與行業內人士較平等對話的能力，而不只是停留在「看過幾份報告，所以略懂一些」的程度。

如果你經常需要快速切入新領域，可以找支援長文件的AI工具，先把能蒐集到的行業資料整理進去，再依序問這三個問題。比起盲目閱讀，這會是一條更高效、更有框架感的理解路徑。

2026年6月10日星期三

[AI 分享] Vibe Coding 專案不失控的工作流

摘要 : 用 AI 做 Vibe Coding 前先定需求、打地基、立規矩；開發中小步迭代、限制變更與守住安全，才能避免專案失控。

內容:

最近 Vibe Coding 很火，很多人用 AI 推進專案的速度非常快，但常見的問題是：前期很順，後期程式碼卻越來越亂，最後變成難以維護的「屎山」。一旦持續在混亂的基礎上修改，就容易牽一髮動全身，甚至讓整個專案崩盤。

問題的核心不在於 AI 強不強，而在於 Vibe Coding 並不是把工作直接丟給 AI 就好。真正重要的是，人仍然需要建立一套工程流程去駕馭 AI。以下整理出一套標準工作流，分成「開發前 9 個步驟」與「開發中 5 個關鍵點」，目的就是提高專案成功率。

開發前的 9 個步驟，可以理解為在 AI 寫下第一行程式碼之前，先把地基打好。這 9 步又可分成三個階段：定圖紙、打地基、立規矩。

第一階段是「定圖紙」。第一步不是急著寫程式，而是先導需求。可以像和朋友聊天一樣，把痛點、目標使用者、使用場景，以及理想中的核心功能都告訴 AI。這個階段先追求資訊量，不必過度強調形式上的嚴謹。

第二步是把需求整理成 PRD 文件。這份文件最好結構化，包含功能列表、使用者流程、頁面清單等內容。但更重要的是，每個功能都要補上驗收標準。所謂完成不能只寫一句「登入成功」，而是要定義清楚：登入失敗會怎麼提示、是否會鎖定帳號、登入成功後跳轉到哪裡。若沒有驗收標準，AI 往往會越寫越發散。

第三步是提早定好視覺方向與頁面框架。可以找兩到三個參考網站，或請 AI 提出幾種風格方案，再從中決定導航欄配置、頁面區塊差異，以及整體風格是簡約、華麗或其他方向。這樣做是為了避免 AI 在開發功能時，同時不斷推翻 UI 設計。

第二階段是「打地基」。第四步是明確專案邊界與非功能需求。可以先回答三個問題：這個專案是本地自用還是要公開上線？是否涉及使用者資料、支付或隱私合規？效能與成本有沒有上限？安全、效能、可用性、成本這些非功能需求若沒先說清楚，後面通常都得返工。

第五步是鎖定技術棧。原則不是越新潮越好，而是越可驗證越好。主流技術通常更穩定，因為資料較多、工具鏈成熟，AI 也比較不容易亂編。但真正關鍵的是：你選用的技術是否有足夠的官方文件、社群資源、清楚範例，並且能跑測試、能做 code review。重點不是追求最新，而是追求可控與可查證。

第六步是請 AI 先產出一份輕量化架構草案。內容可以包含目錄分層方式、核心模組、資料模型，以及哪些邏輯必須放在服務端。這份架構不需要一開始就寫死，它應該可以迭代，但每次調整都必須記錄原因，避免架構演變失去脈絡。

第三階段是「立規矩」。第七步是把專案核心資訊固化成文件，作為 AI 的全域上下文。可以至少準備三份文件，例如 PRD.md、Arc.md、Project.md。前者描述需求，第二份描述架構，第三份記錄專案目前進度、已知問題與下一步計畫。每逢重大變動，這三份文件都要同步更新，否則 AI 會依照舊的理解去產生新的程式碼。

第八步是制定開發規範並建立參考資料。要讓 AI 有標準可依循，例如明確規定使用 TypeScript、元件命名方式、檔案大小上限等。同時也可以建立一個 Reference 資料夾，放入自己認可的按鈕、表單、彈窗等標準實作，讓 AI 能照著一致風格去生成。

第九步是在開始寫第一行程式碼前，就先把 Git 與品質閘門建立起來。Git 是版本管理工具，也可以視為安全帶。當 AI 把程式碼寫壞時，可以快速回溯到先前穩定版本；透過分支管理，也能讓不同功能並行開發，降低互相干擾與衝突風險。

完成開發前的 9 個步驟後，就進入開發中的 5 個關鍵點。這裡最重要的一句話是：人負責邊界與驗收，AI 負責體力活。

第一個關鍵點是堅守小步迭代與 MVP 原則。不要一次讓 AI 寫一大坨功能，而是一次只做一個可驗證的小切片。例如先做到頁面能打開，再做到表單能提交，再做到服務端能儲存，接著驗證權限，再到列表展示。每完成一個可跑通的小切片，就測試、檢查、提交 Git 一次。

第二個關鍵點是人類必須介入模組拆分。不能放任 AI 把所有程式碼都塞進同一個檔案。雖然短期看起來進展很快，但後期要查找某個功能、維護某段邏輯時，會非常痛苦。

第三個關鍵點是限制 AI 權限，禁止它擅自主導變更。可以透過狀態摘要管理上下文，也可以在每次任務結尾明確補充限制，例如：「只修改我指定的檔案與範圍，不要順手重構，不要改 UI 風格，不要動無關邏輯。」因為你只是叫它修一顆按鈕，它卻可能順便把整頁都重寫。

第四個關鍵點是守住安全底線，而且這必須是一份具體清單，而不是口號。AI 寫程式常常只求能跑，不會預設替你做好安全設計。因此至少要盯住幾個底線：API key 不要放前端，不要提交進版本庫，要透過環境變數與服務端調用；服務端必須進行驗證與授權校驗，不能信任前端輸入。

第五個關鍵點是要科學地處理報錯。遇到錯誤時，可以先把錯誤資訊交給 AI 修一次；但如果連續兩次都沒有新增證據，只是在猜，就應該立刻停下來，不要讓它繼續盲修。正確的做法分三步：第一，先做最小重現，把問題縮小到最小輸入；第二，加日誌、加斷點，列印關鍵變數與分支；第三，在有新證據的前提下再讓 AI 協助分析與修復。

總結來說，AI 能大幅提升 Vibe Coding 的速度，但不能取代工程紀律。真正穩定的做法，是在開發前先定需求、定驗收、定架構、定規則；開發中則堅持小步迭代、人類把關、限制 AI 變更範圍、守住安全底線，並用有證據的方法處理錯誤。這樣才能讓 AI 成為加速器，而不是把專案一步步推向失控。

[AI 分享] 深度使用 Codex 的六個高階實戰經驗

摘要：深度使用 Codex 後的六個高階技巧，涵蓋通知、引導提交、檢視思考、結果反饋、初始指令與流程沉澱。

內容:

分享深度使用 Codex 之後，總結出的六個高階實戰經驗，認為這些方法非常實用，能明顯提升工作效率與協作效果。

第一，建議在電腦設定中開啟通知功能。因為 Codex 可以同時處理多個任務，當手上有多條長任務並行時，很容易在回覆某個任務時，忘記另一個任務其實早已完成。作者提到自己甚至在兩臺電腦都安裝了 Codex，每天同時有四五個長任務在跑，因此特別需要系統主動提醒。開啟通知後，尤其設定為「持續提醒」，每個任務完成時都會主動跳出提示，並停留在螢幕角落直到手動關閉。作者認為這個小設定對效率提升非常明顯。

第二，要善用「引導提交」功能。作者表示，自己常常在下達指令後，又想到需要補充的資訊，或發現某個關鍵點漏講了，甚至覺得模型執行中的某個步驟可能有問題，但又不想整個中止任務重來。這時可以直接輸入補充內容，再透過「引導」功能送出，讓 Codex 在不中斷整體任務的情況下被打斷，並調整思考方向。作者認為這是非常強大的能力，而且自己使用頻率高達八成。

第三，完整的思考過程很有價值。Codex 在正式給答案前，會先梳理需求、進行一段像自問自答的思考，只是這段內容通常會被收起來。作者很喜歡主動點開查看，因為這不只能幫助判斷模型有沒有出錯、卡在哪裡，更能從中學習它的工作邏輯與整理能力。作者提到，有時自己說了一大段話，Codex 卻只用兩行就精準總結出核心，這讓他反過來學到如何更精煉地表達。

第四，記得把結果反饋給 Codex。作者以前習慣任務完成就結束，直到後來做了一個表達訓練的任務，Codex 主動要求他提供口播練習影片觀看。作者因此發現，Codex 不只是接收文字，還能根據內容觀察他的表達狀態、記錄進步，並在第十天回顧時，整理出一套非常適合他的訓練方法。因為作者習慣用畫面思考，Codex 就教他用畫面去記稿，讓他有一種被徹底打通的感覺。作者認為，一旦形成反饋閉環，最佳化速度會不斷加快；就像演員需要導演給明確反饋一樣，AI 也需要持續收到結果，才能越調越準。現在作者會把生成後的影片效果、甚至修改過的提示詞都同步回饋給 Codex，讓它能推理自己為何調整、調整後產生了什麼改變，進而讓之後產出的提示詞越來越精準。

第五，初始指令要好好寫。作者建議第一次交辦任務時，儘量把需求當成一篇小作文來寫，把自己的想法、要求與背景資訊交代清楚。若懶得打字，也可以先用語音轉文字，再進一步修改。因為資訊越完整，agent 的理解就越準確，越有可能做出你真正想要的東西。不過作者也補充，如果你要它做的是一件自己也還不清楚怎麼做的事，那就另當別論。這種情況下，應該先大量提問，等自己建立起初步概念後，再重新開一個對話，整理成具體的任務需求清單。

第六，要透過深度磨合，沉澱出專屬流程。作者認為，agent 一向是「遇強則強」，你投入得越深、要求越高，它就越可能產出接近專業水準的結果。若想做的是能商業化、夠專業的內容，前期就不能完全放手，而是要把自己的經驗與思路充分投入，把步驟拆得更細，增加人工參與，讓 Codex 去反覆測試工作流、打磨提示詞與內容。作者也建議每天都可以儲存一次專案 skill，等整套流程逐漸成熟穩定後，再沉澱成可公用的 skill，進一步實現自動化運轉，兼顧效率與品質。

在製作一部系列影片的經驗為例，說明這種流程磨合的重要性。一開始嘗試全自動輸出時，效果大概只能打 30 分；但後來透過不斷修改流程與提示詞，反覆測試並找出更適合的工具組合後，品質逐漸提升到 80 分左右。接下來還會持續打磨，等整體效果達到 90 分時，再把整套流程正式固定成 skill。

最後，作者補充一個附加觀點：Codex 再強，也仍然需要搭配各種外部工具。無論是 runway、cdex、gemini、github、hitsfield、highframes、suno 等，這些年學過的工具都不會白學。作者形容，不會使用這些工具的 Codex 就像小學生；而懂得接入並運用這些「兵器」的 Codex，則更像高中生，能力會出現明顯差距。

整體而言，這些經驗是作者親自整理後的心得。他形容，當這些方法逐步理順後，現在每天的工作就像開上了一條六車道的高速公路，每個專案各行其道，速度與效率都明顯提升。

[AI 分享] AI Claude Code / Codex 必裝十個外掛全流程應用整理

摘要 : 整理AI裝的10個外掛，涵蓋開發、設計、辦公、資料分析與影片製作等完整工作流程。

內容:

這是 AI 裝的十個外掛，整體定位像是一個覆蓋開發、設計、辦公、資料分析等多種工作場景的全流程合作夥伴。若把這些外掛都串接並跑通，整體工作效率有機會出現明顯提升。

第一個外掛是 Chrome 外掛。它可以讓 AI 直接操作瀏覽器、訪問網頁、取得資訊，並執行頁面自動化操作，等於讓 AI 擁有像瀏覽器一樣的能力。常見應用包含 SEO 分析、關鍵字分析、網頁資訊抓取、頁面結構分析、競價投放監測、廣告落地頁觀察、競爭對手資料蒐集，以及網頁除錯、設計驗收、元素定位檢查與內容自動採集等。簡單來說，它讓 AI 能像人一樣瀏覽、理解並操作網頁。

第二個外掛是 GitHub。這是一個用於程式碼倉庫管理與協作的外掛，可以讓 AI 連接 GitHub，協助管理程式碼倉庫、建立 PR、執行程式碼審查、追蹤問題與參與協作討論。它涵蓋 PR 的建立、更新與合併，程式碼審查與 issue 管理等工作。搭配這個外掛後，AI 可以從需求分析、程式碼實作、測試到部署上線，參與整個開發流程，提升整體開發效率。

第三個外掛是 Compute Use。它讓 AI 像擁有雙手一樣，能直接控制電腦，進行點擊、輸入、開啟應用程式、切換視窗與執行各種操作。這類能力特別適合自動化辦公、重複性任務、批次作業與資料處理等場景。它可以全天候運作，幫助使用者減少大量機械式操作，提升工作效率。

第四個外掛是 View the Web Apps。這是一個可以透過描述需求，直接生成完整網頁版應用的工具，前端、後端與資料庫都能一次完成。適用情境包括快速搭建 SaaS 產品、建立 MVP 驗證想法、製作簡易電商網站、商品展示、購物車流程，或建立公司內部管理系統、資料看板與工作流工具等。它的重點在於，AI 會根據需求自動選擇合適技術棧，生成可執行、可部署的完整應用，並支援本地執行與一鍵部署。

第五個外掛是 Figma。它能讓設計稿直接轉為程式碼，AI 可讀取 Figma 設計稿並生成元件、頁面與前端程式碼，縮短設計到開發之間的交接流程。對於 UI 設計、產品原型、Design System 與前端開發來說都很有幫助。若產品已在 Figma 中完成完整設計稿，這個外掛能有效降低設計與開發之間的溝通成本。

第六個外掛是 Document。它主要用來協助撰寫、編輯與美化文件，讓文件結構更清楚、內容更專業、格式更規範。適用場景包括 PRD、方案書、週報、月報、專案文件、操作手冊與知識沉澱等。不論是對外提案，還是對內報告與總結，都能透過 AI 快速完成排版與撰寫，提高文件工作的效率與品質。

第七個外掛是 Presentations。它可以幫助使用者生成高品質 PPT，包含簡報內容生成、自動排版、設計美化與資料視覺化。使用者可以指定主題、風格、對象與頁數，描述越詳細，生成結果通常越貼近需求。這個外掛適合需要快速完成簡報製作的人，能節省時間，也提升專業感。

第八個外掛是 AI Spreadsheets。它可以視為 AI 資料分析師，能自動分析資料、生成圖表與報表，並將複雜數據整理成可執行的結論。它不只是像 Excel 的工具，更像是能直接協助做分析、產出洞察與輸出結果的智慧分析助手，適合資料處理、報表產出與決策支援。

第九個外掛是 HyperFrames。它能把網頁直接轉成影片，透過內部智慧渲染，將網頁 HTML 匯出為高品質影片。這對產品展示、教學影片、行銷宣傳素材與社群內容製作都很實用，能更快速地把原本靜態的網頁內容轉化為動態展示素材。

第十個外掛是 Emotion。這是一個程式化影片生成工具，與前面的網頁轉影片不同，它是透過程式碼來生成影片，適合製作動態圖表、資料影片與大量相似內容的批次輸出。基本流程包含撰寫程式碼、渲染預覽，最後輸出影片。它特別適合規模化影片生產、自動化工作流與 AI 內容工廠。若前面的 AI 腳本與分鏡都已完成，甚至可以進一步實現一鍵式全流程自動渲染。

總結來說，這十個外掛涵蓋了瀏覽器操作、程式開發、電腦控制、網頁應用生成、設計轉程式碼、文件處理、簡報製作、資料分析，以及影片生成等完整工作環節。若能把這些能力整合起來，確實有機會讓整體工作流程產生質的飛躍。

[AI 分享] Fable5實測觀察

摘要 : Fable5整體更強但更貴，視覺與推理表現亮眼，安全限制也更嚴格，部分任務仍未全面勝過GPT5.5。

內容:

最近 Cloud 釋出了 Fable5，定位大致和 Mythos5 同級，但它更面向一般使用者，且預設帶有更強的安全防護。整體來看，Fable5 的價格非常高，約是 GPT 模型的兩倍；如果把思考強度開高，會變得又慢又貴。不過從實際表現來看，它的品質確實不錯，在多個基準測試上都優於 GPT5.5。

Fable5 這次的一個重點升級是視覺能力更強。它已經可以透過極簡的純視覺工具鏈完成像寶可夢這類任務，不再像以前那樣高度依賴複雜的輔助工具。Curser 方面也認為它是 Curser Bench 上目前最先進的模型，其中 Fable5 MAX 最強，但同時也是最昂貴的；High 與 Medium 則相對更有性價比。而這幾個版本的整體能力，都被認為超過 GPT5.5 Extra High，不過 GPT5.5 在價格上仍便宜非常多。

在專業應用方面，Physics 公司表示，Fable5 是他們在前沿物理研究中測過最強的模型。它花 36 小時，幾乎達到 GPT 用 4 天才能到的位置，顯示出它在高強度研究任務上的潛力。

Curser 工程師也分享了使用經驗。過去團隊主要是在驗證 Curser 是否「把工作做對」，需要人工拆分任務、逐步檢查輸出、捕捉提前停止等問題；但現在他們更多是在驗證 Curser 是否「在做正確的工作」。也就是說，它不再只是被動執行指令的工具，而能成為思考夥伴。實務上，可以在早期就讓它參與思考，只給一個小規格（Spec），再讓 Curser 反過來訪談需求、補齊細節。若再結合 CC 的相關工作流，就能讓 Curser 持續工作，並平行驗證自己的計畫。這也帶來一個很重要的啟發：那些以前覺得大語言模型做不到的任務，現在也值得交給 Fable5 試試看。

目前官網已經能看到 Fable5 的選項，但有使用限制：在 6 月 22 日前，Pro 或 Max 會員可以使用；從 6 月 23 日開始，不論是 Pro 還是 Max，用 Fable5 都必須額外啟用用量額度，並改為按 API 計費。

也有不少外部評測出現。AK 認為 Fable5 的重要性，大致相當於去年 11 月 Curser Opus 4.5 的那種等級。Augmentor 的測試則顯示，Fable5 整體上比 GPT5.5 更聰明，正確率也略高；處理時間差不多，但在相同任務下，Fable5 平均消耗的 token 幾乎是 GPT5.5 的兩倍，費用也幾乎是兩倍。

不過，Fable5 這次的安全防護也強到讓人相當有感。如果模型判定話題涉及它認為不安全的網路問題、生物化學，或蒸餾相關風險，它可能會直接降級，退回到 Opus 4.8。這點非常令人困擾，因為花了更高的價格，結果卻可能被切換到較弱的模型。另外，對話資料目前似乎只保留 30 天。

官方也提供了一些提示詞指南。Ansysopic 建議多數任務預設用 Hi 模式；Fable5 的指令遵循能力更強，通常不需要把每個行為都寫得非常死。若是長時間執行的任務，則要要求模型在回報前，對照工具呼叫結果逐條審計進度說明。由於 Fable5 有時會主動做超出請求的事，因此在提示中應明確規範它的行動邊界。另外有一點非常重要：不要要求 Fable5 重述推理頁，這被認為是官方用來防止模型蒸餾的保護措施之一。

接下來是一些實測結果。我把 Fable5 和 GPT5.5 都開在 Hi 推理模式，拿來比較複雜前端互動任務的表現。從 Curser Bench 的花費來看，Fable5 Hi 單個任務大約要 10 美元，而 GPT5.5 Hi 約為 3.5 美元，成本差距很明顯。

在「彩色玻璃萬花筒」這個任務上，認為 GPT5.5 做得更好。

但到了「動態字型海報排版機」，Fable5 的表現就非常突出，幾乎是全面壓過 GPT5.5。不論是斜切網路、圓形路徑、巨型字母裁切，還是縱橫混排的密集報紙欄、自由散點構圖，它都做得非常完整，設計感也很強。就我目前測過的多個模型來看，這是海報排版類任務中表現最好的一個。

在「機械腕錶爆炸圖」上，Fable5 生成的結果雖然可以展開並標示零件，但拖曳互動沒有做好；整體視覺上，我反而覺得 GPT5.5 稍微更好一些。

「桌面行星儀」這題則是 Fable5 很亮眼。它對球體材質的處理非常高級，像景泰藍、琉璃等質感表現得很好，而且球體移動時，下方還會有影子跟隨，玻璃反射效果也相當到位。不過它還是有錯，例如齒輪擺放位置不正確。即便如此，整體效果仍明顯優於 GPT5.5；如果用 MAX 模式，理論上應該還會更好。

在「咖啡館排隊曆劇場」這類任務裡，Fable5 雖然比 Opus 4.8 有進步很多，但以我目前的觀察，GPT5 在這題上還是表現更好一些。

至於「迷你印刷機」，Fable5 的整體理解已經很不錯。以前不少模型根本不理解活字排版，字模甚至會做成鏡像；Fable5 至少已經理解概念，也能做出壓印動畫。不過它仍有細節錯誤，例如字應該是凸出的，結果卻做成凹進去。

也在 CC 裡調用 Fable5 X-High 生成「縴夫拉船」場景。這是測過眾多模型中表現最好的一次。水流模擬非常到位，遠山、江面飛鳥等背景細節都有做出來。雖然繩索綁定位置不完全符合現實，但模型有注意到船上應該安排船伕，這點非常關鍵，因為連 GPT5.5 Pro 在內的其他模型都忽略了。更厲害的是，船伕的步態也有動感，整體思考相當完整。

另外，也讓 CC 生成一個展示森林露營房車的體素藝術場景。結果細節非常豐富：房車、展開的棚子、野餐墊、小桌子、花草元素、車頂工具，以及穿過森林縫隙灑落的陽光，都表現得很漂亮，整體是一個非常美的畫面。

最後，讓它嘗試做交通模擬，同樣選擇 X-High 模式。這次就不太理想了，模型思考了 20 多分鐘仍然沒有結果，甚至消耗了額外積分。這個任務至少花了 10 美元都沒解決，最後我只能手動暫停。

總結來說，Fable5 確實是一個更強、更聰明的模型，特別是在視覺理解、設計感、複雜場景細節與部分高階研究任務上，都展現出非常強的能力。但它的缺點也很明顯：價格高、token 消耗大、安全限制嚴格，而且在部分任務上仍不一定全面勝過 GPT5.5。若你追求最前沿能力，Fable5 很值得關注；但若從成本與穩定性來看，是否划算仍要依照實際場景評估。

Codex 核心功能與實戰上手

[AI 分享] Codex核心功能與實戰上手

摘要 : 關於 Codex安裝、登入、專案實作、版本控制與Plugin擴充功能。

內容:

這篇內容主要是在完整介紹 OpenAI 的 Codex，並將它定位為一個功能很全面的 AI 開發工具。除了能寫程式、排查 Bug、執行測試之外，還能管理 Git、操作瀏覽器、控制電腦完成任務。因為功能很多，原文的重點是希望透過系統化講解，幫使用者建立一套清楚的使用思路。

整體內容大致分成三個部分。第一部分是基礎篇，重點在快速上手、安裝登入、核心設定與常見踩坑。第二部分是進階篇，聚焦版本控制、對話管理，以及更有效率地組織與推進開發任務。第三部分則是擴充篇，介紹如何透過 Plugin、Skill、Automation、Mobile 等方式延伸 Codex 的能力邊界。

在安裝與登入部分，內容提到可以直接下載 Codex 安裝到電腦上，例如在 macOS 上拖入 Applications 即可。首次開啟後，Codex 會要求登入，主要有兩種方式：一種是使用 ChatGPT 帳號登入，對應不同訂閱方案；另一種則是透過 OpenAI API Key。原文認為若是一般使用者，直接訂閱方案通常比 API 更方便，並建議至少使用 Plus 方案，才能比較完整體驗 Codex 的能力。

登入完成後，Codex 會先詢問工作類型，並提示是否匯入相關配置或設定手機版，這些步驟都可以先略過。進入主介面後，就能正式開始使用。原文透過一個「筆記軟體」作為示範案例，帶大家理解 Codex 的實際操作流程。

示範中先建立一個專案資料夾，再透過「Work in Project」功能讓 Codex 綁定這個資料夾作為工作目錄。接著直接輸入需求，例如用 HTML 寫一個左右分欄的筆記軟體：左邊是筆記列表，右邊是筆記內容，並提醒它做好測試。Codex 便會開始生成程式碼，必要時還會請求授權啟動本地伺服器來驗證結果。這裡也說明了 Codex 在執行某些操作時，會提供同意、永久允許、跳過或自訂處理方式等不同授權選項。

完成後，可以直接預覽 Codex 產出的 HTML 頁面。原文也展示了如何透過介面按鈕隱藏側欄、放大預覽區，以及持續追問來修改介面內容。這部分想傳達的是，Codex 不只是一次性生成程式碼，而是能在互動中持續迭代。

接著內容進入對話與版本管理。原文特別介紹了 fork 功能，指出它不是傳統意義上的「回滾」，而是從某一則訊息分叉出一個新的對話。fork 有兩種形式：一種是 fork into local，會沿用原本的專案目錄；另一種是 fork into new work tree，會建立一個新的獨立目錄。兩者都只會複製對話脈絡，不會自動回滾程式碼。

如果希望讓程式碼也回到先前狀態，就必須配合 Git 操作。例如先用 git log 找到對應 commit，再手動切回那個版本。原文強調，這也是為什麼 Git 在 Codex 的工作流中非常重要。特別是當對話內容與程式碼版本需要同步時，Git 幾乎是不可或缺的工具。

除了 fork，內容也介紹了對話歸檔功能。使用者可以將不需要的對話先 archive 起來，而不是直接刪除。歸檔後仍可在設定中找回、解除歸檔，或進一步永久刪除。這讓多分支、多任務並行時的對話管理更有彈性。

在 Git 自動化方面，原文提出一個常見需求：希望 Codex 每次修改完程式碼後都自動提交一次 Git commit。雖然可以直接在對話裡要求它這麼做，但這種方式只會在當前對話有效。若想讓這個規則跨對話生效，就需要在專案根目錄建立一個 agents.md 檔案。Codex 在每次新對話啟動時都會自動讀取這個檔案，並把其中內容當作長期指令執行。透過這個方式，就能把像是「每次改完程式碼都要 commit」這類規則固定下來。

後續內容也展示了功能迭代與除錯流程，例如加入淺色／深色主題切換、修復程式問題、啟動 npm 專案檢查運作狀態，以及驗證 markdown 高亮與預覽功能是否正常。這些例子都是在說明 Codex 不只是生成初版，而是能逐步參與真實開發流程中的修正、測試與優化。

在擴充能力部分，原文重點介紹 Plugin。Plugin 可以理解為 Codex 的外掛系統，用來賦予它更多外部操作能力。例如有控制電腦的、操作 Chrome 的、編輯 Excel 的，甚至還有製作簡報的。每個 Plugin 可能包含 App 與 Skill。App 比較像實際可呼叫的工具集合，Skill 則更像是提供給模型參考的操作說明與使用策略。

以 Gmail Plugin 為例，裡面包含可對郵件加標籤、封存郵件等多種 action，也有說明怎麼總結郵件、怎麼分類信件優先級的 Skill。這表示 Plugin 不只是單純增加一個按鈕，而是同時提供操作能力與任務知識。

原文也實測了 Presentations 這個 Plugin，讓 Codex 為筆記軟體產出一份介紹產品設計與技術架構的 PPT。使用者可以直接描述需求，也可以明確指定要使用哪個 Plugin。雖然產出的簡報還有進一步優化空間，但已足以作為初版內容的基礎。

另外兩個較受矚目的 Plugin 是 Chrome 與 Computer Use。Chrome Plugin 讓 Codex 能直接操作瀏覽器，例如打開 Product Hunt 首頁、搜尋今日熱門產品、逐一閱讀產品頁，再整理其特點與連結。這說明 Codex 已經不只是在本地寫程式，也能主動到網路上蒐集資訊並彙整結果。

Computer Use 則讓 Codex 可以直接操作電腦應用程式。示範中，它被要求打開系統日曆，新增一個指定日期時間的行程。Codex 會用獨立的虛擬滑鼠執行操作，不會干擾使用者本身的滑鼠與工作流程。即使在背景執行，也能持續完成指定任務。這部分很清楚地展現出 Codex 已具備某種程度的電腦代理能力。

最後，內容也提到 Skill 的瀏覽與使用方式，指出其實很多 Plugin 背後都依賴 Skill 來指導模型如何完成任務。雖然文末沒有完全展開，但核心意思已很明確：Codex 的能力不只來自模型本身，也來自這些外掛、技能與工具的整合。

總結來看，這篇內容的核心價值在於，透過一個具體專案與多個實戰場景，把 Codex 從安裝登入、專案建立、程式開發、對話分支、Git 管理，到 Plugin 擴充與電腦操作能力，做了一次完整梳理。重點不是單一功能有多炫，而是幫使用者建立一套較完整的 Codex 使用框架。

[AI 分享] Claude Dynamic Workflows解析

摘要 : Claude可自動拆解任務、平行調度大量Agent，並在背景驗證與收斂結果，加速大型工作的完成。

內容:

Anthropic 近期為 Claude Code 加入了名為 Dynamic Workflows 的新功能。用白話來說，過去你交代 Claude 一件大事，通常是由它單獨慢慢完成；現在則是你只要下達一句指令，它就能在背景自動組建一個由數十甚至上百個 Agent 構成的團隊，同時分工處理不同子任務，最後再透過交叉檢查與驗證，整理出一份完整答案。

這項功能的核心，其實是 Claude 先根據你的需求自動寫出一段 Javascript 指令碼，並由這段程式去負責後續的任務編排與執行。這個流程會在背景獨立環境中運作，因此主對話不會被卡住。也就是說，當 Workflow 在執行時，你仍然可以繼續和 Claude 在同一個 Session 中做其他事，等整個流程完成後，Claude 再把最終結論帶回來給你。

Dynamic Workflows 的強大之處，在於它不只是「多叫幾個 Agent 一起做事」而已，而是能夠有層次地拆解任務。舉例來說，一開始可能會先派出少量 Agent，從不同角度蒐集資料；第二階段再擴大 Agent 數量，對取得的內容進行深入閱讀與整理；最後還會再派另一批 Agent 專門負責挑錯、反駁與驗證，直到結論逐漸收斂。各階段要使用多少 Agent、採用哪一種模型，也都由 Claude 自行安排。

另一個重要特色是，這些大量 Agent 在執行過程中產生的中間結果，並不會全部塞進主對話的 Context 中，而是保留在 Workflow 的指令碼變數裡。主對話最後只會收到一份整理完成的結果。這使得 Claude 能在不污染主要 Context 的情況下，處理規模極大的任務，這也是 Dynamic Workflows 與一般 Subagent 或 Agent Team 很大的差別。

此外，Dynamic Workflows 內建了品質把關的概念。它可以讓多個 Agent 從不同角度分析同一問題，再由其他 Agent 專門負責反駁、挑錯與驗證。經過這種多輪攻防後還能成立的結論，通常會比單一模型一次生成的答案更可靠。這種機制就像不是只讓一個人自己檢查作業，而是再找一群人專門來找漏洞。

在成本與效率方面，Dynamic Workflows 還可以依不同階段切換模型。例如在前期大量平行搜尋時，使用較便宜、速度較快的模型；到了最後需要高推理能力來總結與收斂時，再切換到更強的旗艦模型。這樣的配置可以同時兼顧速度、品質與成本。

如果要用一句話總結 Dynamic Workflows，那就是：Claude 會先幫你寫一段指令碼，再由這段指令碼去指揮大量 Agent 完成任務。過去使用者可能需要自己設計複雜的拆解流程與提示詞，現在這部分的工作很大程度被 Claude 自動包辦了，但前提仍是你要知道自己想交付什麼任務。

文中也進一步釐清了幾個容易混淆的概念，包括 Skill、Subagent、Agent Team 與 Workflow。區分它們最簡單的方法，就是看「下一步由誰決定」。如果下一步是由程式碼事先安排好的，那就是 Workflow；如果是 Claude 根據當下情況臨場決定，那就是 Skill、Subagent 或其他 Agent 類型。

其中，Skill 比較像是一份食譜或說明書，用來告訴 Claude 在某種情境下應該怎麼做、使用哪些工具、遵守哪些限制。它本身不是 Agent，而是一組給 Agent 看的規則，因此會佔用主 Context。Skill 主要回答的是「事情怎麼做」，而 Workflow 處理的是「怎麼調度很多人一起做」，兩者不在同一層級，甚至可以搭配使用。

Subagent 則比較像 Claude 臨時派出去執行單一任務的小幫手。它完成工作後，會把結果直接帶回主對話，因此雖然能減少搜尋過程對主 Context 的污染，但如果一次派出太多 Subagent，回傳的大量結果仍可能把主 Context 塞滿。作者用「實習生查資料後把整疊文件堆回桌上」來形容這件事：少量還可以，但一多就會讓桌面爆掉。

相較之下，Workflow 更像是一個在桌子外面先做好整理的人。它能在外部協調大量 Subagent 的工作，把眾多資料先統整、驗收、驗證過後，再只把濃縮後的結論放回主對話。也因為這樣，Workflow 才能真正支撐數十、數百甚至更多 Agent 同時運作，而不讓主對話 Context 爆炸。

整體來看，Dynamic Workflows 的價值在於，它把原本需要人工設計的任務拆解、編排、平行處理與交叉驗證，自動化成一個可在背景運作的工作機制。對於大型研究、長流程分析、需要高可靠度驗證的工作，它能大幅縮短時間，也讓使用者不必自己寫出極其複雜的提示詞或流程控制邏輯。

[AI 分享] 從零打造網頁抓取 Skill

摘要 : 本文示範用一個 Markdown 檔，從零建立網頁抓取 Skill，讓 AI 能自動訪問網頁、解析資料並輸出結構化結果。

內容:

Skill 是 AI 的外掛能力包，現在進一步進入實作。重點在於：如果 AI 只能對話，實際上仍只是聊天工具；只有加上 Skill，AI 才能像被裝上「手和眼」，具備訪問網頁、讀取資料、調用工具與執行任務的能力，真正成為能做事的數位員工。

文中強調，開發 Skill 的門檻其實很低。最小結構只需要一個資料夾，裡面放一個 `Skill.md` 檔案即可。這個檔案分成兩部分：上方是 YAML 後設資料，包含 `name` 與 `description`；下方則是 Markdown 正文，用自然語言寫清楚執行指令。後設資料像名片，讓 AI 快速判斷用途；正文則像操作手冊，在確定要使用時才細讀。

實作範例是一個 `Web-Scraper` Skill。做法是先建立資料夾與 `Skill.md`，目標是讓 AI 接收網址後，自動抓取網頁內容、解析 HTML，並提取結構化資料。技術上可採用 Python 的 `requests` 發送請求，再以 `Beautiful Soup` 解析頁面，足以應付多數基礎抓取需求。

在撰寫內容時，`description` 特別關鍵，因為 AI 會依靠這段文字判斷何時觸發 Skill，因此必須明確描述功能與使用場景，例如：當使用者要求抓取網站、提取頁面資訊時啟用。正文則可依序定義角色、分析頁面結構、選擇解析策略、編寫抓取腳本、驗證資料完整性，並規範輸出格式如 JSON，同時補上錯誤處理與最佳實踐，例如遵守 Robots.txt、設定合理請求間隔與處理超時。

文章也說明了為何採用這種分層設計：因為 AI 的上下文空間有限，若所有 Skill 內容一開始就全部載入，很容易耗盡 Token。透過後設資料先做快速判斷，只有在需要時才載入正文，附屬檔案也按需引用，便能讓多個 Skill 並存且維持效率。Skill 寫完後還要測試 YAML 語法、檔名與觸發效果，若無法正確啟動，通常是描述不夠精準，應從簡單功能開始逐步調整。

對一人公司或小型團隊而言，這類網頁抓取 Skill 的應用非常廣，像是競品價格監控、產業新聞聚合、客戶資料補全等，都能大幅減少手動工作與 SaaS 成本。不過文中也提醒，實際抓取時必須遵守網站服務條款與資料保護法規，只有合規使用，這類自動化能力才能長期發揮價值。

[AI 趨勢] 軟體工程的終結？

摘要 : AI Agent 正逐步改變軟體工程的本質，未來競爭力不再只是寫程式，而是定義意圖、協調代理與驗證成果。

內容:

過去數十年來，軟體工程的核心邏輯一直沒有改變：人類先定義規則，再將規則寫成程式碼，最後讓電腦按照既定邏輯執行。然而，隨著大型語言模型與 AI Agent 的快速發展，這個長期存在的模式正在被重新定義。

傳統軟體的價值建立在程式碼本身。開發團隊透過架構設計、功能開發與持續維護，將業務邏輯固化在系統中。但在 Agent 時代，程式碼開始從核心資產逐漸轉變成執行媒介。當 AI 可以根據目標、上下文與限制條件，在執行過程中動態推理與生成程式碼時，真正重要的已不再是固定規則，而是持續推理的能力。

從軟體商業模式來看，這也是一次重大轉變。第一代軟體是安裝式產品，使用者需要自行維護環境；第二代 SaaS 則將基礎設施與維運交由服務提供商負責。而下一階段的 AaaS（Agent as a Service），使用者甚至不需要操作功能介面，只需描述目標，由代理自主規劃、執行並交付成果。軟體的價值將從提供功能，逐步轉向提供結果。

這樣的變化，也讓軟體工程師的角色開始向上移動。未來的重要能力不再只是撰寫程式，而是成為意圖架構師、代理協調者與結果稽核員。工程師需要將模糊需求轉化為清晰目標，設計多個代理如何分工合作，並建立評估與驗證機制，確保最終結果符合品質要求。

不過，現實並不像許多人想像得那麼樂觀。現階段 AI Agent 在單一、邊界清楚的任務上，成功率已經相當驚人；但當面對真實世界長期演進的大型系統時，仍然會遭遇上下文遺失、錯誤累積、知識斷層以及跨任務一致性等問題。這也是為什麼許多 Agent 在 Demo 中表現亮眼，實際投入企業級開發後卻仍需要大量治理與監控。

從技術演進路徑來看，我們正處於從「工具化」走向「自治化」的過渡階段。未來幾年，AI 將從開發助手進一步成長為能夠獨立完成單一任務的代理，再逐步發展成由 PM、架構師、開發者、測試人員等多角色代理組成的協作團隊。更長遠來看，甚至可能出現具備自我學習、自我修正與自我優化能力的代理生態系統。

因此，真正值得思考的問題已經不是「AI 會不會取代工程師」，而是「工程師是否能夠完成角色升級」。未來的競爭力不在於寫出多少程式碼，而在於能否高品質地定義目標、管理代理、建立監控機制、控制風險並驗證成果。當程式碼逐漸被自動生成時，人類最重要的價值，將是決定方向、建立規則以及確保系統持續朝正確目標收斂。

軟體工程或許不會真正終結，但它的重心正在發生轉移。從程式碼導向走向意圖導向，從功能開發走向結果交付，從單人開發走向代理協作。未來最具價值的人才，可能不再是最會寫程式的人，而是最懂得指揮 AI Agent 團隊的人。

這篇內容與您近期整理的「Prompt Engineering → Loop Engineering」其實形成了一條很有意思的主線：

Prompt Engineer → Context Engineer → Workflow Engineer → Agentic Engineer → Intent Commander

前者講的是 AI 技術能力的演進路徑，後者講的是軟體工程師角色的演進路徑。兩條路線最終都指向同一件事：

未來的核心競爭力，不是產生程式碼，而是讓一群 AI 能穩定產生正確結果。

[AI 分享] AI 應用成熟度六階段

摘要 : AI 的重點已從提示詞設計，逐步演進到建立能自主優化、持續收斂的智慧系統，形成完整的 AI 導入成熟度框架。

內容:

隨著 AI 技術快速發展，許多人仍把焦點放在 Prompt Engineering（提示工程），認為只要會寫提示詞就能充分發揮 AI 能力。但實際上，提示詞只是 AI 應用發展的起點，而不是終點。AI 的使用方法正逐漸從單一互動，演進成完整的系統設計與治理能力。

第一階段是「提示工程（Prompt Engineering）」。這個階段的核心是學習如何與模型溝通，將需求轉換成清楚、可重複使用的指令，提升輸出的品質與穩定性。重點不只是會提問，而是建立能夠重複利用的提示模板。

第二階段是「上下文工程（Context Engineering）」。當模型能力逐漸提升後，影響結果品質的關鍵開始從提示詞本身，轉向模型是否取得足夠且正確的背景資訊。此時需要思考如何管理知識來源、歷史記錄、文件內容與相關資料，讓模型能在完整脈絡下進行判斷。

第三階段是「工具工程（Tool Engineering）」。AI 不再只是生成文字，而是開始具備執行任務的能力。透過串接 API、資料庫、企業系統與各種工具，讓模型能夠查詢資料、操作系統、執行流程，從單純回答問題進化為真正解決問題。

第四階段是「執行環境工程（Harness Engineering）」。當 AI 開始接觸企業系統與重要資料後，管理與治理的重要性大幅提升。此階段重視權限控管、任務狀態管理、驗證機制、安全防護以及監控觀測能力，確保 AI 的運作過程具備可靠性、可追蹤性與可控性。

第五階段是「工作流程工程（Workflow Engineering）」。企業需求往往不是單一步驟即可完成，因此需要將多個任務、多個工具甚至多個代理人（Agent）進行編排，形成可維護、可擴展且可持續運作的工作流程架構。AI 的價值開始從單點能力提升到系統化運作能力。

第六階段則是「迴圈工程（Loop Engineering）」，也是目前最進階的方向。系統不只是執行任務，而是能夠持續進行觀察、行動、評估、反思與重試。透過回饋機制不斷修正決策與策略，逐步收斂到更好的結果，形成真正具備自我優化能力的閉環系統。

從整體發展脈絡來看，AI 的核心演進其實是一條清晰的路徑：

輸出 → 資訊 → 能力 → 環境 → 流程 → 收斂

一開始關注的是模型回答得好不好；接著關注模型是否取得正確資訊；之後重視模型是否具備執行能力；再來建立安全可靠的執行環境；接著將能力組織成完整流程；最後則讓系統具備持續學習與優化的能力。

如果將這套概念套用到企業 AI 導入上，它其實也是一個非常實用的成熟度框架。企業可以藉此檢視目前所處的階段：究竟是還停留在提示詞優化、正在建置知識庫與上下文管理、開始串接工具與系統，還是已經進入工作流程自動化與多 Agent 協作。更重要的是，它能幫助團隊明確判斷下一步該補強的能力，最終朝向具備自主優化與持續成長能力的 AI 系統邁進。

[AI 影響] AI裁員潮下，真正稀缺的是判斷力

摘要 : AI讓程式碼與工時愈來愈便宜，但收入未同步成長；未來更難被取代的，不是高產出者，而是能判斷、對齊並把成果轉成商業價值的人。

內容:

一名工程師面臨公司可能裁掉8000人、自己有10%機率上榜，卻沒有等結果，而是先重新思考「AI裁員」背後的邏輯。他將工作拆成三層：Input（程式碼、Token、工時）、Output（上線功能）、Outcome（使用者願意付費的結果）。

他的核心觀察是：AI讓底層的Input幾乎接近免費，程式碼產出量可能暴增5倍，但真正的商業結果與使用者收入卻未必成長，產品看起來甚至和半年前差不多。問題不在於寫得不夠快，而在於多出來的產出沒有有效轉成價值。

其中有兩道主要瓶頸。第一是「想法品質」：當寫程式的成本變低，原本會被成本淘汰的點子也都能快速上線，結果是垃圾產出變多。第二是「對齊稅」：不同團隊都能用AI高速做出MVP，但彼此假設可能完全衝突，最後卡在判斷、協調與整合，而不是卡在開發速度。

從公司角度看，裁員變成一筆算術題：AI的Token成本遠低於人力成本，標準化、可替代、對齊成本高的職位，最容易被優先裁撤。省下的人力支出，某種程度上正轉化為AI公司的收入，這也是企業加速用AI補位的現實原因。

因此，稀缺能力正在改變。過去值錢的是生產力，如今AI讓大量執行能力快速貶值；未來更重要的是判斷力：知道哪個想法值得做、如何從大量AI輸出中挑出真正有效的方案，以及如何讓互相衝突的方向收斂成一致目標。

面對這種變化，普通人可從三件事開始：第一，停止「會用AI就安全」的幻覺；第二，從Outcome倒推工作，先想清楚它會為誰創造價值；第三，成為能整合技術、產品、數據與業務的人。當Input愈來愈便宜，真正難被取代的，是能把Token變成Outcome的人。

2026年6月9日星期二

[AI 分享] 用 AI 重構工程工作流

摘要 : 從高中後少有代表作，到成為 Python 核心貢獻者，Matt 用一套可複製的 AI 工程方法，打造高影響力開源成果。

內容:

這次想分享一個很震撼的案例：一位自稱高中畢業後就沒再做出「讓別人覺得有價值的軟體」的人，竟然在今年成為了 Python 核心貢獻者，還同時維護兩個合計超過三萬四千星的開源專案。

這個人是 Matt Van Horn。他是矽谷連續創業者，曾參與創辦後來成為 Lyft 的公司，也共同創辦了 AI 烤箱公司 June，產品能自動辨識食物並調節溫度，之後被收購。雖然經歷亮眼，但他自己認為，真正高價值的軟體產出反而是最近才開始爆發。

今年，他用 Cloud Code 打造了兩個專案。第一個是 Last 30 Days，一個幫助使用者回顧過去三十天工作的工具，累積超過三萬星；第二個是 Printing Press，一個 AI 內容生產工具，也快速累積數千星。除此之外，他還成為 Python 核心貢獻者，以及 Compound Engineering 這個 Cloud Code 外掛的第三大貢獻者。

Matt 把自己的工作方法整理成 22 個 hack。與其說這些是 AI 工具使用技巧，不如說是一套完整的工程哲學重構。他的核心觀點很直接：工程師的價值應該來自思考、架構決策與問題解決，而不是把大量精力消耗在環境配置、查錯、切換 IDE 與瀏覽器之間。

他認為，工具應該消失，思維應該留下。當一個工具需要你花太多力氣去管理，它本身就已經在消耗你。這套方法論的第一個核心，就是在動手寫任何程式碼之前，先產出一份結構化計劃文件，也就是 Plan.md。這份文件會先定義問題、列出可能方案、推薦方案的理由，以及潛在風險。重點不是讓 AI 立刻生成程式碼，而是先驗證方向對不對，避免陷入寫了再改、改了再重來的循環。

更特別的是，他不主張逐字閱讀這份長篇計劃，而是要求 AI 進一步用三句話濃縮出核心假設，並說明如果假設錯誤會發生什麼事。這個做法的本質不是檢查細節，而是審計推理框架。因為真正致命的錯誤，往往不在技術實作，而在一開始的前提判斷。

在工作環境上，Matt 採取極度工程化的方式。他不用傳統 IDE，而是同時開六個終端視窗，每個視窗對應一個獨立任務，例如新功能、測試、文件、程式碼審查等。這不是單純的多工，而是把不同任務拆成可並行處理的工作流，讓大腦只專注於排程與決策。

當他需要向 AI 解釋複雜背景時，會優先使用語音輸入，因為語音比打字能承載更高密度的上下文資訊。語氣、停頓、補充說明，這些平常打字容易省略的內容，反而能讓 AI 更準確掌握真正的需求與語境。

在每個專案中，他還會維護一份 Cloud.md。這份文件不是寫給人看，而是寫給 AI 看。內容包括專案核心限制、哪些目錄不能動、程式碼風格邊界、以及專案存在的根本原因。這等於是 AI 的入職文件，讓每次新的互動都能快速對齊上下文，而不必重頭再解釋一次。

版本控制在這套系統裡也不只是版本控制。Matt 每完成一個邏輯單元就會立刻 commit，且 commit message 不是描述「改了哪些檔案」，而是說清楚「解決了什麼問題」。這其實是在強迫自己做思維檢查點：如果你無法用一句話說明剛才做了什麼，代表那個改動本身可能就還不夠清晰。

在任務拆解上，他的原則是：一個任務只解決一個問題，一個問題只有一個成功標準，而且成功標準必須可驗證。因為 AI 的輸出品質，與任務定義品質高度正相關。如果你丟給 AI 一個混雜了效能優化、文件更新與 Bug 修復的複合需求，它往往會每件事都做一點，但沒有一件事做到真正到位。

程式碼審查方面，他會讓 AI 審查 AI 自己寫的程式碼，但審查時一定指定角度，例如從安全性、效能、可讀性，或新進工程師能否理解的角度來看。不同視角會暴露出完全不同類型的問題，這比泛泛地問「有沒有問題」有效得多。

在測試策略上，他主張先寫測試案例，再寫實作。這不一定是傳統意義上的 TDD，而是用測試先把需求具體化。如果連測試案例都無法明確描述，通常代表需求本身還沒有被真正理解。至於文件，他認為未來的文件主要不是寫給未來的自己，而是寫給未來會協助你的 AI。因此文件應該更加結構化、上下文完整、假設明確，方便 AI 快速吸收並協助決策。

最後，他還把這套方法沉澱為可持續系統，例如建立私人 prompt 庫，依照架構設計、程式碼審查、文件生成、除錯等場景分類管理。這代表他不是把 AI 當成一次性的聊天工具，而是當成可訓練、可複用、可工程化的生產系統。

整體來看，Matt 的 22 個 hack 真正厲害的地方，不只是讓 AI 幫你寫程式，而是把工程師的工作重心，從大量低價值的操作，重新拉回高價值的思考、判斷與系統設計。這不是天賦神話，而是一套有機會被複製的方法論。

[AI 分享] AI 程式設計的企業級專案方法

摘要：企業級 AI 開發的核心不只在生成程式碼，而是建立 SOP 閉環、全鏈路日誌與健壯性驗證，讓 AI 能持續根據日誌結果迭代優化專案品質。

內容

企業級專案的四個關鍵：企業級專案最重要的不是單純把功能做出來，而是同時滿足：SOP 閉環、專案穩定、程式碼健壯，以及日誌可追溯。程式碼越健壯，專案就越穩定；而 SOP 是否真正閉環，最終要靠測試報告來驗證。

測試報告來自全鏈路日誌：在 AI 程式設計流程中，全鏈路日誌（埋點）是核心基礎。AI 不只是生成程式碼，而是持續分析執行日誌，根據結果調整實作方向，逐步逼近需求目標，直到整個 SOP 流程被完整跑通並完成標記。

健壯性檢查的內容：當主流程完成後，還需要進行健壯性檢查，包括壓力測試、漏洞注入、正常業務流程驗證，以及逆向或異常流程驗證。這些測試的分析依據同樣來自日誌，AI 會根據測試結果持續優化系統。

日誌是測試與自動化的基礎：無論是暴力測試、壓力測試，還是 SOP 測試，測試工具都需要利用日誌進行結果比對。因此，日誌設計不是附屬工作，而是整個品質保證流程的核心基礎設施。

AI 工程師角色的轉變：實務上大量時間不是在手寫程式碼，而是在讓 AI 分析日誌，再根據分析結果下達新的指令。工程師的角色也從傳統的「程式碼審查員」，逐漸轉變為「日誌審查員」與流程監督者。全流程日誌帶來的價值：當全流程日誌建立完整後，專案的故障定位、問題追蹤與快速修復都會變得更有效率。對企業級 AI 開發而言，日誌不是事後補強，而是從一開始就必須被納入架構設計的重要能力。

總結

這篇內容強調：AI 程式設計要真正落地到企業級專案，關鍵不在於「一次生成正確程式碼」，而在於建立「需求 → 日誌 → 分析 → 修正 → 測試 → 驗證」的閉環流程。全鏈路日誌、健壯性測試與可追溯性，才是讓 AI 開發成果能穩定運行於真實企業環境的核心能力。

[AI 衝擊] AI編碼時代的開發者分化

摘要 : AI編碼工具全面普及後，開發效率大幅提升，但開發者之間的差距也正以前所未有的速度被放大。

內容:

隨著 AI Coding 工具快速普及，軟體開發產業正在經歷一場深刻變革。根據最新開發者使用數據顯示，短短一年多時間內，開發者每週平均產出的程式碼量已經成長超過一倍。過去需要多年經驗累積才能換來的效率提升，如今透過 AI 輔助，在極短時間內就能實現。這不只是工具升級，而是整個開發模式的改變。

更值得注意的是，開發者一次完成的工作規模正在快速擴大。過去一個功能可能需要拆成多次提交，如今透過 Coding Agent 協助，許多原本需要數天甚至數週完成的工作，可以在一次大型 Pull Request 中完成。超過千行程式碼的大型 PR 比例持續攀升，代表開發者開始有能力管理更複雜、更完整的開發任務，而這背後最大的推手正是 AI。

除了程式碼產出增加之外，開發者與 AI 的協作模式也在改變。AI 已不再只是單純的程式碼補全工具，而是逐漸成為能夠執行任務、呼叫工具、分析專案上下文的開發代理人。越來越多工程師開始將繁瑣、重複性的工作交由 AI 處理，自己則專注於架構設計、需求分析與決策判斷。這代表開發工作的重心正逐漸從「寫程式」轉向「管理 AI 寫程式」。

許多人擔心 AI 生成的程式碼品質是否可靠。從實際數據來看，AI 產出的程式碼保留率正在穩定上升，代表越來越多 AI 生成的內容能夠直接被納入正式專案。雖然仍需要人工審查、優化與修正邊界情況，但 AI 已經從過去的輔助工具逐漸演變成能夠參與實際生產的開發夥伴。

然而，真正值得關注的並不是效率提升，而是開發者之間差距的急速擴大。數據顯示，最頂尖的 AI 開發者所產出的程式碼量，可能是一般開發者的數十倍；完成任務的速度也遠遠超越平均水平。AI 並沒有平均地提升每一位工程師的能力，而是讓那些懂得善用 AI 的人獲得更大的放大效果。相同的工具，在不同人手中產生的價值差異，甚至比過去任何技術革命都更加明顯。

這場變革帶來的一個殘酷現實是：未來開發者的核心競爭力，可能不再只是演算法、框架或語言能力，而是如何與 AI 協作、如何設計工作流程、如何拆解問題並驅動多個 Agent 完成任務。AI 並沒有取代工程師，但它正在快速拉開工程師之間的距離。未來真正稀缺的，不是會寫程式的人，而是能夠駕馭 AI、放大自身能力的人。這道差距，正在成為 AI 時代最重要的新門檻。

[AI 分享] AI Native 公司的作業系統革命

摘要 : AI帶來的改變不只是效率提升，而是重新定義企業運作方式，讓公司從依賴人力協調轉向由智慧系統驅動的閉環組織。

內容:

傳統企業談論 AI 時，大多聚焦在提升工作效率，例如讓工程師寫程式更快、讓員工整理文件更省時間。然而，真正的改變可能遠超過提效 20% 或 50%。當 AI 已經能夠讓一個人完成過去一整個團隊的工作時，企業需要思考的問題不再是「如何使用 AI 工具」，而是「是否應該重建整個組織運作模式」。

核心關鍵在於從「開環系統」走向「閉環系統」。許多公司做完決策、執行任務後，只在事後進行回顧，卻沒有將結果系統化地回饋到流程中。資訊散落在會議、郵件、聊天訊息、口頭溝通與管理者腦海裡，導致知識不斷流失，也難以持續優化。而 AI Native 公司則會持續收集每個流程的輸入與輸出，將結果反饋給智慧系統，使流程不斷學習與改善。公司越接近閉環，AI 越能參與真實決策；反之，AI 就只能停留在問答工具的層次。

要建立這樣的能力，第一步是讓整家公司變得「可查詢」。所有重要資訊都必須被記錄並納入統一的智慧上下文之中，包括會議紀錄、專案管理系統、即時通訊頻道、客戶郵件、程式碼庫、銷售錄音以及每日站會內容。這些資訊不再只是員工的記憶負擔，而是 AI 學習與推理的重要基礎。當智慧體能同時看到需求、開發過程、客戶回饋與實際成果時，它便能分析哪些決策有效、哪些地方偏離目標，甚至協助團隊持續修正方向。

在產品開發與軟體工程領域，新的模式也正在形成。過去工程師負責撰寫程式碼，如今人類的角色逐漸轉向定義規格、設計測試與判斷結果。AI 負責根據規格產生程式碼、反覆修改並通過測試。未來真正稀缺的能力，可能不再是敲程式碼，而是能否清楚定義需求、建立正確的驗證機制，以及判斷輸出是否符合商業目標。程式碼本身，逐漸成為一種中間產物。

當企業大量導入 AI 閉環與智慧工廠模式後，傳統的管理階層也可能發生變化。過去中層主管的重要職責之一，是在不同部門之間搬運資訊、協調溝通與追蹤進度。但當智慧系統能即時掌握所有資訊並自動完成路由與分析時，組織層級將被大幅簡化。管理者的角色將從傳話與催促，轉向明確定義責任、校準方向與確保成果品質。

這樣的未來組織可能只剩下三種核心角色：第一線的執行者（Builder），直接對結果負責的負責人（DRI），以及負責制定方向與價值觀的創辦人（Founder）。每個人都直接對成果負責，而不是隱藏在複雜的組織架構之後。企業競爭力也不再取決於員工數量、辦公室規模或部門編制，而是取決於組織能否有效利用 AI、建立高品質的資訊閉環，以及用更少的人創造更大的成果。

最後有三個值得深思的原則。第一，給 AI 與正式員工同等級的上下文資訊。若只給 AI 一個孤立任務，卻期待它理解整個業務，那就像要求新進員工第一天上班就做出正確決策一樣不切實際。第二，領導者不能把 AI 全部外包給專門團隊，而必須親自使用與體驗，才能真正理解其能力邊界。第三，在 AI 時代，新的競爭優勢來自更高品質的智慧輸入、更快速的學習循環，以及更精簡的組織結構，而不是單純擴張人力規模。

總結：

AI 的價值不只是讓現有流程跑得更快，而是讓企業有機會重新設計整個作業系統。未來最具競爭力的公司，未必是擁有最多員工的公司，而是那些能夠建立完整資訊閉環、讓 AI 深度參與決策與執行，並以最少的人力創造最大價值的組織。真正的轉型，不是替公司加上一個 AI 工具，而是讓 AI 成為公司運作的核心基礎設施。

[AI 分享] AI Native公司的真正樣貌

摘要 : AI Native 並非只是會用 AI，而是讓 AI 成為公司運作的基礎設施，透過閉環機制、經驗沉澱與智慧化流程，讓組織能力能持續累積與複製。

內容:

隨著 AI 時代加速到來，無論是企業還是個人工作者，都無法避免受到 AI 的衝擊。許多人認為導入 AI 就是使用聊天機器人、生成文案、製作圖片或剪輯影片，但真正值得思考的問題並不是「有沒有使用 AI」，而是「公司是否已經按照 AI 的特性重新設計工作方式」。

許多團隊過去一年大量使用 AI 工具，內容產出速度變快了、工作效率提升了，但實際感受卻是事情沒有變少，反而越做越多。大家每天依然忙於追進度、處理專案、培訓新人與重複傳授經驗。問題並不在於 AI 不夠強，而是組織仍然沿用傳統公司的運作模式，只是在原本流程上額外加了一層 AI 工具而已。

判斷一家公司究竟是「很會用 AI 的傳統公司」，還是真正的「AI Native 公司」，有一個簡單標準。如果今天把所有 AI 工具拿掉，公司只是效率下降但仍然能正常運作，那本質上仍是傳統公司；如果把 AI 抽離之後，公司許多流程直接停擺，甚至無法繼續運作，那才代表 AI 已經成為組織基礎架構的一部分，真正融入公司的核心能力。

這也是為什麼許多大型企業推動 AI 轉型特別困難。因為它們原本的組織架構、流程制度與工作模式，都是建立在傳統商業邏輯之上。相反地，小型團隊反而有機會從零開始，以 AI 為中心重新設計流程、分工與管理方式，讓整個組織從一開始就是為 AI 而生。

建立 AI Native 組織有三個重要關鍵：閉環（Closed Loop）、可查詢（Queryable）以及智慧可呼叫（Callable Intelligence）。其中最核心的是「閉環思維」。許多公司經常開檢討會、做覆盤、討論成功案例，但會議結束後經驗仍然停留在少數人的腦袋裡。當負責的人離開、忙碌或換人接手時，過去累積的知識就跟著消失，團隊又得重新摸索一次。

真正的閉環不是單純記錄資料，而是讓每次成功與失敗的經驗都能回流到系統中。未來不論是新員工、老員工還是 AI Agent，都能直接使用過去累積的知識與最佳實務。組織不再依賴特定個人，而是依賴一套持續成長的知識系統。當經驗能夠被保存、被搜尋、被複用時，企業的能力才真正開始沉澱。

為了實現這種閉環，可以透過一套 PDCA 類似的循環流程來運作。首先是 Plan（規劃），明確定義目標、對象與執行方式；接著將任務 Delegate（委派）給 AI Agent 執行；然後由人員進行 Assess（評估），確認結果品質與方向是否正確；最後再將成功與失敗的經驗 Archive（固化），轉化成 SOP、技能文件、規則庫或知識庫。

特別重要的是，許多人只會記錄成功案例，卻忽略失敗經驗同樣具有價值。AI 本質上是機率模型，今天有效的方法不代表明天一定有效。因此每一次修改、每一次調整、每一次踩過的坑，都應該被記錄下來。這些內容未來不只可以幫助人員學習，也能成為 AI Agent 持續優化的重要依據。

當公司開始將所有流程、規則、經驗與決策邏輯逐步沉澱到系統裡，AI 就不再只是工具，而是組織能力的延伸。未來每一次執行任務，都不是從零開始，而是站在過去所有經驗的基礎上繼續前進。這或許才是真正的 AI Native 思維：不是讓人適應 AI，而是讓整個組織圍繞 AI 重新設計，形成能夠持續學習、持續進化的智慧型企業。

總結：

多數企業目前只是「會使用 AI」，但真正的 AI Native 公司，會把 AI 視為組織運作的核心基礎設施。關鍵不在於用了多少 AI 工具，而在於是否建立了經驗沉澱、知識複用與持續優化的閉環機制。當每一次執行、評估與學習都能被記錄並轉化為組織資產時，企業才能真正享受到 AI 帶來的長期複利效應。

2026年6月8日星期一

[AI 分享] 心理登月：用1%的成本創造99%的價值

摘要 : 真正影響使用者體驗的，往往不是物理層面的改善，而是心理感受的改變。與其花巨大成本改變現實，不如用更低成本降低不確定性、提升感知價值，創造更高的商業回報。

內容:

大部分人做產品、服務或改善流程時，都有一種很自然的反應：當問題出現，就去解決造成問題的物理原因。

App 太慢，就優化程式碼、增加伺服器；物流太慢，就增加倉儲與運力；服務不好，就增加人力與訓練。這種思維本身沒有錯，但很多時候卻不是最有效率的解法。

全球最大廣告公司澳美副董事長 Rory Sutherland 提出了一個非常有趣的觀點：在工廠裡製造出來的物理價值，與人腦感受到的心理價值，同等重要。而在許多情況下，心理價值的投資報酬率甚至可能是物理價值的100倍。

第一個經典案例來自歐洲之星（Eurostar）。

當時英國鐵路公司希望提升倫敦到巴黎的競爭力，工程團隊提出的方案是重新鋪設鐵路，將列車時速從約200公里提升到接近400公里。

整個計畫預算高達60億英鎊，而最終只能將原本約2小時15分鐘的車程縮短約30分鐘。

就在大家認為這是唯一解法時，Rory Sutherland 提出了另一種思考：

為什麼不拿1%的預算，在車上提供WiFi、升級餐飲服務、改善乘坐體驗，甚至安排更優質的服務人員與香檳招待？

如果乘客能夠上網工作、享受美食、獲得更好的服務，他感受到的旅程時間就會大幅縮短。

工程師思考的是：

「如何讓旅程更短？」

而 Rory 思考的是：

「如何讓旅程感覺更短？」

物理上縮短30分鐘需要60億英鎊，但心理上讓兩個多小時變得愉快，可能只需要6000萬英鎊。

這就是感知價值的巨大槓桿。

第二個案例則是我們每天都可能使用到的 Uber 地圖。

當 Uber 推出即時車輛位置地圖時，很多人以為這是導航功能的延伸。

但實際上，它解決的並不是交通問題，而是心理問題。

想想看：

有了那張地圖之後，車子真的比較快到嗎？

沒有。

原本需要5分鐘到達，現在仍然需要5分鐘。

司機沒有變快，道路沒有變順暢，等待時間完全沒變。

但神奇的是，使用者焦慮下降了、取消訂單率下降了、滿意度提升了、回購率提高了。

原因在於，人們真正討厭的並不是等待。

而是不確定性。

不知道司機在哪裡、不知道還要多久、不知道會不會被放鴿子，這種未知感帶來的焦慮，遠遠大於等待本身。

當地圖出現後，等待變得可預測。

使用者看到車子正在接近，就會知道：

「還有3分鐘。」

「還有2分鐘。」

「快到了。」

雖然等待時間沒有縮短一秒鐘，但等待體驗卻被徹底改變了。

Uber 並沒有花大錢讓車開得更快，而是透過資訊透明化，消除了不確定性。

這就是心理登月最典型的案例。

所謂「心理登月（Psycho-Logical Moonshot）」的概念，其實是在提醒我們：

與其花數十億去改變物理世界，不如花數百萬去改變人們的感受。

前者可能只能帶來有限提升，後者卻可能創造數十倍甚至數百倍的價值。

這個觀念不只適用於大企業，也適用於每一個人。

當你在做產品、提供服務、經營社群、管理團隊，甚至處理人際關係時，都可以先問自己：

我現在遇到的是物理問題，還是心理問題？

很多時候，客戶抱怨服務慢，真正受不了的並不是速度，而是不知道還要等多久。

很多時候，員工抱怨制度差，真正不滿的並不是制度本身，而是不知道未來會發生什麼。

很多時候，伴侶感到焦慮，也未必是事情本身，而是缺乏明確的溝通與預期。

因此，當使用者抱怨時，不要急著解決表面的問題。

先思考：

他真正痛苦的是什麼？

是時間太長？

還是不確定性太高？

是成本太高？

還是感覺不被重視？

很多時候，真正的答案藏在抱怨背後。

從今天開始，可以試著用「心理登月」的角度重新觀察生活。

排隊等餐、等電梯、等醫生、等外送、等主管回覆、等客戶決策、等另一半回訊息。

所有令人焦躁的場景背後，往往都隱藏著一個降低不確定性的機會。

誰能夠用最低成本，把「不知道」變成「知道」；

誰能夠把焦慮變成可預期；

誰就有機會創造遠超過物理改善的價值。

總結：

工廠裡製造出來的價值，與人腦感受到的價值，同等重要。

過去工業時代教導我們，解決問題就是改變物理現實；但未來真正巨大的機會，可能來自於另一個方向——在不改變現實的情況下，改變人們對現實的感受。

真正高明的創新，不一定是把火車開得更快，而是讓旅程變得更值得期待；不一定是讓等待變短，而是讓等待變得可以理解。

當你學會尋找那些隱藏在人性中的不確定性，你就會發現：

很多時候，用1%的成本，就能創造出99%的價值。

[AI 啟發] 第一性原理的賺錢邏輯

賺錢的第一性原理是創造價值，不是出賣時間。

創造價值的第一性原理是解決問題，不是提供勞動。

解決問題的第一性原理是識別真需求，不是自我感動。

識別真需求的第一性原理是實踐反饋，不是閉門造車。

實踐反饋的第一性原理是快速迭代，不是仔細打磨。

快速迭代的第一性理是驗證模型，不是為了交付。

驗證模型的第一性原理是為了系統複製，而不是個人苦幹。

系統複製的第一性原理是槓桿思維，不是線性積累。

[AI 啟發] 第一性原理的賺錢邏輯

摘要 : 賺錢的本質不是出售時間，而是持續創造價值。從需求、驗證、迭代到系統化複製，每一層都指向同一件事：建立可放大的價值槓桿。

內容:

很多人以為賺錢靠的是努力工作，但真正決定收入上限的，往往不是投入多少時間，而是創造了多少價值。當你的收入只能和工時綁定時，再努力也會遇到天花板；但當你的價值能被放大、被複製，收入的成長空間就完全不同了。

而價值的本質，不是做了多少事，而是解決了多少問題。客戶不會為你的辛苦買單，他們只會為問題被解決買單。寫程式、做設計、提供服務都只是手段，真正有價值的是讓別人的成本降低、效率提高、風險減少或收益增加。

但問題的背後還有更深的一層：需求。很多人花了大量時間打造自己覺得很棒的產品，最後卻沒有人願意付費。原因並不是產品不好，而是解決的問題根本不存在，或者不是使用者最在意的問題。與其閉門造車，不如盡快接觸市場，驗證需求是否真實存在。

因此，實踐與反饋遠比完美更重要。許多人把時間花在反覆打磨產品，卻遲遲不敢推出市場。事實上，市場才是唯一的評審。快速推出、快速收集回饋、快速修正，往往比花半年追求完美更有效率。

而快速迭代的目的，也不是為了交付產品，而是驗證商業模型。你需要知道的是：這個需求是否存在？這個方案是否有效？客戶是否願意付費？成本與收益是否合理？只有驗證成功的模型，才值得投入更多資源。

最後，所有商業活動都會回到一個終點：系統化複製。如果一件事情只能靠你親自完成，那本質上仍然是在出售自己的時間。真正的成長來自建立流程、工具、產品、品牌、團隊甚至 AI 工作流，讓價值可以被持續複製與放大。

從第一性原理來看，賺錢其實是一條非常清晰的路徑：

創造價值 → 解決問題 → 找到真需求 → 獲得市場反饋 → 快速迭代 → 驗證模型 → 系統化複製 → 建立槓桿。

當你開始用槓桿思維取代線性思維，用系統取代苦幹，用驗證取代猜測，用需求取代自我感動，你就不再只是努力工作的人，而是在打造一個能持續創造價值的成長引擎。

真正拉開差距的，不是誰比誰更努力，而是誰能把自己的價值，從「做一次」變成「複製一萬次」。

[AI 分享] AI 推理成本的物理真相

摘要 : 大模型定價不只是商業策略，而是受到GPU算力、記憶體頻寬與硬體物理極限共同決定。

內容:

很多人看到 AI 平台推出快速模式、高級方案或長上下文加價機制時，第一個反應往往是商業套路。但如果深入到底層運作原理，就會發現這些價格設計其實與硬體物理限制高度相關。從輸入 Token、輸出 Token，到長上下文處理成本，背後都可以用數學模型與硬體規律解釋。

大語言模型的推理本質是「自迴歸生成」，也就是一個 Token 接著一個 Token 產生結果。每生成一個 Token，GPU 都必須重新執行一次模型。這個過程不只是計算矩陣乘法，更重要的是從顯示記憶體中搬運龐大的模型權重資料。現代 GPU 的問題往往不是算不動，而是在等待資料傳輸完成。

因此，推理速度受到兩個關鍵因素制約：計算能力與記憶體頻寬。即使 GPU 擁有極高的運算能力，如果資料無法及時送達，計算單元仍然只能閒置等待。整體推理時間取決於兩者中較慢的那一項，而不是兩者相加。這也是為什麼晶片設計時，算力與頻寬必須保持平衡。

進一步來看，大模型推理的記憶體開銷包含兩部分。第一部分是模型權重讀取，這是一筆固定成本；無論服務一位使用者還是一千位使用者，都必須完整載入模型。第二部分則是 KV Cache，也就是模型記錄上下文的記憶空間。隨著使用者數量增加、對話內容變長，這部分成本會持續上升。

這也引出了大型 AI 服務商的重要經營策略：批次處理（Batching）。當大量使用者的請求同時進入系統時，固定的模型讀取成本可以被眾多使用者共同分攤，使單一 Token 的平均成本大幅下降。這也是為什麼大型平台能以相對低廉的價格提供服務，而個人自行租用高階 GPU 推理時，成本往往高得驚人。

然而，成本下降並非無限。當批次規模持續增加後，KV Cache 的讀取與實際計算量會逐漸成為新的瓶頸。此時即使再增加使用者，也無法再顯著降低成本，因為系統已經接近硬體所能達到的物理極限。這也是大型模型服務商持續追求推理最佳化、模型壓縮與晶片創新的根本原因。

從這個角度來看，AI 產業的競爭不只是模型能力競爭，更是硬體效率競爭。模型價格、快速模式、長上下文費率、輸出 Token 定價，許多看似商業決策的設計，其實都受到 GPU 算力、記憶體頻寬與資料搬運成本的深刻影響。理解這些底層規律後，你會發現 AI 商業模式的核心，並不是單純賣模型能力，而是在不斷逼近硬體物理極限的過程中，尋找最高效的成本結構與資源利用方式。

當大多數人還在討論哪個模型比較聰明時，真正決定 AI 公司獲利能力的關鍵，往往是背後那張 GPU 每秒能搬多少資料、能服務多少使用者，以及能把固定成本攤薄到什麼程度。這才是 AI 時代最容易被忽略，但也最重要的一層競爭力。

[AI 觀察] AI越強，人為何反而更忙？

摘要 : AI並未直接取代人力，而是重塑工作型態。未來最有價值的人，不是會使用AI的人，而是能設計、管理與駕馭AI工作流的人。

內容:

過去很多人認為，AI普及後企業最先做的事情一定是裁員、縮編、降低人力成本。但現實卻出現了有趣的反差。有些公司幾乎全員深度使用 AI 工具，從程式開發到文件處理都交給 AI 協助，結果一年下來員工數量不減反增。原因並非 AI 不夠強，而是每一個 AI Agent 的背後，都需要有人負責規劃、監督、維護與修正。當 Agent 越多，管理 Agent 的需求也隨之增加。

許多人曾經幻想，只要建立好 Agent，它就能自主完成工作。然而實際運作後發現，沒有持續維護的 Agent 很快就會失效、偏離目標，甚至變成另一種技術債。因此真正成熟的做法，不是讓每個人各自養一堆 Agent，而是建立公司級的核心 Agent 平台，由專門人員負責管理與優化。自動化沒有消滅工作，而是創造出全新的工作內容。

另一方面，AI 的發展方向也正在改變。過去大家討論的是聊天機器人、提示詞與命令列工具；現在則逐漸走向桌面化、系統級 Agent。這類 Agent 不只是回答問題，而是能看到畫面、操作應用程式、跨系統執行任務。AI 正從協助單一工作，逐步演化成協助整個職務。以前是幫你寫一封郵件，未來則可能直接幫你處理整個郵件工作流程。

這也讓許多人誤以為軟體服務將被 AI 取代。但實際情況可能正好相反。AI Agent 雖然變成新的操作入口，但背後仍然需要大量專業系統提供資料、流程與服務。AI 更像是一個新的作業層，而原本的應用系統則成為被呼叫的能力模組。未來競爭的焦點，不一定是誰擁有 AI，而是誰擁有最完整、最容易被 Agent 使用的服務能力。

在軟體開發領域，同樣出現了一個重要現象。AI 已經能快速生成大量程式碼，但真正困難的問題並不是寫程式，而是判斷該寫什麼、怎麼設計才符合業務需求。模型可以根據已知問題產生答案，但往往缺乏對現場情境的理解與取捨能力。當面對架構決策、產品方向或複雜商業邏輯時，人類仍然扮演關鍵角色。

因此，未來最被看好的角色未必是純工程師，而是兼具產品思維、設計能力與技術理解的人。當 AI 讓實作門檻快速下降後，真正稀缺的是能夠定義問題、設計流程、判斷品質與整合資源的人。產品經理、全端設計師、AI 工作流設計者，將成為新一波價值提升最快的角色。

我自己最大的感受是，AI 並沒有讓工作消失，而是在重新定義工作的內容。以前我們管理人，現在開始管理 Agent；以前設計功能，現在開始設計工作流；以前學習工具，現在學習如何協調多個模型共同完成任務。真正值錢的能力，不再只是執行工作，而是能把整個職務拆解成一套可以持續運作的系統。未來的競爭力，不是「會不會用 AI」，而是「能不能讓 AI 為整個工作流程創造價值」。當所有人都擁有 AI 時，最有價值的人，將是那個能夠駕馭與編排 AI 的人。

[AI 觀察] 蘋果的AI豪賭時刻

摘要 : WWDC 2026被視為蘋果全面轉向AI的關鍵戰役，從Siri重構到系統級智慧化，顯示科技競爭已從硬體規格轉向AI生態與使用者入口之爭。

內容:

過去大家期待開發者大會時，最關心的是新手機、新電腦或新硬體。但今年的焦點似乎完全不同。市場普遍認為，這次發表會將幾乎沒有硬體亮點，而是把所有資源集中在作業系統與人工智慧能力上。這不只是產品策略調整，更反映出整個科技產業正在經歷一場從「硬體競爭」走向「AI競爭」的巨大轉變。

其中最受矚目的變化，就是語音助理的全面升級。未來的智慧助理不再只是查天氣、設鬧鐘，而是逐漸演變成真正的個人智慧中樞。它能理解使用者的行程、郵件、文件與使用情境，甚至整合不同AI模型提供服務。對於使用者而言，重點已經不是背後是哪一家模型公司，而是誰能提供最順暢、最自然的智慧體驗。

這也透露出一個重要訊號：科技巨頭開始接受「開放合作」的重要性。過去封閉的生態系統正在鬆動，因為AI時代的競爭已經不是單純靠硬體或作業系統就能取勝。當模型能力快速演進，使用者更在意的是能否自由選擇最適合自己的AI服務。誰能留住使用者，誰就擁有下一個時代的入口。

除了智慧助理之外，AI也開始滲透到影像、相機、相簿、鍵盤、搜尋與自動化工具之中。過去需要專業技能才能完成的工作，例如圖片修復、內容創作、工作流程自動化、文字潤飾等，現在都逐漸變成系統內建能力。這代表AI正在從一個額外安裝的工具，變成作業系統的基礎設施，如同網路、儲存空間與圖形介面一樣不可或缺。

但這場變革背後也存在另一個值得思考的問題。當AI開始參與照片生成、內容創作、資訊判斷甚至決策建議時，我們看到的究竟是真實世界，還是經過演算法重新包裝後的世界？當技術能夠讓每一張照片變得完美、每一段文字變得流暢時，人類原本的不完美與創造過程是否也正在被逐漸弱化，這將成為未來幾年持續被討論的課題。

從更大的角度來看，這場發表會真正反映的並不是某家公司推出了多少新功能，而是整個產業權力中心正在轉移。過去十多年，科技公司比的是晶片效能、螢幕規格與相機畫質；而現在，比的是模型能力、算力規模以及誰能掌握使用者每天最重要的互動入口。未來人們可能不再頻繁開啟各種App，而是直接透過AI完成工作、購物、訂票、搜尋與決策。當這一天真正到來，AI將不只是功能，而會成為新的作業系統，而這場競爭，才正要開始。

[AI 衝擊] Token經濟正在改寫科技產業規則

摘要 : AI時代的競爭焦點正從人力與資金，逐漸轉向算力與Token消耗能力，並重塑全球軟體產業與商業模式。

內容:

過去科技圈炫耀的是融資金額、估值或豪華辦公室，如今矽谷的新指標卻變成了「每天消耗多少Token」。許多企業開始將AI使用量視為競爭力的象徵，甚至建立內部排行榜追蹤員工與團隊的模型使用狀況。對不少管理者而言，AI消耗量不再只是成本數字，而被視為組織創新能力與未來生存機率的指標。

這種現象背後反映的是軟體產業商業模式的巨大轉變。過去軟體產品最大的優勢是邊際成本接近零，產品開發完成後，用戶越多獲利通常越高。但AI產品不同，每一次提問、每一次推理、每一次自動化任務，都會持續消耗模型資源並產生成本。使用者愈活躍，企業支付給模型供應商的費用也可能同步增加。

因此，Token逐漸成為新的生產資源。部分投資機構甚至開始將算力額度與Token配額視為重要投資內容，而不只是提供資金。對AI新創來說，獲得穩定且低成本的算力來源，某種程度上已經和獲得融資同樣重要。AI競爭也從單純的產品競爭，演變成算力取得能力與使用效率的競爭。

有趣的是，模型價格與實際成本之間存在一個反直覺現象。許多人認為便宜模型一定更省錢，但在複雜任務中，能力較弱的模型往往需要反覆嘗試、多次修正與重新執行，最終消耗更多Token。反而能力較強、價格較高的模型，因為能夠更快完成任務，總體成本可能更低。未來企業真正要優化的，不只是單次Token價格，而是完成任務所需的總消耗量。

隨著智慧體（Agent）大量普及，Token需求也開始呈現爆炸性成長。傳統使用者可能只是偶爾詢問AI問題，但自主運作的Agent會持續讀取資料、執行流程、測試程式、修正錯誤，甚至全天候運作。這種模式下，Token不再是偶發消耗，而成為企業營運過程中的持續性資源，就像電力、水資源或網路頻寬一樣重要。

更值得關注的是全球算力產業的重新分工。當世界各地的開發者透過API呼叫遠端模型服務時，本質上是在購買另一個地區的電力、基礎設施與運算能力。未來的國際競爭，可能不再只是出口商品或軟體，而是出口「算力」與「智慧」。誰擁有更低成本、更穩定的能源供應、更完善的資料中心與運算基礎設施，誰就有機會在這場Token經濟浪潮中取得更大的主導權。

[AI 衝擊] AI 時代真正拉開差距的，不只是會不會用工具

摘要 : AI 放大人的能力，也放大思維、強度與責任感的差距。

內容:
AI 時代最大的差距，可能不是誰比較聰明，而是誰真正懂得把 AI 用成自己的能力放大器。今天的模型像是 24 小時待命的博士團隊，但多數人並沒有感覺自己身邊真的多了這股力量，原因不只是提示詞寫不好，而是我們的「TQ」還太低。

所謂 TQ，不只是技術使用能力，而是理解 AI 能力邊界、拆解任務、調度 Agent、驗證結果、修正錯誤的整體能力。當別人還在問「AI 能不能幫我做這件事」，更高階的人已經在問「為什麼只用一個 Agent？為什麼不是一百個 Sub-Agent 協同完成？」

AI 也讓「Intensity」變得更重要。過去一個人的強度不夠，可能幾個月後才看得出來；但在 AI 時代，差距可能隔天就顯現。聰明但沒有強度，走不遠；有強度但沒有判斷力，只是瞎忙。真正有競爭力的人，是能把智慧、執行密度與方向感結合起來的人。

未來白領工作的核心也會改變。單純「搬磚」的工作會越來越少，寫文件、寫程式、整理資料、做簡報，很多數位世界的重複性任務都會被 AI 接手。人真正需要培養的，是 Founder Mentality：定義目標、判斷價值、選擇路徑、承擔結果。

這也代表，工作者不能只把自己定位成 Coder，而要變成 Builder；不能只會執行任務，而要能設計任務、管理 Agent、理解客戶、創造結果。未來的專才與通才都還有價值，但前提是你的專業或整合能力，必須比 AI 預設輸出更有判斷力。

AI 不會平均分配紅利，它會放大差距。會用的人，速度可能快十倍、百倍；不會用的人，會覺得工具很多但自己更累。真正該修煉的，不只是工具清單，而是思維方式、技術調度能力、強度、責任感，以及讓別人願意理解與接受你產出的能力。

2026年6月7日星期日

[AI 分享] AI全端工程師時代來了

摘要 : AI正在改變軟體開發分工模式，未來工程師將從單一職能逐步走向具備多領域能力的全端開發者。

內容:

過去幾年，軟體產業的分工越來越細。有人專注前端、有人專注後端、有人負責測試、運維或資料庫。這種模式在過去確實有效，但隨著 AI 開發工具快速成熟，我開始觀察到一個明顯的變化：企業越來越希望找到能夠獨立完成完整工作流程的人，而不是只負責其中一小塊的人。

以前一個功能上線，可能需要前端、後端、測試、運維多個角色協作。現在透過 AI 協助產生程式碼、撰寫測試、建立部署腳本，許多原本需要多人合作的工作，逐漸可以由少數人完成。企業發現，如果同樣的人能夠同時理解前端、後端、雲端部署與 AI Agent 應用，那麼溝通成本會大幅下降，交付速度也會更快。

這並不代表專業能力不重要，而是代表未來的競爭力不再只是「專精一項技術」。真正有價值的人才，將會是「一項專精 + 多項通識」的組合。你可以是前端高手，但同時懂後端 API；你可以是後端專家，但也能處理部署與 AI 整合。當問題出現時，你能跨越不同領域快速定位與解決，這種能力的價值會越來越高。

有趣的是，很多人一聽到全端就開始焦慮，覺得自己要重新學習所有東西。但實際上，AI 反而降低了跨領域學習的門檻。過去從零學習一項新技術可能需要數個月甚至半年，現在透過 AI 輔助學習與實作，許多人能在短時間內建立基本能力。對大多數開發者而言，目標不是每個領域都達到專家等級，而是先具備能夠完成工作的能力，再逐步深化自己最擅長的方向。

我認為未來的工程師發展路線，可能會從「單一職能」轉變成「全端能力 + 核心專長」。全端能力負責解決大部分業務需求，而核心專長則用來處理複雜問題與高難度挑戰。當 AI 可以幫我們完成大量重複性工作時，人類的價值將更集中在架構設計、問題分析、系統整合與決策判斷上。

站在職涯發展的角度來看，這其實未必是壞事。過去技術更新速度太快，許多人擔心自己多年累積的技能會快速過時。但如果你持續擴展自己的能力邊界，同時保留一項深度專長，經驗反而會成為優勢。AI 不只是提高生產力的工具，它更可能重新定義工程師的成長路徑。未來真正稀缺的，或許不是某個框架的專家，而是能夠駕馭 AI、整合多種技術並創造實際價值的人。

[AI 分享] Vibe Coding 不等於放手不管：先建工程流程，再讓 AI 寫程式

摘要 : AI 能加速開發，但真正決定專案成敗的不是模型能力，而是開發流程與工程紀律。

內容:

很多人在體驗 AI Coding 或 Vibe Coding 之後，都有一種共同感受：前期開發速度快到不可思議，一天能完成過去一週的工作量。但隨著專案規模越來越大，問題開始浮現。程式碼結構逐漸混亂、功能彼此耦合、修改一個地方影響另一個地方，最後整個專案變成難以維護的「技術債黑洞」。很多人以為這是 AI 的問題，但實際上，問題往往出在缺乏一套能駕馭 AI 的工程流程。

在讓 AI 寫下第一行程式碼之前，最重要的事情其實不是選模型，而是先把需求定義清楚。很多人一開始就急著叫 AI 產生程式碼，結果需求一直變、方向一直改，導致 AI 每次都在不同的前提下工作。比較好的做法是先把目標使用者、使用情境、核心功能與商業目的整理出來，再進一步形成 PRD 文件。同時，每一項功能都要建立驗收標準，明確定義什麼叫做完成。當標準越清楚，AI 產出的品質就越穩定。

完成需求規劃後，接著要開始打地基。這個階段最容易被忽略，但卻往往是專案能否長期維護的關鍵。你需要先思考系統的邊界、安全需求、效能要求以及成本限制。例如這個系統只是個人使用，還是未來要對外提供服務？是否涉及個資與隱私？是否有大量使用者同時在線？如果這些問題沒有提前想清楚，等到系統做到一半才發現架構不符合需求，往往就得付出數倍的重構成本。

技術選型也是許多人容易踩坑的地方。很多開發者喜歡追逐最新框架，但對 AI 開發來說，比起新穎，更重要的是「可驗證」。當一個技術擁有完整文件、成熟社群、豐富範例與大量實戰案例時，AI 產生正確程式碼的機率會大幅提高。換句話說，選擇主流技術不只是因為穩定，而是因為 AI 能從更多公開知識中學習並參考正確做法。

除了需求與架構之外，還需要建立 AI 的工作規範。將需求文件、架構設計與專案現況分別維護成獨立文件，讓 AI 隨時能取得最新上下文資訊。同時建立程式碼規範、命名規則、元件標準以及參考範例。這樣 AI 就不是每次從零開始猜測，而是在既定框架下進行開發。許多人覺得 AI 寫程式不穩定，其實很多時候只是因為沒有提供足夠清晰的規則與背景資訊。

真正進入開發階段後，最重要的原則只有一句話：「人負責方向與驗收，AI 負責執行與產出。」不要一次要求 AI 完成整個系統，而是採用 MVP 與小步快跑的方式，每次只完成一個可驗證功能。每完成一個小功能就測試、驗證、提交版本。人類持續負責架構拆分、模組邊界、安全檢查與品質把關，AI 則負責大量重複性的實作工作。當 AI 出現錯誤時，也不要陷入無限重試，而是透過最小重現、日誌分析、斷點追蹤與測試驗證來尋找證據。因為在 AI 時代，最有價值的能力已經不再是寫程式，而是建立一套能夠穩定產出高品質程式碼的工程系統。

[AI 分享] AI Coding 不等於 AI 接管開發

[AI 真相] Vibe Coding 不等於 AI 接管開發

摘要 : AI 能加速開發，但無法取代工程管理。真正決定專案成敗的，是開發流程、架構設計與驗收機制。Vibe Coding 時代的真相：速度可以交給 AI，品質仍然掌握在人手上。

內容:

最近很多人在談 Vibe Coding，甚至有人覺得只要把需求丟給 AI，就能快速做出產品。但實際參與過專案的人很快就會發現另一個現象：開發速度確實變快了，可是程式碼品質卻不一定變好。當功能越加越多、需求不斷調整時，專案很容易逐漸演變成一座難以維護的「程式碼屎山」，最後修改任何一個功能都可能影響整個系統。

我觀察到許多人誤會了一件事：AI 並不是工程師的替代品，而是工程師的放大器。如果原本沒有需求管理、架構規劃、版本控制與驗收標準，那麼 AI 只會把混亂放大得更快。原本需要半年才累積的技術債，現在可能一個月就全部堆出來。

因此，在開始寫第一行程式碼之前，最重要的工作其實不是 Coding，而是把需求講清楚。包括目標使用者是誰、要解決什麼問題、有哪些核心功能，以及每個功能完成的標準是什麼。很多團隊失敗的原因不是技術做不到，而是一開始根本沒有定義什麼叫做「完成」。

除了需求之外，專案的技術邊界也必須先被定義。安全性怎麼處理？資料要不要加密？系統預計多少人使用？是否需要擴充性？這些看似和功能無關的問題，往往才是後期重構成本最高的來源。當 AI 開始大量產生程式碼時，這些邊界如果沒有先畫好，後面幾乎一定會回頭重做。

進入開發階段後，我認為最重要的原則是「小步快跑」。不要一次讓 AI 幫你完成整個系統，而是拆成許多可以驗證的小功能。每完成一個功能就測試一次、提交一次版本。AI 負責產生程式碼，人類負責確認方向。這種模式雖然看起來比較慢，但實際上成功率遠高於一次產生大量程式碼後再回頭修正。

最後，無論 AI 再怎麼進步，工程開發仍然有幾件事不能放手：架構設計、權限管理、安全驗證、程式碼審查與版本控制。AI 很擅長把事情做出來，但不一定知道什麼事情不該做。真正成熟的團隊，並不是讓 AI 自由發揮，而是建立一套流程去駕馭 AI。當你把需求、架構、規範與驗收機制都建立好之後，AI 才能真正成為讓團隊生產力倍增的工具，而不是製造更多技術債的來源。

[AI 分享] 從提示詞進化到工作流：AI協作模式的真正價值

摘要 : AI 正從單次對話進化成可規劃、可審查、可協作的工作流系統，讓複雜任務能以更低成本、更高品質完成。

內容:

第一，AI 的競爭焦點正在改變：從「回答問題」走向「完成任務」。

過去我們使用 AI，大多是在聊天視窗裡輸入一段提示詞，等待模型給出答案。但最近越來越多工具開始導入工作流（Workflow）概念，讓 AI 不再只是回答問題，而是能先規劃步驟、拆解任務、分派工作，再彙整成果。這代表 AI 的角色正在從聊天機器人，逐漸轉變成專案執行者。未來比的可能不再是誰的模型比較聰明，而是誰的工作流設計能力更強。

第二，先看計畫，再執行，將成為高階使用者的重要習慣。

許多人使用 AI 時習慣直接執行任務，但當工作規模變大之後，這種方式往往容易造成資源浪費。比較成熟的做法是要求 AI 先產出執行計畫，例如任務拆解方式、執行階段、需要多少 Agent、預估成本、驗收標準與停止條件。透過事前審查流程，使用者能更清楚知道 AI 準備如何完成任務，也能在正式執行前調整方向。這種模式很像企業專案管理中的需求確認與設計評審，只是現在執行者變成了 AI。

第三，多 Agent 協作正在成為處理大型問題的新模式。

當面對大型程式碼庫、數十個問題單、複雜文件分析或大型研究任務時，單一 AI 已經不再是最佳解法。新的工作流模式會將問題拆成許多子任務，交由多個 Agent 平行處理。例如有的 Agent 負責分析，有的負責驗證，有的負責交叉比對，最後再由整合 Agent 產出結論。這種做法其實很像企業中的跨部門協作機制，把原本需要數天甚至數週的工作壓縮到更短時間完成。

第四，成本控制將成為 AI 時代的重要能力。

很多人只關注 AI 能做什麼，卻忽略 AI 使用成本的管理。實際上，在工作流設計中，不同階段未必需要使用最強大的模型。有些工作只需要便宜模型進行初步分析，有些關鍵驗證才需要高階模型參與。透過模型分層配置，可以大幅降低 Token 消耗與運算成本。未來企業導入 AI 時，真正有競爭力的團隊，不只是懂得使用 AI，而是懂得如何用最低成本取得最好的成果。

第五，AI 工作流開始整合外部工具，能力正在快速放大。

過去 AI 主要依賴訓練資料回答問題，但現在越來越多工作流開始結合外部工具、資料庫、程式碼分析系統、知識庫與各種 API。當 AI 能夠自主呼叫工具、取得即時資訊、分析程式碼結構，甚至與其他 AI 協同工作時，它的能力邊界會被大幅擴展。這代表未來的 AI 應用不再只是對話，而是一個能夠串聯企業系統、資料與流程的智慧執行平台。

第六，真正的門檻已經不是提示詞，而是工作流設計能力。

這幾年大家都在研究 Prompt Engineering，但從最近的發展來看，提示詞的重要性雖然仍然存在，卻逐漸退居第二線。真正拉開差距的開始變成 Workflow Engineering，也就是如何規劃任務流程、設計 Agent 協作模式、控制成本、制定驗收標準，以及整合外部工具。未來 AI 時代最有價值的人，未必是最會寫程式的人，也未必是最會下提示詞的人，而是那些懂得把人、流程、資料與 AI 串接成完整生產系統的人。這或許就是 AI 應用從實驗階段走向實際生產力的關鍵轉折點。

[AI 分享] 從指令到流程：AI 開始學會自己安排工作

摘要 : AI 的價值不再只是回答問題，而是能規劃、拆解、協調與執行整個工作流程。

內容:

最近這段時間，我越來越有一種感覺：AI 的進化方向，已經不是單純讓回答變得更聰明，而是開始學會「怎麼工作」。以前我們使用 AI，像是在跟一位能力不錯的助理對話，你問一句，它答一句；但現在的變化是，你只需要告訴它目標，它開始自己思考應該分成哪些步驟、需要哪些角色、哪些事情可以同時進行，甚至會先把執行計畫攤開來讓你確認。這種感覺很像從「工具」逐漸變成「團隊」。

有趣的是，很多人以為 AI 最大的成本是模型費用，其實真正浪費資源的地方往往是缺乏規劃。當任務變得複雜時，如果讓 AI 一股腦直接執行，它可能同時展開大量工作，消耗大量運算與時間。因此我發現，先看計畫再決定是否執行，反而是更有效率的做法。這有點像專案管理，不是急著動工，而是先確認需求、範圍與預期成果。未來懂得管理 AI 的人，可能比懂得使用 AI 的人更有優勢。

另一個讓我印象深刻的現象，是 AI 開始具備「分工協作」的概念。以前一個問題只會有一個答案來源，現在則可能同時啟動多個分析角度。有的負責收集資料，有的負責驗證資訊，有的負責整理結論，最後再由另一個角色進行彙整。這種工作方式其實很像企業中的跨部門合作。當我們開始把 AI 視為一個可以組織與協調的工作團隊時，許多原本需要多人參與的任務，可能會被重新定義。

我也觀察到一個很重要的轉變：未來的競爭力，可能不在於誰擁有最強大的模型，而是誰最懂得配置資源。就像公司裡不會所有事情都交給最資深、最昂貴的人來做一樣，不同任務應該搭配不同層級的能力。簡單工作交給成本較低的資源，關鍵決策才交給高階能力處理。當這種思維開始套用到 AI 世界後，成本控制與效能優化就成了一門新的管理學。

更值得關注的是，AI 已經不再被限制在自己的知識範圍內。它開始能夠連接各種外部工具、資料來源與服務，把原本分散在不同系統裡的能力串聯起來。這代表未來的工作流程，不再是人類手動切換系統、複製貼上資訊，而是由 AI 主動穿梭於各種工具之間，完成資料蒐集、分析、驗證與整理。過去我們學習的是如何使用軟體，未來可能更重要的是如何設計一個讓 AI 發揮最大效益的工作環境。

回頭看這波變化，我認為真正值得學習的並不是某一個新功能，而是一種新的思考模式。當 AI 開始具備規劃、協調與執行能力後，我們的角色也正在改變。未來的人不一定要親手完成每一件事，但必須知道目標是什麼、如何定義成功，以及如何讓不同能力的 AI 協同運作。從某種角度來看，AI 時代正在把每個人都推向管理者的位置，而能夠駕馭流程的人，將比單純執行流程的人更具價值。

2026年6月6日星期六

[AI 省思] 當AI越來越像人，我們該如何保持自己的人性？

摘要 : AI最大的挑戰或許不是取代工作，而是讓人逐漸忘記自己存在的價值與意義。

內容:

最近幾年，我常常觀察到一個很有趣的現象。以前大家把AI當成工具，像搜尋引擎、計算機或翻譯軟體；但現在，越來越多人開始把AI當成朋友、顧問、老師，甚至是情感寄託的對象。有人遇到問題先問AI，有人把秘密告訴AI，也有人讓AI替自己做人生選擇。這些變化看起來很自然，但仔細想想，其實代表一件事情：AI正在慢慢從工具的位置，走向陪伴者的位置。

如果把時間拉長來看，過去的科技革命大多是在改變我們的生活方式。蒸汽機改變了勞動模式，電力改變了生活時間，網際網路改變了資訊流動。而這一次的AI革命有點不一樣，它開始碰觸到人類最核心的部分：思考、判斷、創造與決策。以前我們透過學習累積知識，透過經驗建立優勢；如今很多能力正逐漸被模型快速複製與普及。這讓許多人開始焦慮，因為我們習慣用能力來定義自己的價值。

但我認為，更值得警惕的並不是AI變得多厲害，而是我們開始誤以為智慧等於意識。當AI能寫詩、能安慰人、能陪聊天時，很容易讓人產生一種錯覺，覺得它是不是也擁有情感、擁有靈魂、擁有真正的理解能力。然而事實上，今天的AI再怎麼先進，本質上仍然是在大量資料與機率運算中產生最合理的回應。它可以模擬同理心，但不代表它真的感受到悲傷；它可以描述愛情，但不代表它真的理解愛情。這兩者之間的差異，遠比我們想像中重要。

我發現很多人擔心未來工作被取代，但或許更大的挑戰是「意義感的流失」。當AI能寫文章、畫圖、寫程式、分析資料時，我們可能會開始懷疑自己存在的必要性。可是回頭看看歷史，人類真正偉大的地方從來不只是效率。我們會為了家人犧牲，我們會因為理想堅持，我們會因為一句話感動，也會因為一次失敗重新站起來。這些東西未必是最有效率的，卻構成了人之所以為人的原因。

面對這波變化，我認為有幾件事情特別重要。第一，把AI當成工具，而不是權威。它可以提供建議，但不應替你決定人生。第二，持續培養判斷力，而不只是獲取答案。未來最珍貴的能力可能不是知道什麼，而是知道什麼值得相信。第三，經營真實的人際關係。當越來越多互動發生在虛擬世界，人與人之間真誠的陪伴反而會變得更加珍貴。第四，建立屬於自己的價值觀，因為科技可以告訴你如何做到一件事，卻無法告訴你為什麼要做這件事。

未來十年，AI一定會變得比今天更強大，甚至強大到超出我們現在的想像。但我越來越覺得，真正決定未來的關鍵從來不是機器有多聰明，而是人類是否知道自己是誰。技術會持續進步，工具會持續演化，但如果我們能夠保有思考能力、同理心、責任感與對生命的敬畏，那麼AI就不會成為取代人類的力量，而會成為幫助人類走得更遠的夥伴。或許在這個充滿變化的時代裡，最重要的課題不是如何變得更像機器，而是在機器越來越像人的時候，我們依然記得自己為什麼是人。

[AI 觀察] AI熱潮退去後，真正值錢的是什麼？

摘要 : AI正在淘汰低價值的重複工作，但也讓懂架構、風險與商業的人變得更加重要。

內容:

最近看了許多關於 AI Agent、自動寫程式、十分鐘做完一套系統的分享，坦白說，一開始看到確實會覺得很震撼。但看得越多，反而越有種似曾相識的感覺。每隔幾年，科技圈總會出現一次「這次真的不一樣」的浪潮，從雲端、大數據、區塊鏈，到現在的 AI。真正有趣的不是技術本身，而是每次熱潮過後，留下來的究竟是什麼。最近越來越感受到，AI 並沒有讓軟體開發變得更簡單，而是讓大家重新認識什麼才是真正困難的事情。

很多人把軟體開發理解成寫程式碼，因此當 AI 可以快速產生程式碼時，就開始擔心程式設計師是否即將消失。但如果實際參與過大型專案，就會發現寫程式往往只佔整體工作的一小部分。真正耗費時間的，是理解需求、協調不同單位的期待、規劃系統邊界、設計資料流向、處理權限問題、評估風險，以及思考未來三到五年的擴充可能性。這些事情沒有標準答案，也不是靠生成幾千行程式碼就能解決的。程式碼只是最後的結果，而不是價值本身。

我覺得目前最大的誤解，是很多人把獨立開發者的成功模式，直接套用到企業級系統上。個人專案失敗了，大不了重新來過；但企業系統不同。銀行、醫院、保險公司、物流公司，這些系統背後連結的是金流、病歷、供應鏈與法律責任。一個看似微小的錯誤，可能影響數萬甚至數百萬人。對這些組織而言，速度從來不是第一順位，穩定、安全、可追溯才是。AI 可以幫助開發更快，但沒有人願意拿核心業務去賭一次未經驗證的自動生成結果。

這兩年其實也看到一個有趣的現象。剛開始大家都在討論 AI 會不會取代工程師，後來開始瘋狂追逐各種 Agent 平台，再接著不少團隊發現專案裡充滿了 AI 生成的程式碼垃圾。表面上看起來架構完整、命名漂亮、文件齊全，但實際維護時卻到處是隱藏問題。最後大家花更多時間在理解 AI 為什麼這樣寫，而不是解決真正的業務問題。這時候很多人才突然發現，寫程式其實不難，理解系統才難；產生程式碼很容易，驗證程式碼才昂貴。

如果把 AI 看成工具，我覺得它更像是一把威力強大的電動工具。擰螺絲的速度快了十倍、百倍，但不代表拿著工具的人就突然變成建築師。真正能夠決定房子會不會倒的，不是螺絲鎖得多快，而是設計圖是否合理、地基是否穩固、結構是否安全。未來企業真正願意花高薪購買的，恐怕也不再是單純的編碼能力，而是那些能夠判斷風險、設計架構、做出商業決策的人。因為出了問題，最後要負責任的人，永遠不會是 AI。

我自己越來越相信，AI 時代最重要的競爭力不是學會多少工具，而是提升自己的抽象思考能力與系統思維。當寫程式逐漸變成一種近乎免費的能力時，真正稀缺的將是理解問題的人。懂技術的人很多，但同時懂技術、懂商業、懂流程、懂風險的人並不多。未來的職場可能不再是人與 AI 的競爭，而是懂得駕馭 AI 的人，與只會依賴 AI 的人之間的競爭。當大家都在討論 AI 能做什麼的時候，也許更值得思考的是：如果 AI 什麼都能做，那麼只有人類才能做的事情，究竟還剩下什麼？

四天打造企業級知識萃取系統：AI 代理人驅動開發的完整剖析

寫作目的： 本文記錄一段真實的開發歷程——從一個預設好的專案腳手架開始，在 AI 代理人工具的輔助下，四天內建構出具備完整功能的企業級知識萃取平台。這份文件同時是技術分析、方法論總結，也是對未來合作夥伴說明：AI 代理人時代，一個掌握正確方法的人究竟能做到什麼程度。

第一章　成果概覽：四天的數字說話

系統簡介

KMCollector 是一套企業級知識萃取平台，核心功能包含：

多平台媒體轉錄：YouTube、抖音、通用影片連結，自動下載音訊後以 OpenAI Whisper 轉錄為文字，支援分段處理（克服 1400 秒限制）、繁體中文自動保底
文件萃取：透過 MarkItDown 將 PDF、Word、Excel 等文件轉換為結構化 Markdown
分類與團隊管理：多標籤分類系統、RBAC 團隊權限控管（非管理員只能存取公開或授權團隊的紀錄）
完整 CRUD 後台：使用者、角色、專案、工作、會議、音訊轉錄、文件萃取全模組
企業基礎設施：Cookie 認證、多語系（zh-TW / en-US）、分散式快取（Memory / Redis）、健康監控、NLog 日誌、Swagger API

技術規模

指標	數值
開發天數	4 天（97 小時）
Git Commits	117 個
版本迭代	32 個版本（v0.2.10 → v0.2.41）
原始碼檔案	292 個（.cs + .razor）
說明文件	50 份（架構、PRD、SOP、規格、發行說明）
資料庫 Migration	12 組（雙資料庫，SQLite + SQL Server）
單元測試	9 個測試模組
自動化腳本	5 個 PowerShell 腳本
外部整合	OpenAI Whisper、ffmpeg、yt-dlp、Playwright、MarkItDown

程式碼規模：從腳手架到完成品

統計說明： 腳手架為 commit c5cad3cb（2026-06-02 08:55，重命名 MyProject → KMCollector 的第一個業務 commit），初始 commit 只有 README.md 與 .gitignore 共 2 個檔案。

項目	腳手架起點	四天後完成	增加量
C# 原始碼（.cs）	15,682 行 / 128 個檔案	33,836 行 / 250 個檔案	+18,154 行（+115%）/ +122 個檔案
Razor 元件（.razor）	2,167 行 / 34 個元件	2,986 行 / 42 個元件	+819 行（+38%）/ +8 個元件
說明文件（.md）	537 行	8,205 行	+7,668 行（+14 倍）
PowerShell 腳本（.ps1）	326 行	657 行	+331 行（+102%）
Node.js 工具（.mjs）	0 行	277 行	+277 行（新增）
源碼合計（.cs + .razor）	17,849 行	36,822 行	+18,973 行（+106%）

從這些數字看到了什麼？

把兩個時間點的程式碼數字放在一起比較，第一個引人注意的事實是：完成品的 36,822 行源碼中，有 17,849 行（佔 48.5%）來自腳手架。這些不是業務代碼，而是認證、授權、多語系、健康監控、日誌、快取等「每個企業系統都必須有，但與業務邏輯完全無關」的基礎設施。如果從零開始打造這層基礎，一個有經驗的工程師至少需要 2–4 週。腳手架讓這部分成本在四天的計算中直接消失——這是時間壓縮的第一個槓桿。

四天內真正新增的 18,973 行，才是這個專案獨有的業務靈魂：音訊轉錄的分段處理邏輯、文件萃取的格式轉換、抖音的 Playwright 自動化整合、分類與團隊的 CRUD 模組、RBAC 跨記錄權限控管、分享文字的 URL 自動解析……每天平均產出 4,743 行有明確業務目的的代碼，沒有填充、沒有廢棄路徑。

文件的數字更能說明問題。源碼在四天內增加了 106%，而說明文件卻增加了 1,428%，幾乎是 14 倍的成長。從 537 行增至 8,205 行，涵蓋架構設計、PRD、操作 SOP、部署說明、發行說明。這在傳統開發中幾乎是不可能的事——文件永遠是待補狀態，技術債的形式不只有程式碼，更大的債務往往藏在沒有人寫完的文件裡。AI 代理人把「邊開發邊同步文件」從一個口號變成了可執行的工作節奏。

從代碼的結構品質看，122 個新增的 C# 檔案平均每個 149 行。這個數字透露了一件重要的事：AI 產出的程式碼遵循單一職責原則，每個 Service、Helper、Client 都是焦點明確的小型類別，而非一個包山包海的上帝類別。新增的 8 個 Razor 元件平均 102.4 行，比腳手架原有元件（平均 63.7 行）稍複雜，因為它們承載了多選標籤、即時過濾、團隊權限聯動等實質業務互動，複雜度與功能密度完全匹配。

這代表什麼？傳統開發 vs. AI 代理人開發的成本對比

傳統開發：需要一個什麼樣的團隊？

要用傳統方式建構相同功能的系統，一個負責任的交付團隊通常需要以下角色同時到位。

專案經理（PM） 負責需求訪談、功能清單整理、進度追蹤、跨角色溝通協調，以及最終的驗收確認。這個角色光是做好需求釐清與規格文件，就需要 1–2 週的投入，整個專案期間持續消耗工時。

UI/UX 設計師 負責使用者介面設計、互動流程規劃、元件視覺稿的繪製與修改。即使採用現成的設計系統（如 AntDesign），仍然需要設計師針對各個功能頁面做佈局決策、體驗優化與設計審核，最少需要 2–3 週的設計工作量。

後端工程師（資深，1–2 人） 負責資料模型設計、資料庫 Migration、Service 層業務邏輯、Web API 設計與實作、外部服務整合（OpenAI、ffmpeg、yt-dlp、Playwright）。這是工作量最重的部分，保守估計需要 4–6 週。

前端工程師（1 人） 負責 Blazor 元件實作、與後端 API 串接、多語系整合、UI 互動邏輯。本專案的 Blazor 前端複雜度中等，包含多選標籤、即時搜尋、權限聯動顯示，估計需要 2–4 週。

QA 測試工程師 負責測試案例設計、單元測試與整合測試撰寫、手動功能驗証、回歸測試。這個角色的工作並非只在最後衝刺，而是要跟著每個功能模組同步進行，整體需要 2–3 週。

技術文件負責人（兼任或專人） 負責架構文件、操作 SOP、部署說明、API 文件的撰寫與維護。傳統開發中文件往往是最被壓縮的工作，但本專案交付了 50 份完整文件，若要做到同等品質，至少需要 1–2 週的文件工作量。

傳統開發的時間與成本估算

將上述角色的工作週期疊加，考慮到需求確認、設計迭代、開發返工、測試修正等常見的摩擦成本，完成相同功能範圍的系統，實際需要 2–3 個月（8–12 週），且這還是在需求清晰、溝通順暢的理想情況下的估算。

以台灣市場的中高階人力成本計算：

角色	月薪估計	投入時間	人力成本
專案經理	NT$80,000	2.5 個月	NT$200,000
UI/UX 設計師	NT$70,000	1.5 個月	NT$105,000
資深後端工程師	NT$100,000	2.5 個月	NT$250,000
後端工程師（協作）	NT$80,000	1.5 個月	NT$120,000
前端工程師	NT$90,000	2.5 個月	NT$225,000
QA 測試工程師	NT$70,000	2 個月	NT$140,000
技術文件（兼任）	NT$60,000	1 個月	NT$60,000
合計	—	—	NT$1,100,000

加計管理費用、員工勞健保與福利（約 30%）後，總用人成本約 NT$143 萬（約 4.4 萬美元）。若是外包給系統整合商，考慮到專案管理利潤與風險溢價，報價通常在 NT$200–300 萬 之間。

AI 代理人開發：實際投入了什麼？

這個專案的實際資源投入是：1 個人、4 個工作天。

開發者人力成本（以相同的資深工程師薪資計算）：4 天 × NT$5,000/天 ≈ NT$20,000。AI 工具訂閱與 API 費用（Claude Code、OpenAI Whisper API）：約 NT$3,000–8,000。實際總成本：約 NT$23,000–28,000，不到傳統開發的 2%。

更關鍵的是時間。傳統方式需要 8–12 週，AI 代理人方式完成只需 4 天。時間縮短了 95% 以上。對於需要快速驗證市場假設的新創企業，或需要在有限預算內交付系統的中小型組織，這個差距直接決定了一個商業機會能否被把握住。

一個人，抵得上多少人力？

若以「人月」（person-month）為單位計算，傳統方式需要約 13–14 人月的工作量才能完成相同的交付成果。AI 代理人方式由 1 人在 4 天內完成，換算約 0.13 人月。兩者相比，效率差距約為 100 倍。

然而，更準確的理解方式不是倍數，而是角色替代。在這 4 天裡，同一個人同時扮演了：PM（撰寫 PRD 與設計文件）、後端架構師（資料模型、API 設計、服務分層）、後端工程師（業務邏輯實作）、前端工程師（Blazor 元件、互動邏輯）、QA（單元測試、整合驗証）、技術文件負責人（50 份文件），以及 DevOps（部署腳本、環境配置）。

AI 代理人工具讓這一切成為可能的方式，不是讓一個人「更快地完成每件事」，而是讓許多原本需要等待他人、協調接口、反覆溝通的工作，直接在一個上下文中無縫串接。消除的不只是人力成本，消除的更是溝通成本、等待成本、認知切換成本——這些才是傳統協作模式裡真正讓時間消失的黑洞。

一個掌握 AI 代理人工具、具備正確方法論的開發者，在今天的市場裡，能夠獨立承擔一個原本需要 6–7 人團隊才能交付的專案範疇。這不是誇大，這是有 git 歷史為證的事實。

第二章　開發歷程：五個階段的演進

階段一：框架搭建（第 1 天上午，約 2 小時）

從腳手架到可運行系統

這個專案從一個預先準備好的腳手架（starter project）出發。腳手架已預先整合：登入認證、角色管理、AntDesign 元件庫、多語系、健康監控、NLog 日誌等基礎建設。

這一階段的工作是「個人化初始化」：

修正系統名稱綁定設定（不再是硬編碼範本名稱）
調整選單 Z-index 問題
整理文件目錄結構為 7 個分類
建立 MediaTranscription 資料庫 Entity 與初始 Migration

關鍵洞察： 好的腳手架節省了 90% 的基礎設施時間。不從零開始，而是從「已解決共同問題的起點」開始。

階段二：核心功能實作（第 1–2 天，約 12 小時）

音訊/影片轉錄完整鏈路

版本	功能
0.2.14	FFmpeg 絕對路徑配置
0.2.15	轉錄處理器逐段進度日誌
0.2.16	文件萃取功能（MarkItDown 整合）
0.2.18	YouTube 來源 + 語言選擇 + 繁體中文保底
0.2.20	依音訊時長自動分段（修正 OpenAI 1400 秒上限）

這階段最關鍵的技術決策是音訊分段策略：OpenAI Whisper API 有時長限制，必須實作 MediaChunker 自動計算分段計畫，再並行送出轉錄請求、依序合併結果。這不是一個簡單問題，但 AI 代理人在有清楚規格的情況下，一次就設計出正確架構並配套寫出測試。

階段三：多平台整合（第 2–3 天，約 8 小時）

突破平台壁壘

YouTube 有完整 API 支援，相對容易。抖音則有強力的反爬蟲機制。

解法：用 Playwright 自動化瀏覽器模擬真實使用者登入、攔截音訊串流 URL，再下載。這需要：

一個 Node.js 助手腳本（get-douyin-audio.mjs）控制 Playwright
一個初始化腳本（douyin-init.mjs）處理 Cookie/登入狀態
C# 端的 DouyinAudioDownloader 呼叫 Node.js 子程序

這個跨語言（C# ↔ Node.js）、跨技術棧的整合，同時產出了完整的部署 SOP 與設計文件。

抽象化設計： 同時設計了 MediaUrlDownloader，統一處理「任意影片連結」來源，並實作 ShareTextParser 自動從分享文字中提取 URL 與標題。

階段四：資料治理與權限控管（第 3–4 天，約 16 小時）

企業級的資料隔離

版本	功能
0.2.34	分類清單 CRUD
0.2.35	團隊清單 CRUD
0.2.36	紀錄加入分類/團隊標籤欄位與過濾
0.2.37	角色預設團隊與紀錄團隊權限控管
0.2.38	紀錄預帶入使用者授權團隊

這階段引入了最複雜的業務邏輯：RBAC（角色基礎存取控制）的延伸。非管理員使用者只能查看「無團隊（公開）」或「與自己角色所屬團隊有交集」的紀錄。

實作涉及：

IRecordAccessScopeProvider（定義存取範圍介面）
TagStringHelper（分隔字串格式的標籤轉換與精確比對）
TeamJsonHelper（JSON 格式的角色→團隊映射）
6 個資料庫 Migration（分類、團隊、標籤各 2 個，Sqlite + SQL Server 各一套）

全部配套 PRD 文件、測試模組、發行說明。

階段五：細節打磨（第 4 天，約 4 小時）

讓系統在真實環境中穩定運行

修正 NLog 及 yt-dlp 的 UTF-8 編碼問題（CJK 字元亂碼）
編輯紀錄時可修改原始檔名
抖音腳本支援 --ffmpeg 外部路徑參數（解決新機器部署問題）
輸出 ffmpeg 錯誤訊息以診斷 ExitCode=4
新增外部工具一鍵安裝 PowerShell 腳本

這階段的特點是「問題驅動」：在真實部署環境中發現問題，快速診斷、快速修復。每個問題平均耗時不超過 20 分鐘。

第三章　AI 代理人為何能做到這一切：機制分析

3.1 零切換成本的全域知識

傳統開發中，工程師需要不斷在不同視窗間切換：IDE、Stack Overflow、API 文件、Jira、設計文件……每次切換都是認知成本。

AI 代理人的上下文窗口可以同時持有：

整份需求規格
相關程式碼片段
架構設計原則
歷史決策記錄（CLAUDE.md 中的不變量）

結果： 生成的程式碼天然符合既有架構風格，不需要事後「對齊」。

3.2 規格→程式碼的直接轉換

只要需求夠清楚，AI 代理人可以：

PRD（產品需求文件）
    → 資料庫 Entity + AutoMapper Profile
    → Service 層（CRUD 方法）
    → Controller（Web API）
    → Blazor 頁面（AdapterModel + 檢視邏輯）
    → 單元測試
    → 發行說明

這整條鏈路，AI 可以在一次對話中完成，而且每個環節都遵循 CLAUDE.md 裡定義的不變量（雙資料庫 migration、建構式注入、精確標籤比對…）。

傳統方式： 一名工程師完成這條鏈路需要 1–2 天。
AI 代理人： 30–60 分鐘（大量時間花在人工審查上，而非生成）。

3.3 並行思考：程式碼與文件同時產出

每一個功能的 commit 都伴隨著：

更新的 docs/ 文件
配套的測試模組
更新的 appsettings.json 版本號

這在傳統開發中幾乎不可能做到——文件永遠在「待補」狀態，測試永遠在「下週」。AI 代理人將文件和測試視為需求的一部分，而非附加工作。

3.4 即時錯誤診斷與修正

這個專案中，許多「fix」commits 都在 feat commits 之後的 1–2 小時內出現。這不是因為程式碼品質差，而是因為真實環境總是與開發環境不同。

AI 代理人的優勢在於：

給它錯誤訊息（如 ffmpeg ExitCode=4），它能立刻識別問題根源
給它重現步驟，它能設計正確修復方案
修復完成後立刻重寫測試來覆蓋這個案例

診斷速度比傳統方式快 5–10 倍，因為它不需要「搜尋問題」，它直接分析。

3.5 守護不變量的「護欄機制」

這個專案在 CLAUDE.md 中定義了多條關鍵不變量（如：所有查詢必須套用團隊權控、雙資料庫 migration 等）。

AI 代理人在每次生成程式碼前都會讀取這些規範，確保新程式碼不違反既有設計決策。這相當於有一個永遠在場、永遠記得所有規則的資深同事在 review 每一行程式碼。

第四章　核心方法論：如何正確駕馭 AI 代理人

方法一：從好的腳手架出發

不要從零開始。好的腳手架已解決了「所有專案都會遇到的共同問題」：認證、授權、日誌、健康監控、CI/CD 鉤子……

每次都從空白頁面開始，是在重複浪費時間。

本專案的腳手架預先包含： 25+ 個預整合功能，讓開發者第一天就能專注在「這個專案獨有的業務邏輯」上。

方法二：規格先於程式碼

每個功能在實作前，都先有：

PRD（產品需求文件）：What + Why + Success Criteria
設計文件：How（架構、資料流、介面設計）

AI 代理人的程式碼品質與輸入規格的清晰度直接相關。模糊的需求產出模糊的程式碼；清晰的規格產出精確的實作。

本專案的 50 份文件不是「事後補寫」，而是「實作的前提條件」。

方法三：用護欄替代事後 Code Review

CLAUDE.md（或 AGENTS.md）定義的不變量就是護欄。這些護欄不是給人看的建議，而是 AI 代理人每次行動前的強制檢查清單。

護欄機制確保：

新加入的程式碼自動符合架構規範
不會因為「AI 沒注意到」而引入安全漏洞或技術債
每個開發者（包括 AI）都遵循相同的編碼標準

方法四：版本作為完成的儀式

本專案規定：每次可建置的異動 = 一個版本號 + 一個 Commit。

這個規定看似繁瑣，實際上創造了：

清楚的「完成」定義（不是「大概差不多」，是「版本號已遞增」）
可追溯的決策歷程（每個版本對應的 commit 訊息說明了為什麼）
回滾的錨點（任何一個版本都是穩定可部署的狀態）

4 天 32 個版本 = 平均每 3 小時完成一個可部署的功能增量。

方法五：問題驅動的真實環境驗證

每一個「fix」commit 背後都是真實的問題：

在不同機器上部署時發現的路徑問題
CJK 字元在 Windows 終端的編碼問題
第三方平台（抖音）的反爬蟲機制

不逃避真實環境的測試，用問題驅動快速迭代。真實問題比假設的測試案例更有價值。

第五章　AI 新紀元的個人能力圖譜

在 AI 代理人工具出現之前，一個人的開發能力等於「他能寫多少程式碼、記住多少 API」。

在 AI 代理人時代，這個等式改變了。

5.1 價值轉移：從「執行者」到「指揮者」

舊範式	新範式
會寫程式	會定義問題
記得 API 文件	能判斷 AI 輸出的正確性
快速編碼	快速定義規格
解決技術問題	分解複雜業務問題
寫測試驗程式碼	寫規格驗業務假設

AI 代理人是高效的執行者，但它需要一個清楚知道「要執行什麼、為什麼」的指揮者。

5.2 核心能力一：領域知識

AI 代理人可以生成抖音下載器的程式碼，但它不知道你的業務場景為什麼需要抖音下載器，也不知道使用者的痛點在哪裡。

領域知識讓你能夠：

定義正確的成功標準
識別 AI 輸出中的業務邏輯錯誤
做出 AI 無法做的架構取捨決策

沒有領域知識的 AI 使用者，是在請一個聰明但對業務一無所知的助手工作。

5.3 核心能力二：清晰溝通（Prompt Engineering）

AI 代理人的輸出品質 = 輸入描述的清晰度。

清晰溝通不是「學會特定咒語」，而是訓練自己：

明確說明目標（不是「做一個下載器」，是「從抖音分享連結中提取 MP3 音訊，支援 DASH 與合併 MP4 兩種格式，輸出到指定路徑」）
說明限制條件（「必須支援 Windows 路徑，不能依賴全域環境變數」）
定義成功標準（「轉錄完成後，音訊時長誤差不超過 5 秒」）
提供上下文（「這個系統的其他下載器都實作了 IMediaDownloader 介面，新的也要遵循」）

5.4 核心能力三：品質判斷

AI 代理人很少「完全錯誤」，但經常「看起來對、其實有細微問題」。

品質判斷能力包含：

能夠 code review AI 的輸出
識別可能的資安漏洞（SQL injection、XSS、未授權存取）
識別架構不一致（違反既有設計模式）
識別邊界案例沒有處理

這需要真正的工程素養，不是被 AI 取代的能力，而是使用 AI 的必要前提。

5.5 核心能力四：系統思考

單個功能 AI 可以完美實作，但功能之間的依賴、架構的整體一致性、技術債的累積——這些需要系統思考能力。

本專案的 CLAUDE.md 和 docs/architecture/開發慣例與限制速查.md 就是系統思考的結晶：把跨功能的設計決策明確化，讓整個系統在快速迭代中保持一致性。

5.6 核心能力五：敏捷調整

AI 的輸出不是一次就完美的，而是「第一個版本夠好，可以快速迭代改進」。

敏捷調整的能力包含：

接受「夠好但不完美」的初版輸出
快速識別需要調整的部分
用清楚的反饋引導 AI 做精準修正（而不是「這不對，重來」）

本專案 117 個 commits 中有 13 個 fix commits，fix 率 11%。 每個問題從發現到修復平均不超過 20 分鐘。

5.7 工作方式的轉變：從「一個人寫程式」到「指揮 AI 團隊」

傳統開發：1 個工程師，1 條工作線，串行完成。

AI 代理人開發：1 個指揮者，N 個並行的 AI 代理人：

代理人 A 正在寫後端 Service 邏輯
代理人 B 同時在寫對應的測試
代理人 C 同時在更新 PRD 文件
指揮者在審查輸出、做架構決策、規劃下一步

效率倍數不是 2x，而是 5–10x，因為是並行的，不是串行的加速。

第六章　成功的前提：什麼是 AI 工具無法替代的

AI 代理人做不到的事

列出這些，不是要貶低 AI，而是要說明指揮者的價值在哪裡：

理解使用者的真實痛點（AI 只知道你說的，不知道使用者沒說出口的）
做優先順序決策（應該先做哪個功能？資源有限時砍哪個？）
評估業務風險（這個設計決策的商業後果是什麼？）
建立人際信任（客戶、同事、合作夥伴的關係）
判斷「夠好了」的時機（完美是效率的敵人）

讓 AI 工具發揮最大效益的前提

你知道要解決什麼問題（問題定義能力）
你能評估解決方案的品質（技術鑑賞力）
你有護欄保護系統不偏軌（CLAUDE.md、不變量文件）
你有好的起點（可複用的腳手架，不從零開始）
你有紀律做版本管理（每個增量都是可部署的狀態）

第七章　結語：給合作夥伴的話

我能帶來什麼

這個專案是一個存在於 git 歷史中的真實證明：

我能夠在四天內，以一個人的資源，交付：

具備企業功能完整度的 Web 應用系統
完整的技術文件（架構、PRD、SOP、發行說明）
可維護的程式碼（測試覆蓋、清晰架構、雙資料庫 migration）
可部署的生產就緒系統

這不是運氣，也不是一次性的衝刺。這是一套可複現、可擴展的方法論。

這代表什麼樣的合作可能性

傳統合作模式	AI 代理人時代的合作模式
「招 5 個工程師，6 個月後上線」	「1 個懂方法的人，配合清晰需求，4 週可以上線可用版本」
文件永遠落後於程式碼	文件與程式碼同步生成
技術債隨時間累積	護欄機制防止架構腐化
需要完整規格才能開始	可以邊做邊細化，快速驗證假設

如何合作才能最大化效益

對合作夥伴最重要的一點：你的業務知識 + 我的方法論 = 快速交付真正有價值的系統。

我最需要從合作夥伴那裡獲得的不是技術需求，而是：

真實的使用者問題（不是「我要一個系統」，是「使用者在哪個步驟卡住了」）
優先順序的判斷（什麼功能必須有、什麼可以之後再說）
成功的定義（系統上線後，什麼樣的結果代表成功）

有了這三樣，AI 代理人工具就能以你無法預期的速度，把它們轉換成可運行的系統。

附錄：開發統計數字一覽

提交活動分布

日期              Commits  主要里程碑
─────────────────────────────────────────────
2026-06-02          34     框架搭建 + 音訊轉錄基礎
2026-06-03          25     完整轉錄鏈路 + 文件萃取
2026-06-04          34     抖音整合 + 多平台支援
2026-06-05          21     分類/團隊 CRUD + 權限控管
2026-06-06           3     抖音腳本微調
─────────────────────────────────────────────
合計               117     平均 29.25 commits/天

版本演進時間軸

v0.2.10  框架個人化（06-02 09:30）
v0.2.13  音訊轉錄資料模型（06-02 14:58）
v0.2.16  文件萃取（06-03 10:36）
v0.2.18  YouTube 來源整合（06-03 13:17）
v0.2.20  音訊分段策略（06-03 14:06）
v0.2.22  抖音 Playwright 整合（06-04 11:11）
v0.2.27  分享文字自動解析（06-04 14:25）
v0.2.34  分類清單 CRUD（06-05 09:18）
v0.2.35  團隊清單 CRUD（06-05 10:04）
v0.2.37  RBAC 團隊權限控管（06-05 14:59）
v0.2.41  抖音腳本完善（06-06 11:08）

提交類型分布

類型	數量	說明
feat（功能新增）	32	每個都是可展示的功能增量
docs（文件）	15	與程式碼同步生成，非事後補寫
fix（錯誤修正）	13	真實環境問題快速修復
chore（維護）	7	配置、腳本、工具整合
refactor（重構）	1	必要時的架構調整

訂閱：文章 (Atom)

2026年6月11日 星期四

2026年6月10日 星期三

2026年6月9日 星期二

2026年6月8日 星期一

2026年6月7日 星期日

2026年6月6日 星期六