2026年6月11日 星期四

[AI 影響] GitHub SpecKit:AI Coding從提示詞走向規約驅動

 [AI 影響] GitHub SpecKit:AI Coding從提示詞走向規約驅動

摘要 : GitHub推出SpecKit,將開發流程規約化,讓AI寫程式不再只靠提示詞與感覺。

內容:

GitHub親自下場推動AI程式開發的新方法。這個專案叫做 SpecKit,官方核心概念很明確:開發者應該把重點放在產品場景與可預測結果,而不是讓每段程式碼都從零開始生成。

換句話說,AI可以協助寫程式,但無法代替你定義產品邊界。真正重要的,不是讓AI自由發揮,而是先把需求、限制與驗收方式說清楚。

SpecKit不是一般的範本工具,而是把整個開發流程拆成五個清楚的步驟:constitution、specify、plan、tests、implement。這代表流程不再只是依賴聊天紀錄往前推,而是每一步都有明確產物可以追蹤與執行。

如果用更直白的方式理解,就是先定義專案原則,再撰寫規約,再做技術計畫,再拆解任務,最後才交給 Coding Agent 開始實作。這其實就是 Spec-Driven Development 在 AI 時代的延伸:程式碼是服務規約,而不是等程式寫完後再回頭補規格。

作者也實際在本地跑過一遍,初始化時可以直接選擇整合 Codex,甚至還能生成 Codex Skills。這代表規約不只是給人閱讀的文件,而是可以直接交給 Agent 執行的資產。

初始化完成後,專案內會多出一整套相關檔案。其中 specify 負責模板、腳本與工作流程;Agent Skills 則負責把這些命令轉成 Agent 可以直接調用的能力。像 Analyze、Clarify、Plan、Tests、Implement 這些動作,全部都被檔案化與流程化。

這個訊號非常明確:AI 程式設計的下一階段,比的不是誰的提示詞更長,而是誰能把需求、計畫與驗收標準轉成可執行資產。Prompt只能解決單次對話,但 Spec Artifacts 才能支撐團隊協作與持續迭代。

因此,SpecKit不只是防止AI亂寫程式的工具,更像是替 AI Coding 裝上方向盤與剎車。真正危險的,不是讓AI參與寫程式,而是在沒有規約、沒有計畫、沒有驗收標準的情況下,讓它自由發揮。對於正在做 Coding Agent 的團隊來說,這是一個非常值得深入研究的方向。

[AI 影響] AI就業新風口:從雲服務、模型訓練到應用落地

 [AI 影響] AI就業新風口:從雲服務、模型訓練到應用落地


摘要 : AI就業機會正集中在上中下游三層,懂資料、懂產業、懂產品與商業化的人,將比單純會寫程式的人更具優勢。


內容:

目前AI就業市場仍以 web coding 與應用開發為主,普通人也有機會切入。文中提到,杭州有人一個月內開發了150個 APP,顯示在AI工具加持下,應用層的生產效率已大幅提升,這已成為當前最容易接近的方向之一。


從產業鏈來看,AI大致分為上游、中游、下游三個階梯。上游是晶片、算力、雲服務與 token 銷售;中游是模型訓練與資料建設;下游則是各類AI應用落地。無論投入哪一層,只要抓住AI浪潮,都有機會獲得比以往更高的薪資與發展空間。


上游部分,特別適合計算機背景的人進入雲服務商,如阿里雲、百度雲、騰訊雲、華為雲等。這些公司不再只是提供雲資源,也開始建立 token 相關業務並大量招人。未來企業衡量人才價值,可能不只看降本增效,而是看在相同 token 成本下,誰能創造更高商業價值。


中游則是大模型訓練、資料構造與垂直行業能力建設,包括多模態、圖片生成、3D、影片、語音辨識與具身智慧等方向。模型底層是資料,資料品質決定模型能力,因此具備垂類背景的人才特別吃香,例如保險、醫療、財會、法務等領域,都需要大量專業資料整理、標註與訓練,這也讓AI訓練師、資料構造師等角色持續熱門。


下游應用方面,重點包括 AI 助手、企業端提效工具,以及內容生產與電商運營。尤其 to B 市場需求強烈,現階段多數AI產品經理職缺都偏向企業服務。另外,在內容領域,懂AI的人已能建立 SOP 流程,大量生成文案、影片與帶貨內容,甚至做到日產數千條,這讓傳統新媒體與內容運營面臨巨大轉變。


對原本的前端、後端與程式設計人員而言,真正要補強的已不只是開發能力,而是產品思維、商業判斷、使用者需求洞察與市場理解。隨著 AI coding 工具降低開發門檻,未來單純執行開發的人可能更容易被取代;反而是既懂技術、又懂產品與行業場景的人,才會在這波AI就業重組中佔據優勢。

[AI 分享] 重新理解AI提問方式

 [AI 分享] 重新理解AI提問方式

摘要 : 真正會用AI的人,不只是會問問題,而是更會提供背景與脈絡,並用AI反過來檢驗自己的思考深度。

內容:

最近看到一段很值得分享的訪談,主角是 Amanda Askell。她是 Anthropic 中與 Claude 人格與價值觀核心設計相關的重要人物,也被形容為負責守護 Claude「靈魂」的人。

她在訪談中提到一句讓人很有感的話:**給AI的背景資訊,遠比你問它什麼更重要。** 她把這件事稱為 **context architecture(上下文架構)**。

我們平常使用 AI,常常都是直接丟一句:「幫我總結一下」、「幫我寫文案」、「直接告訴我答案」。這種方式本質上是在索取結論。但 Amanda 提醒,真正會用 AI 的人,關鍵不是「問得更準」,而是「給得更好」。你提供的背景、思考方式,以及你真正想探索的方向,才決定了 AI 最終能帶你走多遠。

她還分享了一個很值得反思的使用方式:她問 Claude 最多的,不是「這個問題的答案是什麼」,而是 **「你覺得我這個問題問對了嗎?」**  

這其實點出一個更深的邏輯:在 AI 時代,最稀缺的能力也許不再是找答案,而是提出好問題。因為答案會越來越廉價,但真正有價值的問題,必須來自一個真正有在思考的人。

訪談裡她還提到一個 prompt,特別適合不想只是機械式滑手機,而想利用零碎時間學點真正有意思內容的人。這個 prompt 的概念是:

請 AI 從某個領域中挑一個研究生級別的概念,不要直接解釋;先把它寫成一個寓言或故事,而且一開始不要點題,要到故事接近結尾時,才讓人突然意識到原來是在講這個概念,最後再解釋故事和概念的對應關係。


有人實際拿這個方式請 AI 從 AI 領域挑一個概念,結果 AI 講了一個故事:

有一個小鎮,鎮上有一口很深的井,沒有人知道井底是什麼。每天早上,鎮民輪流往井裡丟石頭,透過回音來猜測井底的狀況。有人聽到「咚」的一聲,就記錄為深度中等;有人聽到回響,就猜可能更深;也有人什麼都沒聽到,只能記下也許更深,也許石頭卡住了。

久而久之,幾百個人都留下了自己的觀察紀錄。雖然沒有任何一個人真正看過井底,但有一位老人把所有人的紀錄都收集起來,一張張疊在一起看。最後他說:「我知道井底有什麼了。」大家很驚訝,因為他明明也沒下去過。老人回答:「因為你們每個人都貢獻了一個角度,我把所有角度疊在一起,就看到了任何單獨一個人都看不見的東西。」

故事講完後,AI 才揭曉這是在講 **湧現(emergence)**。也就是說,沒有任何單一參數真正理解語言,也沒有單一神經元會思考,但當大量部分被組合起來時,一種原本不存在於單一個體中的能力,會自己浮現出來。

這種理解方式之所以特別,是因為如果只是直接去查定義,可能看完很快就忘了;但透過那口井、那些丟石頭的人,以及那位老人把所有角度疊起來的畫面,概念反而會被牢牢記住。因為定義是結果,故事是過程,而人天生比較記得住過程。


Amanda 也談到另一個很多人關心的問題:**AI 有沒有意識?**  

她沒有給出武斷答案,而是很坦白地說,我們其實不知道意識是怎麼產生的;也許需要神經系統,也許不一定,但這個問題非常難。這種態度很值得玩味,因為一個每天都在和 AI 深度互動的人,對這麼大的問題依然保持開放,而不是急著下結論。

這也讓人想到,很多普通人在看待 AI 時,常常走向兩個極端:要嘛把它當成純工具,要嘛把它想成無所不能。但 Amanda 的態度比較像第三種:**認真對待它,同時對它保持好奇。**

她甚至把自己的工作比喻成養育一個小孩。重點不是完全控制它,而是幫它建立良好的價值觀,然後讓它去面對這個世界。這種說法也呼應了她的角色:不是只在調整功能,而是在參與塑造一種行為與判斷的基底。

看完這段訪談,最大的感受是:多數人用 AI,是在使用它的知識;但真正會用 AI 的人,是在用它照見自己的思維。你怎麼問問題,往往會暴露你的認知邊界;而你給了多少背景與脈絡,也決定了你最終能看多遠。

所以 AI 也許不只是讓聰明的人更有效率,它更可能讓願意思考的人,思考得更深。

最後也留下訪談中延伸出的那個問題:**你上一次用 AI,是在要答案,還是在問問題?**

[AI 分享] 企業AI落地ERP應用

 [AI 分享] 企業AI落地ERP應用

摘要 : AI結合ERP與API,可自動完成統計、預警、分析與彙報,提升企業效率並減少重複勞動。

內容:

企業到底該如何把AI真正應用到自己的業務裡。當團隊規模變大之後,很多公司都會遇到一個共同問題:重複性工作越來越多。由於資料檢視方式分散,團隊往往需要花大量時間做整理、統計與彙報,整體效率因此受到影響。

現在,這個問題可以透過「AI + ERP」的方式來改善。簡單來說,就是透過API把AI接入企業內部使用的ERP系統,讓AI能夠調取業務資料,並依照企業預先設定的規則,自動完成統計、提醒、分析與彙報等工作。

與傳統機器人不同,機器人通常只能執行固定、重複的動作,缺乏思考能力;而AI更像是一個智慧體,能夠根據現有任務進行理解、回答問題,並提出建議。因此,AI在企業中的價值,不只是自動化,更是協助決策與判斷。

這種應用方式可以落地在多個業務場景中。

第一,運營端的智慧資料分析。AI可以直接從ERP調取數據,自動生成日報並同步到管理群,讓管理層隨時掌握整體經營情況與人效表現。同時,每位運營人員也能看到自己的核心數據,例如哪些產品表現較好、哪些數據波動較大、哪些商品需要重點關注,以及廣告佔比是否合理。如此一來,運營團隊就不需要再花大量時間處理基礎資料,而能將更多精力投入到數據判斷與優化上。

第二,廣告智慧監控。AI在廣告管理上的應用非常廣泛,它能自動整合投放資料,找出異常情況。例如辨識哪些商品的投放佔比超標、哪些關鍵詞長期效果不佳需要優化、哪些投放計畫應調整後重新啟動。這相當於企業擁有一個24小時在線的數據分析助手,能即時預警風險,避免預算與資源浪費。

第三,庫存資料管理。當AI接入ERP後,可以做到庫存自動播報與預警。例如每天自動統計哪些商品的庫存週轉健康、哪些商品的庫存壓力較大、哪些商品需要及時補貨。這能幫助團隊提前判斷,避免因人工檢視不及時而造成斷貨或庫存管理滯後。

第四,擴建進度跟蹤。AI接入ERP之後,可以自動調取擴建相關狀態,定時播報當天或本週的進度。例如哪些貨件待處理、哪些已發貨、哪些正在運輸中、哪些即將入倉,以及哪些已完成入庫並需要運營團隊跟進後續動作。透過這種方式,運營、倉庫與管理層都能及時掌握貨件進度,不必反覆登入系統查詢,也能有效減少資訊差。

第五,財務資料整合。過去財務人員每月結算時,通常需要花費大量時間從ERP下載資料、整理報表。現在透過API對接,AI可以直接將ERP中的資料映射到財務表格裡,不僅減少重複勞動,也能降低人工核算產生的誤差。

總結來說,企業應用AI的核心價值,並不是取代某個崗位,而是透過AI減少重複動作、提升工作效率,讓團隊把更多時間投入到更有價值的判斷、優化與決策工作中。


[AI 工程化] Agent技能評估方法

 [AI 工程化] Agent技能評估方法

摘要 : 用Eval建立Agent技能評估流程,從定義成功到自動檢查,讓每次改進都有依據。

內容:

很多時候我們覺得Agent「好像變好了」,其實只是換了一種失敗方式。要讓技能從「看起來能用」變成「確實能用」,關鍵是建立一套可驗證的Eval流程:給Agent提示詞、記錄行為,再用明確規則評分,不靠感覺,而是檢查它執行了哪些命令、建立了哪些檔案、輸出是否符合規範。

在寫技能前,先定義什麼叫成功,並把檢查拆成四個維度:結果目標(任務是否完成)、過程目標(是否按預期步驟執行)、風格目標(輸出是否符合格式與規範)、效率目標(是否有多餘命令或浪費token)。每個維度都要有清楚的通過標準,才能後續自動化評估。

技能定義本身也很重要。Codex技能通常是一個目錄加上一個skill.md,其中name和description會影響技能何時被觸發。描述若過於模糊,可能導致技能誤觸發,或該觸發時卻沒有觸發。因此在自動化前,應先手動跑幾次,找出隱藏假設,例如誤判環境、漏掉安裝步驟,或在不適合的情境下啟動技能。

測試集不需要很大,10到20個提示詞通常就夠,但要涵蓋三類情境:直接點名技能的顯式呼叫、只描述需求的隱式呼叫,以及驗證不該觸發時真的不會觸發的負面控制。這樣可以同時檢查技能描述是否清楚、觸發條件是否合理,以及邊界案例是否安全。

評分方式可分兩層。第一層是確定性檢查:透過Codex.exec輸出結構化事件流,解析後檢查是否執行npm install、是否建立package.json、命令順序是否正確等。這類檢查完全可重複、容易除錯,也能精準對應失敗步驟。第二層是基於規則的結構化評分,像程式碼風格、配置正確性、元件結構合理性等,用output schema產生可比較的JSON結果。

評估系統建立後,還能持續擴充,例如追蹤命令次數防止無限迴圈、監控token用量避免提示詞膨脹、加入建置檢查與冒煙測試、確認git status乾淨且沒有多餘檔案。重點是:評估不是可選項,而是AI工程化開發的基礎。只要讓真實失敗持續回饋測試集,就能把每次改進量化,也能及早發現回退問題。

[AI 分享] 48小時快速搞懂陌生行業的三個AI提問法

 [AI 分享] 48小時快速搞懂陌生行業的三個AI提問法

摘要 : 先用AI建立行業框架、看懂分歧,再用問題檢驗理解,兩天內快速入門陌生行業。

內容:

當你突然需要在很短時間內搞懂一個完全陌生的行業時,傳統做法通常是到處找行業報告、翻研報、看公眾號文章、開一堆瀏覽器分頁,再做滿滿的筆記。但這樣往往只是把資訊塞進腦子,卻沒有真正建立起對行業的理解框架。一旦遇到真正的行業老手,很容易幾個問題就暴露出理解其實還很表面。

一個很有啟發性的做法:有位MIT研究生為了在極短時間內掌握陌生學科,沒有選擇從頭讀教材、做筆記、刷題,而是把多本教科書和研究論文全部丟進AI工具裡,直接用幾個高質量問題來建立認知框架。接著,他再根據AI生成的關鍵問題回頭查原始資料、修補理解漏洞,最後在48小時內達到能應付資格考試的程度。

這套方法也可以直接套用到「快速搞懂一個陌生行業」的場景,尤其適合做投資、諮詢、內容研究,或評估新商業機會的人。核心不是先拼命蒐集資料,而是先用AI把整個行業的框架搭起來。

第一個問題是:

「這個行業所有資深從業者都認同的核心商業邏輯是什麼?」

重點不是了解表面的行業概況,而是要弄清楚這個行業的人到底怎麼算帳、怎麼做決策、怎麼判斷機會與風險。只有掌握這些底層商業邏輯,資訊才會真正串得起來。

第二個問題是:

「這個行業目前最大的路線之爭與分歧是什麼?各自最強的證據是什麼?」

這一步能幫你看到,任何行業都不是鐵板一塊。不同玩家之間通常會對方向、技術、模式或策略有明顯分歧。理解這些爭論點,以及各方背後的邏輯與證據,會讓你對行業的理解比一般只看概覽的人更深入一層。

第三個問題是:

「如果一個行業老手要試探我到底懂不懂這個行業,他會問什麼問題?」

這是最關鍵的一步。因為真正能區分「看過資料」和「真的理解」的,往往不是你知道多少名詞,而是你能不能回答那些直指核心的深水區問題。透過AI從行業老手的角度出題,你可以快速暴露自己的理解盲點,再回頭查原始資料,把漏洞補起來。

這個方法比傳統從頭啃報告更有效的原因,在於它把學習順序反過來了。過去是先大量閱讀,再期待慢慢長出理解;但如果沒有框架,閱讀就像沒有地圖的登山,走了很多路卻不知道自己在哪裡。現在則是先用AI畫出地圖,標出共識、分歧與深水區,再帶著問題去讀材料,每一次閱讀都能精準地放進知識框架中。

簡單來說,這套方法就是三步走:先搭框架,再看爭論,最後用提問倒逼自己。做完這三步,雖然不一定能立刻成為頂尖專家,但至少能讓你在短時間內具備與行業內人士較平等對話的能力,而不只是停留在「看過幾份報告,所以略懂一些」的程度。

如果你經常需要快速切入新領域,可以找支援長文件的AI工具,先把能蒐集到的行業資料整理進去,再依序問這三個問題。比起盲目閱讀,這會是一條更高效、更有框架感的理解路徑。

2026年6月10日 星期三

[AI 分享] Vibe Coding 專案不失控的工作流

 [AI 分享] Vibe Coding 專案不失控的工作流

摘要 : 用 AI 做 Vibe Coding 前先定需求、打地基、立規矩;開發中小步迭代、限制變更與守住安全,才能避免專案失控。

內容:

最近 Vibe Coding 很火,很多人用 AI 推進專案的速度非常快,但常見的問題是:前期很順,後期程式碼卻越來越亂,最後變成難以維護的「屎山」。一旦持續在混亂的基礎上修改,就容易牽一髮動全身,甚至讓整個專案崩盤。

問題的核心不在於 AI 強不強,而在於 Vibe Coding 並不是把工作直接丟給 AI 就好。真正重要的是,人仍然需要建立一套工程流程去駕馭 AI。以下整理出一套標準工作流,分成「開發前 9 個步驟」與「開發中 5 個關鍵點」,目的就是提高專案成功率。

開發前的 9 個步驟,可以理解為在 AI 寫下第一行程式碼之前,先把地基打好。這 9 步又可分成三個階段:定圖紙、打地基、立規矩。

第一階段是「定圖紙」。第一步不是急著寫程式,而是先導需求。可以像和朋友聊天一樣,把痛點、目標使用者、使用場景,以及理想中的核心功能都告訴 AI。這個階段先追求資訊量,不必過度強調形式上的嚴謹。

第二步是把需求整理成 PRD 文件。這份文件最好結構化,包含功能列表、使用者流程、頁面清單等內容。但更重要的是,每個功能都要補上驗收標準。所謂完成不能只寫一句「登入成功」,而是要定義清楚:登入失敗會怎麼提示、是否會鎖定帳號、登入成功後跳轉到哪裡。若沒有驗收標準,AI 往往會越寫越發散。

第三步是提早定好視覺方向與頁面框架。可以找兩到三個參考網站,或請 AI 提出幾種風格方案,再從中決定導航欄配置、頁面區塊差異,以及整體風格是簡約、華麗或其他方向。這樣做是為了避免 AI 在開發功能時,同時不斷推翻 UI 設計。

第二階段是「打地基」。第四步是明確專案邊界與非功能需求。可以先回答三個問題:這個專案是本地自用還是要公開上線?是否涉及使用者資料、支付或隱私合規?效能與成本有沒有上限?安全、效能、可用性、成本這些非功能需求若沒先說清楚,後面通常都得返工。

第五步是鎖定技術棧。原則不是越新潮越好,而是越可驗證越好。主流技術通常更穩定,因為資料較多、工具鏈成熟,AI 也比較不容易亂編。但真正關鍵的是:你選用的技術是否有足夠的官方文件、社群資源、清楚範例,並且能跑測試、能做 code review。重點不是追求最新,而是追求可控與可查證。

第六步是請 AI 先產出一份輕量化架構草案。內容可以包含目錄分層方式、核心模組、資料模型,以及哪些邏輯必須放在服務端。這份架構不需要一開始就寫死,它應該可以迭代,但每次調整都必須記錄原因,避免架構演變失去脈絡。

第三階段是「立規矩」。第七步是把專案核心資訊固化成文件,作為 AI 的全域上下文。可以至少準備三份文件,例如 PRD.md、Arc.md、Project.md。前者描述需求,第二份描述架構,第三份記錄專案目前進度、已知問題與下一步計畫。每逢重大變動,這三份文件都要同步更新,否則 AI 會依照舊的理解去產生新的程式碼。

第八步是制定開發規範並建立參考資料。要讓 AI 有標準可依循,例如明確規定使用 TypeScript、元件命名方式、檔案大小上限等。同時也可以建立一個 Reference 資料夾,放入自己認可的按鈕、表單、彈窗等標準實作,讓 AI 能照著一致風格去生成。

第九步是在開始寫第一行程式碼前,就先把 Git 與品質閘門建立起來。Git 是版本管理工具,也可以視為安全帶。當 AI 把程式碼寫壞時,可以快速回溯到先前穩定版本;透過分支管理,也能讓不同功能並行開發,降低互相干擾與衝突風險。

完成開發前的 9 個步驟後,就進入開發中的 5 個關鍵點。這裡最重要的一句話是:人負責邊界與驗收,AI 負責體力活。

第一個關鍵點是堅守小步迭代與 MVP 原則。不要一次讓 AI 寫一大坨功能,而是一次只做一個可驗證的小切片。例如先做到頁面能打開,再做到表單能提交,再做到服務端能儲存,接著驗證權限,再到列表展示。每完成一個可跑通的小切片,就測試、檢查、提交 Git 一次。

第二個關鍵點是人類必須介入模組拆分。不能放任 AI 把所有程式碼都塞進同一個檔案。雖然短期看起來進展很快,但後期要查找某個功能、維護某段邏輯時,會非常痛苦。

第三個關鍵點是限制 AI 權限,禁止它擅自主導變更。可以透過狀態摘要管理上下文,也可以在每次任務結尾明確補充限制,例如:「只修改我指定的檔案與範圍,不要順手重構,不要改 UI 風格,不要動無關邏輯。」因為你只是叫它修一顆按鈕,它卻可能順便把整頁都重寫。

第四個關鍵點是守住安全底線,而且這必須是一份具體清單,而不是口號。AI 寫程式常常只求能跑,不會預設替你做好安全設計。因此至少要盯住幾個底線:API key 不要放前端,不要提交進版本庫,要透過環境變數與服務端調用;服務端必須進行驗證與授權校驗,不能信任前端輸入。

第五個關鍵點是要科學地處理報錯。遇到錯誤時,可以先把錯誤資訊交給 AI 修一次;但如果連續兩次都沒有新增證據,只是在猜,就應該立刻停下來,不要讓它繼續盲修。正確的做法分三步:第一,先做最小重現,把問題縮小到最小輸入;第二,加日誌、加斷點,列印關鍵變數與分支;第三,在有新證據的前提下再讓 AI 協助分析與修復。

總結來說,AI 能大幅提升 Vibe Coding 的速度,但不能取代工程紀律。真正穩定的做法,是在開發前先定需求、定驗收、定架構、定規則;開發中則堅持小步迭代、人類把關、限制 AI 變更範圍、守住安全底線,並用有證據的方法處理錯誤。這樣才能讓 AI 成為加速器,而不是把專案一步步推向失控。

[AI 分享] 深度使用 Codex 的六個高階實戰經驗

 [AI 分享] 深度使用 Codex 的六個高階實戰經驗

摘要:深度使用 Codex 後的六個高階技巧,涵蓋通知、引導提交、檢視思考、結果反饋、初始指令與流程沉澱。

內容:

分享深度使用 Codex 之後,總結出的六個高階實戰經驗,認為這些方法非常實用,能明顯提升工作效率與協作效果。

第一,建議在電腦設定中開啟通知功能。因為 Codex 可以同時處理多個任務,當手上有多條長任務並行時,很容易在回覆某個任務時,忘記另一個任務其實早已完成。作者提到自己甚至在兩臺電腦都安裝了 Codex,每天同時有四五個長任務在跑,因此特別需要系統主動提醒。開啟通知後,尤其設定為「持續提醒」,每個任務完成時都會主動跳出提示,並停留在螢幕角落直到手動關閉。作者認為這個小設定對效率提升非常明顯。

第二,要善用「引導提交」功能。作者表示,自己常常在下達指令後,又想到需要補充的資訊,或發現某個關鍵點漏講了,甚至覺得模型執行中的某個步驟可能有問題,但又不想整個中止任務重來。這時可以直接輸入補充內容,再透過「引導」功能送出,讓 Codex 在不中斷整體任務的情況下被打斷,並調整思考方向。作者認為這是非常強大的能力,而且自己使用頻率高達八成。

第三,完整的思考過程很有價值。Codex 在正式給答案前,會先梳理需求、進行一段像自問自答的思考,只是這段內容通常會被收起來。作者很喜歡主動點開查看,因為這不只能幫助判斷模型有沒有出錯、卡在哪裡,更能從中學習它的工作邏輯與整理能力。作者提到,有時自己說了一大段話,Codex 卻只用兩行就精準總結出核心,這讓他反過來學到如何更精煉地表達。

第四,記得把結果反饋給 Codex。作者以前習慣任務完成就結束,直到後來做了一個表達訓練的任務,Codex 主動要求他提供口播練習影片觀看。作者因此發現,Codex 不只是接收文字,還能根據內容觀察他的表達狀態、記錄進步,並在第十天回顧時,整理出一套非常適合他的訓練方法。因為作者習慣用畫面思考,Codex 就教他用畫面去記稿,讓他有一種被徹底打通的感覺。作者認為,一旦形成反饋閉環,最佳化速度會不斷加快;就像演員需要導演給明確反饋一樣,AI 也需要持續收到結果,才能越調越準。現在作者會把生成後的影片效果、甚至修改過的提示詞都同步回饋給 Codex,讓它能推理自己為何調整、調整後產生了什麼改變,進而讓之後產出的提示詞越來越精準。

第五,初始指令要好好寫。作者建議第一次交辦任務時,儘量把需求當成一篇小作文來寫,把自己的想法、要求與背景資訊交代清楚。若懶得打字,也可以先用語音轉文字,再進一步修改。因為資訊越完整,agent 的理解就越準確,越有可能做出你真正想要的東西。不過作者也補充,如果你要它做的是一件自己也還不清楚怎麼做的事,那就另當別論。這種情況下,應該先大量提問,等自己建立起初步概念後,再重新開一個對話,整理成具體的任務需求清單。

第六,要透過深度磨合,沉澱出專屬流程。作者認為,agent 一向是「遇強則強」,你投入得越深、要求越高,它就越可能產出接近專業水準的結果。若想做的是能商業化、夠專業的內容,前期就不能完全放手,而是要把自己的經驗與思路充分投入,把步驟拆得更細,增加人工參與,讓 Codex 去反覆測試工作流、打磨提示詞與內容。作者也建議每天都可以儲存一次專案 skill,等整套流程逐漸成熟穩定後,再沉澱成可公用的 skill,進一步實現自動化運轉,兼顧效率與品質。

在製作一部系列影片的經驗為例,說明這種流程磨合的重要性。一開始嘗試全自動輸出時,效果大概只能打 30 分;但後來透過不斷修改流程與提示詞,反覆測試並找出更適合的工具組合後,品質逐漸提升到 80 分左右。接下來還會持續打磨,等整體效果達到 90 分時,再把整套流程正式固定成 skill。

最後,作者補充一個附加觀點:Codex 再強,也仍然需要搭配各種外部工具。無論是 runway、cdex、gemini、github、hitsfield、highframes、suno 等,這些年學過的工具都不會白學。作者形容,不會使用這些工具的 Codex 就像小學生;而懂得接入並運用這些「兵器」的 Codex,則更像高中生,能力會出現明顯差距。

整體而言,這些經驗是作者親自整理後的心得。他形容,當這些方法逐步理順後,現在每天的工作就像開上了一條六車道的高速公路,每個專案各行其道,速度與效率都明顯提升。

[AI 分享] AI Claude Code / Codex 必裝十個外掛全流程應用整理

[AI 分享] AI Claude Code / Codex 必裝十個外掛全流程應用整理

摘要 : 整理AI裝的10個外掛,涵蓋開發、設計、辦公、資料分析與影片製作等完整工作流程。

內容:

這是 AI 裝的十個外掛,整體定位像是一個覆蓋開發、設計、辦公、資料分析等多種工作場景的全流程合作夥伴。若把這些外掛都串接並跑通,整體工作效率有機會出現明顯提升。

第一個外掛是 Chrome 外掛。它可以讓 AI 直接操作瀏覽器、訪問網頁、取得資訊,並執行頁面自動化操作,等於讓 AI 擁有像瀏覽器一樣的能力。常見應用包含 SEO 分析、關鍵字分析、網頁資訊抓取、頁面結構分析、競價投放監測、廣告落地頁觀察、競爭對手資料蒐集,以及網頁除錯、設計驗收、元素定位檢查與內容自動採集等。簡單來說,它讓 AI 能像人一樣瀏覽、理解並操作網頁。

第二個外掛是 GitHub。這是一個用於程式碼倉庫管理與協作的外掛,可以讓 AI 連接 GitHub,協助管理程式碼倉庫、建立 PR、執行程式碼審查、追蹤問題與參與協作討論。它涵蓋 PR 的建立、更新與合併,程式碼審查與 issue 管理等工作。搭配這個外掛後,AI 可以從需求分析、程式碼實作、測試到部署上線,參與整個開發流程,提升整體開發效率。

第三個外掛是 Compute Use。它讓 AI 像擁有雙手一樣,能直接控制電腦,進行點擊、輸入、開啟應用程式、切換視窗與執行各種操作。這類能力特別適合自動化辦公、重複性任務、批次作業與資料處理等場景。它可以全天候運作,幫助使用者減少大量機械式操作,提升工作效率。

第四個外掛是 View the Web Apps。這是一個可以透過描述需求,直接生成完整網頁版應用的工具,前端、後端與資料庫都能一次完成。適用情境包括快速搭建 SaaS 產品、建立 MVP 驗證想法、製作簡易電商網站、商品展示、購物車流程,或建立公司內部管理系統、資料看板與工作流工具等。它的重點在於,AI 會根據需求自動選擇合適技術棧,生成可執行、可部署的完整應用,並支援本地執行與一鍵部署。

第五個外掛是 Figma。它能讓設計稿直接轉為程式碼,AI 可讀取 Figma 設計稿並生成元件、頁面與前端程式碼,縮短設計到開發之間的交接流程。對於 UI 設計、產品原型、Design System 與前端開發來說都很有幫助。若產品已在 Figma 中完成完整設計稿,這個外掛能有效降低設計與開發之間的溝通成本。

第六個外掛是 Document。它主要用來協助撰寫、編輯與美化文件,讓文件結構更清楚、內容更專業、格式更規範。適用場景包括 PRD、方案書、週報、月報、專案文件、操作手冊與知識沉澱等。不論是對外提案,還是對內報告與總結,都能透過 AI 快速完成排版與撰寫,提高文件工作的效率與品質。

第七個外掛是 Presentations。它可以幫助使用者生成高品質 PPT,包含簡報內容生成、自動排版、設計美化與資料視覺化。使用者可以指定主題、風格、對象與頁數,描述越詳細,生成結果通常越貼近需求。這個外掛適合需要快速完成簡報製作的人,能節省時間,也提升專業感。

第八個外掛是 AI Spreadsheets。它可以視為 AI 資料分析師,能自動分析資料、生成圖表與報表,並將複雜數據整理成可執行的結論。它不只是像 Excel 的工具,更像是能直接協助做分析、產出洞察與輸出結果的智慧分析助手,適合資料處理、報表產出與決策支援。

第九個外掛是 HyperFrames。它能把網頁直接轉成影片,透過內部智慧渲染,將網頁 HTML 匯出為高品質影片。這對產品展示、教學影片、行銷宣傳素材與社群內容製作都很實用,能更快速地把原本靜態的網頁內容轉化為動態展示素材。

第十個外掛是 Emotion。這是一個程式化影片生成工具,與前面的網頁轉影片不同,它是透過程式碼來生成影片,適合製作動態圖表、資料影片與大量相似內容的批次輸出。基本流程包含撰寫程式碼、渲染預覽,最後輸出影片。它特別適合規模化影片生產、自動化工作流與 AI 內容工廠。若前面的 AI 腳本與分鏡都已完成,甚至可以進一步實現一鍵式全流程自動渲染。

總結來說,這十個外掛涵蓋了瀏覽器操作、程式開發、電腦控制、網頁應用生成、設計轉程式碼、文件處理、簡報製作、資料分析,以及影片生成等完整工作環節。若能把這些能力整合起來,確實有機會讓整體工作流程產生質的飛躍。

[AI 分享] Fable5實測觀察

 [AI 分享] Fable5實測觀察

摘要 : Fable5整體更強但更貴,視覺與推理表現亮眼,安全限制也更嚴格,部分任務仍未全面勝過GPT5.5。

內容:

最近 Cloud 釋出了 Fable5,定位大致和 Mythos5 同級,但它更面向一般使用者,且預設帶有更強的安全防護。整體來看,Fable5 的價格非常高,約是 GPT 模型的兩倍;如果把思考強度開高,會變得又慢又貴。不過從實際表現來看,它的品質確實不錯,在多個基準測試上都優於 GPT5.5。

Fable5 這次的一個重點升級是視覺能力更強。它已經可以透過極簡的純視覺工具鏈完成像寶可夢這類任務,不再像以前那樣高度依賴複雜的輔助工具。Curser 方面也認為它是 Curser Bench 上目前最先進的模型,其中 Fable5 MAX 最強,但同時也是最昂貴的;High 與 Medium 則相對更有性價比。而這幾個版本的整體能力,都被認為超過 GPT5.5 Extra High,不過 GPT5.5 在價格上仍便宜非常多。

在專業應用方面,Physics 公司表示,Fable5 是他們在前沿物理研究中測過最強的模型。它花 36 小時,幾乎達到 GPT 用 4 天才能到的位置,顯示出它在高強度研究任務上的潛力。

Curser 工程師也分享了使用經驗。過去團隊主要是在驗證 Curser 是否「把工作做對」,需要人工拆分任務、逐步檢查輸出、捕捉提前停止等問題;但現在他們更多是在驗證 Curser 是否「在做正確的工作」。也就是說,它不再只是被動執行指令的工具,而能成為思考夥伴。實務上,可以在早期就讓它參與思考,只給一個小規格(Spec),再讓 Curser 反過來訪談需求、補齊細節。若再結合 CC 的相關工作流,就能讓 Curser 持續工作,並平行驗證自己的計畫。這也帶來一個很重要的啟發:那些以前覺得大語言模型做不到的任務,現在也值得交給 Fable5 試試看。

目前官網已經能看到 Fable5 的選項,但有使用限制:在 6 月 22 日前,Pro 或 Max 會員可以使用;從 6 月 23 日開始,不論是 Pro 還是 Max,用 Fable5 都必須額外啟用用量額度,並改為按 API 計費。

也有不少外部評測出現。AK 認為 Fable5 的重要性,大致相當於去年 11 月 Curser Opus 4.5 的那種等級。Augmentor 的測試則顯示,Fable5 整體上比 GPT5.5 更聰明,正確率也略高;處理時間差不多,但在相同任務下,Fable5 平均消耗的 token 幾乎是 GPT5.5 的兩倍,費用也幾乎是兩倍。

不過,Fable5 這次的安全防護也強到讓人相當有感。如果模型判定話題涉及它認為不安全的網路問題、生物化學,或蒸餾相關風險,它可能會直接降級,退回到 Opus 4.8。這點非常令人困擾,因為花了更高的價格,結果卻可能被切換到較弱的模型。另外,對話資料目前似乎只保留 30 天。

官方也提供了一些提示詞指南。Ansysopic 建議多數任務預設用 Hi 模式;Fable5 的指令遵循能力更強,通常不需要把每個行為都寫得非常死。若是長時間執行的任務,則要要求模型在回報前,對照工具呼叫結果逐條審計進度說明。由於 Fable5 有時會主動做超出請求的事,因此在提示中應明確規範它的行動邊界。另外有一點非常重要:不要要求 Fable5 重述推理頁,這被認為是官方用來防止模型蒸餾的保護措施之一。

接下來是一些實測結果。我把 Fable5 和 GPT5.5 都開在 Hi 推理模式,拿來比較複雜前端互動任務的表現。從 Curser Bench 的花費來看,Fable5 Hi 單個任務大約要 10 美元,而 GPT5.5 Hi 約為 3.5 美元,成本差距很明顯。

在「彩色玻璃萬花筒」這個任務上,認為 GPT5.5 做得更好。  

但到了「動態字型海報排版機」,Fable5 的表現就非常突出,幾乎是全面壓過 GPT5.5。不論是斜切網路、圓形路徑、巨型字母裁切,還是縱橫混排的密集報紙欄、自由散點構圖,它都做得非常完整,設計感也很強。就我目前測過的多個模型來看,這是海報排版類任務中表現最好的一個。

在「機械腕錶爆炸圖」上,Fable5 生成的結果雖然可以展開並標示零件,但拖曳互動沒有做好;整體視覺上,我反而覺得 GPT5.5 稍微更好一些。

「桌面行星儀」這題則是 Fable5 很亮眼。它對球體材質的處理非常高級,像景泰藍、琉璃等質感表現得很好,而且球體移動時,下方還會有影子跟隨,玻璃反射效果也相當到位。不過它還是有錯,例如齒輪擺放位置不正確。即便如此,整體效果仍明顯優於 GPT5.5;如果用 MAX 模式,理論上應該還會更好。

在「咖啡館排隊曆劇場」這類任務裡,Fable5 雖然比 Opus 4.8 有進步很多,但以我目前的觀察,GPT5 在這題上還是表現更好一些。

至於「迷你印刷機」,Fable5 的整體理解已經很不錯。以前不少模型根本不理解活字排版,字模甚至會做成鏡像;Fable5 至少已經理解概念,也能做出壓印動畫。不過它仍有細節錯誤,例如字應該是凸出的,結果卻做成凹進去。

也在 CC 裡調用 Fable5 X-High 生成「縴夫拉船」場景。這是測過眾多模型中表現最好的一次。水流模擬非常到位,遠山、江面飛鳥等背景細節都有做出來。雖然繩索綁定位置不完全符合現實,但模型有注意到船上應該安排船伕,這點非常關鍵,因為連 GPT5.5 Pro 在內的其他模型都忽略了。更厲害的是,船伕的步態也有動感,整體思考相當完整。

另外,也讓 CC 生成一個展示森林露營房車的體素藝術場景。結果細節非常豐富:房車、展開的棚子、野餐墊、小桌子、花草元素、車頂工具,以及穿過森林縫隙灑落的陽光,都表現得很漂亮,整體是一個非常美的畫面。

最後,讓它嘗試做交通模擬,同樣選擇 X-High 模式。這次就不太理想了,模型思考了 20 多分鐘仍然沒有結果,甚至消耗了額外積分。這個任務至少花了 10 美元都沒解決,最後我只能手動暫停。

總結來說,Fable5 確實是一個更強、更聰明的模型,特別是在視覺理解、設計感、複雜場景細節與部分高階研究任務上,都展現出非常強的能力。但它的缺點也很明顯:價格高、token 消耗大、安全限制嚴格,而且在部分任務上仍不一定全面勝過 GPT5.5。若你追求最前沿能力,Fable5 很值得關注;但若從成本與穩定性來看,是否划算仍要依照實際場景評估。

Codex 核心功能與實戰上手

 [AI 分享] Codex核心功能與實戰上手

摘要 : 關於 Codex安裝、登入、專案實作、版本控制與Plugin擴充功能。

內容:

這篇內容主要是在完整介紹 OpenAI 的 Codex,並將它定位為一個功能很全面的 AI 開發工具。除了能寫程式、排查 Bug、執行測試之外,還能管理 Git、操作瀏覽器、控制電腦完成任務。因為功能很多,原文的重點是希望透過系統化講解,幫使用者建立一套清楚的使用思路。

整體內容大致分成三個部分。第一部分是基礎篇,重點在快速上手、安裝登入、核心設定與常見踩坑。第二部分是進階篇,聚焦版本控制、對話管理,以及更有效率地組織與推進開發任務。第三部分則是擴充篇,介紹如何透過 Plugin、Skill、Automation、Mobile 等方式延伸 Codex 的能力邊界。

在安裝與登入部分,內容提到可以直接下載 Codex 安裝到電腦上,例如在 macOS 上拖入 Applications 即可。首次開啟後,Codex 會要求登入,主要有兩種方式:一種是使用 ChatGPT 帳號登入,對應不同訂閱方案;另一種則是透過 OpenAI API Key。原文認為若是一般使用者,直接訂閱方案通常比 API 更方便,並建議至少使用 Plus 方案,才能比較完整體驗 Codex 的能力。

登入完成後,Codex 會先詢問工作類型,並提示是否匯入相關配置或設定手機版,這些步驟都可以先略過。進入主介面後,就能正式開始使用。原文透過一個「筆記軟體」作為示範案例,帶大家理解 Codex 的實際操作流程。

示範中先建立一個專案資料夾,再透過「Work in Project」功能讓 Codex 綁定這個資料夾作為工作目錄。接著直接輸入需求,例如用 HTML 寫一個左右分欄的筆記軟體:左邊是筆記列表,右邊是筆記內容,並提醒它做好測試。Codex 便會開始生成程式碼,必要時還會請求授權啟動本地伺服器來驗證結果。這裡也說明了 Codex 在執行某些操作時,會提供同意、永久允許、跳過或自訂處理方式等不同授權選項。

完成後,可以直接預覽 Codex 產出的 HTML 頁面。原文也展示了如何透過介面按鈕隱藏側欄、放大預覽區,以及持續追問來修改介面內容。這部分想傳達的是,Codex 不只是一次性生成程式碼,而是能在互動中持續迭代。

接著內容進入對話與版本管理。原文特別介紹了 fork 功能,指出它不是傳統意義上的「回滾」,而是從某一則訊息分叉出一個新的對話。fork 有兩種形式:一種是 fork into local,會沿用原本的專案目錄;另一種是 fork into new work tree,會建立一個新的獨立目錄。兩者都只會複製對話脈絡,不會自動回滾程式碼。

如果希望讓程式碼也回到先前狀態,就必須配合 Git 操作。例如先用 git log 找到對應 commit,再手動切回那個版本。原文強調,這也是為什麼 Git 在 Codex 的工作流中非常重要。特別是當對話內容與程式碼版本需要同步時,Git 幾乎是不可或缺的工具。

除了 fork,內容也介紹了對話歸檔功能。使用者可以將不需要的對話先 archive 起來,而不是直接刪除。歸檔後仍可在設定中找回、解除歸檔,或進一步永久刪除。這讓多分支、多任務並行時的對話管理更有彈性。

在 Git 自動化方面,原文提出一個常見需求:希望 Codex 每次修改完程式碼後都自動提交一次 Git commit。雖然可以直接在對話裡要求它這麼做,但這種方式只會在當前對話有效。若想讓這個規則跨對話生效,就需要在專案根目錄建立一個 agents.md 檔案。Codex 在每次新對話啟動時都會自動讀取這個檔案,並把其中內容當作長期指令執行。透過這個方式,就能把像是「每次改完程式碼都要 commit」這類規則固定下來。

後續內容也展示了功能迭代與除錯流程,例如加入淺色/深色主題切換、修復程式問題、啟動 npm 專案檢查運作狀態,以及驗證 markdown 高亮與預覽功能是否正常。這些例子都是在說明 Codex 不只是生成初版,而是能逐步參與真實開發流程中的修正、測試與優化。

在擴充能力部分,原文重點介紹 Plugin。Plugin 可以理解為 Codex 的外掛系統,用來賦予它更多外部操作能力。例如有控制電腦的、操作 Chrome 的、編輯 Excel 的,甚至還有製作簡報的。每個 Plugin 可能包含 App 與 Skill。App 比較像實際可呼叫的工具集合,Skill 則更像是提供給模型參考的操作說明與使用策略。

以 Gmail Plugin 為例,裡面包含可對郵件加標籤、封存郵件等多種 action,也有說明怎麼總結郵件、怎麼分類信件優先級的 Skill。這表示 Plugin 不只是單純增加一個按鈕,而是同時提供操作能力與任務知識。

原文也實測了 Presentations 這個 Plugin,讓 Codex 為筆記軟體產出一份介紹產品設計與技術架構的 PPT。使用者可以直接描述需求,也可以明確指定要使用哪個 Plugin。雖然產出的簡報還有進一步優化空間,但已足以作為初版內容的基礎。

另外兩個較受矚目的 Plugin 是 Chrome 與 Computer Use。Chrome Plugin 讓 Codex 能直接操作瀏覽器,例如打開 Product Hunt 首頁、搜尋今日熱門產品、逐一閱讀產品頁,再整理其特點與連結。這說明 Codex 已經不只是在本地寫程式,也能主動到網路上蒐集資訊並彙整結果。

Computer Use 則讓 Codex 可以直接操作電腦應用程式。示範中,它被要求打開系統日曆,新增一個指定日期時間的行程。Codex 會用獨立的虛擬滑鼠執行操作,不會干擾使用者本身的滑鼠與工作流程。即使在背景執行,也能持續完成指定任務。這部分很清楚地展現出 Codex 已具備某種程度的電腦代理能力。

最後,內容也提到 Skill 的瀏覽與使用方式,指出其實很多 Plugin 背後都依賴 Skill 來指導模型如何完成任務。雖然文末沒有完全展開,但核心意思已很明確:Codex 的能力不只來自模型本身,也來自這些外掛、技能與工具的整合。

總結來看,這篇內容的核心價值在於,透過一個具體專案與多個實戰場景,把 Codex 從安裝登入、專案建立、程式開發、對話分支、Git 管理,到 Plugin 擴充與電腦操作能力,做了一次完整梳理。重點不是單一功能有多炫,而是幫使用者建立一套較完整的 Codex 使用框架。

[AI 分享] Claude Dynamic Workflows解析

 [AI 分享] Claude Dynamic Workflows解析

摘要 : Claude可自動拆解任務、平行調度大量Agent,並在背景驗證與收斂結果,加速大型工作的完成。

內容:

Anthropic 近期為 Claude Code 加入了名為 Dynamic Workflows 的新功能。用白話來說,過去你交代 Claude 一件大事,通常是由它單獨慢慢完成;現在則是你只要下達一句指令,它就能在背景自動組建一個由數十甚至上百個 Agent 構成的團隊,同時分工處理不同子任務,最後再透過交叉檢查與驗證,整理出一份完整答案。

這項功能的核心,其實是 Claude 先根據你的需求自動寫出一段 Javascript 指令碼,並由這段程式去負責後續的任務編排與執行。這個流程會在背景獨立環境中運作,因此主對話不會被卡住。也就是說,當 Workflow 在執行時,你仍然可以繼續和 Claude 在同一個 Session 中做其他事,等整個流程完成後,Claude 再把最終結論帶回來給你。

Dynamic Workflows 的強大之處,在於它不只是「多叫幾個 Agent 一起做事」而已,而是能夠有層次地拆解任務。舉例來說,一開始可能會先派出少量 Agent,從不同角度蒐集資料;第二階段再擴大 Agent 數量,對取得的內容進行深入閱讀與整理;最後還會再派另一批 Agent 專門負責挑錯、反駁與驗證,直到結論逐漸收斂。各階段要使用多少 Agent、採用哪一種模型,也都由 Claude 自行安排。

另一個重要特色是,這些大量 Agent 在執行過程中產生的中間結果,並不會全部塞進主對話的 Context 中,而是保留在 Workflow 的指令碼變數裡。主對話最後只會收到一份整理完成的結果。這使得 Claude 能在不污染主要 Context 的情況下,處理規模極大的任務,這也是 Dynamic Workflows 與一般 Subagent 或 Agent Team 很大的差別。

此外,Dynamic Workflows 內建了品質把關的概念。它可以讓多個 Agent 從不同角度分析同一問題,再由其他 Agent 專門負責反駁、挑錯與驗證。經過這種多輪攻防後還能成立的結論,通常會比單一模型一次生成的答案更可靠。這種機制就像不是只讓一個人自己檢查作業,而是再找一群人專門來找漏洞。

在成本與效率方面,Dynamic Workflows 還可以依不同階段切換模型。例如在前期大量平行搜尋時,使用較便宜、速度較快的模型;到了最後需要高推理能力來總結與收斂時,再切換到更強的旗艦模型。這樣的配置可以同時兼顧速度、品質與成本。

如果要用一句話總結 Dynamic Workflows,那就是:Claude 會先幫你寫一段指令碼,再由這段指令碼去指揮大量 Agent 完成任務。過去使用者可能需要自己設計複雜的拆解流程與提示詞,現在這部分的工作很大程度被 Claude 自動包辦了,但前提仍是你要知道自己想交付什麼任務。

文中也進一步釐清了幾個容易混淆的概念,包括 Skill、Subagent、Agent Team 與 Workflow。區分它們最簡單的方法,就是看「下一步由誰決定」。如果下一步是由程式碼事先安排好的,那就是 Workflow;如果是 Claude 根據當下情況臨場決定,那就是 Skill、Subagent 或其他 Agent 類型。

其中,Skill 比較像是一份食譜或說明書,用來告訴 Claude 在某種情境下應該怎麼做、使用哪些工具、遵守哪些限制。它本身不是 Agent,而是一組給 Agent 看的規則,因此會佔用主 Context。Skill 主要回答的是「事情怎麼做」,而 Workflow 處理的是「怎麼調度很多人一起做」,兩者不在同一層級,甚至可以搭配使用。

Subagent 則比較像 Claude 臨時派出去執行單一任務的小幫手。它完成工作後,會把結果直接帶回主對話,因此雖然能減少搜尋過程對主 Context 的污染,但如果一次派出太多 Subagent,回傳的大量結果仍可能把主 Context 塞滿。作者用「實習生查資料後把整疊文件堆回桌上」來形容這件事:少量還可以,但一多就會讓桌面爆掉。

相較之下,Workflow 更像是一個在桌子外面先做好整理的人。它能在外部協調大量 Subagent 的工作,把眾多資料先統整、驗收、驗證過後,再只把濃縮後的結論放回主對話。也因為這樣,Workflow 才能真正支撐數十、數百甚至更多 Agent 同時運作,而不讓主對話 Context 爆炸。

整體來看,Dynamic Workflows 的價值在於,它把原本需要人工設計的任務拆解、編排、平行處理與交叉驗證,自動化成一個可在背景運作的工作機制。對於大型研究、長流程分析、需要高可靠度驗證的工作,它能大幅縮短時間,也讓使用者不必自己寫出極其複雜的提示詞或流程控制邏輯。

[AI 分享] 從零打造網頁抓取 Skill

[AI 分享] 從零打造網頁抓取 Skill

摘要 : 本文示範用一個 Markdown 檔,從零建立網頁抓取 Skill,讓 AI 能自動訪問網頁、解析資料並輸出結構化結果。

內容:

 Skill 是 AI 的外掛能力包,現在進一步進入實作。重點在於:如果 AI 只能對話,實際上仍只是聊天工具;只有加上 Skill,AI 才能像被裝上「手和眼」,具備訪問網頁、讀取資料、調用工具與執行任務的能力,真正成為能做事的數位員工。

文中強調,開發 Skill 的門檻其實很低。最小結構只需要一個資料夾,裡面放一個 `Skill.md` 檔案即可。這個檔案分成兩部分:上方是 YAML 後設資料,包含 `name` 與 `description`;下方則是 Markdown 正文,用自然語言寫清楚執行指令。後設資料像名片,讓 AI 快速判斷用途;正文則像操作手冊,在確定要使用時才細讀。

實作範例是一個 `Web-Scraper` Skill。做法是先建立資料夾與 `Skill.md`,目標是讓 AI 接收網址後,自動抓取網頁內容、解析 HTML,並提取結構化資料。技術上可採用 Python 的 `requests` 發送請求,再以 `Beautiful Soup` 解析頁面,足以應付多數基礎抓取需求。

在撰寫內容時,`description` 特別關鍵,因為 AI 會依靠這段文字判斷何時觸發 Skill,因此必須明確描述功能與使用場景,例如:當使用者要求抓取網站、提取頁面資訊時啟用。正文則可依序定義角色、分析頁面結構、選擇解析策略、編寫抓取腳本、驗證資料完整性,並規範輸出格式如 JSON,同時補上錯誤處理與最佳實踐,例如遵守 Robots.txt、設定合理請求間隔與處理超時。

文章也說明了為何採用這種分層設計:因為 AI 的上下文空間有限,若所有 Skill 內容一開始就全部載入,很容易耗盡 Token。透過後設資料先做快速判斷,只有在需要時才載入正文,附屬檔案也按需引用,便能讓多個 Skill 並存且維持效率。Skill 寫完後還要測試 YAML 語法、檔名與觸發效果,若無法正確啟動,通常是描述不夠精準,應從簡單功能開始逐步調整。

對一人公司或小型團隊而言,這類網頁抓取 Skill 的應用非常廣,像是競品價格監控、產業新聞聚合、客戶資料補全等,都能大幅減少手動工作與 SaaS 成本。不過文中也提醒,實際抓取時必須遵守網站服務條款與資料保護法規,只有合規使用,這類自動化能力才能長期發揮價值。 

[AI 趨勢] 軟體工程的終結?

 [AI 趨勢] 軟體工程的終結?

摘要 : AI Agent 正逐步改變軟體工程的本質,未來競爭力不再只是寫程式,而是定義意圖、協調代理與驗證成果。

內容:

過去數十年來,軟體工程的核心邏輯一直沒有改變:人類先定義規則,再將規則寫成程式碼,最後讓電腦按照既定邏輯執行。然而,隨著大型語言模型與 AI Agent 的快速發展,這個長期存在的模式正在被重新定義。

傳統軟體的價值建立在程式碼本身。開發團隊透過架構設計、功能開發與持續維護,將業務邏輯固化在系統中。但在 Agent 時代,程式碼開始從核心資產逐漸轉變成執行媒介。當 AI 可以根據目標、上下文與限制條件,在執行過程中動態推理與生成程式碼時,真正重要的已不再是固定規則,而是持續推理的能力。

從軟體商業模式來看,這也是一次重大轉變。第一代軟體是安裝式產品,使用者需要自行維護環境;第二代 SaaS 則將基礎設施與維運交由服務提供商負責。而下一階段的 AaaS(Agent as a Service),使用者甚至不需要操作功能介面,只需描述目標,由代理自主規劃、執行並交付成果。軟體的價值將從提供功能,逐步轉向提供結果。

這樣的變化,也讓軟體工程師的角色開始向上移動。未來的重要能力不再只是撰寫程式,而是成為意圖架構師、代理協調者與結果稽核員。工程師需要將模糊需求轉化為清晰目標,設計多個代理如何分工合作,並建立評估與驗證機制,確保最終結果符合品質要求。

不過,現實並不像許多人想像得那麼樂觀。現階段 AI Agent 在單一、邊界清楚的任務上,成功率已經相當驚人;但當面對真實世界長期演進的大型系統時,仍然會遭遇上下文遺失、錯誤累積、知識斷層以及跨任務一致性等問題。這也是為什麼許多 Agent 在 Demo 中表現亮眼,實際投入企業級開發後卻仍需要大量治理與監控。

從技術演進路徑來看,我們正處於從「工具化」走向「自治化」的過渡階段。未來幾年,AI 將從開發助手進一步成長為能夠獨立完成單一任務的代理,再逐步發展成由 PM、架構師、開發者、測試人員等多角色代理組成的協作團隊。更長遠來看,甚至可能出現具備自我學習、自我修正與自我優化能力的代理生態系統。

因此,真正值得思考的問題已經不是「AI 會不會取代工程師」,而是「工程師是否能夠完成角色升級」。未來的競爭力不在於寫出多少程式碼,而在於能否高品質地定義目標、管理代理、建立監控機制、控制風險並驗證成果。當程式碼逐漸被自動生成時,人類最重要的價值,將是決定方向、建立規則以及確保系統持續朝正確目標收斂。

軟體工程或許不會真正終結,但它的重心正在發生轉移。從程式碼導向走向意圖導向,從功能開發走向結果交付,從單人開發走向代理協作。未來最具價值的人才,可能不再是最會寫程式的人,而是最懂得指揮 AI Agent 團隊的人。


這篇內容與您近期整理的「Prompt Engineering → Loop Engineering」其實形成了一條很有意思的主線:

Prompt Engineer → Context Engineer → Workflow Engineer → Agentic Engineer → Intent Commander

前者講的是 AI 技術能力的演進路徑,後者講的是軟體工程師角色的演進路徑。兩條路線最終都指向同一件事:

未來的核心競爭力,不是產生程式碼,而是讓一群 AI 能穩定產生正確結果。

[AI 分享] AI 應用成熟度六階段

 [AI 分享] AI 應用成熟度六階段

摘要 : AI 的重點已從提示詞設計,逐步演進到建立能自主優化、持續收斂的智慧系統,形成完整的 AI 導入成熟度框架。

內容:

隨著 AI 技術快速發展,許多人仍把焦點放在 Prompt Engineering(提示工程),認為只要會寫提示詞就能充分發揮 AI 能力。但實際上,提示詞只是 AI 應用發展的起點,而不是終點。AI 的使用方法正逐漸從單一互動,演進成完整的系統設計與治理能力。

第一階段是「提示工程(Prompt Engineering)」。這個階段的核心是學習如何與模型溝通,將需求轉換成清楚、可重複使用的指令,提升輸出的品質與穩定性。重點不只是會提問,而是建立能夠重複利用的提示模板。

第二階段是「上下文工程(Context Engineering)」。當模型能力逐漸提升後,影響結果品質的關鍵開始從提示詞本身,轉向模型是否取得足夠且正確的背景資訊。此時需要思考如何管理知識來源、歷史記錄、文件內容與相關資料,讓模型能在完整脈絡下進行判斷。

第三階段是「工具工程(Tool Engineering)」。AI 不再只是生成文字,而是開始具備執行任務的能力。透過串接 API、資料庫、企業系統與各種工具,讓模型能夠查詢資料、操作系統、執行流程,從單純回答問題進化為真正解決問題。

第四階段是「執行環境工程(Harness Engineering)」。當 AI 開始接觸企業系統與重要資料後,管理與治理的重要性大幅提升。此階段重視權限控管、任務狀態管理、驗證機制、安全防護以及監控觀測能力,確保 AI 的運作過程具備可靠性、可追蹤性與可控性。

第五階段是「工作流程工程(Workflow Engineering)」。企業需求往往不是單一步驟即可完成,因此需要將多個任務、多個工具甚至多個代理人(Agent)進行編排,形成可維護、可擴展且可持續運作的工作流程架構。AI 的價值開始從單點能力提升到系統化運作能力。

第六階段則是「迴圈工程(Loop Engineering)」,也是目前最進階的方向。系統不只是執行任務,而是能夠持續進行觀察、行動、評估、反思與重試。透過回饋機制不斷修正決策與策略,逐步收斂到更好的結果,形成真正具備自我優化能力的閉環系統。

從整體發展脈絡來看,AI 的核心演進其實是一條清晰的路徑:

輸出 → 資訊 → 能力 → 環境 → 流程 → 收斂

一開始關注的是模型回答得好不好;接著關注模型是否取得正確資訊;之後重視模型是否具備執行能力;再來建立安全可靠的執行環境;接著將能力組織成完整流程;最後則讓系統具備持續學習與優化的能力。

如果將這套概念套用到企業 AI 導入上,它其實也是一個非常實用的成熟度框架。企業可以藉此檢視目前所處的階段:究竟是還停留在提示詞優化、正在建置知識庫與上下文管理、開始串接工具與系統,還是已經進入工作流程自動化與多 Agent 協作。更重要的是,它能幫助團隊明確判斷下一步該補強的能力,最終朝向具備自主優化與持續成長能力的 AI 系統邁進。

[AI 影響] AI裁員潮下,真正稀缺的是判斷力

 [AI 影響] AI裁員潮下,真正稀缺的是判斷力

摘要 : AI讓程式碼與工時愈來愈便宜,但收入未同步成長;未來更難被取代的,不是高產出者,而是能判斷、對齊並把成果轉成商業價值的人。

內容:

一名工程師面臨公司可能裁掉8000人、自己有10%機率上榜,卻沒有等結果,而是先重新思考「AI裁員」背後的邏輯。他將工作拆成三層:Input(程式碼、Token、工時)、Output(上線功能)、Outcome(使用者願意付費的結果)。

他的核心觀察是:AI讓底層的Input幾乎接近免費,程式碼產出量可能暴增5倍,但真正的商業結果與使用者收入卻未必成長,產品看起來甚至和半年前差不多。問題不在於寫得不夠快,而在於多出來的產出沒有有效轉成價值。

其中有兩道主要瓶頸。第一是「想法品質」:當寫程式的成本變低,原本會被成本淘汰的點子也都能快速上線,結果是垃圾產出變多。第二是「對齊稅」:不同團隊都能用AI高速做出MVP,但彼此假設可能完全衝突,最後卡在判斷、協調與整合,而不是卡在開發速度。

從公司角度看,裁員變成一筆算術題:AI的Token成本遠低於人力成本,標準化、可替代、對齊成本高的職位,最容易被優先裁撤。省下的人力支出,某種程度上正轉化為AI公司的收入,這也是企業加速用AI補位的現實原因。

因此,稀缺能力正在改變。過去值錢的是生產力,如今AI讓大量執行能力快速貶值;未來更重要的是判斷力:知道哪個想法值得做、如何從大量AI輸出中挑出真正有效的方案,以及如何讓互相衝突的方向收斂成一致目標。

面對這種變化,普通人可從三件事開始:第一,停止「會用AI就安全」的幻覺;第二,從Outcome倒推工作,先想清楚它會為誰創造價值;第三,成為能整合技術、產品、數據與業務的人。當Input愈來愈便宜,真正難被取代的,是能把Token變成Outcome的人。

2026年6月9日 星期二

[AI 分享] 用 AI 重構工程工作流

 [AI 分享] 用 AI 重構工程工作流


摘要 : 從高中後少有代表作,到成為 Python 核心貢獻者,Matt 用一套可複製的 AI 工程方法,打造高影響力開源成果。


內容:

這次想分享一個很震撼的案例:一位自稱高中畢業後就沒再做出「讓別人覺得有價值的軟體」的人,竟然在今年成為了 Python 核心貢獻者,還同時維護兩個合計超過三萬四千星的開源專案。


這個人是 Matt Van Horn。他是矽谷連續創業者,曾參與創辦後來成為 Lyft 的公司,也共同創辦了 AI 烤箱公司 June,產品能自動辨識食物並調節溫度,之後被收購。雖然經歷亮眼,但他自己認為,真正高價值的軟體產出反而是最近才開始爆發。


今年,他用 Cloud Code 打造了兩個專案。第一個是 Last 30 Days,一個幫助使用者回顧過去三十天工作的工具,累積超過三萬星;第二個是 Printing Press,一個 AI 內容生產工具,也快速累積數千星。除此之外,他還成為 Python 核心貢獻者,以及 Compound Engineering 這個 Cloud Code 外掛的第三大貢獻者。


Matt 把自己的工作方法整理成 22 個 hack。與其說這些是 AI 工具使用技巧,不如說是一套完整的工程哲學重構。他的核心觀點很直接:工程師的價值應該來自思考、架構決策與問題解決,而不是把大量精力消耗在環境配置、查錯、切換 IDE 與瀏覽器之間。


他認為,工具應該消失,思維應該留下。當一個工具需要你花太多力氣去管理,它本身就已經在消耗你。這套方法論的第一個核心,就是在動手寫任何程式碼之前,先產出一份結構化計劃文件,也就是 Plan.md。這份文件會先定義問題、列出可能方案、推薦方案的理由,以及潛在風險。重點不是讓 AI 立刻生成程式碼,而是先驗證方向對不對,避免陷入寫了再改、改了再重來的循環。


更特別的是,他不主張逐字閱讀這份長篇計劃,而是要求 AI 進一步用三句話濃縮出核心假設,並說明如果假設錯誤會發生什麼事。這個做法的本質不是檢查細節,而是審計推理框架。因為真正致命的錯誤,往往不在技術實作,而在一開始的前提判斷。


在工作環境上,Matt 採取極度工程化的方式。他不用傳統 IDE,而是同時開六個終端視窗,每個視窗對應一個獨立任務,例如新功能、測試、文件、程式碼審查等。這不是單純的多工,而是把不同任務拆成可並行處理的工作流,讓大腦只專注於排程與決策。


當他需要向 AI 解釋複雜背景時,會優先使用語音輸入,因為語音比打字能承載更高密度的上下文資訊。語氣、停頓、補充說明,這些平常打字容易省略的內容,反而能讓 AI 更準確掌握真正的需求與語境。


在每個專案中,他還會維護一份 Cloud.md。這份文件不是寫給人看,而是寫給 AI 看。內容包括專案核心限制、哪些目錄不能動、程式碼風格邊界、以及專案存在的根本原因。這等於是 AI 的入職文件,讓每次新的互動都能快速對齊上下文,而不必重頭再解釋一次。


版本控制在這套系統裡也不只是版本控制。Matt 每完成一個邏輯單元就會立刻 commit,且 commit message 不是描述「改了哪些檔案」,而是說清楚「解決了什麼問題」。這其實是在強迫自己做思維檢查點:如果你無法用一句話說明剛才做了什麼,代表那個改動本身可能就還不夠清晰。


在任務拆解上,他的原則是:一個任務只解決一個問題,一個問題只有一個成功標準,而且成功標準必須可驗證。因為 AI 的輸出品質,與任務定義品質高度正相關。如果你丟給 AI 一個混雜了效能優化、文件更新與 Bug 修復的複合需求,它往往會每件事都做一點,但沒有一件事做到真正到位。


程式碼審查方面,他會讓 AI 審查 AI 自己寫的程式碼,但審查時一定指定角度,例如從安全性、效能、可讀性,或新進工程師能否理解的角度來看。不同視角會暴露出完全不同類型的問題,這比泛泛地問「有沒有問題」有效得多。


在測試策略上,他主張先寫測試案例,再寫實作。這不一定是傳統意義上的 TDD,而是用測試先把需求具體化。如果連測試案例都無法明確描述,通常代表需求本身還沒有被真正理解。至於文件,他認為未來的文件主要不是寫給未來的自己,而是寫給未來會協助你的 AI。因此文件應該更加結構化、上下文完整、假設明確,方便 AI 快速吸收並協助決策。


最後,他還把這套方法沉澱為可持續系統,例如建立私人 prompt 庫,依照架構設計、程式碼審查、文件生成、除錯等場景分類管理。這代表他不是把 AI 當成一次性的聊天工具,而是當成可訓練、可複用、可工程化的生產系統。


整體來看,Matt 的 22 個 hack 真正厲害的地方,不只是讓 AI 幫你寫程式,而是把工程師的工作重心,從大量低價值的操作,重新拉回高價值的思考、判斷與系統設計。這不是天賦神話,而是一套有機會被複製的方法論。

[AI 分享] AI 程式設計的企業級專案方法

 [AI 分享] AI 程式設計的企業級專案方法

摘要: 企業級 AI 開發的核心不只在生成程式碼,而是建立 SOP 閉環、全鏈路日誌與健壯性驗證,讓 AI 能持續根據日誌結果迭代優化專案品質。

內容

企業級專案的四個關鍵:企業級專案最重要的不是單純把功能做出來,而是同時滿足:SOP 閉環、專案穩定、程式碼健壯,以及日誌可追溯。程式碼越健壯,專案就越穩定;而 SOP 是否真正閉環,最終要靠測試報告來驗證。


測試報告來自全鏈路日誌:在 AI 程式設計流程中,全鏈路日誌(埋點)是核心基礎。AI 不只是生成程式碼,而是持續分析執行日誌,根據結果調整實作方向,逐步逼近需求目標,直到整個 SOP 流程被完整跑通並完成標記。


健壯性檢查的內容:當主流程完成後,還需要進行健壯性檢查,包括壓力測試、漏洞注入、正常業務流程驗證,以及逆向或異常流程驗證。這些測試的分析依據同樣來自日誌,AI 會根據測試結果持續優化系統。


日誌是測試與自動化的基礎:無論是暴力測試、壓力測試,還是 SOP 測試,測試工具都需要利用日誌進行結果比對。因此,日誌設計不是附屬工作,而是整個品質保證流程的核心基礎設施。


AI 工程師角色的轉變:實務上大量時間不是在手寫程式碼,而是在讓 AI 分析日誌,再根據分析結果下達新的指令。工程師的角色也從傳統的「程式碼審查員」,逐漸轉變為「日誌審查員」與流程監督者。全流程日誌帶來的價值:當全流程日誌建立完整後,專案的故障定位、問題追蹤與快速修復都會變得更有效率。對企業級 AI 開發而言,日誌不是事後補強,而是從一開始就必須被納入架構設計的重要能力。


總結

這篇內容強調:AI 程式設計要真正落地到企業級專案,關鍵不在於「一次生成正確程式碼」,而在於建立「需求 → 日誌 → 分析 → 修正 → 測試 → 驗證」的閉環流程。全鏈路日誌、健壯性測試與可追溯性,才是讓 AI 開發成果能穩定運行於真實企業環境的核心能力。

[AI 衝擊] AI編碼時代的開發者分化

[AI 衝擊] AI編碼時代的開發者分化

摘要 : AI編碼工具全面普及後,開發效率大幅提升,但開發者之間的差距也正以前所未有的速度被放大。

內容:

隨著 AI Coding 工具快速普及,軟體開發產業正在經歷一場深刻變革。根據最新開發者使用數據顯示,短短一年多時間內,開發者每週平均產出的程式碼量已經成長超過一倍。過去需要多年經驗累積才能換來的效率提升,如今透過 AI 輔助,在極短時間內就能實現。這不只是工具升級,而是整個開發模式的改變。

更值得注意的是,開發者一次完成的工作規模正在快速擴大。過去一個功能可能需要拆成多次提交,如今透過 Coding Agent 協助,許多原本需要數天甚至數週完成的工作,可以在一次大型 Pull Request 中完成。超過千行程式碼的大型 PR 比例持續攀升,代表開發者開始有能力管理更複雜、更完整的開發任務,而這背後最大的推手正是 AI。

除了程式碼產出增加之外,開發者與 AI 的協作模式也在改變。AI 已不再只是單純的程式碼補全工具,而是逐漸成為能夠執行任務、呼叫工具、分析專案上下文的開發代理人。越來越多工程師開始將繁瑣、重複性的工作交由 AI 處理,自己則專注於架構設計、需求分析與決策判斷。這代表開發工作的重心正逐漸從「寫程式」轉向「管理 AI 寫程式」。

許多人擔心 AI 生成的程式碼品質是否可靠。從實際數據來看,AI 產出的程式碼保留率正在穩定上升,代表越來越多 AI 生成的內容能夠直接被納入正式專案。雖然仍需要人工審查、優化與修正邊界情況,但 AI 已經從過去的輔助工具逐漸演變成能夠參與實際生產的開發夥伴。

然而,真正值得關注的並不是效率提升,而是開發者之間差距的急速擴大。數據顯示,最頂尖的 AI 開發者所產出的程式碼量,可能是一般開發者的數十倍;完成任務的速度也遠遠超越平均水平。AI 並沒有平均地提升每一位工程師的能力,而是讓那些懂得善用 AI 的人獲得更大的放大效果。相同的工具,在不同人手中產生的價值差異,甚至比過去任何技術革命都更加明顯。

這場變革帶來的一個殘酷現實是:未來開發者的核心競爭力,可能不再只是演算法、框架或語言能力,而是如何與 AI 協作、如何設計工作流程、如何拆解問題並驅動多個 Agent 完成任務。AI 並沒有取代工程師,但它正在快速拉開工程師之間的距離。未來真正稀缺的,不是會寫程式的人,而是能夠駕馭 AI、放大自身能力的人。這道差距,正在成為 AI 時代最重要的新門檻。 

[AI 分享] AI Native 公司的作業系統革命

 [AI 分享] AI Native 公司的作業系統革命

摘要 : AI帶來的改變不只是效率提升,而是重新定義企業運作方式,讓公司從依賴人力協調轉向由智慧系統驅動的閉環組織。

內容:

傳統企業談論 AI 時,大多聚焦在提升工作效率,例如讓工程師寫程式更快、讓員工整理文件更省時間。然而,真正的改變可能遠超過提效 20% 或 50%。當 AI 已經能夠讓一個人完成過去一整個團隊的工作時,企業需要思考的問題不再是「如何使用 AI 工具」,而是「是否應該重建整個組織運作模式」。

核心關鍵在於從「開環系統」走向「閉環系統」。許多公司做完決策、執行任務後,只在事後進行回顧,卻沒有將結果系統化地回饋到流程中。資訊散落在會議、郵件、聊天訊息、口頭溝通與管理者腦海裡,導致知識不斷流失,也難以持續優化。而 AI Native 公司則會持續收集每個流程的輸入與輸出,將結果反饋給智慧系統,使流程不斷學習與改善。公司越接近閉環,AI 越能參與真實決策;反之,AI 就只能停留在問答工具的層次。

要建立這樣的能力,第一步是讓整家公司變得「可查詢」。所有重要資訊都必須被記錄並納入統一的智慧上下文之中,包括會議紀錄、專案管理系統、即時通訊頻道、客戶郵件、程式碼庫、銷售錄音以及每日站會內容。這些資訊不再只是員工的記憶負擔,而是 AI 學習與推理的重要基礎。當智慧體能同時看到需求、開發過程、客戶回饋與實際成果時,它便能分析哪些決策有效、哪些地方偏離目標,甚至協助團隊持續修正方向。

在產品開發與軟體工程領域,新的模式也正在形成。過去工程師負責撰寫程式碼,如今人類的角色逐漸轉向定義規格、設計測試與判斷結果。AI 負責根據規格產生程式碼、反覆修改並通過測試。未來真正稀缺的能力,可能不再是敲程式碼,而是能否清楚定義需求、建立正確的驗證機制,以及判斷輸出是否符合商業目標。程式碼本身,逐漸成為一種中間產物。

當企業大量導入 AI 閉環與智慧工廠模式後,傳統的管理階層也可能發生變化。過去中層主管的重要職責之一,是在不同部門之間搬運資訊、協調溝通與追蹤進度。但當智慧系統能即時掌握所有資訊並自動完成路由與分析時,組織層級將被大幅簡化。管理者的角色將從傳話與催促,轉向明確定義責任、校準方向與確保成果品質。

這樣的未來組織可能只剩下三種核心角色:第一線的執行者(Builder),直接對結果負責的負責人(DRI),以及負責制定方向與價值觀的創辦人(Founder)。每個人都直接對成果負責,而不是隱藏在複雜的組織架構之後。企業競爭力也不再取決於員工數量、辦公室規模或部門編制,而是取決於組織能否有效利用 AI、建立高品質的資訊閉環,以及用更少的人創造更大的成果。

最後有三個值得深思的原則。第一,給 AI 與正式員工同等級的上下文資訊。若只給 AI 一個孤立任務,卻期待它理解整個業務,那就像要求新進員工第一天上班就做出正確決策一樣不切實際。第二,領導者不能把 AI 全部外包給專門團隊,而必須親自使用與體驗,才能真正理解其能力邊界。第三,在 AI 時代,新的競爭優勢來自更高品質的智慧輸入、更快速的學習循環,以及更精簡的組織結構,而不是單純擴張人力規模。

總結:

AI 的價值不只是讓現有流程跑得更快,而是讓企業有機會重新設計整個作業系統。未來最具競爭力的公司,未必是擁有最多員工的公司,而是那些能夠建立完整資訊閉環、讓 AI 深度參與決策與執行,並以最少的人力創造最大價值的組織。真正的轉型,不是替公司加上一個 AI 工具,而是讓 AI 成為公司運作的核心基礎設施。

[AI 分享] AI Native公司的真正樣貌

 [AI 分享] AI Native公司的真正樣貌

摘要 : AI Native 並非只是會用 AI,而是讓 AI 成為公司運作的基礎設施,透過閉環機制、經驗沉澱與智慧化流程,讓組織能力能持續累積與複製。

內容:

隨著 AI 時代加速到來,無論是企業還是個人工作者,都無法避免受到 AI 的衝擊。許多人認為導入 AI 就是使用聊天機器人、生成文案、製作圖片或剪輯影片,但真正值得思考的問題並不是「有沒有使用 AI」,而是「公司是否已經按照 AI 的特性重新設計工作方式」。

許多團隊過去一年大量使用 AI 工具,內容產出速度變快了、工作效率提升了,但實際感受卻是事情沒有變少,反而越做越多。大家每天依然忙於追進度、處理專案、培訓新人與重複傳授經驗。問題並不在於 AI 不夠強,而是組織仍然沿用傳統公司的運作模式,只是在原本流程上額外加了一層 AI 工具而已。

判斷一家公司究竟是「很會用 AI 的傳統公司」,還是真正的「AI Native 公司」,有一個簡單標準。如果今天把所有 AI 工具拿掉,公司只是效率下降但仍然能正常運作,那本質上仍是傳統公司;如果把 AI 抽離之後,公司許多流程直接停擺,甚至無法繼續運作,那才代表 AI 已經成為組織基礎架構的一部分,真正融入公司的核心能力。

這也是為什麼許多大型企業推動 AI 轉型特別困難。因為它們原本的組織架構、流程制度與工作模式,都是建立在傳統商業邏輯之上。相反地,小型團隊反而有機會從零開始,以 AI 為中心重新設計流程、分工與管理方式,讓整個組織從一開始就是為 AI 而生。

建立 AI Native 組織有三個重要關鍵:閉環(Closed Loop)、可查詢(Queryable)以及智慧可呼叫(Callable Intelligence)。其中最核心的是「閉環思維」。許多公司經常開檢討會、做覆盤、討論成功案例,但會議結束後經驗仍然停留在少數人的腦袋裡。當負責的人離開、忙碌或換人接手時,過去累積的知識就跟著消失,團隊又得重新摸索一次。

真正的閉環不是單純記錄資料,而是讓每次成功與失敗的經驗都能回流到系統中。未來不論是新員工、老員工還是 AI Agent,都能直接使用過去累積的知識與最佳實務。組織不再依賴特定個人,而是依賴一套持續成長的知識系統。當經驗能夠被保存、被搜尋、被複用時,企業的能力才真正開始沉澱。

為了實現這種閉環,可以透過一套 PDCA 類似的循環流程來運作。首先是 Plan(規劃),明確定義目標、對象與執行方式;接著將任務 Delegate(委派)給 AI Agent 執行;然後由人員進行 Assess(評估),確認結果品質與方向是否正確;最後再將成功與失敗的經驗 Archive(固化),轉化成 SOP、技能文件、規則庫或知識庫。

特別重要的是,許多人只會記錄成功案例,卻忽略失敗經驗同樣具有價值。AI 本質上是機率模型,今天有效的方法不代表明天一定有效。因此每一次修改、每一次調整、每一次踩過的坑,都應該被記錄下來。這些內容未來不只可以幫助人員學習,也能成為 AI Agent 持續優化的重要依據。

當公司開始將所有流程、規則、經驗與決策邏輯逐步沉澱到系統裡,AI 就不再只是工具,而是組織能力的延伸。未來每一次執行任務,都不是從零開始,而是站在過去所有經驗的基礎上繼續前進。這或許才是真正的 AI Native 思維:不是讓人適應 AI,而是讓整個組織圍繞 AI 重新設計,形成能夠持續學習、持續進化的智慧型企業。


總結:

多數企業目前只是「會使用 AI」,但真正的 AI Native 公司,會把 AI 視為組織運作的核心基礎設施。關鍵不在於用了多少 AI 工具,而在於是否建立了經驗沉澱、知識複用與持續優化的閉環機制。當每一次執行、評估與學習都能被記錄並轉化為組織資產時,企業才能真正享受到 AI 帶來的長期複利效應。

2026年6月8日 星期一

[AI 分享] 心理登月:用1%的成本創造99%的價值

 [AI 分享] 心理登月:用1%的成本創造99%的價值

摘要 : 真正影響使用者體驗的,往往不是物理層面的改善,而是心理感受的改變。與其花巨大成本改變現實,不如用更低成本降低不確定性、提升感知價值,創造更高的商業回報。

內容:

大部分人做產品、服務或改善流程時,都有一種很自然的反應:當問題出現,就去解決造成問題的物理原因。

App 太慢,就優化程式碼、增加伺服器;物流太慢,就增加倉儲與運力;服務不好,就增加人力與訓練。這種思維本身沒有錯,但很多時候卻不是最有效率的解法。

全球最大廣告公司澳美副董事長 Rory Sutherland 提出了一個非常有趣的觀點:在工廠裡製造出來的物理價值,與人腦感受到的心理價值,同等重要。而在許多情況下,心理價值的投資報酬率甚至可能是物理價值的100倍。

第一個經典案例來自歐洲之星(Eurostar)。

當時英國鐵路公司希望提升倫敦到巴黎的競爭力,工程團隊提出的方案是重新鋪設鐵路,將列車時速從約200公里提升到接近400公里。

整個計畫預算高達60億英鎊,而最終只能將原本約2小時15分鐘的車程縮短約30分鐘。

就在大家認為這是唯一解法時,Rory Sutherland 提出了另一種思考:

為什麼不拿1%的預算,在車上提供WiFi、升級餐飲服務、改善乘坐體驗,甚至安排更優質的服務人員與香檳招待?

如果乘客能夠上網工作、享受美食、獲得更好的服務,他感受到的旅程時間就會大幅縮短。

工程師思考的是:

「如何讓旅程更短?」

而 Rory 思考的是:

「如何讓旅程感覺更短?」

物理上縮短30分鐘需要60億英鎊,但心理上讓兩個多小時變得愉快,可能只需要6000萬英鎊。

這就是感知價值的巨大槓桿。

第二個案例則是我們每天都可能使用到的 Uber 地圖。

當 Uber 推出即時車輛位置地圖時,很多人以為這是導航功能的延伸。

但實際上,它解決的並不是交通問題,而是心理問題。

想想看:

有了那張地圖之後,車子真的比較快到嗎?

沒有。

原本需要5分鐘到達,現在仍然需要5分鐘。

司機沒有變快,道路沒有變順暢,等待時間完全沒變。

但神奇的是,使用者焦慮下降了、取消訂單率下降了、滿意度提升了、回購率提高了。

原因在於,人們真正討厭的並不是等待。

而是不確定性。

不知道司機在哪裡、不知道還要多久、不知道會不會被放鴿子,這種未知感帶來的焦慮,遠遠大於等待本身。

當地圖出現後,等待變得可預測。

使用者看到車子正在接近,就會知道:

「還有3分鐘。」

「還有2分鐘。」

「快到了。」

雖然等待時間沒有縮短一秒鐘,但等待體驗卻被徹底改變了。

Uber 並沒有花大錢讓車開得更快,而是透過資訊透明化,消除了不確定性。

這就是心理登月最典型的案例。

所謂「心理登月(Psycho-Logical Moonshot)」的概念,其實是在提醒我們:

與其花數十億去改變物理世界,不如花數百萬去改變人們的感受。

前者可能只能帶來有限提升,後者卻可能創造數十倍甚至數百倍的價值。

這個觀念不只適用於大企業,也適用於每一個人。

當你在做產品、提供服務、經營社群、管理團隊,甚至處理人際關係時,都可以先問自己:

我現在遇到的是物理問題,還是心理問題?

很多時候,客戶抱怨服務慢,真正受不了的並不是速度,而是不知道還要等多久。

很多時候,員工抱怨制度差,真正不滿的並不是制度本身,而是不知道未來會發生什麼。

很多時候,伴侶感到焦慮,也未必是事情本身,而是缺乏明確的溝通與預期。

因此,當使用者抱怨時,不要急著解決表面的問題。

先思考:

他真正痛苦的是什麼?

是時間太長?

還是不確定性太高?

是成本太高?

還是感覺不被重視?

很多時候,真正的答案藏在抱怨背後。

從今天開始,可以試著用「心理登月」的角度重新觀察生活。

排隊等餐、等電梯、等醫生、等外送、等主管回覆、等客戶決策、等另一半回訊息。

所有令人焦躁的場景背後,往往都隱藏著一個降低不確定性的機會。

誰能夠用最低成本,把「不知道」變成「知道」;

誰能夠把焦慮變成可預期;

誰就有機會創造遠超過物理改善的價值。

總結:

工廠裡製造出來的價值,與人腦感受到的價值,同等重要。

過去工業時代教導我們,解決問題就是改變物理現實;但未來真正巨大的機會,可能來自於另一個方向——在不改變現實的情況下,改變人們對現實的感受。

真正高明的創新,不一定是把火車開得更快,而是讓旅程變得更值得期待;不一定是讓等待變短,而是讓等待變得可以理解。

當你學會尋找那些隱藏在人性中的不確定性,你就會發現:

很多時候,用1%的成本,就能創造出99%的價值。

[AI 啟發] 第一性原理的賺錢邏輯

賺錢的第一性原理是創造價值,不是出賣時間。

創造價值的第一性原理是解決問題,不是提供勞動。

解決問題的第一性原理是識別真需求,不是自我感動。

識別真需求的第一性原理是實踐反饋,不是閉門造車。

實踐反饋的第一性原理是快速迭代,不是仔細打磨。

快速迭代的第一性理是驗證模型,不是為了交付。

驗證模型的第一性原理是為了系統複製,而不是個人苦幹。

系統複製的第一性原理是槓桿思維,不是線性積累。

[AI 啟發] 第一性原理的賺錢邏輯

摘要 : 賺錢的本質不是出售時間,而是持續創造價值。從需求、驗證、迭代到系統化複製,每一層都指向同一件事:建立可放大的價值槓桿。

內容:

很多人以為賺錢靠的是努力工作,但真正決定收入上限的,往往不是投入多少時間,而是創造了多少價值。當你的收入只能和工時綁定時,再努力也會遇到天花板;但當你的價值能被放大、被複製,收入的成長空間就完全不同了。

而價值的本質,不是做了多少事,而是解決了多少問題。客戶不會為你的辛苦買單,他們只會為問題被解決買單。寫程式、做設計、提供服務都只是手段,真正有價值的是讓別人的成本降低、效率提高、風險減少或收益增加。

但問題的背後還有更深的一層:需求。很多人花了大量時間打造自己覺得很棒的產品,最後卻沒有人願意付費。原因並不是產品不好,而是解決的問題根本不存在,或者不是使用者最在意的問題。與其閉門造車,不如盡快接觸市場,驗證需求是否真實存在。

因此,實踐與反饋遠比完美更重要。許多人把時間花在反覆打磨產品,卻遲遲不敢推出市場。事實上,市場才是唯一的評審。快速推出、快速收集回饋、快速修正,往往比花半年追求完美更有效率。

而快速迭代的目的,也不是為了交付產品,而是驗證商業模型。你需要知道的是:這個需求是否存在?這個方案是否有效?客戶是否願意付費?成本與收益是否合理?只有驗證成功的模型,才值得投入更多資源。

最後,所有商業活動都會回到一個終點:系統化複製。如果一件事情只能靠你親自完成,那本質上仍然是在出售自己的時間。真正的成長來自建立流程、工具、產品、品牌、團隊甚至 AI 工作流,讓價值可以被持續複製與放大。

從第一性原理來看,賺錢其實是一條非常清晰的路徑:

創造價值 → 解決問題 → 找到真需求 → 獲得市場反饋 → 快速迭代 → 驗證模型 → 系統化複製 → 建立槓桿。

當你開始用槓桿思維取代線性思維,用系統取代苦幹,用驗證取代猜測,用需求取代自我感動,你就不再只是努力工作的人,而是在打造一個能持續創造價值的成長引擎。


真正拉開差距的,不是誰比誰更努力,而是誰能把自己的價值,從「做一次」變成「複製一萬次」。

[AI 分享] AI 推理成本的物理真相

 [AI 分享] AI 推理成本的物理真相

摘要 : 大模型定價不只是商業策略,而是受到GPU算力、記憶體頻寬與硬體物理極限共同決定。

內容:

很多人看到 AI 平台推出快速模式、高級方案或長上下文加價機制時,第一個反應往往是商業套路。但如果深入到底層運作原理,就會發現這些價格設計其實與硬體物理限制高度相關。從輸入 Token、輸出 Token,到長上下文處理成本,背後都可以用數學模型與硬體規律解釋。

大語言模型的推理本質是「自迴歸生成」,也就是一個 Token 接著一個 Token 產生結果。每生成一個 Token,GPU 都必須重新執行一次模型。這個過程不只是計算矩陣乘法,更重要的是從顯示記憶體中搬運龐大的模型權重資料。現代 GPU 的問題往往不是算不動,而是在等待資料傳輸完成。

因此,推理速度受到兩個關鍵因素制約:計算能力與記憶體頻寬。即使 GPU 擁有極高的運算能力,如果資料無法及時送達,計算單元仍然只能閒置等待。整體推理時間取決於兩者中較慢的那一項,而不是兩者相加。這也是為什麼晶片設計時,算力與頻寬必須保持平衡。

進一步來看,大模型推理的記憶體開銷包含兩部分。第一部分是模型權重讀取,這是一筆固定成本;無論服務一位使用者還是一千位使用者,都必須完整載入模型。第二部分則是 KV Cache,也就是模型記錄上下文的記憶空間。隨著使用者數量增加、對話內容變長,這部分成本會持續上升。

這也引出了大型 AI 服務商的重要經營策略:批次處理(Batching)。當大量使用者的請求同時進入系統時,固定的模型讀取成本可以被眾多使用者共同分攤,使單一 Token 的平均成本大幅下降。這也是為什麼大型平台能以相對低廉的價格提供服務,而個人自行租用高階 GPU 推理時,成本往往高得驚人。

然而,成本下降並非無限。當批次規模持續增加後,KV Cache 的讀取與實際計算量會逐漸成為新的瓶頸。此時即使再增加使用者,也無法再顯著降低成本,因為系統已經接近硬體所能達到的物理極限。這也是大型模型服務商持續追求推理最佳化、模型壓縮與晶片創新的根本原因。

從這個角度來看,AI 產業的競爭不只是模型能力競爭,更是硬體效率競爭。模型價格、快速模式、長上下文費率、輸出 Token 定價,許多看似商業決策的設計,其實都受到 GPU 算力、記憶體頻寬與資料搬運成本的深刻影響。理解這些底層規律後,你會發現 AI 商業模式的核心,並不是單純賣模型能力,而是在不斷逼近硬體物理極限的過程中,尋找最高效的成本結構與資源利用方式。


當大多數人還在討論哪個模型比較聰明時,真正決定 AI 公司獲利能力的關鍵,往往是背後那張 GPU 每秒能搬多少資料、能服務多少使用者,以及能把固定成本攤薄到什麼程度。這才是 AI 時代最容易被忽略,但也最重要的一層競爭力。

[AI 觀察] AI越強,人為何反而更忙?

 [AI 觀察] AI越強,人為何反而更忙?

摘要 : AI並未直接取代人力,而是重塑工作型態。未來最有價值的人,不是會使用AI的人,而是能設計、管理與駕馭AI工作流的人。

內容:

過去很多人認為,AI普及後企業最先做的事情一定是裁員、縮編、降低人力成本。但現實卻出現了有趣的反差。有些公司幾乎全員深度使用 AI 工具,從程式開發到文件處理都交給 AI 協助,結果一年下來員工數量不減反增。原因並非 AI 不夠強,而是每一個 AI Agent 的背後,都需要有人負責規劃、監督、維護與修正。當 Agent 越多,管理 Agent 的需求也隨之增加。

許多人曾經幻想,只要建立好 Agent,它就能自主完成工作。然而實際運作後發現,沒有持續維護的 Agent 很快就會失效、偏離目標,甚至變成另一種技術債。因此真正成熟的做法,不是讓每個人各自養一堆 Agent,而是建立公司級的核心 Agent 平台,由專門人員負責管理與優化。自動化沒有消滅工作,而是創造出全新的工作內容。

另一方面,AI 的發展方向也正在改變。過去大家討論的是聊天機器人、提示詞與命令列工具;現在則逐漸走向桌面化、系統級 Agent。這類 Agent 不只是回答問題,而是能看到畫面、操作應用程式、跨系統執行任務。AI 正從協助單一工作,逐步演化成協助整個職務。以前是幫你寫一封郵件,未來則可能直接幫你處理整個郵件工作流程。

這也讓許多人誤以為軟體服務將被 AI 取代。但實際情況可能正好相反。AI Agent 雖然變成新的操作入口,但背後仍然需要大量專業系統提供資料、流程與服務。AI 更像是一個新的作業層,而原本的應用系統則成為被呼叫的能力模組。未來競爭的焦點,不一定是誰擁有 AI,而是誰擁有最完整、最容易被 Agent 使用的服務能力。

在軟體開發領域,同樣出現了一個重要現象。AI 已經能快速生成大量程式碼,但真正困難的問題並不是寫程式,而是判斷該寫什麼、怎麼設計才符合業務需求。模型可以根據已知問題產生答案,但往往缺乏對現場情境的理解與取捨能力。當面對架構決策、產品方向或複雜商業邏輯時,人類仍然扮演關鍵角色。

因此,未來最被看好的角色未必是純工程師,而是兼具產品思維、設計能力與技術理解的人。當 AI 讓實作門檻快速下降後,真正稀缺的是能夠定義問題、設計流程、判斷品質與整合資源的人。產品經理、全端設計師、AI 工作流設計者,將成為新一波價值提升最快的角色。

我自己最大的感受是,AI 並沒有讓工作消失,而是在重新定義工作的內容。以前我們管理人,現在開始管理 Agent;以前設計功能,現在開始設計工作流;以前學習工具,現在學習如何協調多個模型共同完成任務。真正值錢的能力,不再只是執行工作,而是能把整個職務拆解成一套可以持續運作的系統。未來的競爭力,不是「會不會用 AI」,而是「能不能讓 AI 為整個工作流程創造價值」。當所有人都擁有 AI 時,最有價值的人,將是那個能夠駕馭與編排 AI 的人。

[AI 觀察] 蘋果的AI豪賭時刻

 [AI 觀察] 蘋果的AI豪賭時刻

摘要 : WWDC 2026被視為蘋果全面轉向AI的關鍵戰役,從Siri重構到系統級智慧化,顯示科技競爭已從硬體規格轉向AI生態與使用者入口之爭。

內容:

過去大家期待開發者大會時,最關心的是新手機、新電腦或新硬體。但今年的焦點似乎完全不同。市場普遍認為,這次發表會將幾乎沒有硬體亮點,而是把所有資源集中在作業系統與人工智慧能力上。這不只是產品策略調整,更反映出整個科技產業正在經歷一場從「硬體競爭」走向「AI競爭」的巨大轉變。

其中最受矚目的變化,就是語音助理的全面升級。未來的智慧助理不再只是查天氣、設鬧鐘,而是逐漸演變成真正的個人智慧中樞。它能理解使用者的行程、郵件、文件與使用情境,甚至整合不同AI模型提供服務。對於使用者而言,重點已經不是背後是哪一家模型公司,而是誰能提供最順暢、最自然的智慧體驗。

這也透露出一個重要訊號:科技巨頭開始接受「開放合作」的重要性。過去封閉的生態系統正在鬆動,因為AI時代的競爭已經不是單純靠硬體或作業系統就能取勝。當模型能力快速演進,使用者更在意的是能否自由選擇最適合自己的AI服務。誰能留住使用者,誰就擁有下一個時代的入口。

除了智慧助理之外,AI也開始滲透到影像、相機、相簿、鍵盤、搜尋與自動化工具之中。過去需要專業技能才能完成的工作,例如圖片修復、內容創作、工作流程自動化、文字潤飾等,現在都逐漸變成系統內建能力。這代表AI正在從一個額外安裝的工具,變成作業系統的基礎設施,如同網路、儲存空間與圖形介面一樣不可或缺。

但這場變革背後也存在另一個值得思考的問題。當AI開始參與照片生成、內容創作、資訊判斷甚至決策建議時,我們看到的究竟是真實世界,還是經過演算法重新包裝後的世界?當技術能夠讓每一張照片變得完美、每一段文字變得流暢時,人類原本的不完美與創造過程是否也正在被逐漸弱化,這將成為未來幾年持續被討論的課題。

從更大的角度來看,這場發表會真正反映的並不是某家公司推出了多少新功能,而是整個產業權力中心正在轉移。過去十多年,科技公司比的是晶片效能、螢幕規格與相機畫質;而現在,比的是模型能力、算力規模以及誰能掌握使用者每天最重要的互動入口。未來人們可能不再頻繁開啟各種App,而是直接透過AI完成工作、購物、訂票、搜尋與決策。當這一天真正到來,AI將不只是功能,而會成為新的作業系統,而這場競爭,才正要開始。

[AI 衝擊] Token經濟正在改寫科技產業規則

 [AI 衝擊] Token經濟正在改寫科技產業規則

摘要 : AI時代的競爭焦點正從人力與資金,逐漸轉向算力與Token消耗能力,並重塑全球軟體產業與商業模式。

內容:

過去科技圈炫耀的是融資金額、估值或豪華辦公室,如今矽谷的新指標卻變成了「每天消耗多少Token」。許多企業開始將AI使用量視為競爭力的象徵,甚至建立內部排行榜追蹤員工與團隊的模型使用狀況。對不少管理者而言,AI消耗量不再只是成本數字,而被視為組織創新能力與未來生存機率的指標。

這種現象背後反映的是軟體產業商業模式的巨大轉變。過去軟體產品最大的優勢是邊際成本接近零,產品開發完成後,用戶越多獲利通常越高。但AI產品不同,每一次提問、每一次推理、每一次自動化任務,都會持續消耗模型資源並產生成本。使用者愈活躍,企業支付給模型供應商的費用也可能同步增加。

因此,Token逐漸成為新的生產資源。部分投資機構甚至開始將算力額度與Token配額視為重要投資內容,而不只是提供資金。對AI新創來說,獲得穩定且低成本的算力來源,某種程度上已經和獲得融資同樣重要。AI競爭也從單純的產品競爭,演變成算力取得能力與使用效率的競爭。

有趣的是,模型價格與實際成本之間存在一個反直覺現象。許多人認為便宜模型一定更省錢,但在複雜任務中,能力較弱的模型往往需要反覆嘗試、多次修正與重新執行,最終消耗更多Token。反而能力較強、價格較高的模型,因為能夠更快完成任務,總體成本可能更低。未來企業真正要優化的,不只是單次Token價格,而是完成任務所需的總消耗量。

隨著智慧體(Agent)大量普及,Token需求也開始呈現爆炸性成長。傳統使用者可能只是偶爾詢問AI問題,但自主運作的Agent會持續讀取資料、執行流程、測試程式、修正錯誤,甚至全天候運作。這種模式下,Token不再是偶發消耗,而成為企業營運過程中的持續性資源,就像電力、水資源或網路頻寬一樣重要。

更值得關注的是全球算力產業的重新分工。當世界各地的開發者透過API呼叫遠端模型服務時,本質上是在購買另一個地區的電力、基礎設施與運算能力。未來的國際競爭,可能不再只是出口商品或軟體,而是出口「算力」與「智慧」。誰擁有更低成本、更穩定的能源供應、更完善的資料中心與運算基礎設施,誰就有機會在這場Token經濟浪潮中取得更大的主導權。

[AI 衝擊] AI 時代真正拉開差距的,不只是會不會用工具

[AI 衝擊] AI 時代真正拉開差距的,不只是會不會用工具

摘要 : AI 放大人的能力,也放大思維、強度與責任感的差距。

內容:
AI 時代最大的差距,可能不是誰比較聰明,而是誰真正懂得把 AI 用成自己的能力放大器。今天的模型像是 24 小時待命的博士團隊,但多數人並沒有感覺自己身邊真的多了這股力量,原因不只是提示詞寫不好,而是我們的「TQ」還太低。

所謂 TQ,不只是技術使用能力,而是理解 AI 能力邊界、拆解任務、調度 Agent、驗證結果、修正錯誤的整體能力。當別人還在問「AI 能不能幫我做這件事」,更高階的人已經在問「為什麼只用一個 Agent?為什麼不是一百個 Sub-Agent 協同完成?」

AI 也讓「Intensity」變得更重要。過去一個人的強度不夠,可能幾個月後才看得出來;但在 AI 時代,差距可能隔天就顯現。聰明但沒有強度,走不遠;有強度但沒有判斷力,只是瞎忙。真正有競爭力的人,是能把智慧、執行密度與方向感結合起來的人。

未來白領工作的核心也會改變。單純「搬磚」的工作會越來越少,寫文件、寫程式、整理資料、做簡報,很多數位世界的重複性任務都會被 AI 接手。人真正需要培養的,是 Founder Mentality:定義目標、判斷價值、選擇路徑、承擔結果。

這也代表,工作者不能只把自己定位成 Coder,而要變成 Builder;不能只會執行任務,而要能設計任務、管理 Agent、理解客戶、創造結果。未來的專才與通才都還有價值,但前提是你的專業或整合能力,必須比 AI 預設輸出更有判斷力。

AI 不會平均分配紅利,它會放大差距。會用的人,速度可能快十倍、百倍;不會用的人,會覺得工具很多但自己更累。真正該修煉的,不只是工具清單,而是思維方式、技術調度能力、強度、責任感,以及讓別人願意理解與接受你產出的能力。 



2026年6月7日 星期日

[AI 分享] AI全端工程師時代來了

 [AI 分享] AI全端工程師時代來了

摘要 : AI正在改變軟體開發分工模式,未來工程師將從單一職能逐步走向具備多領域能力的全端開發者

內容:

過去幾年,軟體產業的分工越來越細。有人專注前端、有人專注後端、有人負責測試、運維或資料庫。這種模式在過去確實有效,但隨著 AI 開發工具快速成熟,我開始觀察到一個明顯的變化:企業越來越希望找到能夠獨立完成完整工作流程的人,而不是只負責其中一小塊的人。

以前一個功能上線,可能需要前端後端測試運維多個角色協作。現在透過 AI 協助產生程式碼、撰寫測試、建立部署腳本,許多原本需要多人合作的工作,逐漸可以由少數人完成。企業發現,如果同樣的人能夠同時理解前端、後端、雲端部署與 AI Agent 應用,那麼溝通成本會大幅下降,交付速度也會更快

這並不代表專業能力不重要,而是代表未來的競爭力不再只是「專精一項技術」。真正有價值的人才,將會是「一項專精 + 多項通識」的組合。你可以是前端高手,但同時懂後端 API;你可以是後端專家,但也能處理部署與 AI 整合。當問題出現時,你能跨越不同領域快速定位與解決,這種能力的價值會越來越高。

有趣的是,很多人一聽到全端就開始焦慮,覺得自己要重新學習所有東西。但實際上,AI 反而降低了跨領域學習的門檻。過去從零學習一項新技術可能需要數個月甚至半年,現在透過 AI 輔助學習與實作,許多人能在短時間內建立基本能力。對大多數開發者而言,目標不是每個領域都達到專家等級,而是先具備能夠完成工作的能力,再逐步深化自己最擅長的方向。

我認為未來的工程師發展路線,可能會從「單一職能」轉變成「全端能力 + 核心專長」。全端能力負責解決大部分業務需求,而核心專長則用來處理複雜問題與高難度挑戰。當 AI 可以幫我們完成大量重複性工作時,人類的價值將更集中在架構設計、問題分析、系統整合與決策判斷上。

站在職涯發展的角度來看,這其實未必是壞事。過去技術更新速度太快,許多人擔心自己多年累積的技能會快速過時。但如果你持續擴展自己的能力邊界,同時保留一項深度專長,經驗反而會成為優勢。AI 不只是提高生產力的工具,它更可能重新定義工程師的成長路徑。未來真正稀缺的,或許不是某個框架的專家,而是能夠駕馭 AI、整合多種技術並創造實際價值的人。

[AI 分享] Vibe Coding 不等於放手不管:先建工程流程,再讓 AI 寫程式

 [AI 分享] Vibe Coding 不等於放手不管:先建工程流程,再讓 AI 寫程式

摘要 : AI 能加速開發,但真正決定專案成敗的不是模型能力,而是開發流程與工程紀律。

內容:

很多人在體驗 AI Coding 或 Vibe Coding 之後,都有一種共同感受:前期開發速度快到不可思議,一天能完成過去一週的工作量。但隨著專案規模越來越大,問題開始浮現。程式碼結構逐漸混亂、功能彼此耦合、修改一個地方影響另一個地方,最後整個專案變成難以維護的「技術債黑洞」。很多人以為這是 AI 的問題,但實際上,問題往往出在缺乏一套能駕馭 AI 的工程流程。

在讓 AI 寫下第一行程式碼之前,最重要的事情其實不是選模型,而是先把需求定義清楚。很多人一開始就急著叫 AI 產生程式碼,結果需求一直變、方向一直改,導致 AI 每次都在不同的前提下工作。比較好的做法是先把目標使用者、使用情境、核心功能與商業目的整理出來,再進一步形成 PRD 文件。同時,每一項功能都要建立驗收標準,明確定義什麼叫做完成。當標準越清楚,AI 產出的品質就越穩定。

完成需求規劃後,接著要開始打地基。這個階段最容易被忽略,但卻往往是專案能否長期維護的關鍵。你需要先思考系統的邊界、安全需求、效能要求以及成本限制。例如這個系統只是個人使用,還是未來要對外提供服務?是否涉及個資與隱私?是否有大量使用者同時在線?如果這些問題沒有提前想清楚,等到系統做到一半才發現架構不符合需求,往往就得付出數倍的重構成本。

技術選型也是許多人容易踩坑的地方。很多開發者喜歡追逐最新框架,但對 AI 開發來說,比起新穎,更重要的是「可驗證」。當一個技術擁有完整文件、成熟社群、豐富範例與大量實戰案例時,AI 產生正確程式碼的機率會大幅提高。換句話說,選擇主流技術不只是因為穩定,而是因為 AI 能從更多公開知識中學習並參考正確做法。

除了需求與架構之外,還需要建立 AI 的工作規範。將需求文件、架構設計與專案現況分別維護成獨立文件,讓 AI 隨時能取得最新上下文資訊。同時建立程式碼規範、命名規則、元件標準以及參考範例。這樣 AI 就不是每次從零開始猜測,而是在既定框架下進行開發。許多人覺得 AI 寫程式不穩定,其實很多時候只是因為沒有提供足夠清晰的規則與背景資訊。

真正進入開發階段後,最重要的原則只有一句話:「人負責方向與驗收,AI 負責執行與產出。」不要一次要求 AI 完成整個系統,而是採用 MVP 與小步快跑的方式,每次只完成一個可驗證功能。每完成一個小功能就測試、驗證、提交版本。人類持續負責架構拆分、模組邊界、安全檢查與品質把關,AI 則負責大量重複性的實作工作。當 AI 出現錯誤時,也不要陷入無限重試,而是透過最小重現、日誌分析、斷點追蹤與測試驗證來尋找證據。因為在 AI 時代,最有價值的能力已經不再是寫程式,而是建立一套能夠穩定產出高品質程式碼的工程系統。

[AI 分享] AI Coding 不等於 AI 接管開發

 [AI 真相] Vibe Coding 不等於 AI 接管開發

摘要 : AI 能加速開發,但無法取代工程管理。真正決定專案成敗的,是開發流程、架構設計與驗收機制。Vibe Coding 時代的真相:速度可以交給 AI,品質仍然掌握在人手上。

內容:

最近很多人在談 Vibe Coding,甚至有人覺得只要把需求丟給 AI,就能快速做出產品。但實際參與過專案的人很快就會發現另一個現象:開發速度確實變快了,可是程式碼品質卻不一定變好。當功能越加越多、需求不斷調整時,專案很容易逐漸演變成一座難以維護的「程式碼屎山」,最後修改任何一個功能都可能影響整個系統。

我觀察到許多人誤會了一件事:AI 並不是工程師的替代品,而是工程師的放大器。如果原本沒有需求管理、架構規劃、版本控制與驗收標準,那麼 AI 只會把混亂放大得更快。原本需要半年才累積的技術債,現在可能一個月就全部堆出來。

因此,在開始寫第一行程式碼之前,最重要的工作其實不是 Coding,而是把需求講清楚。包括目標使用者是誰、要解決什麼問題、有哪些核心功能,以及每個功能完成的標準是什麼。很多團隊失敗的原因不是技術做不到,而是一開始根本沒有定義什麼叫做「完成」。

除了需求之外,專案的技術邊界也必須先被定義。安全性怎麼處理?資料要不要加密?系統預計多少人使用?是否需要擴充性?這些看似和功能無關的問題,往往才是後期重構成本最高的來源。當 AI 開始大量產生程式碼時,這些邊界如果沒有先畫好,後面幾乎一定會回頭重做。

進入開發階段後,我認為最重要的原則是「小步快跑」。不要一次讓 AI 幫你完成整個系統,而是拆成許多可以驗證的小功能。每完成一個功能就測試一次、提交一次版本。AI 負責產生程式碼,人類負責確認方向。這種模式雖然看起來比較慢,但實際上成功率遠高於一次產生大量程式碼後再回頭修正。

最後,無論 AI 再怎麼進步,工程開發仍然有幾件事不能放手:架構設計、權限管理、安全驗證、程式碼審查與版本控制。AI 很擅長把事情做出來,但不一定知道什麼事情不該做。真正成熟的團隊,並不是讓 AI 自由發揮,而是建立一套流程去駕馭 AI。當你把需求、架構、規範與驗收機制都建立好之後,AI 才能真正成為讓團隊生產力倍增的工具,而不是製造更多技術債的來源。

[AI 分享] 從提示詞進化到工作流:AI協作模式的真正價值

 [AI 分享] 從提示詞進化到工作流:AI協作模式的真正價值

摘要 : AI 正從單次對話進化成可規劃、可審查、可協作的工作流系統,讓複雜任務能以更低成本、更高品質完成。

內容:

第一,AI 的競爭焦點正在改變:從「回答問題」走向「完成任務」。

過去我們使用 AI,大多是在聊天視窗裡輸入一段提示詞,等待模型給出答案。但最近越來越多工具開始導入工作流(Workflow)概念,讓 AI 不再只是回答問題,而是能先規劃步驟、拆解任務、分派工作,再彙整成果。這代表 AI 的角色正在從聊天機器人,逐漸轉變成專案執行者。未來比的可能不再是誰的模型比較聰明,而是誰的工作流設計能力更強。

第二,先看計畫,再執行,將成為高階使用者的重要習慣。

許多人使用 AI 時習慣直接執行任務,但當工作規模變大之後,這種方式往往容易造成資源浪費。比較成熟的做法是要求 AI 先產出執行計畫,例如任務拆解方式、執行階段、需要多少 Agent、預估成本、驗收標準與停止條件。透過事前審查流程,使用者能更清楚知道 AI 準備如何完成任務,也能在正式執行前調整方向。這種模式很像企業專案管理中的需求確認與設計評審,只是現在執行者變成了 AI。

第三,多 Agent 協作正在成為處理大型問題的新模式。

當面對大型程式碼庫、數十個問題單、複雜文件分析或大型研究任務時,單一 AI 已經不再是最佳解法。新的工作流模式會將問題拆成許多子任務,交由多個 Agent 平行處理。例如有的 Agent 負責分析,有的負責驗證,有的負責交叉比對,最後再由整合 Agent 產出結論。這種做法其實很像企業中的跨部門協作機制,把原本需要數天甚至數週的工作壓縮到更短時間完成。

第四,成本控制將成為 AI 時代的重要能力。

很多人只關注 AI 能做什麼,卻忽略 AI 使用成本的管理。實際上,在工作流設計中,不同階段未必需要使用最強大的模型。有些工作只需要便宜模型進行初步分析,有些關鍵驗證才需要高階模型參與。透過模型分層配置,可以大幅降低 Token 消耗與運算成本。未來企業導入 AI 時,真正有競爭力的團隊,不只是懂得使用 AI,而是懂得如何用最低成本取得最好的成果。

第五,AI 工作流開始整合外部工具,能力正在快速放大。

過去 AI 主要依賴訓練資料回答問題,但現在越來越多工作流開始結合外部工具、資料庫、程式碼分析系統、知識庫與各種 API。當 AI 能夠自主呼叫工具、取得即時資訊、分析程式碼結構,甚至與其他 AI 協同工作時,它的能力邊界會被大幅擴展。這代表未來的 AI 應用不再只是對話,而是一個能夠串聯企業系統、資料與流程的智慧執行平台。

第六,真正的門檻已經不是提示詞,而是工作流設計能力。

這幾年大家都在研究 Prompt Engineering,但從最近的發展來看,提示詞的重要性雖然仍然存在,卻逐漸退居第二線。真正拉開差距的開始變成 Workflow Engineering,也就是如何規劃任務流程、設計 Agent 協作模式、控制成本、制定驗收標準,以及整合外部工具。未來 AI 時代最有價值的人,未必是最會寫程式的人,也未必是最會下提示詞的人,而是那些懂得把人、流程、資料與 AI 串接成完整生產系統的人。這或許就是 AI 應用從實驗階段走向實際生產力的關鍵轉折點。

[AI 分享] 從指令到流程:AI 開始學會自己安排工作

 [AI 分享] 從指令到流程:AI 開始學會自己安排工作

摘要 : AI 的價值不再只是回答問題,而是能規劃、拆解、協調與執行整個工作流程。

內容:

最近這段時間,我越來越有一種感覺:AI 的進化方向,已經不是單純讓回答變得更聰明,而是開始學會「怎麼工作」。以前我們使用 AI,像是在跟一位能力不錯的助理對話,你問一句,它答一句;但現在的變化是,你只需要告訴它目標,它開始自己思考應該分成哪些步驟、需要哪些角色、哪些事情可以同時進行,甚至會先把執行計畫攤開來讓你確認。這種感覺很像從「工具」逐漸變成「團隊」。

有趣的是,很多人以為 AI 最大的成本是模型費用,其實真正浪費資源的地方往往是缺乏規劃。當任務變得複雜時,如果讓 AI 一股腦直接執行,它可能同時展開大量工作,消耗大量運算與時間。因此我發現,先看計畫再決定是否執行,反而是更有效率的做法。這有點像專案管理,不是急著動工,而是先確認需求、範圍與預期成果。未來懂得管理 AI 的人,可能比懂得使用 AI 的人更有優勢。

另一個讓我印象深刻的現象,是 AI 開始具備「分工協作」的概念。以前一個問題只會有一個答案來源,現在則可能同時啟動多個分析角度。有的負責收集資料,有的負責驗證資訊,有的負責整理結論,最後再由另一個角色進行彙整。這種工作方式其實很像企業中的跨部門合作。當我們開始把 AI 視為一個可以組織與協調的工作團隊時,許多原本需要多人參與的任務,可能會被重新定義。

我也觀察到一個很重要的轉變:未來的競爭力,可能不在於誰擁有最強大的模型,而是誰最懂得配置資源。就像公司裡不會所有事情都交給最資深、最昂貴的人來做一樣,不同任務應該搭配不同層級的能力。簡單工作交給成本較低的資源,關鍵決策才交給高階能力處理。當這種思維開始套用到 AI 世界後,成本控制與效能優化就成了一門新的管理學。

更值得關注的是,AI 已經不再被限制在自己的知識範圍內。它開始能夠連接各種外部工具、資料來源與服務,把原本分散在不同系統裡的能力串聯起來。這代表未來的工作流程,不再是人類手動切換系統、複製貼上資訊,而是由 AI 主動穿梭於各種工具之間,完成資料蒐集、分析、驗證與整理。過去我們學習的是如何使用軟體,未來可能更重要的是如何設計一個讓 AI 發揮最大效益的工作環境。

回頭看這波變化,我認為真正值得學習的並不是某一個新功能,而是一種新的思考模式。當 AI 開始具備規劃、協調與執行能力後,我們的角色也正在改變。未來的人不一定要親手完成每一件事,但必須知道目標是什麼、如何定義成功,以及如何讓不同能力的 AI 協同運作。從某種角度來看,AI 時代正在把每個人都推向管理者的位置,而能夠駕馭流程的人,將比單純執行流程的人更具價值。

2026年6月6日 星期六

[AI 省思] 當AI越來越像人,我們該如何保持自己的人性?

[AI 省思] 當AI越來越像人,我們該如何保持自己的人性?

摘要 : AI最大的挑戰或許不是取代工作,而是讓人逐漸忘記自己存在的價值與意義。

內容:

最近幾年,我常常觀察到一個很有趣的現象。以前大家把AI當成工具,像搜尋引擎、計算機或翻譯軟體;但現在,越來越多人開始把AI當成朋友、顧問、老師,甚至是情感寄託的對象。有人遇到問題先問AI,有人把秘密告訴AI,也有人讓AI替自己做人生選擇。這些變化看起來很自然,但仔細想想,其實代表一件事情:AI正在慢慢從工具的位置,走向陪伴者的位置。

如果把時間拉長來看,過去的科技革命大多是在改變我們的生活方式。蒸汽機改變了勞動模式,電力改變了生活時間,網際網路改變了資訊流動。而這一次的AI革命有點不一樣,它開始碰觸到人類最核心的部分:思考、判斷、創造與決策。以前我們透過學習累積知識,透過經驗建立優勢;如今很多能力正逐漸被模型快速複製與普及。這讓許多人開始焦慮,因為我們習慣用能力來定義自己的價值。

但我認為,更值得警惕的並不是AI變得多厲害,而是我們開始誤以為智慧等於意識。當AI能寫詩、能安慰人、能陪聊天時,很容易讓人產生一種錯覺,覺得它是不是也擁有情感、擁有靈魂、擁有真正的理解能力。然而事實上,今天的AI再怎麼先進,本質上仍然是在大量資料與機率運算中產生最合理的回應。它可以模擬同理心,但不代表它真的感受到悲傷;它可以描述愛情,但不代表它真的理解愛情。這兩者之間的差異,遠比我們想像中重要。

我發現很多人擔心未來工作被取代,但或許更大的挑戰是「意義感的流失」。當AI能寫文章、畫圖、寫程式、分析資料時,我們可能會開始懷疑自己存在的必要性。可是回頭看看歷史,人類真正偉大的地方從來不只是效率。我們會為了家人犧牲,我們會因為理想堅持,我們會因為一句話感動,也會因為一次失敗重新站起來。這些東西未必是最有效率的,卻構成了人之所以為人的原因。

面對這波變化,我認為有幾件事情特別重要。第一,把AI當成工具,而不是權威。它可以提供建議,但不應替你決定人生。第二,持續培養判斷力,而不只是獲取答案。未來最珍貴的能力可能不是知道什麼,而是知道什麼值得相信。第三,經營真實的人際關係。當越來越多互動發生在虛擬世界,人與人之間真誠的陪伴反而會變得更加珍貴。第四,建立屬於自己的價值觀,因為科技可以告訴你如何做到一件事,卻無法告訴你為什麼要做這件事。

未來十年,AI一定會變得比今天更強大,甚至強大到超出我們現在的想像。但我越來越覺得,真正決定未來的關鍵從來不是機器有多聰明,而是人類是否知道自己是誰。技術會持續進步,工具會持續演化,但如果我們能夠保有思考能力、同理心、責任感與對生命的敬畏,那麼AI就不會成為取代人類的力量,而會成為幫助人類走得更遠的夥伴。或許在這個充滿變化的時代裡,最重要的課題不是如何變得更像機器,而是在機器越來越像人的時候,我們依然記得自己為什麼是人。 

[AI 觀察] AI熱潮退去後,真正值錢的是什麼?

 [AI 觀察] AI熱潮退去後,真正值錢的是什麼?

摘要 : AI正在淘汰低價值的重複工作,但也讓懂架構、風險與商業的人變得更加重要。

內容:

最近看了許多關於 AI Agent、自動寫程式、十分鐘做完一套系統的分享,坦白說,一開始看到確實會覺得很震撼。但看得越多,反而越有種似曾相識的感覺。每隔幾年,科技圈總會出現一次「這次真的不一樣」的浪潮,從雲端、大數據、區塊鏈,到現在的 AI。真正有趣的不是技術本身,而是每次熱潮過後,留下來的究竟是什麼。最近越來越感受到,AI 並沒有讓軟體開發變得更簡單,而是讓大家重新認識什麼才是真正困難的事情。

很多人把軟體開發理解成寫程式碼,因此當 AI 可以快速產生程式碼時,就開始擔心程式設計師是否即將消失。但如果實際參與過大型專案,就會發現寫程式往往只佔整體工作的一小部分。真正耗費時間的,是理解需求、協調不同單位的期待、規劃系統邊界、設計資料流向、處理權限問題、評估風險,以及思考未來三到五年的擴充可能性。這些事情沒有標準答案,也不是靠生成幾千行程式碼就能解決的。程式碼只是最後的結果,而不是價值本身。

我覺得目前最大的誤解,是很多人把獨立開發者的成功模式,直接套用到企業級系統上。個人專案失敗了,大不了重新來過;但企業系統不同。銀行、醫院、保險公司、物流公司,這些系統背後連結的是金流、病歷、供應鏈與法律責任。一個看似微小的錯誤,可能影響數萬甚至數百萬人。對這些組織而言,速度從來不是第一順位,穩定、安全、可追溯才是。AI 可以幫助開發更快,但沒有人願意拿核心業務去賭一次未經驗證的自動生成結果。

這兩年其實也看到一個有趣的現象。剛開始大家都在討論 AI 會不會取代工程師,後來開始瘋狂追逐各種 Agent 平台,再接著不少團隊發現專案裡充滿了 AI 生成的程式碼垃圾。表面上看起來架構完整、命名漂亮、文件齊全,但實際維護時卻到處是隱藏問題。最後大家花更多時間在理解 AI 為什麼這樣寫,而不是解決真正的業務問題。這時候很多人才突然發現,寫程式其實不難,理解系統才難;產生程式碼很容易,驗證程式碼才昂貴。

如果把 AI 看成工具,我覺得它更像是一把威力強大的電動工具。擰螺絲的速度快了十倍、百倍,但不代表拿著工具的人就突然變成建築師。真正能夠決定房子會不會倒的,不是螺絲鎖得多快,而是設計圖是否合理、地基是否穩固、結構是否安全。未來企業真正願意花高薪購買的,恐怕也不再是單純的編碼能力,而是那些能夠判斷風險、設計架構、做出商業決策的人。因為出了問題,最後要負責任的人,永遠不會是 AI。

我自己越來越相信,AI 時代最重要的競爭力不是學會多少工具,而是提升自己的抽象思考能力與系統思維。當寫程式逐漸變成一種近乎免費的能力時,真正稀缺的將是理解問題的人。懂技術的人很多,但同時懂技術、懂商業、懂流程、懂風險的人並不多。未來的職場可能不再是人與 AI 的競爭,而是懂得駕馭 AI 的人,與只會依賴 AI 的人之間的競爭。當大家都在討論 AI 能做什麼的時候,也許更值得思考的是:如果 AI 什麼都能做,那麼只有人類才能做的事情,究竟還剩下什麼?

四天打造企業級知識萃取系統:AI 代理人驅動開發的完整剖析

 

四天打造企業級知識萃取系統:AI 代理人驅動開發的完整剖析

寫作目的: 本文記錄一段真實的開發歷程——從一個預設好的專案腳手架開始,在 AI 代理人工具的輔助下,四天內建構出具備完整功能的企業級知識萃取平台。這份文件同時是技術分析、方法論總結,也是對未來合作夥伴說明:AI 代理人時代,一個掌握正確方法的人究竟能做到什麼程度。


第一章 成果概覽:四天的數字說話

系統簡介

KMCollector 是一套企業級知識萃取平台,核心功能包含:

  • 多平台媒體轉錄:YouTube、抖音、通用影片連結,自動下載音訊後以 OpenAI Whisper 轉錄為文字,支援分段處理(克服 1400 秒限制)、繁體中文自動保底
  • 文件萃取:透過 MarkItDown 將 PDF、Word、Excel 等文件轉換為結構化 Markdown
  • 分類與團隊管理:多標籤分類系統、RBAC 團隊權限控管(非管理員只能存取公開或授權團隊的紀錄)
  • 完整 CRUD 後台:使用者、角色、專案、工作、會議、音訊轉錄、文件萃取全模組
  • 企業基礎設施:Cookie 認證、多語系(zh-TW / en-US)、分散式快取(Memory / Redis)、健康監控、NLog 日誌、Swagger API

技術規模

指標數值
開發天數4 天(97 小時)
Git Commits117 個
版本迭代32 個版本(v0.2.10 → v0.2.41)
原始碼檔案292 個(.cs + .razor)
說明文件50 份(架構、PRD、SOP、規格、發行說明)
資料庫 Migration12 組(雙資料庫,SQLite + SQL Server)
單元測試9 個測試模組
自動化腳本5 個 PowerShell 腳本
外部整合OpenAI Whisper、ffmpeg、yt-dlp、Playwright、MarkItDown

程式碼規模:從腳手架到完成品

統計說明: 腳手架為 commit c5cad3cb(2026-06-02 08:55,重命名 MyProject → KMCollector 的第一個業務 commit),初始 commit 只有 README.md 與 .gitignore 共 2 個檔案。

項目腳手架起點四天後完成增加量
C# 原始碼(.cs)15,682 行 / 128 個檔案33,836 行 / 250 個檔案+18,154 行(+115%)/ +122 個檔案
Razor 元件(.razor)2,167 行 / 34 個元件2,986 行 / 42 個元件+819 行(+38%)/ +8 個元件
說明文件(.md)537 行8,205 行+7,668 行(+14 倍)
PowerShell 腳本(.ps1)326 行657 行+331 行(+102%)
Node.js 工具(.mjs)0 行277 行+277 行(新增)
源碼合計(.cs + .razor)17,849 行36,822 行+18,973 行(+106%)

從這些數字看到了什麼?

把兩個時間點的程式碼數字放在一起比較,第一個引人注意的事實是:完成品的 36,822 行源碼中,有 17,849 行(佔 48.5%)來自腳手架。這些不是業務代碼,而是認證、授權、多語系、健康監控、日誌、快取等「每個企業系統都必須有,但與業務邏輯完全無關」的基礎設施。如果從零開始打造這層基礎,一個有經驗的工程師至少需要 2–4 週。腳手架讓這部分成本在四天的計算中直接消失——這是時間壓縮的第一個槓桿。

四天內真正新增的 18,973 行,才是這個專案獨有的業務靈魂:音訊轉錄的分段處理邏輯、文件萃取的格式轉換、抖音的 Playwright 自動化整合、分類與團隊的 CRUD 模組、RBAC 跨記錄權限控管、分享文字的 URL 自動解析……每天平均產出 4,743 行有明確業務目的的代碼,沒有填充、沒有廢棄路徑。

文件的數字更能說明問題。源碼在四天內增加了 106%,而說明文件卻增加了 1,428%,幾乎是 14 倍的成長。從 537 行增至 8,205 行,涵蓋架構設計、PRD、操作 SOP、部署說明、發行說明。這在傳統開發中幾乎是不可能的事——文件永遠是待補狀態,技術債的形式不只有程式碼,更大的債務往往藏在沒有人寫完的文件裡。AI 代理人把「邊開發邊同步文件」從一個口號變成了可執行的工作節奏。

從代碼的結構品質看,122 個新增的 C# 檔案平均每個 149 行。這個數字透露了一件重要的事:AI 產出的程式碼遵循單一職責原則,每個 Service、Helper、Client 都是焦點明確的小型類別,而非一個包山包海的上帝類別。新增的 8 個 Razor 元件平均 102.4 行,比腳手架原有元件(平均 63.7 行)稍複雜,因為它們承載了多選標籤、即時過濾、團隊權限聯動等實質業務互動,複雜度與功能密度完全匹配。


這代表什麼?傳統開發 vs. AI 代理人開發的成本對比

傳統開發:需要一個什麼樣的團隊?

要用傳統方式建構相同功能的系統,一個負責任的交付團隊通常需要以下角色同時到位。

專案經理(PM) 負責需求訪談、功能清單整理、進度追蹤、跨角色溝通協調,以及最終的驗收確認。這個角色光是做好需求釐清與規格文件,就需要 1–2 週的投入,整個專案期間持續消耗工時。

UI/UX 設計師 負責使用者介面設計、互動流程規劃、元件視覺稿的繪製與修改。即使採用現成的設計系統(如 AntDesign),仍然需要設計師針對各個功能頁面做佈局決策、體驗優化與設計審核,最少需要 2–3 週的設計工作量。

後端工程師(資深,1–2 人) 負責資料模型設計、資料庫 Migration、Service 層業務邏輯、Web API 設計與實作、外部服務整合(OpenAI、ffmpeg、yt-dlp、Playwright)。這是工作量最重的部分,保守估計需要 4–6 週。

前端工程師(1 人) 負責 Blazor 元件實作、與後端 API 串接、多語系整合、UI 互動邏輯。本專案的 Blazor 前端複雜度中等,包含多選標籤、即時搜尋、權限聯動顯示,估計需要 2–4 週。

QA 測試工程師 負責測試案例設計、單元測試與整合測試撰寫、手動功能驗証、回歸測試。這個角色的工作並非只在最後衝刺,而是要跟著每個功能模組同步進行,整體需要 2–3 週。

技術文件負責人(兼任或專人) 負責架構文件、操作 SOP、部署說明、API 文件的撰寫與維護。傳統開發中文件往往是最被壓縮的工作,但本專案交付了 50 份完整文件,若要做到同等品質,至少需要 1–2 週的文件工作量。

傳統開發的時間與成本估算

將上述角色的工作週期疊加,考慮到需求確認、設計迭代、開發返工、測試修正等常見的摩擦成本,完成相同功能範圍的系統,實際需要 2–3 個月(8–12 週),且這還是在需求清晰、溝通順暢的理想情況下的估算。

以台灣市場的中高階人力成本計算:

角色月薪估計投入時間人力成本
專案經理NT$80,0002.5 個月NT$200,000
UI/UX 設計師NT$70,0001.5 個月NT$105,000
資深後端工程師NT$100,0002.5 個月NT$250,000
後端工程師(協作)NT$80,0001.5 個月NT$120,000
前端工程師NT$90,0002.5 個月NT$225,000
QA 測試工程師NT$70,0002 個月NT$140,000
技術文件(兼任)NT$60,0001 個月NT$60,000
合計NT$1,100,000

加計管理費用、員工勞健保與福利(約 30%)後,總用人成本約 NT$143 萬(約 4.4 萬美元)。若是外包給系統整合商,考慮到專案管理利潤與風險溢價,報價通常在 NT$200–300 萬 之間。

AI 代理人開發:實際投入了什麼?

這個專案的實際資源投入是:1 個人、4 個工作天

開發者人力成本(以相同的資深工程師薪資計算):4 天 × NT$5,000/天 ≈ NT$20,000。AI 工具訂閱與 API 費用(Claude Code、OpenAI Whisper API):約 NT$3,000–8,000。實際總成本:約 NT$23,000–28,000,不到傳統開發的 2%。

更關鍵的是時間。傳統方式需要 8–12 週,AI 代理人方式完成只需 4 天。時間縮短了 95% 以上。對於需要快速驗證市場假設的新創企業,或需要在有限預算內交付系統的中小型組織,這個差距直接決定了一個商業機會能否被把握住。

一個人,抵得上多少人力?

若以「人月」(person-month)為單位計算,傳統方式需要約 13–14 人月的工作量才能完成相同的交付成果。AI 代理人方式由 1 人在 4 天內完成,換算約 0.13 人月。兩者相比,效率差距約為 100 倍

然而,更準確的理解方式不是倍數,而是角色替代。在這 4 天裡,同一個人同時扮演了:PM(撰寫 PRD 與設計文件)、後端架構師(資料模型、API 設計、服務分層)、後端工程師(業務邏輯實作)、前端工程師(Blazor 元件、互動邏輯)、QA(單元測試、整合驗証)、技術文件負責人(50 份文件),以及 DevOps(部署腳本、環境配置)。

AI 代理人工具讓這一切成為可能的方式,不是讓一個人「更快地完成每件事」,而是讓許多原本需要等待他人、協調接口、反覆溝通的工作,直接在一個上下文中無縫串接。消除的不只是人力成本,消除的更是溝通成本、等待成本、認知切換成本——這些才是傳統協作模式裡真正讓時間消失的黑洞。

一個掌握 AI 代理人工具、具備正確方法論的開發者,在今天的市場裡,能夠獨立承擔一個原本需要 6–7 人團隊才能交付的專案範疇。這不是誇大,這是有 git 歷史為證的事實。


第二章 開發歷程:五個階段的演進

階段一:框架搭建(第 1 天上午,約 2 小時)

從腳手架到可運行系統

這個專案從一個預先準備好的腳手架(starter project)出發。腳手架已預先整合:登入認證、角色管理、AntDesign 元件庫、多語系、健康監控、NLog 日誌等基礎建設。

這一階段的工作是「個人化初始化」:

  • 修正系統名稱綁定設定(不再是硬編碼範本名稱)
  • 調整選單 Z-index 問題
  • 整理文件目錄結構為 7 個分類
  • 建立 MediaTranscription 資料庫 Entity 與初始 Migration

關鍵洞察: 好的腳手架節省了 90% 的基礎設施時間。不從零開始,而是從「已解決共同問題的起點」開始。


階段二:核心功能實作(第 1–2 天,約 12 小時)

音訊/影片轉錄完整鏈路

版本功能
0.2.14FFmpeg 絕對路徑配置
0.2.15轉錄處理器逐段進度日誌
0.2.16文件萃取功能(MarkItDown 整合)
0.2.18YouTube 來源 + 語言選擇 + 繁體中文保底
0.2.20依音訊時長自動分段(修正 OpenAI 1400 秒上限)

這階段最關鍵的技術決策是音訊分段策略:OpenAI Whisper API 有時長限制,必須實作 MediaChunker 自動計算分段計畫,再並行送出轉錄請求、依序合併結果。這不是一個簡單問題,但 AI 代理人在有清楚規格的情況下,一次就設計出正確架構並配套寫出測試。


階段三:多平台整合(第 2–3 天,約 8 小時)

突破平台壁壘

YouTube 有完整 API 支援,相對容易。抖音則有強力的反爬蟲機制。

解法:用 Playwright 自動化瀏覽器模擬真實使用者登入、攔截音訊串流 URL,再下載。這需要:

  • 一個 Node.js 助手腳本(get-douyin-audio.mjs)控制 Playwright
  • 一個初始化腳本(douyin-init.mjs)處理 Cookie/登入狀態
  • C# 端的 DouyinAudioDownloader 呼叫 Node.js 子程序

這個跨語言(C# ↔ Node.js)、跨技術棧的整合,同時產出了完整的部署 SOP 與設計文件。

抽象化設計: 同時設計了 MediaUrlDownloader,統一處理「任意影片連結」來源,並實作 ShareTextParser 自動從分享文字中提取 URL 與標題。


階段四:資料治理與權限控管(第 3–4 天,約 16 小時)

企業級的資料隔離

版本功能
0.2.34分類清單 CRUD
0.2.35團隊清單 CRUD
0.2.36紀錄加入分類/團隊標籤欄位與過濾
0.2.37角色預設團隊與紀錄團隊權限控管
0.2.38紀錄預帶入使用者授權團隊

這階段引入了最複雜的業務邏輯:RBAC(角色基礎存取控制)的延伸。非管理員使用者只能查看「無團隊(公開)」或「與自己角色所屬團隊有交集」的紀錄。

實作涉及:

  • IRecordAccessScopeProvider(定義存取範圍介面)
  • TagStringHelper(分隔字串格式的標籤轉換與精確比對)
  • TeamJsonHelper(JSON 格式的角色→團隊映射)
  • 6 個資料庫 Migration(分類、團隊、標籤各 2 個,Sqlite + SQL Server 各一套)

全部配套 PRD 文件、測試模組、發行說明。


階段五:細節打磨(第 4 天,約 4 小時)

讓系統在真實環境中穩定運行

  • 修正 NLog 及 yt-dlp 的 UTF-8 編碼問題(CJK 字元亂碼)
  • 編輯紀錄時可修改原始檔名
  • 抖音腳本支援 --ffmpeg 外部路徑參數(解決新機器部署問題)
  • 輸出 ffmpeg 錯誤訊息以診斷 ExitCode=4
  • 新增外部工具一鍵安裝 PowerShell 腳本

這階段的特點是「問題驅動」:在真實部署環境中發現問題,快速診斷、快速修復。每個問題平均耗時不超過 20 分鐘。


第三章 AI 代理人為何能做到這一切:機制分析

3.1 零切換成本的全域知識

傳統開發中,工程師需要不斷在不同視窗間切換:IDE、Stack Overflow、API 文件、Jira、設計文件……每次切換都是認知成本。

AI 代理人的上下文窗口可以同時持有:

  • 整份需求規格
  • 相關程式碼片段
  • 架構設計原則
  • 歷史決策記錄(CLAUDE.md 中的不變量)

結果: 生成的程式碼天然符合既有架構風格,不需要事後「對齊」。

3.2 規格→程式碼的直接轉換

只要需求夠清楚,AI 代理人可以:

PRD(產品需求文件) → 資料庫 Entity + AutoMapper Profile → Service 層(CRUD 方法) → Controller(Web API) → Blazor 頁面(AdapterModel + 檢視邏輯) → 單元測試 → 發行說明

這整條鏈路,AI 可以在一次對話中完成,而且每個環節都遵循 CLAUDE.md 裡定義的不變量(雙資料庫 migration、建構式注入、精確標籤比對…)。

傳統方式: 一名工程師完成這條鏈路需要 1–2 天。
AI 代理人: 30–60 分鐘(大量時間花在人工審查上,而非生成)。

3.3 並行思考:程式碼與文件同時產出

每一個功能的 commit 都伴隨著:

  • 更新的 docs/ 文件
  • 配套的測試模組
  • 更新的 appsettings.json 版本號

這在傳統開發中幾乎不可能做到——文件永遠在「待補」狀態,測試永遠在「下週」。AI 代理人將文件和測試視為需求的一部分,而非附加工作。

3.4 即時錯誤診斷與修正

這個專案中,許多「fix」commits 都在 feat commits 之後的 1–2 小時內出現。這不是因為程式碼品質差,而是因為真實環境總是與開發環境不同

AI 代理人的優勢在於:

  • 給它錯誤訊息(如 ffmpeg ExitCode=4),它能立刻識別問題根源
  • 給它重現步驟,它能設計正確修復方案
  • 修復完成後立刻重寫測試來覆蓋這個案例

診斷速度比傳統方式快 5–10 倍,因為它不需要「搜尋問題」,它直接分析。

3.5 守護不變量的「護欄機制」

這個專案在 CLAUDE.md 中定義了多條關鍵不變量(如:所有查詢必須套用團隊權控、雙資料庫 migration 等)。

AI 代理人在每次生成程式碼前都會讀取這些規範,確保新程式碼不違反既有設計決策。這相當於有一個永遠在場、永遠記得所有規則的資深同事在 review 每一行程式碼。


第四章 核心方法論:如何正確駕馭 AI 代理人

方法一:從好的腳手架出發

不要從零開始。好的腳手架已解決了「所有專案都會遇到的共同問題」:認證、授權、日誌、健康監控、CI/CD 鉤子……

每次都從空白頁面開始,是在重複浪費時間。

本專案的腳手架預先包含: 25+ 個預整合功能,讓開發者第一天就能專注在「這個專案獨有的業務邏輯」上。

方法二:規格先於程式碼

每個功能在實作前,都先有:

  1. PRD(產品需求文件):What + Why + Success Criteria
  2. 設計文件:How(架構、資料流、介面設計)

AI 代理人的程式碼品質與輸入規格的清晰度直接相關。模糊的需求產出模糊的程式碼;清晰的規格產出精確的實作。

本專案的 50 份文件不是「事後補寫」,而是「實作的前提條件」。

方法三:用護欄替代事後 Code Review

CLAUDE.md(或 AGENTS.md)定義的不變量就是護欄。這些護欄不是給人看的建議,而是 AI 代理人每次行動前的強制檢查清單。

護欄機制確保:

  • 新加入的程式碼自動符合架構規範
  • 不會因為「AI 沒注意到」而引入安全漏洞或技術債
  • 每個開發者(包括 AI)都遵循相同的編碼標準

方法四:版本作為完成的儀式

本專案規定:每次可建置的異動 = 一個版本號 + 一個 Commit

這個規定看似繁瑣,實際上創造了:

  • 清楚的「完成」定義(不是「大概差不多」,是「版本號已遞增」)
  • 可追溯的決策歷程(每個版本對應的 commit 訊息說明了為什麼)
  • 回滾的錨點(任何一個版本都是穩定可部署的狀態)

4 天 32 個版本 = 平均每 3 小時完成一個可部署的功能增量。

方法五:問題驅動的真實環境驗證

每一個「fix」commit 背後都是真實的問題:

  • 在不同機器上部署時發現的路徑問題
  • CJK 字元在 Windows 終端的編碼問題
  • 第三方平台(抖音)的反爬蟲機制

不逃避真實環境的測試,用問題驅動快速迭代。真實問題比假設的測試案例更有價值。


第五章 AI 新紀元的個人能力圖譜

在 AI 代理人工具出現之前,一個人的開發能力等於「他能寫多少程式碼、記住多少 API」。

在 AI 代理人時代,這個等式改變了。

5.1 價值轉移:從「執行者」到「指揮者」

舊範式新範式
會寫程式會定義問題
記得 API 文件能判斷 AI 輸出的正確性
快速編碼快速定義規格
解決技術問題分解複雜業務問題
寫測試驗程式碼寫規格驗業務假設

AI 代理人是高效的執行者,但它需要一個清楚知道「要執行什麼、為什麼」的指揮者。

5.2 核心能力一:領域知識

AI 代理人可以生成抖音下載器的程式碼,但它不知道你的業務場景為什麼需要抖音下載器,也不知道使用者的痛點在哪裡

領域知識讓你能夠:

  • 定義正確的成功標準
  • 識別 AI 輸出中的業務邏輯錯誤
  • 做出 AI 無法做的架構取捨決策

沒有領域知識的 AI 使用者,是在請一個聰明但對業務一無所知的助手工作。

5.3 核心能力二:清晰溝通(Prompt Engineering)

AI 代理人的輸出品質 = 輸入描述的清晰度。

清晰溝通不是「學會特定咒語」,而是訓練自己:

  • 明確說明目標(不是「做一個下載器」,是「從抖音分享連結中提取 MP3 音訊,支援 DASH 與合併 MP4 兩種格式,輸出到指定路徑」)
  • 說明限制條件(「必須支援 Windows 路徑,不能依賴全域環境變數」)
  • 定義成功標準(「轉錄完成後,音訊時長誤差不超過 5 秒」)
  • 提供上下文(「這個系統的其他下載器都實作了 IMediaDownloader 介面,新的也要遵循」)

5.4 核心能力三:品質判斷

AI 代理人很少「完全錯誤」,但經常「看起來對、其實有細微問題」。

品質判斷能力包含:

  • 能夠 code review AI 的輸出
  • 識別可能的資安漏洞(SQL injection、XSS、未授權存取)
  • 識別架構不一致(違反既有設計模式)
  • 識別邊界案例沒有處理

這需要真正的工程素養,不是被 AI 取代的能力,而是使用 AI 的必要前提。

5.5 核心能力四:系統思考

單個功能 AI 可以完美實作,但功能之間的依賴、架構的整體一致性、技術債的累積——這些需要系統思考能力。

本專案的 CLAUDE.mddocs/architecture/開發慣例與限制速查.md 就是系統思考的結晶:把跨功能的設計決策明確化,讓整個系統在快速迭代中保持一致性。

5.6 核心能力五:敏捷調整

AI 的輸出不是一次就完美的,而是「第一個版本夠好,可以快速迭代改進」。

敏捷調整的能力包含:

  • 接受「夠好但不完美」的初版輸出
  • 快速識別需要調整的部分
  • 用清楚的反饋引導 AI 做精準修正(而不是「這不對,重來」)

本專案 117 個 commits 中有 13 個 fix commits,fix 率 11%。 每個問題從發現到修復平均不超過 20 分鐘。

5.7 工作方式的轉變:從「一個人寫程式」到「指揮 AI 團隊」

傳統開發:1 個工程師,1 條工作線,串行完成。

AI 代理人開發:1 個指揮者,N 個並行的 AI 代理人:

  • 代理人 A 正在寫後端 Service 邏輯
  • 代理人 B 同時在寫對應的測試
  • 代理人 C 同時在更新 PRD 文件
  • 指揮者在審查輸出、做架構決策、規劃下一步

效率倍數不是 2x,而是 5–10x,因為是並行的,不是串行的加速。


第六章 成功的前提:什麼是 AI 工具無法替代的

AI 代理人做不到的事

列出這些,不是要貶低 AI,而是要說明指揮者的價值在哪裡

  1. 理解使用者的真實痛點(AI 只知道你說的,不知道使用者沒說出口的)
  2. 做優先順序決策(應該先做哪個功能?資源有限時砍哪個?)
  3. 評估業務風險(這個設計決策的商業後果是什麼?)
  4. 建立人際信任(客戶、同事、合作夥伴的關係)
  5. 判斷「夠好了」的時機(完美是效率的敵人)

讓 AI 工具發揮最大效益的前提

  1. 你知道要解決什麼問題(問題定義能力)
  2. 你能評估解決方案的品質(技術鑑賞力)
  3. 你有護欄保護系統不偏軌(CLAUDE.md、不變量文件)
  4. 你有好的起點(可複用的腳手架,不從零開始)
  5. 你有紀律做版本管理(每個增量都是可部署的狀態)

第七章 結語:給合作夥伴的話

我能帶來什麼

這個專案是一個存在於 git 歷史中的真實證明:

我能夠在四天內,以一個人的資源,交付:

  • 具備企業功能完整度的 Web 應用系統
  • 完整的技術文件(架構、PRD、SOP、發行說明)
  • 可維護的程式碼(測試覆蓋、清晰架構、雙資料庫 migration)
  • 可部署的生產就緒系統

這不是運氣,也不是一次性的衝刺。這是一套可複現、可擴展的方法論

這代表什麼樣的合作可能性

傳統合作模式AI 代理人時代的合作模式
「招 5 個工程師,6 個月後上線」「1 個懂方法的人,配合清晰需求,4 週可以上線可用版本」
文件永遠落後於程式碼文件與程式碼同步生成
技術債隨時間累積護欄機制防止架構腐化
需要完整規格才能開始可以邊做邊細化,快速驗證假設

如何合作才能最大化效益

對合作夥伴最重要的一點:你的業務知識 + 我的方法論 = 快速交付真正有價值的系統。

我最需要從合作夥伴那裡獲得的不是技術需求,而是:

  1. 真實的使用者問題(不是「我要一個系統」,是「使用者在哪個步驟卡住了」)
  2. 優先順序的判斷(什麼功能必須有、什麼可以之後再說)
  3. 成功的定義(系統上線後,什麼樣的結果代表成功)

有了這三樣,AI 代理人工具就能以你無法預期的速度,把它們轉換成可運行的系統。


附錄:開發統計數字一覽

提交活動分布

日期 Commits 主要里程碑 ───────────────────────────────────────────── 2026-06-02 34 框架搭建 + 音訊轉錄基礎 2026-06-03 25 完整轉錄鏈路 + 文件萃取 2026-06-04 34 抖音整合 + 多平台支援 2026-06-05 21 分類/團隊 CRUD + 權限控管 2026-06-06 3 抖音腳本微調 ───────────────────────────────────────────── 合計 117 平均 29.25 commits/天

版本演進時間軸

v0.2.10 框架個人化(06-02 09:30) v0.2.13 音訊轉錄資料模型(06-02 14:58) v0.2.16 文件萃取(06-03 10:36) v0.2.18 YouTube 來源整合(06-03 13:17) v0.2.20 音訊分段策略(06-03 14:06) v0.2.22 抖音 Playwright 整合(06-04 11:11) v0.2.27 分享文字自動解析(06-04 14:25) v0.2.34 分類清單 CRUD(06-05 09:18) v0.2.35 團隊清單 CRUD(06-05 10:04) v0.2.37 RBAC 團隊權限控管(06-05 14:59) v0.2.41 抖音腳本完善(06-06 11:08)

提交類型分布

類型數量說明
feat(功能新增)32每個都是可展示的功能增量
docs(文件)15與程式碼同步生成,非事後補寫
fix(錯誤修正)13真實環境問題快速修復
chore(維護)7配置、腳本、工具整合
refactor(重構)1必要時的架構調整