2026年6月6日 星期六

[AI 觀察] AI熱潮退去後,真正值錢的是什麼?

 [AI 觀察] AI熱潮退去後,真正值錢的是什麼?

摘要 : AI正在淘汰低價值的重複工作,但也讓懂架構、風險與商業的人變得更加重要。

內容:

最近看了許多關於 AI Agent、自動寫程式、十分鐘做完一套系統的分享,坦白說,一開始看到確實會覺得很震撼。但看得越多,反而越有種似曾相識的感覺。每隔幾年,科技圈總會出現一次「這次真的不一樣」的浪潮,從雲端、大數據、區塊鏈,到現在的 AI。真正有趣的不是技術本身,而是每次熱潮過後,留下來的究竟是什麼。最近越來越感受到,AI 並沒有讓軟體開發變得更簡單,而是讓大家重新認識什麼才是真正困難的事情。

很多人把軟體開發理解成寫程式碼,因此當 AI 可以快速產生程式碼時,就開始擔心程式設計師是否即將消失。但如果實際參與過大型專案,就會發現寫程式往往只佔整體工作的一小部分。真正耗費時間的,是理解需求、協調不同單位的期待、規劃系統邊界、設計資料流向、處理權限問題、評估風險,以及思考未來三到五年的擴充可能性。這些事情沒有標準答案,也不是靠生成幾千行程式碼就能解決的。程式碼只是最後的結果,而不是價值本身。

我覺得目前最大的誤解,是很多人把獨立開發者的成功模式,直接套用到企業級系統上。個人專案失敗了,大不了重新來過;但企業系統不同。銀行、醫院、保險公司、物流公司,這些系統背後連結的是金流、病歷、供應鏈與法律責任。一個看似微小的錯誤,可能影響數萬甚至數百萬人。對這些組織而言,速度從來不是第一順位,穩定、安全、可追溯才是。AI 可以幫助開發更快,但沒有人願意拿核心業務去賭一次未經驗證的自動生成結果。

這兩年其實也看到一個有趣的現象。剛開始大家都在討論 AI 會不會取代工程師,後來開始瘋狂追逐各種 Agent 平台,再接著不少團隊發現專案裡充滿了 AI 生成的程式碼垃圾。表面上看起來架構完整、命名漂亮、文件齊全,但實際維護時卻到處是隱藏問題。最後大家花更多時間在理解 AI 為什麼這樣寫,而不是解決真正的業務問題。這時候很多人才突然發現,寫程式其實不難,理解系統才難;產生程式碼很容易,驗證程式碼才昂貴。

如果把 AI 看成工具,我覺得它更像是一把威力強大的電動工具。擰螺絲的速度快了十倍、百倍,但不代表拿著工具的人就突然變成建築師。真正能夠決定房子會不會倒的,不是螺絲鎖得多快,而是設計圖是否合理、地基是否穩固、結構是否安全。未來企業真正願意花高薪購買的,恐怕也不再是單純的編碼能力,而是那些能夠判斷風險、設計架構、做出商業決策的人。因為出了問題,最後要負責任的人,永遠不會是 AI。

我自己越來越相信,AI 時代最重要的競爭力不是學會多少工具,而是提升自己的抽象思考能力與系統思維。當寫程式逐漸變成一種近乎免費的能力時,真正稀缺的將是理解問題的人。懂技術的人很多,但同時懂技術、懂商業、懂流程、懂風險的人並不多。未來的職場可能不再是人與 AI 的競爭,而是懂得駕馭 AI 的人,與只會依賴 AI 的人之間的競爭。當大家都在討論 AI 能做什麼的時候,也許更值得思考的是:如果 AI 什麼都能做,那麼只有人類才能做的事情,究竟還剩下什麼?

四天打造企業級知識萃取系統:AI 代理人驅動開發的完整剖析

 

四天打造企業級知識萃取系統:AI 代理人驅動開發的完整剖析

寫作目的: 本文記錄一段真實的開發歷程——從一個預設好的專案腳手架開始,在 AI 代理人工具的輔助下,四天內建構出具備完整功能的企業級知識萃取平台。這份文件同時是技術分析、方法論總結,也是對未來合作夥伴說明:AI 代理人時代,一個掌握正確方法的人究竟能做到什麼程度。


第一章 成果概覽:四天的數字說話

系統簡介

KMCollector 是一套企業級知識萃取平台,核心功能包含:

  • 多平台媒體轉錄:YouTube、抖音、通用影片連結,自動下載音訊後以 OpenAI Whisper 轉錄為文字,支援分段處理(克服 1400 秒限制)、繁體中文自動保底
  • 文件萃取:透過 MarkItDown 將 PDF、Word、Excel 等文件轉換為結構化 Markdown
  • 分類與團隊管理:多標籤分類系統、RBAC 團隊權限控管(非管理員只能存取公開或授權團隊的紀錄)
  • 完整 CRUD 後台:使用者、角色、專案、工作、會議、音訊轉錄、文件萃取全模組
  • 企業基礎設施:Cookie 認證、多語系(zh-TW / en-US)、分散式快取(Memory / Redis)、健康監控、NLog 日誌、Swagger API

技術規模

指標數值
開發天數4 天(97 小時)
Git Commits117 個
版本迭代32 個版本(v0.2.10 → v0.2.41)
原始碼檔案292 個(.cs + .razor)
說明文件50 份(架構、PRD、SOP、規格、發行說明)
資料庫 Migration12 組(雙資料庫,SQLite + SQL Server)
單元測試9 個測試模組
自動化腳本5 個 PowerShell 腳本
外部整合OpenAI Whisper、ffmpeg、yt-dlp、Playwright、MarkItDown

程式碼規模:從腳手架到完成品

統計說明: 腳手架為 commit c5cad3cb(2026-06-02 08:55,重命名 MyProject → KMCollector 的第一個業務 commit),初始 commit 只有 README.md 與 .gitignore 共 2 個檔案。

項目腳手架起點四天後完成增加量
C# 原始碼(.cs)15,682 行 / 128 個檔案33,836 行 / 250 個檔案+18,154 行(+115%)/ +122 個檔案
Razor 元件(.razor)2,167 行 / 34 個元件2,986 行 / 42 個元件+819 行(+38%)/ +8 個元件
說明文件(.md)537 行8,205 行+7,668 行(+14 倍)
PowerShell 腳本(.ps1)326 行657 行+331 行(+102%)
Node.js 工具(.mjs)0 行277 行+277 行(新增)
源碼合計(.cs + .razor)17,849 行36,822 行+18,973 行(+106%)

從這些數字看到了什麼?

把兩個時間點的程式碼數字放在一起比較,第一個引人注意的事實是:完成品的 36,822 行源碼中,有 17,849 行(佔 48.5%)來自腳手架。這些不是業務代碼,而是認證、授權、多語系、健康監控、日誌、快取等「每個企業系統都必須有,但與業務邏輯完全無關」的基礎設施。如果從零開始打造這層基礎,一個有經驗的工程師至少需要 2–4 週。腳手架讓這部分成本在四天的計算中直接消失——這是時間壓縮的第一個槓桿。

四天內真正新增的 18,973 行,才是這個專案獨有的業務靈魂:音訊轉錄的分段處理邏輯、文件萃取的格式轉換、抖音的 Playwright 自動化整合、分類與團隊的 CRUD 模組、RBAC 跨記錄權限控管、分享文字的 URL 自動解析……每天平均產出 4,743 行有明確業務目的的代碼,沒有填充、沒有廢棄路徑。

文件的數字更能說明問題。源碼在四天內增加了 106%,而說明文件卻增加了 1,428%,幾乎是 14 倍的成長。從 537 行增至 8,205 行,涵蓋架構設計、PRD、操作 SOP、部署說明、發行說明。這在傳統開發中幾乎是不可能的事——文件永遠是待補狀態,技術債的形式不只有程式碼,更大的債務往往藏在沒有人寫完的文件裡。AI 代理人把「邊開發邊同步文件」從一個口號變成了可執行的工作節奏。

從代碼的結構品質看,122 個新增的 C# 檔案平均每個 149 行。這個數字透露了一件重要的事:AI 產出的程式碼遵循單一職責原則,每個 Service、Helper、Client 都是焦點明確的小型類別,而非一個包山包海的上帝類別。新增的 8 個 Razor 元件平均 102.4 行,比腳手架原有元件(平均 63.7 行)稍複雜,因為它們承載了多選標籤、即時過濾、團隊權限聯動等實質業務互動,複雜度與功能密度完全匹配。


這代表什麼?傳統開發 vs. AI 代理人開發的成本對比

傳統開發:需要一個什麼樣的團隊?

要用傳統方式建構相同功能的系統,一個負責任的交付團隊通常需要以下角色同時到位。

專案經理(PM) 負責需求訪談、功能清單整理、進度追蹤、跨角色溝通協調,以及最終的驗收確認。這個角色光是做好需求釐清與規格文件,就需要 1–2 週的投入,整個專案期間持續消耗工時。

UI/UX 設計師 負責使用者介面設計、互動流程規劃、元件視覺稿的繪製與修改。即使採用現成的設計系統(如 AntDesign),仍然需要設計師針對各個功能頁面做佈局決策、體驗優化與設計審核,最少需要 2–3 週的設計工作量。

後端工程師(資深,1–2 人) 負責資料模型設計、資料庫 Migration、Service 層業務邏輯、Web API 設計與實作、外部服務整合(OpenAI、ffmpeg、yt-dlp、Playwright)。這是工作量最重的部分,保守估計需要 4–6 週。

前端工程師(1 人) 負責 Blazor 元件實作、與後端 API 串接、多語系整合、UI 互動邏輯。本專案的 Blazor 前端複雜度中等,包含多選標籤、即時搜尋、權限聯動顯示,估計需要 2–4 週。

QA 測試工程師 負責測試案例設計、單元測試與整合測試撰寫、手動功能驗証、回歸測試。這個角色的工作並非只在最後衝刺,而是要跟著每個功能模組同步進行,整體需要 2–3 週。

技術文件負責人(兼任或專人) 負責架構文件、操作 SOP、部署說明、API 文件的撰寫與維護。傳統開發中文件往往是最被壓縮的工作,但本專案交付了 50 份完整文件,若要做到同等品質,至少需要 1–2 週的文件工作量。

傳統開發的時間與成本估算

將上述角色的工作週期疊加,考慮到需求確認、設計迭代、開發返工、測試修正等常見的摩擦成本,完成相同功能範圍的系統,實際需要 2–3 個月(8–12 週),且這還是在需求清晰、溝通順暢的理想情況下的估算。

以台灣市場的中高階人力成本計算:

角色月薪估計投入時間人力成本
專案經理NT$80,0002.5 個月NT$200,000
UI/UX 設計師NT$70,0001.5 個月NT$105,000
資深後端工程師NT$100,0002.5 個月NT$250,000
後端工程師(協作)NT$80,0001.5 個月NT$120,000
前端工程師NT$90,0002.5 個月NT$225,000
QA 測試工程師NT$70,0002 個月NT$140,000
技術文件(兼任)NT$60,0001 個月NT$60,000
合計NT$1,100,000

加計管理費用、員工勞健保與福利(約 30%)後,總用人成本約 NT$143 萬(約 4.4 萬美元)。若是外包給系統整合商,考慮到專案管理利潤與風險溢價,報價通常在 NT$200–300 萬 之間。

AI 代理人開發:實際投入了什麼?

這個專案的實際資源投入是:1 個人、4 個工作天

開發者人力成本(以相同的資深工程師薪資計算):4 天 × NT$5,000/天 ≈ NT$20,000。AI 工具訂閱與 API 費用(Claude Code、OpenAI Whisper API):約 NT$3,000–8,000。實際總成本:約 NT$23,000–28,000,不到傳統開發的 2%。

更關鍵的是時間。傳統方式需要 8–12 週,AI 代理人方式完成只需 4 天。時間縮短了 95% 以上。對於需要快速驗證市場假設的新創企業,或需要在有限預算內交付系統的中小型組織,這個差距直接決定了一個商業機會能否被把握住。

一個人,抵得上多少人力?

若以「人月」(person-month)為單位計算,傳統方式需要約 13–14 人月的工作量才能完成相同的交付成果。AI 代理人方式由 1 人在 4 天內完成,換算約 0.13 人月。兩者相比,效率差距約為 100 倍

然而,更準確的理解方式不是倍數,而是角色替代。在這 4 天裡,同一個人同時扮演了:PM(撰寫 PRD 與設計文件)、後端架構師(資料模型、API 設計、服務分層)、後端工程師(業務邏輯實作)、前端工程師(Blazor 元件、互動邏輯)、QA(單元測試、整合驗証)、技術文件負責人(50 份文件),以及 DevOps(部署腳本、環境配置)。

AI 代理人工具讓這一切成為可能的方式,不是讓一個人「更快地完成每件事」,而是讓許多原本需要等待他人、協調接口、反覆溝通的工作,直接在一個上下文中無縫串接。消除的不只是人力成本,消除的更是溝通成本、等待成本、認知切換成本——這些才是傳統協作模式裡真正讓時間消失的黑洞。

一個掌握 AI 代理人工具、具備正確方法論的開發者,在今天的市場裡,能夠獨立承擔一個原本需要 6–7 人團隊才能交付的專案範疇。這不是誇大,這是有 git 歷史為證的事實。


第二章 開發歷程:五個階段的演進

階段一:框架搭建(第 1 天上午,約 2 小時)

從腳手架到可運行系統

這個專案從一個預先準備好的腳手架(starter project)出發。腳手架已預先整合:登入認證、角色管理、AntDesign 元件庫、多語系、健康監控、NLog 日誌等基礎建設。

這一階段的工作是「個人化初始化」:

  • 修正系統名稱綁定設定(不再是硬編碼範本名稱)
  • 調整選單 Z-index 問題
  • 整理文件目錄結構為 7 個分類
  • 建立 MediaTranscription 資料庫 Entity 與初始 Migration

關鍵洞察: 好的腳手架節省了 90% 的基礎設施時間。不從零開始,而是從「已解決共同問題的起點」開始。


階段二:核心功能實作(第 1–2 天,約 12 小時)

音訊/影片轉錄完整鏈路

版本功能
0.2.14FFmpeg 絕對路徑配置
0.2.15轉錄處理器逐段進度日誌
0.2.16文件萃取功能(MarkItDown 整合)
0.2.18YouTube 來源 + 語言選擇 + 繁體中文保底
0.2.20依音訊時長自動分段(修正 OpenAI 1400 秒上限)

這階段最關鍵的技術決策是音訊分段策略:OpenAI Whisper API 有時長限制,必須實作 MediaChunker 自動計算分段計畫,再並行送出轉錄請求、依序合併結果。這不是一個簡單問題,但 AI 代理人在有清楚規格的情況下,一次就設計出正確架構並配套寫出測試。


階段三:多平台整合(第 2–3 天,約 8 小時)

突破平台壁壘

YouTube 有完整 API 支援,相對容易。抖音則有強力的反爬蟲機制。

解法:用 Playwright 自動化瀏覽器模擬真實使用者登入、攔截音訊串流 URL,再下載。這需要:

  • 一個 Node.js 助手腳本(get-douyin-audio.mjs)控制 Playwright
  • 一個初始化腳本(douyin-init.mjs)處理 Cookie/登入狀態
  • C# 端的 DouyinAudioDownloader 呼叫 Node.js 子程序

這個跨語言(C# ↔ Node.js)、跨技術棧的整合,同時產出了完整的部署 SOP 與設計文件。

抽象化設計: 同時設計了 MediaUrlDownloader,統一處理「任意影片連結」來源,並實作 ShareTextParser 自動從分享文字中提取 URL 與標題。


階段四:資料治理與權限控管(第 3–4 天,約 16 小時)

企業級的資料隔離

版本功能
0.2.34分類清單 CRUD
0.2.35團隊清單 CRUD
0.2.36紀錄加入分類/團隊標籤欄位與過濾
0.2.37角色預設團隊與紀錄團隊權限控管
0.2.38紀錄預帶入使用者授權團隊

這階段引入了最複雜的業務邏輯:RBAC(角色基礎存取控制)的延伸。非管理員使用者只能查看「無團隊(公開)」或「與自己角色所屬團隊有交集」的紀錄。

實作涉及:

  • IRecordAccessScopeProvider(定義存取範圍介面)
  • TagStringHelper(分隔字串格式的標籤轉換與精確比對)
  • TeamJsonHelper(JSON 格式的角色→團隊映射)
  • 6 個資料庫 Migration(分類、團隊、標籤各 2 個,Sqlite + SQL Server 各一套)

全部配套 PRD 文件、測試模組、發行說明。


階段五:細節打磨(第 4 天,約 4 小時)

讓系統在真實環境中穩定運行

  • 修正 NLog 及 yt-dlp 的 UTF-8 編碼問題(CJK 字元亂碼)
  • 編輯紀錄時可修改原始檔名
  • 抖音腳本支援 --ffmpeg 外部路徑參數(解決新機器部署問題)
  • 輸出 ffmpeg 錯誤訊息以診斷 ExitCode=4
  • 新增外部工具一鍵安裝 PowerShell 腳本

這階段的特點是「問題驅動」:在真實部署環境中發現問題,快速診斷、快速修復。每個問題平均耗時不超過 20 分鐘。


第三章 AI 代理人為何能做到這一切:機制分析

3.1 零切換成本的全域知識

傳統開發中,工程師需要不斷在不同視窗間切換:IDE、Stack Overflow、API 文件、Jira、設計文件……每次切換都是認知成本。

AI 代理人的上下文窗口可以同時持有:

  • 整份需求規格
  • 相關程式碼片段
  • 架構設計原則
  • 歷史決策記錄(CLAUDE.md 中的不變量)

結果: 生成的程式碼天然符合既有架構風格,不需要事後「對齊」。

3.2 規格→程式碼的直接轉換

只要需求夠清楚,AI 代理人可以:

PRD(產品需求文件) → 資料庫 Entity + AutoMapper Profile → Service 層(CRUD 方法) → Controller(Web API) → Blazor 頁面(AdapterModel + 檢視邏輯) → 單元測試 → 發行說明

這整條鏈路,AI 可以在一次對話中完成,而且每個環節都遵循 CLAUDE.md 裡定義的不變量(雙資料庫 migration、建構式注入、精確標籤比對…)。

傳統方式: 一名工程師完成這條鏈路需要 1–2 天。
AI 代理人: 30–60 分鐘(大量時間花在人工審查上,而非生成)。

3.3 並行思考:程式碼與文件同時產出

每一個功能的 commit 都伴隨著:

  • 更新的 docs/ 文件
  • 配套的測試模組
  • 更新的 appsettings.json 版本號

這在傳統開發中幾乎不可能做到——文件永遠在「待補」狀態,測試永遠在「下週」。AI 代理人將文件和測試視為需求的一部分,而非附加工作。

3.4 即時錯誤診斷與修正

這個專案中,許多「fix」commits 都在 feat commits 之後的 1–2 小時內出現。這不是因為程式碼品質差,而是因為真實環境總是與開發環境不同

AI 代理人的優勢在於:

  • 給它錯誤訊息(如 ffmpeg ExitCode=4),它能立刻識別問題根源
  • 給它重現步驟,它能設計正確修復方案
  • 修復完成後立刻重寫測試來覆蓋這個案例

診斷速度比傳統方式快 5–10 倍,因為它不需要「搜尋問題」,它直接分析。

3.5 守護不變量的「護欄機制」

這個專案在 CLAUDE.md 中定義了多條關鍵不變量(如:所有查詢必須套用團隊權控、雙資料庫 migration 等)。

AI 代理人在每次生成程式碼前都會讀取這些規範,確保新程式碼不違反既有設計決策。這相當於有一個永遠在場、永遠記得所有規則的資深同事在 review 每一行程式碼。


第四章 核心方法論:如何正確駕馭 AI 代理人

方法一:從好的腳手架出發

不要從零開始。好的腳手架已解決了「所有專案都會遇到的共同問題」:認證、授權、日誌、健康監控、CI/CD 鉤子……

每次都從空白頁面開始,是在重複浪費時間。

本專案的腳手架預先包含: 25+ 個預整合功能,讓開發者第一天就能專注在「這個專案獨有的業務邏輯」上。

方法二:規格先於程式碼

每個功能在實作前,都先有:

  1. PRD(產品需求文件):What + Why + Success Criteria
  2. 設計文件:How(架構、資料流、介面設計)

AI 代理人的程式碼品質與輸入規格的清晰度直接相關。模糊的需求產出模糊的程式碼;清晰的規格產出精確的實作。

本專案的 50 份文件不是「事後補寫」,而是「實作的前提條件」。

方法三:用護欄替代事後 Code Review

CLAUDE.md(或 AGENTS.md)定義的不變量就是護欄。這些護欄不是給人看的建議,而是 AI 代理人每次行動前的強制檢查清單。

護欄機制確保:

  • 新加入的程式碼自動符合架構規範
  • 不會因為「AI 沒注意到」而引入安全漏洞或技術債
  • 每個開發者(包括 AI)都遵循相同的編碼標準

方法四:版本作為完成的儀式

本專案規定:每次可建置的異動 = 一個版本號 + 一個 Commit

這個規定看似繁瑣,實際上創造了:

  • 清楚的「完成」定義(不是「大概差不多」,是「版本號已遞增」)
  • 可追溯的決策歷程(每個版本對應的 commit 訊息說明了為什麼)
  • 回滾的錨點(任何一個版本都是穩定可部署的狀態)

4 天 32 個版本 = 平均每 3 小時完成一個可部署的功能增量。

方法五:問題驅動的真實環境驗證

每一個「fix」commit 背後都是真實的問題:

  • 在不同機器上部署時發現的路徑問題
  • CJK 字元在 Windows 終端的編碼問題
  • 第三方平台(抖音)的反爬蟲機制

不逃避真實環境的測試,用問題驅動快速迭代。真實問題比假設的測試案例更有價值。


第五章 AI 新紀元的個人能力圖譜

在 AI 代理人工具出現之前,一個人的開發能力等於「他能寫多少程式碼、記住多少 API」。

在 AI 代理人時代,這個等式改變了。

5.1 價值轉移:從「執行者」到「指揮者」

舊範式新範式
會寫程式會定義問題
記得 API 文件能判斷 AI 輸出的正確性
快速編碼快速定義規格
解決技術問題分解複雜業務問題
寫測試驗程式碼寫規格驗業務假設

AI 代理人是高效的執行者,但它需要一個清楚知道「要執行什麼、為什麼」的指揮者。

5.2 核心能力一:領域知識

AI 代理人可以生成抖音下載器的程式碼,但它不知道你的業務場景為什麼需要抖音下載器,也不知道使用者的痛點在哪裡

領域知識讓你能夠:

  • 定義正確的成功標準
  • 識別 AI 輸出中的業務邏輯錯誤
  • 做出 AI 無法做的架構取捨決策

沒有領域知識的 AI 使用者,是在請一個聰明但對業務一無所知的助手工作。

5.3 核心能力二:清晰溝通(Prompt Engineering)

AI 代理人的輸出品質 = 輸入描述的清晰度。

清晰溝通不是「學會特定咒語」,而是訓練自己:

  • 明確說明目標(不是「做一個下載器」,是「從抖音分享連結中提取 MP3 音訊,支援 DASH 與合併 MP4 兩種格式,輸出到指定路徑」)
  • 說明限制條件(「必須支援 Windows 路徑,不能依賴全域環境變數」)
  • 定義成功標準(「轉錄完成後,音訊時長誤差不超過 5 秒」)
  • 提供上下文(「這個系統的其他下載器都實作了 IMediaDownloader 介面,新的也要遵循」)

5.4 核心能力三:品質判斷

AI 代理人很少「完全錯誤」,但經常「看起來對、其實有細微問題」。

品質判斷能力包含:

  • 能夠 code review AI 的輸出
  • 識別可能的資安漏洞(SQL injection、XSS、未授權存取)
  • 識別架構不一致(違反既有設計模式)
  • 識別邊界案例沒有處理

這需要真正的工程素養,不是被 AI 取代的能力,而是使用 AI 的必要前提。

5.5 核心能力四:系統思考

單個功能 AI 可以完美實作,但功能之間的依賴、架構的整體一致性、技術債的累積——這些需要系統思考能力。

本專案的 CLAUDE.mddocs/architecture/開發慣例與限制速查.md 就是系統思考的結晶:把跨功能的設計決策明確化,讓整個系統在快速迭代中保持一致性。

5.6 核心能力五:敏捷調整

AI 的輸出不是一次就完美的,而是「第一個版本夠好,可以快速迭代改進」。

敏捷調整的能力包含:

  • 接受「夠好但不完美」的初版輸出
  • 快速識別需要調整的部分
  • 用清楚的反饋引導 AI 做精準修正(而不是「這不對,重來」)

本專案 117 個 commits 中有 13 個 fix commits,fix 率 11%。 每個問題從發現到修復平均不超過 20 分鐘。

5.7 工作方式的轉變:從「一個人寫程式」到「指揮 AI 團隊」

傳統開發:1 個工程師,1 條工作線,串行完成。

AI 代理人開發:1 個指揮者,N 個並行的 AI 代理人:

  • 代理人 A 正在寫後端 Service 邏輯
  • 代理人 B 同時在寫對應的測試
  • 代理人 C 同時在更新 PRD 文件
  • 指揮者在審查輸出、做架構決策、規劃下一步

效率倍數不是 2x,而是 5–10x,因為是並行的,不是串行的加速。


第六章 成功的前提:什麼是 AI 工具無法替代的

AI 代理人做不到的事

列出這些,不是要貶低 AI,而是要說明指揮者的價值在哪裡

  1. 理解使用者的真實痛點(AI 只知道你說的,不知道使用者沒說出口的)
  2. 做優先順序決策(應該先做哪個功能?資源有限時砍哪個?)
  3. 評估業務風險(這個設計決策的商業後果是什麼?)
  4. 建立人際信任(客戶、同事、合作夥伴的關係)
  5. 判斷「夠好了」的時機(完美是效率的敵人)

讓 AI 工具發揮最大效益的前提

  1. 你知道要解決什麼問題(問題定義能力)
  2. 你能評估解決方案的品質(技術鑑賞力)
  3. 你有護欄保護系統不偏軌(CLAUDE.md、不變量文件)
  4. 你有好的起點(可複用的腳手架,不從零開始)
  5. 你有紀律做版本管理(每個增量都是可部署的狀態)

第七章 結語:給合作夥伴的話

我能帶來什麼

這個專案是一個存在於 git 歷史中的真實證明:

我能夠在四天內,以一個人的資源,交付:

  • 具備企業功能完整度的 Web 應用系統
  • 完整的技術文件(架構、PRD、SOP、發行說明)
  • 可維護的程式碼(測試覆蓋、清晰架構、雙資料庫 migration)
  • 可部署的生產就緒系統

這不是運氣,也不是一次性的衝刺。這是一套可複現、可擴展的方法論

這代表什麼樣的合作可能性

傳統合作模式AI 代理人時代的合作模式
「招 5 個工程師,6 個月後上線」「1 個懂方法的人,配合清晰需求,4 週可以上線可用版本」
文件永遠落後於程式碼文件與程式碼同步生成
技術債隨時間累積護欄機制防止架構腐化
需要完整規格才能開始可以邊做邊細化,快速驗證假設

如何合作才能最大化效益

對合作夥伴最重要的一點:你的業務知識 + 我的方法論 = 快速交付真正有價值的系統。

我最需要從合作夥伴那裡獲得的不是技術需求,而是:

  1. 真實的使用者問題(不是「我要一個系統」,是「使用者在哪個步驟卡住了」)
  2. 優先順序的判斷(什麼功能必須有、什麼可以之後再說)
  3. 成功的定義(系統上線後,什麼樣的結果代表成功)

有了這三樣,AI 代理人工具就能以你無法預期的速度,把它們轉換成可運行的系統。


附錄:開發統計數字一覽

提交活動分布

日期 Commits 主要里程碑 ───────────────────────────────────────────── 2026-06-02 34 框架搭建 + 音訊轉錄基礎 2026-06-03 25 完整轉錄鏈路 + 文件萃取 2026-06-04 34 抖音整合 + 多平台支援 2026-06-05 21 分類/團隊 CRUD + 權限控管 2026-06-06 3 抖音腳本微調 ───────────────────────────────────────────── 合計 117 平均 29.25 commits/天

版本演進時間軸

v0.2.10 框架個人化(06-02 09:30) v0.2.13 音訊轉錄資料模型(06-02 14:58) v0.2.16 文件萃取(06-03 10:36) v0.2.18 YouTube 來源整合(06-03 13:17) v0.2.20 音訊分段策略(06-03 14:06) v0.2.22 抖音 Playwright 整合(06-04 11:11) v0.2.27 分享文字自動解析(06-04 14:25) v0.2.34 分類清單 CRUD(06-05 09:18) v0.2.35 團隊清單 CRUD(06-05 10:04) v0.2.37 RBAC 團隊權限控管(06-05 14:59) v0.2.41 抖音腳本完善(06-06 11:08)

提交類型分布

類型數量說明
feat(功能新增)32每個都是可展示的功能增量
docs(文件)15與程式碼同步生成,非事後補寫
fix(錯誤修正)13真實環境問題快速修復
chore(維護)7配置、腳本、工具整合
refactor(重構)1必要時的架構調整




[AI 分享] AI賺錢不是工具問題,而是工作流問題

 [AI 分享] AI賺錢不是工具問題,而是工作流問題

摘要 : 多數人用AI賺不到錢,不是能力不足,而是缺少一套能持續產出價值與變現的完整流程。

內容:

最近發現一個很有趣的現象,很多人對 AI 的期待其實很高。看到別人分享收入、流量、接案成果,總覺得只要買個會員、學幾個提示詞,好像就能快速複製成功。但真正開始操作後,卻常常卡在第一步,不知道該做什麼,也不知道下一步在哪裡。最後留下的不是成果,而是一堆收藏的影片和滿滿的焦慮感。

後來慢慢發現,問題從來不在工具本身。今天有人說寫文章最好賺,明天有人說做圖片最有前景,後天又有人說自動化才是未來。大家一直在追新的工具、新的方法,卻很少有人告訴你,從開始到賺到第一筆錢,中間到底要經過哪些步驟。沒有完整路徑,再強大的 AI 也很難產生價值。

我觀察到很多真正有成果的人,他們不是比別人更會寫提示詞,而是比別人更懂得拆解需求。他們不會一開始就想做一個給所有人使用的大產品,而是先找到一群有明確痛點的人。因為市場上最有價值的產品,往往不是功能最多的,而是最能解決特定問題的那一個。

這讓我想到一件事。在 AI 時代,真正值錢的已經不只是內容,而是「解決方案」。同樣是一份資料、一組模板、一套提示詞,如果能幫助某個職業、某個產業、某個場景節省時間或增加收入,它的價值就完全不同。很多人以為自己在賣文件,其實真正賣的是結果。

有時候我們會羨慕那些看起來輕鬆獲利的人,但仔細研究後會發現,他們背後都有一套固定流程。從市場研究、需求分析、產品設計、內容產出,到銷售與優化,每個環節都經過反覆驗證。AI 只是讓這些工作變得更快,而不是直接幫你完成商業模式。

如果要說這波 AI 浪潮帶給我最大的體悟是什麼,我會說:不要急著找下一個熱門工具,而是先建立自己的工作流。當你擁有一套能持續創造價值的流程時,工具更新再快都不是問題;但如果只有工具,沒有流程,那麼永遠都會在追逐下一個風口的路上。

[AI 分享] 從筆記工具到個人知識作業系統

 [AI 分享] 從筆記工具到個人知識作業系統

摘要 : Obsidian 的價值不在記筆記,而在讓知識能被累積、連結、重用,並成為 AI 時代可持續成長的個人知識資產。

內容:

最近看到不少人在討論知識管理工具,但我發現很多人一開始就走錯方向。大家總是在比較哪個工具功能最多、外掛最強、介面最漂亮,卻很少思考一個更重要的問題:這些筆記,半年後、一年後,甚至三年後,你還找得到、用得到嗎?真正有價值的從來不是記錄本身,而是知識能否持續沉澱並被重新利用。

觀察很多人的學習過程,都有一個共同現象。還沒開始寫內容,就先花大量時間設計分類架構、規劃資料夾層級、研究外掛功能。結果系統越做越複雜,真正的內容卻少得可憐。後來才慢慢理解,好的知識庫不是先設計出來的,而是在持續使用的過程中自然長出來的。內容永遠比架構重要,輸出永遠比收藏重要。

我自己很認同一個觀念:筆記其實不應該是一座倉庫,而是一張網路。當不同想法開始彼此產生關聯,會議記錄連到專案計畫,讀書心得連到工作經驗,靈感連到過去的觀察,那些原本零散的資訊才開始產生價值。很多時候真正有用的答案,不是在某一篇筆記裡,而是在多篇筆記交會的地方。

另外一個值得思考的現象是,很多人對於知識管理的焦慮,其實來自於過度追求完美系統。今天流行一種方法,明天又看到另一種架構,最後一直在重建系統,卻沒有真正累積知識。其實不存在放諸四海皆準的方法,每一套架構都是為了解決特定問題。有人需要管理專案,有人需要累積研究資料,有人需要整理長期想法,只要能解決當下問題,就是適合自己的方法。

進入 AI 時代後,我越來越覺得個人知識庫的重要性正在快速提升。因為 AI 很擅長理解結構化、有來源、有脈絡的資訊,但面對散落在各個資料夾、聊天記錄、文件與網頁中的內容時,效果往往大打折扣。當我們把知識整理成可閱讀、可搜尋、可引用的形式,其實不只是方便自己查找,也是在替未來的 AI 協作者建立工作基礎。

最後我認為,知識管理這件事最值得投資的地方,不是工具本身,而是養成持續記錄與整理的習慣。與其花一個月研究工具,不如花三十天每天留下幾則有價值的筆記。當內容開始累積,關聯開始形成,AI 開始能理解你的知識脈絡時,你會發現自己建立的早已不是筆記系統,而是一套屬於自己的第二大腦,以及未來能持續增值的個人智慧資產。

[AI 觀察] 當Windows開始說Linux的語言

 [AI 觀察] 當Windows開始說Linux的語言

摘要 : 微軟將Linux常用工具原生帶入Windows,背後反映的不只是功能更新,而是整個軟體產業從陣營對立走向生態融合的重要轉變。

內容:

最近看到一則消息,乍看之下好像只是作業系統新增了幾個命令工具,但仔細想想,卻讓人感受到一個時代正在慢慢改變。微軟開始把許多 Linux 世界裡最經典、最常用的工具直接帶進 Windows,而且還是原生支援。對一般使用者來說可能沒什麼感覺,但對很多開發者而言,這其實是一個很有象徵意義的訊號。

如果是十幾年前接觸過軟體開發的人,大概都經歷過那種「工作在 Windows、開發在 Linux」的時代。為了讓兩邊環境能夠互通,我們安裝各種工具、模擬層與轉換方案,每天都在不同系統的操作習慣之間切換。那時候大家總覺得這是一件理所當然的事情,但現在回頭看,其實那代表著軟體世界一直存在著一道看不見的牆。

有趣的是,這幾年這道牆正在被一點一點拆除。從開源工具、容器技術、雲端平台,到今天直接把 Linux 的基礎工具整合進 Windows,整個產業似乎都朝著同一個方向前進:降低環境差異,減少切換成本,讓開發者把時間花在創造價值,而不是解決工具相容問題。

更值得觀察的是微軟態度的變化。過去大家習慣把 Windows 與 Linux 看成兩個不同陣營,但現在這種界線越來越模糊。因為在 AI、雲端、大數據與容器化技術盛行的今天,開放與協作往往比封閉與競爭更重要。誰能吸引更多開發者,誰就更有機會成為下一個技術浪潮的中心。

我一直覺得,真正影響產業方向的事情,很多時候不是那些聲勢浩大的發表會,而是一些容易被忽略的小細節。當一家公司開始主動適應開發者,而不是要求開發者適應平台時,背後其實反映的是整個商業策略與生態思維的轉變。這種改變不一定會立刻帶來震撼,但往往會在幾年後回頭看時,發現它才是真正的分水嶺。

或許未來的軟體世界,大家不再那麼在意自己是 Windows 派還是 Linux 派。因為系統本身正在逐漸退居幕後,真正重要的事情變成:你能不能更快完成工作、更快驗證想法,以及更快創造價值。當工具之間的界線越來越模糊,留下來的競爭力,終究還是來自於人的創造力與解決問題的能力。


[AI 分享] AI落地的真正起點,不是工具,而是資產

 [AI 分享] AI落地的真正起點,不是工具,而是資產

企業導入 AI 不只是選工具,更重要的是思考知識與資料如何沉澱。從單點應用到系統化平台,真正的價值來自企業長期累積的業務資產。

最近和不少企業主管聊天,發現大家談 AI 的時候,常常走向兩個極端。

一種是看到什麼 AI 工具都想導入,文案生成、客服助理、數據分析、影音製作全部一起上,然後用每個月消耗多少 Token 來衡量轉型成果。另一種則是希望一步到位,直接打造一個能串聯所有部門的 AI 平台。兩種做法其實都沒有絕對對錯,只是背後代表的是不同階段的思維。

如果把 AI 落地看成一條路,我認為第一階段是「單點應用」。選擇一個明確、重複性高、容易量化成果的工作切入,例如內容產生、資料整理或報表分析。這類應用成本低、見效快,也最容易讓團隊建立信心。但它帶來的通常是局部效率提升,而不是整體能力升級。

再往上一層,是讓 AI 開始接手完整的業務流程。這時候重點已經不是工具本身,而是企業是否把流程、經驗、成功與失敗的原因整理出來。因為 AI 能否做出好的判斷,很大程度取決於企業願意提供多少可被學習的知識。這個階段開始出現一種很有趣的現象:系統越用越好,經驗會持續累積,而不是每次都重新開始。

而真正值得關注的,可能是第三個階段。未來企業裡不會只有一個 AI,而是許多不同角色的 AI 協同工作。市場資訊、產品研發、行銷策略、客服服務與知識管理彼此串聯,形成一個共享資料與知識的運作體系。這時候競爭的焦點就不再是誰用了哪個模型,而是誰擁有更完整、更乾淨、更有價值的知識資產。

這段時間最大的感觸是,很多企業其實不是缺 AI,而是缺少能被 AI 使用的知識。大量經驗散落在員工腦中、Excel 檔案裡、會議紀錄中,甚至跟著離職員工一起離開公司。當知識沒有變成組織資產,再強大的 AI 也只能發揮有限效果。

所以我越來越認為,AI 落地最重要的問題不是先買哪個工具,而是先回答一個問題:公司的知識、流程與經驗,未來要沉澱在哪裡?因為 AI 不會憑空創造能力,它只會把你原本累積的能力與資產,以更快的速度放大出來。

[AI 觀察] AI Agent 工具大亂鬥:功能愈強,選擇反而愈困難

 [AI 觀察] AI Agent 工具大亂鬥:功能愈強,選擇反而愈困難

最近體驗多款 AI Agent 桌面工具後發現,真正的挑戰不是能力不足,而是如何理解不同工具的定位與適用情境。

最近這幾天,我花了一些時間實際體驗幾套熱門的 AI Agent 桌面工具。原本以為答案會很簡單,誰比較強就用誰,但實際使用後才發現,問題根本不是哪個比較厲害,而是每個工具正在往不同方向演化。

有些工具強調的是直接開始工作,打開後就能聊天、搜尋、執行任務,介面直覺到幾乎不需要學習。有些工具則試圖把專案管理、文件產出、技能庫、排程、自動化全部整合進來,希望成為你的 AI 工作中心。還有一些工具則走極簡路線,把複雜度藏起來,讓使用者先專注在任務本身。

實際比較之後,我發現一個有趣的現象。當 AI 工具能力愈來愈強,介面反而開始變成新的門檻。很多功能其實都存在,但使用者未必知道該去哪裡找,更不知道什麼情境下應該使用哪一個功能。尤其是聊天、協作、專案、自動化之間的界線,對新手來說其實相當模糊。

這次我讓三套工具執行同一個任務:開發一個「今天吃什麼」的餐廳推薦網站。結果發現,它們最終都能完成任務,但過程卻完全不同。有的直接開始產生程式與預覽畫面,有的會先規劃完整設計方案再開始實作,有的則需要更多互動與引導才能進入開發流程。

如果從工程管理的角度來看,我反而開始覺得「先規劃再開發」的重要性正在重新被放大。以前大家總覺得規劃文件很浪費時間,但當 AI 可以幾分鐘完成開發時,真正影響成果品質的反而變成需求是否定義清楚,以及執行方向是否正確。

也許未來大家選擇 AI Agent 的標準,不再是模型分數高低,也不是功能清單有多長,而是它是否符合自己的工作模式。有人需要快速執行,有人需要嚴謹規劃,有人需要深度協作。當 AI 開始接管越來越多工作流程後,我們真正要學習的能力,或許已經不是怎麼使用 AI,而是如何挑選最適合自己的 AI 工作夥伴。

#AI

[AI 變革] 從操作軟體到指揮智慧體

 [AI 變革] 從操作軟體到指揮智慧體

AI 正在改變人與電腦的互動方式。未來工作的重點,可能不再是熟悉每個軟體如何操作,而是學會如何清楚描述需求,讓智慧系統替你完成整個流程。
這幾天看著各種 AI 工具的發展,我突然發現一件很有趣的事情。過去我們使用電腦時,總是在學習軟體;現在卻開始變成軟體在學習理解我們。以前完成一份報告,要自己蒐集資料、整理內容、排版輸出。現在只要把需求講清楚,剩下的工作正在逐漸交給 AI 處理。
我覺得真正重要的變化,不是生成內容變快了,而是工作流程開始被重新定義。過去一項任務往往需要在好幾個系統之間來回切換,複製貼上、整理格式、確認資訊。未來這些重複動作,很可能都會被整合成一句話、一個指令,甚至一段語音。
最近也越來越能感受到,AI 的角色正在從工具變成助手。它不只是回答問題,而是能夠主動規劃步驟、搜尋資訊、整理結果,甚至在不同系統之間協調工作。人類開始從執行者的位置,慢慢往決策者的位置移動。
另一個值得注意的現象,是資訊管理方式正在改變。每天面對大量新聞、報告、郵件和各種通知,我們真正缺的其實不是資訊,而是篩選資訊的能力。當 AI 能夠持續追蹤特定領域、主動整理重點、定期回報結果時,資訊焦慮有機會被大幅降低。
很多人認為 AI 只是幫助提高效率,但我覺得它更像是在改變工作的基本單位。過去的工作單位是「操作步驟」,現在開始變成「目標」。你不需要告訴系統每一步怎麼做,而是告訴它你想得到什麼結果。
或許未來幾年最有價值的人,不一定是最會使用軟體的人,而是最懂得拆解需求、設計流程、指揮 AI 協同工作的人。當大家都擁有強大的工具之後,真正拉開差距的,將是思考問題與定義問題的能力。

[AI 趨勢] 當辦公室不再圍繞軟體運轉

 [AI 趨勢] 當辦公室不再圍繞軟體運轉

未來的工作入口可能不再是滑鼠、鍵盤與 APP,而是隨時陪伴在身邊的 AI 智慧體。辦公模式正在從工具導向,走向目標導向的新時代。

最近看到許多科技公司的發展方向,我越來越確信一件事情:未來十年的辦公革命,可能不是來自更快的電腦或更強的手機,而是來自一種全新的工作介面。過去我們必須打開一個又一個應用程式完成工作,未來則可能只需要面對自己的 AI 助理。

回頭看過去二十年的數位化歷程,我們一直在學習各種軟體。文書軟體、郵件系統、會議工具、專案管理平台,每增加一種需求,就增加一套新的工具。但現在的趨勢似乎正在反過來。人不再需要適應工具,而是讓 AI 去理解需求,再代替我們操作工具。

我覺得最值得注意的不是硬體本身,而是背後的設計思維。當 AI 能夠持續理解你的工作內容、記住你的習慣、掌握當下環境,甚至知道你正在開會、出差或撰寫文件時,它提供的已經不只是功能,而是一種隨時在線的工作夥伴。

想像一下未來的辦公場景。走進會議室,不需要開啟錄音軟體;討論過程中,重點已經自動整理完成。離開會議室時,待辦事項、決策紀錄與後續追蹤內容早已分派給相關人員。很多過去需要花費大量時間整理的工作,可能在背景就已經完成。

更大的改變來自於工作流程本身。以前我們的工作流程是「人 → 軟體 → 結果」。未來可能變成「人 → AI → 結果」。AI 負責協調各種系統、整合資料、執行流程,而人專注於判斷方向、做出決策與創造價值。

也許再過幾年,我們回頭看現在的工作方式,就像今天回頭看傳真機一樣。那時候大家比的是誰更會操作軟體;未來比的,可能是誰更懂得與 AI 協作。當工作入口從 APP 變成智慧體,人與科技之間的關係,也將被重新定義。

2026年6月5日 星期五

〔這次我不在因為焦慮而失眠〕

 〔這次我不在因為焦慮而失眠〕

上個星期我才在思考這個問題,那就是這些AI基礎建設廠商不斷的擴增他們的AI算力。一旦每個廠商都具有一定規模的算力,而且AI模型若差不多的時候。他們該如何從總獲利呢?
在以往可能要等到幾年之後觀察哪些廠商在這場戰爭中,因為沒有掌握到異地的收益而殞落。
謝謝總是很快了來打了一個巴掌,小龍蝦就是解決了這個問題,他解決了AI模型基建廠商的算力大量部署問題。因為有了小龍蝦。每個養龍蝦的人需要大量的算力來解決他們的問題。
更多的非一線大廠也趁著這一波龍蝦熱,打包各式龍蝦解決方案。 提供更優惠的AI算力。 這似乎成為一個全民運動。每個人都在嘗試如何用龍蝦來解決他們身旁的問題。
想要看到這波龍蝦是否真的有效益? 現在不用等太久。 也不用到年底。 也許下個月就會看到未來是否每個人,每個組織,每個公司是否都要來養一隻龍蝦。
從原來要養一隻龍蝦。 需要許多時間與技術背景才能夠開始建置出來。 到現在變成一件安裝,只需要把新台幣準備好。這其中的變化也造成了許多原有引以為傲的能力。就此消失了。
也許龍蝦的熱潮在3個月之後就會消失。 但這波AI的熱潮永遠不會消滅。 也許3個月之後就會出現猴子這樣的應用。2026年似乎都在比誰的速度快,誰能大力擁抱AI,Say能有餘常識?並且找出真正實用的方法。
當然這並不一定是需要能夠在市場上搶的商業機會更重要的是在這一波2026年的AI浪潮中,不會就此淹沒。取得接下來的比賽機會。
這樣的現象真的是十分殘酷。現在我真的覺得古代的這句話 不則退退。十分貼近現今的現象,若我自己想著。 我在觀望一段時間。 憑藉著以往的經驗。為了未來頭前投人,我一樣可以追悼大家所具有相同的規模與能力,不過真的有些殘酷。這可能要打破很多人的幻想。
因為這波的AI浪潮。 不是隻是掀起一波巨浪,隨著時間的遷移,大浪逐步打到岸上。 接著大浪消失在灘頭上。也許這波大浪淹死了許多人。透過觀察,我發現到當你看到1個大浪打來的時候。其實在這個大浪的背後又有更多的大浪已經成形或者正在醞釀中。
許多的商業模式機會紅利已經逐漸在推翻中,這是因為已經發生了許多根本上實質變化,脫離絕大多數人以往的認知。歷史可以作為借鏡。但是需要有人參悟這些未來的問題。
在我最近使用AI的過程中。 幾乎每個禮拜都有翻天覆地的變化。當我還在追逐著過去以往,我所沒有AI的知識與能力的同時。 新一波的AI能量已經撲向我眼前。 這讓我想到我是否還有能力與及慾望。 要繼續隨波逐流呢?我想我心中已經有了答案