2026年6月10日 星期三

Codex 核心功能與實戰上手

 [AI 分享] Codex核心功能與實戰上手

摘要 : 關於 Codex安裝、登入、專案實作、版本控制與Plugin擴充功能。

內容:

這篇內容主要是在完整介紹 OpenAI 的 Codex,並將它定位為一個功能很全面的 AI 開發工具。除了能寫程式、排查 Bug、執行測試之外,還能管理 Git、操作瀏覽器、控制電腦完成任務。因為功能很多,原文的重點是希望透過系統化講解,幫使用者建立一套清楚的使用思路。

整體內容大致分成三個部分。第一部分是基礎篇,重點在快速上手、安裝登入、核心設定與常見踩坑。第二部分是進階篇,聚焦版本控制、對話管理,以及更有效率地組織與推進開發任務。第三部分則是擴充篇,介紹如何透過 Plugin、Skill、Automation、Mobile 等方式延伸 Codex 的能力邊界。

在安裝與登入部分,內容提到可以直接下載 Codex 安裝到電腦上,例如在 macOS 上拖入 Applications 即可。首次開啟後,Codex 會要求登入,主要有兩種方式:一種是使用 ChatGPT 帳號登入,對應不同訂閱方案;另一種則是透過 OpenAI API Key。原文認為若是一般使用者,直接訂閱方案通常比 API 更方便,並建議至少使用 Plus 方案,才能比較完整體驗 Codex 的能力。

登入完成後,Codex 會先詢問工作類型,並提示是否匯入相關配置或設定手機版,這些步驟都可以先略過。進入主介面後,就能正式開始使用。原文透過一個「筆記軟體」作為示範案例,帶大家理解 Codex 的實際操作流程。

示範中先建立一個專案資料夾,再透過「Work in Project」功能讓 Codex 綁定這個資料夾作為工作目錄。接著直接輸入需求,例如用 HTML 寫一個左右分欄的筆記軟體:左邊是筆記列表,右邊是筆記內容,並提醒它做好測試。Codex 便會開始生成程式碼,必要時還會請求授權啟動本地伺服器來驗證結果。這裡也說明了 Codex 在執行某些操作時,會提供同意、永久允許、跳過或自訂處理方式等不同授權選項。

完成後,可以直接預覽 Codex 產出的 HTML 頁面。原文也展示了如何透過介面按鈕隱藏側欄、放大預覽區,以及持續追問來修改介面內容。這部分想傳達的是,Codex 不只是一次性生成程式碼,而是能在互動中持續迭代。

接著內容進入對話與版本管理。原文特別介紹了 fork 功能,指出它不是傳統意義上的「回滾」,而是從某一則訊息分叉出一個新的對話。fork 有兩種形式:一種是 fork into local,會沿用原本的專案目錄;另一種是 fork into new work tree,會建立一個新的獨立目錄。兩者都只會複製對話脈絡,不會自動回滾程式碼。

如果希望讓程式碼也回到先前狀態,就必須配合 Git 操作。例如先用 git log 找到對應 commit,再手動切回那個版本。原文強調,這也是為什麼 Git 在 Codex 的工作流中非常重要。特別是當對話內容與程式碼版本需要同步時,Git 幾乎是不可或缺的工具。

除了 fork,內容也介紹了對話歸檔功能。使用者可以將不需要的對話先 archive 起來,而不是直接刪除。歸檔後仍可在設定中找回、解除歸檔,或進一步永久刪除。這讓多分支、多任務並行時的對話管理更有彈性。

在 Git 自動化方面,原文提出一個常見需求:希望 Codex 每次修改完程式碼後都自動提交一次 Git commit。雖然可以直接在對話裡要求它這麼做,但這種方式只會在當前對話有效。若想讓這個規則跨對話生效,就需要在專案根目錄建立一個 agents.md 檔案。Codex 在每次新對話啟動時都會自動讀取這個檔案,並把其中內容當作長期指令執行。透過這個方式,就能把像是「每次改完程式碼都要 commit」這類規則固定下來。

後續內容也展示了功能迭代與除錯流程,例如加入淺色/深色主題切換、修復程式問題、啟動 npm 專案檢查運作狀態,以及驗證 markdown 高亮與預覽功能是否正常。這些例子都是在說明 Codex 不只是生成初版,而是能逐步參與真實開發流程中的修正、測試與優化。

在擴充能力部分,原文重點介紹 Plugin。Plugin 可以理解為 Codex 的外掛系統,用來賦予它更多外部操作能力。例如有控制電腦的、操作 Chrome 的、編輯 Excel 的,甚至還有製作簡報的。每個 Plugin 可能包含 App 與 Skill。App 比較像實際可呼叫的工具集合,Skill 則更像是提供給模型參考的操作說明與使用策略。

以 Gmail Plugin 為例,裡面包含可對郵件加標籤、封存郵件等多種 action,也有說明怎麼總結郵件、怎麼分類信件優先級的 Skill。這表示 Plugin 不只是單純增加一個按鈕,而是同時提供操作能力與任務知識。

原文也實測了 Presentations 這個 Plugin,讓 Codex 為筆記軟體產出一份介紹產品設計與技術架構的 PPT。使用者可以直接描述需求,也可以明確指定要使用哪個 Plugin。雖然產出的簡報還有進一步優化空間,但已足以作為初版內容的基礎。

另外兩個較受矚目的 Plugin 是 Chrome 與 Computer Use。Chrome Plugin 讓 Codex 能直接操作瀏覽器,例如打開 Product Hunt 首頁、搜尋今日熱門產品、逐一閱讀產品頁,再整理其特點與連結。這說明 Codex 已經不只是在本地寫程式,也能主動到網路上蒐集資訊並彙整結果。

Computer Use 則讓 Codex 可以直接操作電腦應用程式。示範中,它被要求打開系統日曆,新增一個指定日期時間的行程。Codex 會用獨立的虛擬滑鼠執行操作,不會干擾使用者本身的滑鼠與工作流程。即使在背景執行,也能持續完成指定任務。這部分很清楚地展現出 Codex 已具備某種程度的電腦代理能力。

最後,內容也提到 Skill 的瀏覽與使用方式,指出其實很多 Plugin 背後都依賴 Skill 來指導模型如何完成任務。雖然文末沒有完全展開,但核心意思已很明確:Codex 的能力不只來自模型本身,也來自這些外掛、技能與工具的整合。

總結來看,這篇內容的核心價值在於,透過一個具體專案與多個實戰場景,把 Codex 從安裝登入、專案建立、程式開發、對話分支、Git 管理,到 Plugin 擴充與電腦操作能力,做了一次完整梳理。重點不是單一功能有多炫,而是幫使用者建立一套較完整的 Codex 使用框架。

[AI 分享] Claude Dynamic Workflows解析

 [AI 分享] Claude Dynamic Workflows解析

摘要 : Claude可自動拆解任務、平行調度大量Agent,並在背景驗證與收斂結果,加速大型工作的完成。

內容:

Anthropic 近期為 Claude Code 加入了名為 Dynamic Workflows 的新功能。用白話來說,過去你交代 Claude 一件大事,通常是由它單獨慢慢完成;現在則是你只要下達一句指令,它就能在背景自動組建一個由數十甚至上百個 Agent 構成的團隊,同時分工處理不同子任務,最後再透過交叉檢查與驗證,整理出一份完整答案。

這項功能的核心,其實是 Claude 先根據你的需求自動寫出一段 Javascript 指令碼,並由這段程式去負責後續的任務編排與執行。這個流程會在背景獨立環境中運作,因此主對話不會被卡住。也就是說,當 Workflow 在執行時,你仍然可以繼續和 Claude 在同一個 Session 中做其他事,等整個流程完成後,Claude 再把最終結論帶回來給你。

Dynamic Workflows 的強大之處,在於它不只是「多叫幾個 Agent 一起做事」而已,而是能夠有層次地拆解任務。舉例來說,一開始可能會先派出少量 Agent,從不同角度蒐集資料;第二階段再擴大 Agent 數量,對取得的內容進行深入閱讀與整理;最後還會再派另一批 Agent 專門負責挑錯、反駁與驗證,直到結論逐漸收斂。各階段要使用多少 Agent、採用哪一種模型,也都由 Claude 自行安排。

另一個重要特色是,這些大量 Agent 在執行過程中產生的中間結果,並不會全部塞進主對話的 Context 中,而是保留在 Workflow 的指令碼變數裡。主對話最後只會收到一份整理完成的結果。這使得 Claude 能在不污染主要 Context 的情況下,處理規模極大的任務,這也是 Dynamic Workflows 與一般 Subagent 或 Agent Team 很大的差別。

此外,Dynamic Workflows 內建了品質把關的概念。它可以讓多個 Agent 從不同角度分析同一問題,再由其他 Agent 專門負責反駁、挑錯與驗證。經過這種多輪攻防後還能成立的結論,通常會比單一模型一次生成的答案更可靠。這種機制就像不是只讓一個人自己檢查作業,而是再找一群人專門來找漏洞。

在成本與效率方面,Dynamic Workflows 還可以依不同階段切換模型。例如在前期大量平行搜尋時,使用較便宜、速度較快的模型;到了最後需要高推理能力來總結與收斂時,再切換到更強的旗艦模型。這樣的配置可以同時兼顧速度、品質與成本。

如果要用一句話總結 Dynamic Workflows,那就是:Claude 會先幫你寫一段指令碼,再由這段指令碼去指揮大量 Agent 完成任務。過去使用者可能需要自己設計複雜的拆解流程與提示詞,現在這部分的工作很大程度被 Claude 自動包辦了,但前提仍是你要知道自己想交付什麼任務。

文中也進一步釐清了幾個容易混淆的概念,包括 Skill、Subagent、Agent Team 與 Workflow。區分它們最簡單的方法,就是看「下一步由誰決定」。如果下一步是由程式碼事先安排好的,那就是 Workflow;如果是 Claude 根據當下情況臨場決定,那就是 Skill、Subagent 或其他 Agent 類型。

其中,Skill 比較像是一份食譜或說明書,用來告訴 Claude 在某種情境下應該怎麼做、使用哪些工具、遵守哪些限制。它本身不是 Agent,而是一組給 Agent 看的規則,因此會佔用主 Context。Skill 主要回答的是「事情怎麼做」,而 Workflow 處理的是「怎麼調度很多人一起做」,兩者不在同一層級,甚至可以搭配使用。

Subagent 則比較像 Claude 臨時派出去執行單一任務的小幫手。它完成工作後,會把結果直接帶回主對話,因此雖然能減少搜尋過程對主 Context 的污染,但如果一次派出太多 Subagent,回傳的大量結果仍可能把主 Context 塞滿。作者用「實習生查資料後把整疊文件堆回桌上」來形容這件事:少量還可以,但一多就會讓桌面爆掉。

相較之下,Workflow 更像是一個在桌子外面先做好整理的人。它能在外部協調大量 Subagent 的工作,把眾多資料先統整、驗收、驗證過後,再只把濃縮後的結論放回主對話。也因為這樣,Workflow 才能真正支撐數十、數百甚至更多 Agent 同時運作,而不讓主對話 Context 爆炸。

整體來看,Dynamic Workflows 的價值在於,它把原本需要人工設計的任務拆解、編排、平行處理與交叉驗證,自動化成一個可在背景運作的工作機制。對於大型研究、長流程分析、需要高可靠度驗證的工作,它能大幅縮短時間,也讓使用者不必自己寫出極其複雜的提示詞或流程控制邏輯。

[AI 分享] 從零打造網頁抓取 Skill

[AI 分享] 從零打造網頁抓取 Skill

摘要 : 本文示範用一個 Markdown 檔,從零建立網頁抓取 Skill,讓 AI 能自動訪問網頁、解析資料並輸出結構化結果。

內容:

 Skill 是 AI 的外掛能力包,現在進一步進入實作。重點在於:如果 AI 只能對話,實際上仍只是聊天工具;只有加上 Skill,AI 才能像被裝上「手和眼」,具備訪問網頁、讀取資料、調用工具與執行任務的能力,真正成為能做事的數位員工。

文中強調,開發 Skill 的門檻其實很低。最小結構只需要一個資料夾,裡面放一個 `Skill.md` 檔案即可。這個檔案分成兩部分:上方是 YAML 後設資料,包含 `name` 與 `description`;下方則是 Markdown 正文,用自然語言寫清楚執行指令。後設資料像名片,讓 AI 快速判斷用途;正文則像操作手冊,在確定要使用時才細讀。

實作範例是一個 `Web-Scraper` Skill。做法是先建立資料夾與 `Skill.md`,目標是讓 AI 接收網址後,自動抓取網頁內容、解析 HTML,並提取結構化資料。技術上可採用 Python 的 `requests` 發送請求,再以 `Beautiful Soup` 解析頁面,足以應付多數基礎抓取需求。

在撰寫內容時,`description` 特別關鍵,因為 AI 會依靠這段文字判斷何時觸發 Skill,因此必須明確描述功能與使用場景,例如:當使用者要求抓取網站、提取頁面資訊時啟用。正文則可依序定義角色、分析頁面結構、選擇解析策略、編寫抓取腳本、驗證資料完整性,並規範輸出格式如 JSON,同時補上錯誤處理與最佳實踐,例如遵守 Robots.txt、設定合理請求間隔與處理超時。

文章也說明了為何採用這種分層設計:因為 AI 的上下文空間有限,若所有 Skill 內容一開始就全部載入,很容易耗盡 Token。透過後設資料先做快速判斷,只有在需要時才載入正文,附屬檔案也按需引用,便能讓多個 Skill 並存且維持效率。Skill 寫完後還要測試 YAML 語法、檔名與觸發效果,若無法正確啟動,通常是描述不夠精準,應從簡單功能開始逐步調整。

對一人公司或小型團隊而言,這類網頁抓取 Skill 的應用非常廣,像是競品價格監控、產業新聞聚合、客戶資料補全等,都能大幅減少手動工作與 SaaS 成本。不過文中也提醒,實際抓取時必須遵守網站服務條款與資料保護法規,只有合規使用,這類自動化能力才能長期發揮價值。 

[AI 趨勢] 軟體工程的終結?

 [AI 趨勢] 軟體工程的終結?

摘要 : AI Agent 正逐步改變軟體工程的本質,未來競爭力不再只是寫程式,而是定義意圖、協調代理與驗證成果。

內容:

過去數十年來,軟體工程的核心邏輯一直沒有改變:人類先定義規則,再將規則寫成程式碼,最後讓電腦按照既定邏輯執行。然而,隨著大型語言模型與 AI Agent 的快速發展,這個長期存在的模式正在被重新定義。

傳統軟體的價值建立在程式碼本身。開發團隊透過架構設計、功能開發與持續維護,將業務邏輯固化在系統中。但在 Agent 時代,程式碼開始從核心資產逐漸轉變成執行媒介。當 AI 可以根據目標、上下文與限制條件,在執行過程中動態推理與生成程式碼時,真正重要的已不再是固定規則,而是持續推理的能力。

從軟體商業模式來看,這也是一次重大轉變。第一代軟體是安裝式產品,使用者需要自行維護環境;第二代 SaaS 則將基礎設施與維運交由服務提供商負責。而下一階段的 AaaS(Agent as a Service),使用者甚至不需要操作功能介面,只需描述目標,由代理自主規劃、執行並交付成果。軟體的價值將從提供功能,逐步轉向提供結果。

這樣的變化,也讓軟體工程師的角色開始向上移動。未來的重要能力不再只是撰寫程式,而是成為意圖架構師、代理協調者與結果稽核員。工程師需要將模糊需求轉化為清晰目標,設計多個代理如何分工合作,並建立評估與驗證機制,確保最終結果符合品質要求。

不過,現實並不像許多人想像得那麼樂觀。現階段 AI Agent 在單一、邊界清楚的任務上,成功率已經相當驚人;但當面對真實世界長期演進的大型系統時,仍然會遭遇上下文遺失、錯誤累積、知識斷層以及跨任務一致性等問題。這也是為什麼許多 Agent 在 Demo 中表現亮眼,實際投入企業級開發後卻仍需要大量治理與監控。

從技術演進路徑來看,我們正處於從「工具化」走向「自治化」的過渡階段。未來幾年,AI 將從開發助手進一步成長為能夠獨立完成單一任務的代理,再逐步發展成由 PM、架構師、開發者、測試人員等多角色代理組成的協作團隊。更長遠來看,甚至可能出現具備自我學習、自我修正與自我優化能力的代理生態系統。

因此,真正值得思考的問題已經不是「AI 會不會取代工程師」,而是「工程師是否能夠完成角色升級」。未來的競爭力不在於寫出多少程式碼,而在於能否高品質地定義目標、管理代理、建立監控機制、控制風險並驗證成果。當程式碼逐漸被自動生成時,人類最重要的價值,將是決定方向、建立規則以及確保系統持續朝正確目標收斂。

軟體工程或許不會真正終結,但它的重心正在發生轉移。從程式碼導向走向意圖導向,從功能開發走向結果交付,從單人開發走向代理協作。未來最具價值的人才,可能不再是最會寫程式的人,而是最懂得指揮 AI Agent 團隊的人。


這篇內容與您近期整理的「Prompt Engineering → Loop Engineering」其實形成了一條很有意思的主線:

Prompt Engineer → Context Engineer → Workflow Engineer → Agentic Engineer → Intent Commander

前者講的是 AI 技術能力的演進路徑,後者講的是軟體工程師角色的演進路徑。兩條路線最終都指向同一件事:

未來的核心競爭力,不是產生程式碼,而是讓一群 AI 能穩定產生正確結果。

[AI 分享] AI 應用成熟度六階段

 [AI 分享] AI 應用成熟度六階段

摘要 : AI 的重點已從提示詞設計,逐步演進到建立能自主優化、持續收斂的智慧系統,形成完整的 AI 導入成熟度框架。

內容:

隨著 AI 技術快速發展,許多人仍把焦點放在 Prompt Engineering(提示工程),認為只要會寫提示詞就能充分發揮 AI 能力。但實際上,提示詞只是 AI 應用發展的起點,而不是終點。AI 的使用方法正逐漸從單一互動,演進成完整的系統設計與治理能力。

第一階段是「提示工程(Prompt Engineering)」。這個階段的核心是學習如何與模型溝通,將需求轉換成清楚、可重複使用的指令,提升輸出的品質與穩定性。重點不只是會提問,而是建立能夠重複利用的提示模板。

第二階段是「上下文工程(Context Engineering)」。當模型能力逐漸提升後,影響結果品質的關鍵開始從提示詞本身,轉向模型是否取得足夠且正確的背景資訊。此時需要思考如何管理知識來源、歷史記錄、文件內容與相關資料,讓模型能在完整脈絡下進行判斷。

第三階段是「工具工程(Tool Engineering)」。AI 不再只是生成文字,而是開始具備執行任務的能力。透過串接 API、資料庫、企業系統與各種工具,讓模型能夠查詢資料、操作系統、執行流程,從單純回答問題進化為真正解決問題。

第四階段是「執行環境工程(Harness Engineering)」。當 AI 開始接觸企業系統與重要資料後,管理與治理的重要性大幅提升。此階段重視權限控管、任務狀態管理、驗證機制、安全防護以及監控觀測能力,確保 AI 的運作過程具備可靠性、可追蹤性與可控性。

第五階段是「工作流程工程(Workflow Engineering)」。企業需求往往不是單一步驟即可完成,因此需要將多個任務、多個工具甚至多個代理人(Agent)進行編排,形成可維護、可擴展且可持續運作的工作流程架構。AI 的價值開始從單點能力提升到系統化運作能力。

第六階段則是「迴圈工程(Loop Engineering)」,也是目前最進階的方向。系統不只是執行任務,而是能夠持續進行觀察、行動、評估、反思與重試。透過回饋機制不斷修正決策與策略,逐步收斂到更好的結果,形成真正具備自我優化能力的閉環系統。

從整體發展脈絡來看,AI 的核心演進其實是一條清晰的路徑:

輸出 → 資訊 → 能力 → 環境 → 流程 → 收斂

一開始關注的是模型回答得好不好;接著關注模型是否取得正確資訊;之後重視模型是否具備執行能力;再來建立安全可靠的執行環境;接著將能力組織成完整流程;最後則讓系統具備持續學習與優化的能力。

如果將這套概念套用到企業 AI 導入上,它其實也是一個非常實用的成熟度框架。企業可以藉此檢視目前所處的階段:究竟是還停留在提示詞優化、正在建置知識庫與上下文管理、開始串接工具與系統,還是已經進入工作流程自動化與多 Agent 協作。更重要的是,它能幫助團隊明確判斷下一步該補強的能力,最終朝向具備自主優化與持續成長能力的 AI 系統邁進。

[AI 影響] AI裁員潮下,真正稀缺的是判斷力

 [AI 影響] AI裁員潮下,真正稀缺的是判斷力

摘要 : AI讓程式碼與工時愈來愈便宜,但收入未同步成長;未來更難被取代的,不是高產出者,而是能判斷、對齊並把成果轉成商業價值的人。

內容:

一名工程師面臨公司可能裁掉8000人、自己有10%機率上榜,卻沒有等結果,而是先重新思考「AI裁員」背後的邏輯。他將工作拆成三層:Input(程式碼、Token、工時)、Output(上線功能)、Outcome(使用者願意付費的結果)。

他的核心觀察是:AI讓底層的Input幾乎接近免費,程式碼產出量可能暴增5倍,但真正的商業結果與使用者收入卻未必成長,產品看起來甚至和半年前差不多。問題不在於寫得不夠快,而在於多出來的產出沒有有效轉成價值。

其中有兩道主要瓶頸。第一是「想法品質」:當寫程式的成本變低,原本會被成本淘汰的點子也都能快速上線,結果是垃圾產出變多。第二是「對齊稅」:不同團隊都能用AI高速做出MVP,但彼此假設可能完全衝突,最後卡在判斷、協調與整合,而不是卡在開發速度。

從公司角度看,裁員變成一筆算術題:AI的Token成本遠低於人力成本,標準化、可替代、對齊成本高的職位,最容易被優先裁撤。省下的人力支出,某種程度上正轉化為AI公司的收入,這也是企業加速用AI補位的現實原因。

因此,稀缺能力正在改變。過去值錢的是生產力,如今AI讓大量執行能力快速貶值;未來更重要的是判斷力:知道哪個想法值得做、如何從大量AI輸出中挑出真正有效的方案,以及如何讓互相衝突的方向收斂成一致目標。

面對這種變化,普通人可從三件事開始:第一,停止「會用AI就安全」的幻覺;第二,從Outcome倒推工作,先想清楚它會為誰創造價值;第三,成為能整合技術、產品、數據與業務的人。當Input愈來愈便宜,真正難被取代的,是能把Token變成Outcome的人。

2026年6月9日 星期二

[AI 分享] 用 AI 重構工程工作流

 [AI 分享] 用 AI 重構工程工作流


摘要 : 從高中後少有代表作,到成為 Python 核心貢獻者,Matt 用一套可複製的 AI 工程方法,打造高影響力開源成果。


內容:

這次想分享一個很震撼的案例:一位自稱高中畢業後就沒再做出「讓別人覺得有價值的軟體」的人,竟然在今年成為了 Python 核心貢獻者,還同時維護兩個合計超過三萬四千星的開源專案。


這個人是 Matt Van Horn。他是矽谷連續創業者,曾參與創辦後來成為 Lyft 的公司,也共同創辦了 AI 烤箱公司 June,產品能自動辨識食物並調節溫度,之後被收購。雖然經歷亮眼,但他自己認為,真正高價值的軟體產出反而是最近才開始爆發。


今年,他用 Cloud Code 打造了兩個專案。第一個是 Last 30 Days,一個幫助使用者回顧過去三十天工作的工具,累積超過三萬星;第二個是 Printing Press,一個 AI 內容生產工具,也快速累積數千星。除此之外,他還成為 Python 核心貢獻者,以及 Compound Engineering 這個 Cloud Code 外掛的第三大貢獻者。


Matt 把自己的工作方法整理成 22 個 hack。與其說這些是 AI 工具使用技巧,不如說是一套完整的工程哲學重構。他的核心觀點很直接:工程師的價值應該來自思考、架構決策與問題解決,而不是把大量精力消耗在環境配置、查錯、切換 IDE 與瀏覽器之間。


他認為,工具應該消失,思維應該留下。當一個工具需要你花太多力氣去管理,它本身就已經在消耗你。這套方法論的第一個核心,就是在動手寫任何程式碼之前,先產出一份結構化計劃文件,也就是 Plan.md。這份文件會先定義問題、列出可能方案、推薦方案的理由,以及潛在風險。重點不是讓 AI 立刻生成程式碼,而是先驗證方向對不對,避免陷入寫了再改、改了再重來的循環。


更特別的是,他不主張逐字閱讀這份長篇計劃,而是要求 AI 進一步用三句話濃縮出核心假設,並說明如果假設錯誤會發生什麼事。這個做法的本質不是檢查細節,而是審計推理框架。因為真正致命的錯誤,往往不在技術實作,而在一開始的前提判斷。


在工作環境上,Matt 採取極度工程化的方式。他不用傳統 IDE,而是同時開六個終端視窗,每個視窗對應一個獨立任務,例如新功能、測試、文件、程式碼審查等。這不是單純的多工,而是把不同任務拆成可並行處理的工作流,讓大腦只專注於排程與決策。


當他需要向 AI 解釋複雜背景時,會優先使用語音輸入,因為語音比打字能承載更高密度的上下文資訊。語氣、停頓、補充說明,這些平常打字容易省略的內容,反而能讓 AI 更準確掌握真正的需求與語境。


在每個專案中,他還會維護一份 Cloud.md。這份文件不是寫給人看,而是寫給 AI 看。內容包括專案核心限制、哪些目錄不能動、程式碼風格邊界、以及專案存在的根本原因。這等於是 AI 的入職文件,讓每次新的互動都能快速對齊上下文,而不必重頭再解釋一次。


版本控制在這套系統裡也不只是版本控制。Matt 每完成一個邏輯單元就會立刻 commit,且 commit message 不是描述「改了哪些檔案」,而是說清楚「解決了什麼問題」。這其實是在強迫自己做思維檢查點:如果你無法用一句話說明剛才做了什麼,代表那個改動本身可能就還不夠清晰。


在任務拆解上,他的原則是:一個任務只解決一個問題,一個問題只有一個成功標準,而且成功標準必須可驗證。因為 AI 的輸出品質,與任務定義品質高度正相關。如果你丟給 AI 一個混雜了效能優化、文件更新與 Bug 修復的複合需求,它往往會每件事都做一點,但沒有一件事做到真正到位。


程式碼審查方面,他會讓 AI 審查 AI 自己寫的程式碼,但審查時一定指定角度,例如從安全性、效能、可讀性,或新進工程師能否理解的角度來看。不同視角會暴露出完全不同類型的問題,這比泛泛地問「有沒有問題」有效得多。


在測試策略上,他主張先寫測試案例,再寫實作。這不一定是傳統意義上的 TDD,而是用測試先把需求具體化。如果連測試案例都無法明確描述,通常代表需求本身還沒有被真正理解。至於文件,他認為未來的文件主要不是寫給未來的自己,而是寫給未來會協助你的 AI。因此文件應該更加結構化、上下文完整、假設明確,方便 AI 快速吸收並協助決策。


最後,他還把這套方法沉澱為可持續系統,例如建立私人 prompt 庫,依照架構設計、程式碼審查、文件生成、除錯等場景分類管理。這代表他不是把 AI 當成一次性的聊天工具,而是當成可訓練、可複用、可工程化的生產系統。


整體來看,Matt 的 22 個 hack 真正厲害的地方,不只是讓 AI 幫你寫程式,而是把工程師的工作重心,從大量低價值的操作,重新拉回高價值的思考、判斷與系統設計。這不是天賦神話,而是一套有機會被複製的方法論。

[AI 分享] AI 程式設計的企業級專案方法

 [AI 分享] AI 程式設計的企業級專案方法

摘要: 企業級 AI 開發的核心不只在生成程式碼,而是建立 SOP 閉環、全鏈路日誌與健壯性驗證,讓 AI 能持續根據日誌結果迭代優化專案品質。

內容

企業級專案的四個關鍵:企業級專案最重要的不是單純把功能做出來,而是同時滿足:SOP 閉環、專案穩定、程式碼健壯,以及日誌可追溯。程式碼越健壯,專案就越穩定;而 SOP 是否真正閉環,最終要靠測試報告來驗證。


測試報告來自全鏈路日誌:在 AI 程式設計流程中,全鏈路日誌(埋點)是核心基礎。AI 不只是生成程式碼,而是持續分析執行日誌,根據結果調整實作方向,逐步逼近需求目標,直到整個 SOP 流程被完整跑通並完成標記。


健壯性檢查的內容:當主流程完成後,還需要進行健壯性檢查,包括壓力測試、漏洞注入、正常業務流程驗證,以及逆向或異常流程驗證。這些測試的分析依據同樣來自日誌,AI 會根據測試結果持續優化系統。


日誌是測試與自動化的基礎:無論是暴力測試、壓力測試,還是 SOP 測試,測試工具都需要利用日誌進行結果比對。因此,日誌設計不是附屬工作,而是整個品質保證流程的核心基礎設施。


AI 工程師角色的轉變:實務上大量時間不是在手寫程式碼,而是在讓 AI 分析日誌,再根據分析結果下達新的指令。工程師的角色也從傳統的「程式碼審查員」,逐漸轉變為「日誌審查員」與流程監督者。全流程日誌帶來的價值:當全流程日誌建立完整後,專案的故障定位、問題追蹤與快速修復都會變得更有效率。對企業級 AI 開發而言,日誌不是事後補強,而是從一開始就必須被納入架構設計的重要能力。


總結

這篇內容強調:AI 程式設計要真正落地到企業級專案,關鍵不在於「一次生成正確程式碼」,而在於建立「需求 → 日誌 → 分析 → 修正 → 測試 → 驗證」的閉環流程。全鏈路日誌、健壯性測試與可追溯性,才是讓 AI 開發成果能穩定運行於真實企業環境的核心能力。

[AI 衝擊] AI編碼時代的開發者分化

[AI 衝擊] AI編碼時代的開發者分化

摘要 : AI編碼工具全面普及後,開發效率大幅提升,但開發者之間的差距也正以前所未有的速度被放大。

內容:

隨著 AI Coding 工具快速普及,軟體開發產業正在經歷一場深刻變革。根據最新開發者使用數據顯示,短短一年多時間內,開發者每週平均產出的程式碼量已經成長超過一倍。過去需要多年經驗累積才能換來的效率提升,如今透過 AI 輔助,在極短時間內就能實現。這不只是工具升級,而是整個開發模式的改變。

更值得注意的是,開發者一次完成的工作規模正在快速擴大。過去一個功能可能需要拆成多次提交,如今透過 Coding Agent 協助,許多原本需要數天甚至數週完成的工作,可以在一次大型 Pull Request 中完成。超過千行程式碼的大型 PR 比例持續攀升,代表開發者開始有能力管理更複雜、更完整的開發任務,而這背後最大的推手正是 AI。

除了程式碼產出增加之外,開發者與 AI 的協作模式也在改變。AI 已不再只是單純的程式碼補全工具,而是逐漸成為能夠執行任務、呼叫工具、分析專案上下文的開發代理人。越來越多工程師開始將繁瑣、重複性的工作交由 AI 處理,自己則專注於架構設計、需求分析與決策判斷。這代表開發工作的重心正逐漸從「寫程式」轉向「管理 AI 寫程式」。

許多人擔心 AI 生成的程式碼品質是否可靠。從實際數據來看,AI 產出的程式碼保留率正在穩定上升,代表越來越多 AI 生成的內容能夠直接被納入正式專案。雖然仍需要人工審查、優化與修正邊界情況,但 AI 已經從過去的輔助工具逐漸演變成能夠參與實際生產的開發夥伴。

然而,真正值得關注的並不是效率提升,而是開發者之間差距的急速擴大。數據顯示,最頂尖的 AI 開發者所產出的程式碼量,可能是一般開發者的數十倍;完成任務的速度也遠遠超越平均水平。AI 並沒有平均地提升每一位工程師的能力,而是讓那些懂得善用 AI 的人獲得更大的放大效果。相同的工具,在不同人手中產生的價值差異,甚至比過去任何技術革命都更加明顯。

這場變革帶來的一個殘酷現實是:未來開發者的核心競爭力,可能不再只是演算法、框架或語言能力,而是如何與 AI 協作、如何設計工作流程、如何拆解問題並驅動多個 Agent 完成任務。AI 並沒有取代工程師,但它正在快速拉開工程師之間的距離。未來真正稀缺的,不是會寫程式的人,而是能夠駕馭 AI、放大自身能力的人。這道差距,正在成為 AI 時代最重要的新門檻。 

[AI 分享] AI Native 公司的作業系統革命

 [AI 分享] AI Native 公司的作業系統革命

摘要 : AI帶來的改變不只是效率提升,而是重新定義企業運作方式,讓公司從依賴人力協調轉向由智慧系統驅動的閉環組織。

內容:

傳統企業談論 AI 時,大多聚焦在提升工作效率,例如讓工程師寫程式更快、讓員工整理文件更省時間。然而,真正的改變可能遠超過提效 20% 或 50%。當 AI 已經能夠讓一個人完成過去一整個團隊的工作時,企業需要思考的問題不再是「如何使用 AI 工具」,而是「是否應該重建整個組織運作模式」。

核心關鍵在於從「開環系統」走向「閉環系統」。許多公司做完決策、執行任務後,只在事後進行回顧,卻沒有將結果系統化地回饋到流程中。資訊散落在會議、郵件、聊天訊息、口頭溝通與管理者腦海裡,導致知識不斷流失,也難以持續優化。而 AI Native 公司則會持續收集每個流程的輸入與輸出,將結果反饋給智慧系統,使流程不斷學習與改善。公司越接近閉環,AI 越能參與真實決策;反之,AI 就只能停留在問答工具的層次。

要建立這樣的能力,第一步是讓整家公司變得「可查詢」。所有重要資訊都必須被記錄並納入統一的智慧上下文之中,包括會議紀錄、專案管理系統、即時通訊頻道、客戶郵件、程式碼庫、銷售錄音以及每日站會內容。這些資訊不再只是員工的記憶負擔,而是 AI 學習與推理的重要基礎。當智慧體能同時看到需求、開發過程、客戶回饋與實際成果時,它便能分析哪些決策有效、哪些地方偏離目標,甚至協助團隊持續修正方向。

在產品開發與軟體工程領域,新的模式也正在形成。過去工程師負責撰寫程式碼,如今人類的角色逐漸轉向定義規格、設計測試與判斷結果。AI 負責根據規格產生程式碼、反覆修改並通過測試。未來真正稀缺的能力,可能不再是敲程式碼,而是能否清楚定義需求、建立正確的驗證機制,以及判斷輸出是否符合商業目標。程式碼本身,逐漸成為一種中間產物。

當企業大量導入 AI 閉環與智慧工廠模式後,傳統的管理階層也可能發生變化。過去中層主管的重要職責之一,是在不同部門之間搬運資訊、協調溝通與追蹤進度。但當智慧系統能即時掌握所有資訊並自動完成路由與分析時,組織層級將被大幅簡化。管理者的角色將從傳話與催促,轉向明確定義責任、校準方向與確保成果品質。

這樣的未來組織可能只剩下三種核心角色:第一線的執行者(Builder),直接對結果負責的負責人(DRI),以及負責制定方向與價值觀的創辦人(Founder)。每個人都直接對成果負責,而不是隱藏在複雜的組織架構之後。企業競爭力也不再取決於員工數量、辦公室規模或部門編制,而是取決於組織能否有效利用 AI、建立高品質的資訊閉環,以及用更少的人創造更大的成果。

最後有三個值得深思的原則。第一,給 AI 與正式員工同等級的上下文資訊。若只給 AI 一個孤立任務,卻期待它理解整個業務,那就像要求新進員工第一天上班就做出正確決策一樣不切實際。第二,領導者不能把 AI 全部外包給專門團隊,而必須親自使用與體驗,才能真正理解其能力邊界。第三,在 AI 時代,新的競爭優勢來自更高品質的智慧輸入、更快速的學習循環,以及更精簡的組織結構,而不是單純擴張人力規模。

總結:

AI 的價值不只是讓現有流程跑得更快,而是讓企業有機會重新設計整個作業系統。未來最具競爭力的公司,未必是擁有最多員工的公司,而是那些能夠建立完整資訊閉環、讓 AI 深度參與決策與執行,並以最少的人力創造最大價值的組織。真正的轉型,不是替公司加上一個 AI 工具,而是讓 AI 成為公司運作的核心基礎設施。