2026年6月18日 星期四

[AI 影響] Codex不只是寫程式,而是AI工作方式的轉變

 [AI 影響] Codex不只是寫程式,而是AI工作方式的轉變

摘要 : 輝達全面推動員工使用Codex,顯示AI正從聊天工具升級為可執行任務的agent。




內容:

過去很多人把 Codex 視為單純的寫程式工具,但現在更值得注意的是,它正在代表一種全新的工作模式。輝達 CEO 黃仁勳要求所有員工使用 Codex,背後反映的重點,不是 AI 會不會寫程式,而是 AI 的角色已經開始改變。


傳統聊天機器人的核心是回答問題,你問一句,它回一句;但像 Codex 這類工具,正朝向 agent 的方向演進,也就是不只提供建議,而是能直接接下任務、理解專案、執行命令、修改檔案,最後交付結果。


例如當你提出「幫我找出這個專案為什麼構建失敗」時,一般 AI 可能只會列出一串排查方向;但 Codex 類型的 agent,則可能直接進入程式碼倉庫、閱讀錯誤日誌、定位問題檔案、修改程式碼、執行測試,並把修改內容與測試結果整理後交給你確認。這種差異,就像是從「詢問一位聰明的人」變成「多了一位能實際動手的同事」。


OpenCloud 創始人 Peter Steinberger 加入 OpenAI,也被視為這股趨勢的延伸。下一代 AI 的競爭關鍵,已不只是模型是否更聰明,而是能不能安全、穩定、持續地替人完成真實世界的工作任務。


因此,對一般人來說,現在最重要的不只是學更多 AI 名詞,而是學會如何把工作拆解成 agent 可以執行的任務。不要只停留在「幫我寫一下」,而要進一步明確指示,例如「先讀這三個檔案、找出問題、提出兩個方案、選擇風險最低的做法並執行測試」。


這才是 Codex 時代真正重要的提示能力。未來真正能善用 AI 的人,未必是最懂技術的人,而更可能是最會分配任務、驗收成果與控制風險的人。

[AI 警示] 納德拉談AI生態風險

 [AI 警示] 納德拉談AI生態風險

摘要 : 納德拉警告,若AI紅利被少數巨頭壟斷,企業將失去自身能力;真正關鍵是沉澱自己的AI經驗資本。




內容:

微軟CEO納德拉近日一篇長文在美國社群媒體引發熱烈討論,單日閱讀量高達數千萬,連馬斯克也親自評論。文中他提出嚴正警告:如果AI紅利最終只集中在少數科技巨頭手中,整個產業將面臨被掏空的風險,而這樣的AI未來,社會終將無法接受。


納德拉提出一個新的框架,認為未來每家公司都必須管理好兩種資本。第一種是「人力資本」,也就是員工所擁有的知識、判斷力、人脈、創造力與模式識別能力。第二種則是他提出的新概念「token資本」,也就是企業自身累積的AI經驗資本。


所謂token資本,並不是單純使用現成的通用大模型,而是要把企業內部的流程、經驗、判斷方式與專業知識,沉澱成屬於自己的AI系統。這兩種資本並不是互相取代,而是彼此放大:AI負責執行、擴張與規模化,人則負責設定目標、建立關係、做出判斷與決策。若沒有人來引導,再強的算力也可能只是原地打轉。


他特別強調,任務可以外包,工作甚至可以外包,但學習本身永遠不能外包。真正屬於企業與個人的能力,來自於持續沉澱與吸收,而不是只依賴工具代勞。


納德拉也提出一個非常實用的判斷標準,叫做「換模型測試」。也就是說,一家公司應該有能力隨時更換底層的通用AI模型,卻不會因此失去自己系統裡累積下來的經驗與能力。如果一換模型,整個業務就癱瘓,那就代表這家公司其實並沒有真正掌握自己的AI能力。


而他最擔心的,不是AI發展得不夠快,而是AI可能重演全球化初期的悲劇。當年許多發達國家把製造業外包出去,表面上GDP仍在增長,但實際上產業鏈逐漸被掏空,導致工人失業、地方衰退,這些後遺症至今仍未完全消失。


納德拉警告,如果AI也走上同樣的路,後果可能更加嚴重。企業若把內部資料、流程與專業知識全部餵給少數大模型,最後模型學走了所有本事,企業自己卻變成空殼。最終價值會流向極少數模型供應商,多數產業只能淪為配角,自己的知識被商品化,卻無法真正分享收益。這樣的政治與經濟結構,社會根本難以承受。


因此,他認為當前最重要的任務,不是只打造最前沿的模型,而是建立一個「前沿生態系統」。這個生態系統應該讓每家公司、每個產業、每個國家都能建立自己的學習閉環,持續累積人力資本與token資本,形成自己的競爭優勢。


對企業來說,這是一個非常現實的道理:AI工具可以購買,但透過AI使用過程中所累積的經驗、流程與知識,必須掌握在自己手中。若只是依附在通用模型之上,隨波逐流,等到環境變化時,才可能發現自己根本沒有真正的護城河。


對大公司而言,這是戰略問題;但對中小企業和普通工作者來說,這甚至是生存法則。若一個人只是依賴各種AI工具寫報告、回郵件、做方案,卻從不總結、不沉澱,也沒有建立自己的判斷框架,那麼一旦換了模型或工具,很可能就會失去獨立工作的能力。


AI可以替人完成工作,但無法代替一個人的成長。納德拉這封信的核心意思其實很簡單:不要把自己的腦子外包給機器。


對打工人來說,不要只當AI的操作員,而要成為AI的指揮官,學會用AI放大自己的判斷力,而不是讓AI取代判斷力。對老闆來說,不要只停留在採購AI工具,更要有意識地沉澱自己的業務流程與資料資產,否則大家都在用同一套外部大腦,公司自然難以建立真正的競爭力。


歸根到底,AI浪潮不會淘汰人,但一定會淘汰那些只會使用AI、卻不會培養與沉澱AI能力的人和組織。

2026年6月17日 星期三

[AI 分享] 提升AI生產力的核心Skill架構

 [AI 分享] 提升AI生產力的核心Skill架構

摘要 : 真正拉開AI效率差距的,不是模型強弱,而是Skill配置與工作流設計。




內容:

很多人使用 AI 時,常陷入一個誤區:一直糾結到底哪個平台最強、哪個大模型最聰明。但真正決定生產力上限的,往往不只是平台本身,而是你替它配置了什麼 Skill。若底層能力沒有補齊,再強的 Agent 也可能只是空轉。


這套核心 Skill 架構大致可以分成四個部分。第一部分是原生基礎 Skill,它不直接負責執行具體任務,而更像是替 AI 裝上一個自我進化引擎,讓它能自己寫新工具,或是到外部尋找現成幫手。這是無論未來想讓 AI 做什麼,都應該最先打好的基礎。


第二部分聚焦在程式開發時常見的幻覺問題。AI 生成的程式碼經常看起來邏輯完整,但實際執行卻會報錯。因此這裡引入工程化規則,例如測試驅動開發與專家審計,讓 AI 不再憑直覺亂寫,而是依照嚴格標準來完成程式碼。


第三部分談的是前端設計。現在許多 AI 生成的網頁都有一種明顯的「AI 味」,缺少質感與耐看度。因此需要專業設計類 Skill,協助 AI 產出更成熟、更有審美與商業感的介面設計。


第四部分則是內容創作。目標不只是讓 AI 寫出好內容,而是打通從配圖、資訊圖表繪製、排版、翻譯,到一鍵多平台發布的完整流程,形成真正的自動化閉環,把大量瑣碎工作交由 Agent 處理。


在原生基礎 Skill 中,第一個重要工具是 Skill Creator,這是 Anthropic 官方推出的工具。它的核心作用,是把成熟工作流打包成可以高頻重複使用的原子工具。過去如果想自己製作 Skill,往往需要研究繁瑣格式、手動修改配置檔,稍有錯誤就容易報錯,而且做出來的效果也未必理想。


有了 Skill Creator 後,流程被大幅簡化。使用者不需要硬啃開發文件,只要像對同事交辦工作一樣,用自然語言描述流程,或者直接提供既有 SOP 與操作手冊,它就能協助生成 Skill。整體流程大致分成三步:先用口語提出需求,再由系統在後台自動測試、打磨與迭代,最後不到一分鐘,就能產出標準且可用的 Skill。這大幅降低了手寫配置與除錯的負擔。


第二個原生 Skill 是 Find Skills。它不只是傳統意義上的應用商店搜尋工具,而是把被動搜尋變成主動指派。當使用者交給 Agent 一個複雜任務,例如設計帶有一鍵結算機制的系統 UI,若 Agent 本身不具備 UI 設計能力,它不會直接卡住,而是會在後台先把需求拆解成像 UI Design 這樣的原子意圖,再連接到 skill.sh 平台,主動盤點合適的 Skill。


它會評估哪些 Skill 安裝量高、作者可靠、口碑佳,並過濾掉冗餘或廢棄的工具,再把最適合的選項呈現給使用者。確認後,還能透過一行指令自動下載安裝。簡單來說,Skill Creator 讓 Agent 能自己造工具,Find Skills 則讓它能主動尋找外援。這兩者搭配後,Agent 的能力邊界會被大幅打開。


進入實戰場景後,軟體開發是一個很重要的應用方向。這裡提到的第一個 Skill 是 Superpowers。它的核心邏輯很硬核,直接把測試驅動開發的工程標準,變成 Agent 必須遵守的規則。很多人用 AI 寫程式時,第一直覺是讓它幫忙寫測試,而 Superpowers 則把整個流程徹底制度化。


它會強制 Agent 進入標準的紅綠重構循環。第一步是先寫一個必然失敗的測試,用來證明功能尚未實現;第二步只允許撰寫最少量、剛好能讓測試通過的程式碼;第三步則是在測試通過後,再進行結構優化與程式碼重構,去除不良設計與壞味道。


更穩健的是,完成程式後它不會立刻交差,而是啟動兩輪內部交叉審計。第一層是藍圖對齊審視,重點不是只看程式碼是否能跑,而是檢查實作邏輯是否真正對齊最初需求。第二層則是高危邊界挑刺,專門去找像空指標、例外狀況與隱藏邊界條件這類問題。雖然這套流程看似更花時間,但因為第一版程式碼品質更高,能大幅降低後續反覆 debug 的成本,長期來看反而更省時間與 token。


此外,它在流程最後仍保留人工決策空間,使用者可以選擇直接 merge 合併、暫時 stay 觀察,或是 drop 作廢。這代表 AI 並不是完全接管,而是以工程化方式輔助人類做更高品質的判斷。


如果要打造的不是單一功能模組,而是完整的商業系統,那麼單靠一位程式設計師的視角通常不夠。這時候就需要更像團隊協作的工具,例如 G-Stack。這個工具由 YC 總裁 Gary Tan 推出,最大的特色是在 Agent 裡直接內建 23 個不同專家角色,例如 CEO、視覺設計師、後端架構師、安全專家與發布架構師等。使用者可以透過斜線命令直接召喚這些角色,讓 AI 在單一工作流中模擬跨職能團隊協作。

[AI 分享] 可交付AI Agent系統構建

 [AI 分享] 可交付AI Agent系統構建

摘要 : 從產品認知、上下文管理到評估體系,整理可交付AI Agent系統的實戰方法與原則。




內容:

這篇內容主要在討論:**如何構建真正可交付的 AI Agent 系統**。整體思路來自 5 月 31 日 AI Engineer 的一支 YouTube 影片,但也與企業 AI Agent 交付、AI Coding Harness 以及陪跑專案中的實際經驗高度契合,因此很值得整理分享。


全文大致可分成五個核心方向,從最底層的認知開始,談人類與 Agent 使用產品的方式差異,接著談上下文管理、狀態機制、評估體系建設,以及提示詞與技術實作上的原則。其中作者特別強調:**評估體系是最關鍵、也最容易被忽略的一環**。


首先,最核心的認知是:**人類與 Agent 消費產品的方式並不一樣**。  

以 HTML 為例,人類在看網頁時,往往是從視覺、元素、關聯與互動效果去理解;但 Agent 在處理 HTML 時,更多是從文字結構與語意關係去推斷內容。因此,當我們設計產品或資料給 AI 使用時,不能完全沿用「給人看的方式」,而要開始思考怎樣讓模型更容易抓取、總結與理解。


這也帶出第一個重要原則:**不需要把所有文件都丟給 AI**。  

因為很多通用知識模型本來就知道了,真正需要補充的,反而是那些模型最容易誤解的地方,例如產品中的特殊規則、常見踩坑點、容易混淆的邏輯等。換句話說,給 AI 的資訊不在於多,而在於是否能幫助它避開誤解。


此外,在設計產品時,也可以逐步往 **更容易被 AI 理解的結構** 靠攏。比如以往很多頁面設計是優先給人類瀏覽體驗,但未來也許需要兼顧「是否有利於 Agent 抓取、解析、摘要與推理」。這些與人的差異雖然微妙,卻會在實作過程中持續影響成效。


第二個重點是**上下文管理**。  

在 AI Coding 或 Agent 工作流中,常常有大量時間花在補充背景資訊與前置條件上,而且每次新開一個上下文,都要重新講一次,效率很低。比較好的做法,是把這些重複性高、可複用的資訊提前整理起來,做成可被調用的內容模組,例如 skills 或 agent cmd,讓模型在需要時自動載入。


這樣做的價值在於:當你發現某些背景資訊、操作說明或工作流程總是要重複提供,就應該把它們結構化,沉澱成系統能力,而不是每次人工重新輸入。這能大幅降低前置溝通成本。


不過,就算把 skills 都準備好了,也不代表模型就一定能從頭到尾穩定執行。  

因為大模型本質上仍然是機率性系統,即便 temperature 設為 0,穩定性仍有限,也可能出現幻覺或中途偏離。因此,在 AI Agent 產品中,不論是 AI Coding 還是其他 Agent 類型系統,**狀態機制** 都是很有效的處理方式,可以幫助流程更可控。


接著進入全文最重要的部分:**評估體系建設**。  

這裡引用了一個很關鍵的觀點:如果沒有評估,就沒有改進。對可交付的 AI Agent 系統來說,評估不是附屬品,而是核心能力。


曾把過去大量的人類經驗文件整理成 skills,讓 AI 在處理問題時調用,原本以為這樣效果會更好;但在建立評估體系後卻發現,**把所有 skills 都給模型時,準確率只有 70%;反而什麼 skills 都不給時,準確率可以達到 97%**。這是一個非常有啟發性的結果。


原因在於,skills 本身也會佔據上下文,而且其中可能混入過時文件、不夠精準的指導,或與當前專案結構不一致的內容。這些資訊不但沒有幫助,反而可能干擾模型判斷。因此,這裡得到一個非常重要的結論:  

**與其給模型固定規定,不如給它指導原則。**


也就是說,不要試圖用大量細碎、陳舊、僵硬的規則去束縛模型,而應該提供方向性的引導,讓模型依據當前情境做合理判斷。這被認為是整支影片中最有價值的一個觀點。


至於評估體系怎麼建立,可以分成幾個層次:


第一層是**確定性驗證**。  

例如在程式碼提交流程中,透過單元測試、Lint、Build 驗證等方式做檢查,這些屬於 CI/CD 中本來就應該存在的固定環節。AI 介入後,這些機制不能省,反而更重要,因為它們能提供穩定、可重複的品質保障。


第二層是**規則化檢查**。  

像是程式碼規範、靜態檢查、格式化與一些明確可定義的規則,這些也應該交給工具或系統做,而不是完全依賴模型的主觀判斷。


第三層才是**模型評估**。  

但這裡有個關鍵技巧:不要讓模型做過於寬泛的評價。例如不要問「這段程式碼好不好」,而應該把問題窄化成具體維度,例如:「找出這段程式碼中與需求不一致的地方」、「列出可能缺失的邊界條件」、「指出風險較高的區域」。當評估範圍被縮小後,模型的焦點會更集中,輸出品質也更穩定。


最後一層仍然是**人工審查**。  

即使前面有規則檢查與模型評估,人依然不能完全退出。對於重要程式碼、關鍵業務邏輯、風險區域,例如支付流程、核心架構、可維護性等,人還是需要親自看。也就是說,真正可交付的系統,不是把責任全部推給 AI,而是建立一個多層次驗證機制,讓 AI、規則與人工彼此補位。


因此,不只是 AI Agent,包含 RAG、Harness、AI Coding 流程,只要是要落地交付的系統,**都必須有評估體系**。這一點非常關鍵。


最後回到 skills 的問題,這段內容也再次提醒:**不是 skills 給得越多越好**。  

當模型本身的理解與執行能力越來越強時,我們需要做的,不是塞滿所有文件,而是「輕推一下」,把它引導到正確方向。真正有效的做法,不是用大量陳舊規則綁住模型,而是提供清楚、簡潔、方向明確的原則,讓模型在具體任務中靈活發揮。

[AI 反思] AI寫程式一年後,你是變強還是更依賴了?

 [AI 反思] AI寫程式一年後,你是變強還是更依賴了?

摘要 : AI能讓寫程式更快,但也可能讓獨立思考、判斷與重構能力悄悄退化,真正風險是你失去離開AI後的戰力。




內容:

這提出一個很值得所有工程師自問的問題:這一年大量使用 AI 寫程式,到底是真的變強了,還是只是變得更依賴工具?表面上看,很多原本要花很久的工作,現在只要幾分鐘就能完成,效率提升非常有感,也容易讓人產生「自己明顯進步了」的感覺。


但真正的風險不在於 AI 取代你,而在於你長期依賴它之後,獨立解決問題的能力可能正在退化。當某一天碰上 AI 幫不上忙、給錯答案,或者情境非常複雜時,你若已失去判斷與修正能力,就會發現自己既離不開它,也無法真正頂上去。這才是最危險的地方,因為那往往直接影響職場競爭力。


AI 確實在某些任務上能顯著提速。以 GitHub 的 Copilot 實驗為例,使用者完成任務的速度快了將近 56%。但這類任務往往是邊界清楚、標準答案多、重複性高的模板型工作,例如從零寫一個 HTTP 伺服器。這正是 AI 最擅長的「甜區」,並不能代表一個工程師真正的整體能力。


真正有價值、也真正困難的部分,通常不是模板工作,而是那些複雜業務邏輯、架構設計、效能瓶頸排查,或是在模糊情境下做出正確判斷。這些問題沒有單一標準答案,也很難靠模式套用解決。AI 在這類場景裡給出的內容,常常只是「看起來合理」的參考,而不是真正理解系統後的推理結果。


AI 的核心不是理解,而是模式匹配。它根據大量既有資料去猜測「下一段最像什麼」,所以面對常見題型時表現很好,但只要題目稍微偏離它熟悉的範圍,就可能產生語法正確、語氣篤定、實際卻完全不適用的答案。最可怕的不是 AI 出錯,而是它出錯時,你也剛好失去了辨識錯誤的能力。


這種「錯覺式提效」並非空談。引用一項 2025 年的實驗,讓 16 位資深開發者在自己熟悉的大型成熟專案中完成 246 個真實任務。這些人原本預期 AI 能讓自己快 24%,實際做完後主觀感受也認為快了 20%,但客觀測量結果卻是平均慢了 19%。雖然研究樣本有限,不能當成絕對定論,但至少說明一件事:連資深工程師都可能誤判自己在 AI 輔助下的真實效率。


除了效率錯覺,程式碼品質的變化也值得警惕。GitClear 分析了 2.11 億行程式碼、長達 5 年的資料後發現,2024 年 5 行以上的重複程式碼塊暴增到 8 倍;而代表整理、重構、抽象化的程式碼比例,則從 2021 年的大約 25% 一路下降到 2024 年不到 10%。更值得注意的是,2024 年成為首次「複製貼上的程式碼量超過重構整理程式碼量」的一年。


這代表整體開發行為正在改變:大家都更快地新增程式碼,卻越來越少回頭整理結構、抽象邏輯、提升可維護性。而後者恰恰是資深工程師最重要的價值所在,也是判斷力與設計能力的體現。若這部分長期不練,留下來的系統就會愈來愈像拼湊品。研究也指出,這類克隆式程式碼的缺陷率,可能比正常程式碼高出 15% 到 50%。


進一步把問題擴大到整體認知層面。根據一項針對 666 人的研究,越頻繁使用 AI 的人,批判性思維分數越低;其中關鍵機制被稱為「認知卸載」,也就是把原本應由自己完成的思考外包給工具。更值得注意的是,越年輕、越依賴 AI 的人,能力下滑的幅度越明顯。當你把「想」這件事長期交出去,自己的思考肌肉就會更快萎縮。


最後把使用者分成三類來看。第一類是新手,AI 讓他們看起來進步很快,但其實很多只是短板被工具暫時撐住,能力本身未必真的補上。第二類是中階使用者,效率感最強、爽感最高,但也最容易在不知不覺中減少親手解題的頻率,因此退化風險最大。第三類是真正的高手,他們不會只看「有 AI 時我多快」,而是更在意「拿掉 AI 之後,我還剩多少戰力」。


整篇文章的核心提醒是:當某項能力可以被工具低成本取代,市場就不再為「只會執行」的人支付高溢價。AI 已經逐漸把「會寫程式碼」這件事變成標準化能力,因此真正更值錢的,不再只是寫得快,而是你是否知道該寫什麼、為什麼這樣寫、出了問題怎麼判斷,以及能不能在沒有 AI 的情況下仍然獨立完成關鍵決策。

2026 .NET 開發者現代技術棧與實務建議

2026 .NET 開發者現代技術棧與實務建議



1. IDE 與編輯器(IDE & Editors)

  • 主力推薦:VS Code + GitHub Copilot / Cursor
  • 企業級選擇:Rider
  • 核心思維AI-assisted coding is the default now AI 輔助編碼已成為標準工作方式,而非額外加分項。

2. 測試(Testing)

  • 單元/整合測試:xUnit + NSubstitute + Shouldly
  • 容器化測試:Testcontainers
  • E2E 測試:Playwright
  • 核心思維Testcontainers changed integration testing forever 讓測試環境真正貼近真實系統依賴。

3. 日誌與可觀測性(Logging & Observability)

  • 結構化日誌:Serilog
  • 標準觀測:OpenTelemetry
  • 本機儀表板:Aspire Dashboard
  • 後端分析:Seq / Grafana
  • 核心思維If you're not using OpenTelemetry yet, start now 它已成為可觀測性的事實標準。

4. API 開發(API Development)

  • 主力框架:Minimal APIs
  • 文件介面:Scalar(OpenAPI UI)
  • HTTP Client:Refit
  • 中介處理:MediatR
  • 核心思維Minimal APIs are all you need 對大多數情境已完全足夠,大幅降低複雜度。

5. 資料與快取(Data & Caching)

  • ORM:EF Core(大多數情境)
  • 高性能查詢:Dapper(熱路徑)
  • 快取:Redis
  • 資料庫:PostgreSQL / SQL Server
  • 核心思維EF Core for most things, Dapper for hot paths

6. 驗證與安全(Auth & Security)

  • 自架方案:Keycloak
  • 雲端方案:Entra ID (Azure AD)
  • 標準協定:OAuth 2.0 / OIDC + JWT Bearer
  • 核心思維Keycloak is the go-to for self-hosted auth

7. 容器與編排(Containers & Orchestration)

  • 基礎:Docker + Docker Compose
  • .NET 整合中樞:Aspire
  • 生產環境:Kubernetes
  • 核心思維Aspire makes local dev with containers trivial

8. CI/CD

  • 主力:GitHub Actions
  • 企業級:Azure DevOps Pipelines
  • 快速部署:Aspire deployments
  • 核心思維Aspire manifest to Azure deployment in minutes

9. 雲端(Cloud)

  • 主要平台:Azure(推薦深入)、AWS、Google Cloud
  • IaC:Bicep(Azure)或其他 IaC 工具
  • 核心思維Pick one cloud and go deep

10. 前端(Frontend)

  • 企業內部工具:Blazor
  • 對外產品:React + TypeScript + Tailwind CSS
  • 核心思維Blazor for internal tools, React for public-facing

11. 訊息與背景處理(Messaging)

  • 訊息代理:RabbitMQ / Azure Service Bus
  • 抽象層:Wolverine
  • 背景工作:Background workers
  • 核心思維Wolverine abstracts the broker for you

12. 架構設計(Architecture)

  • Vertical Slices
  • Event-Driven Design
  • Microservices(視規模而定)

整體趨勢總結(2026 版)

  • AI 已成標配:Copilot / Cursor 是日常開發基礎。
  • 可觀測性標準化:OpenTelemetry 是必備。
  • 開發體驗大幅整合:Aspire 成為本機多服務 + 容器 + 觀測 + 部署的關鍵橋樑。
  • 務實混合策略:EF Core + Dapper、Blazor + React、Minimal APIs 為主。
  • 少而精:每個領域選擇 1~2 個成熟工具深入,而非廣度優先。
  • 端到端思維:現代 .NET 工程師必須掌握從開發、測試、觀測、部署到架構的全鏈路。

 

2026年6月16日 星期二

[AI 影響] WebMCP正在改變AI連接世界的方式

 [AI 影響] WebMCP正在改變AI連接世界的方式


摘要 : WebMCP有望統一AI與各類系統的連接方式,讓AI從只會回答問題,進化到能真正調用工具完成任務。




內容:

最近許多人開始討論一個新詞——WebMCP。它之所以受到開發者關注,不是因為技術本身多麼複雜,而是因為它可能解決AI目前最關鍵也最尷尬的問題:模型雖然很聰明,卻無法直接接觸現實世界中的資料與工具。


過去的大模型像是一位被困在房間裡的天才。它懂程式、懂法律、懂醫學,也懂商業分析,但它不知道企業資料庫裡有什麼,也無法直接接觸公司的內部系統、最新網頁內容,或是支付系統、工單系統與辦公軟體中的即時資訊。


因此,當企業希望AI真正幫忙做事時,往往必須額外開發各種介面、外掛與適配層。不同工具有不同接法,不同模型又有不同協議,導致開發團隊花費大量時間在重複建設連接能力。


而WebMCP想做的,就是把這些混亂的連線方式統一起來。它可以被理解為AI世界裡的USB介面。過去每接一個裝置都需要不同的線材與轉接方式,現在只要支援同一套標準,就能更直接地完成連接。


當一個系統支援WebMCP後,AI便可以透過一致的方式發現可用能力、呼叫工具並取得資料。這代表企業不必再為每一個模型單獨開發整合方式,也不必為每一套工具重新做一次適配,整體開發效率將大幅提升。


更重要的是,這背後代表一種新的工作模式正在形成。過去是人操作軟體,後來變成軟體輔助人,而現在正逐步進入第三種模式:人只需要告訴AI目標,AI就能主動調用多個系統來完成任務。


例如,銷售經理只要說一句「幫我整理本週客戶跟進情況並生成下週計畫」,AI就可以自動讀取CRM系統、檢查郵件往來、分析客戶狀態,甚至進一步安排相關會議。整個流程中,人類負責下達目標,AI則負責執行。


這也是為什麼越來越多公司開始關注MCP。因為大家逐漸意識到,大模型本身的能力提升雖然重要,但已經不是唯一瓶頸。能否順利、安全、可靠地把AI接上真實世界的工具與系統,才是下一階段競爭的核心。


誰能讓AI安全地存取工具,誰能讓AI穩定地執行任務,誰就更接近真正可用的AI助手。從這個角度來看,AI革命或許並不是已經完成,而是才剛進入基礎設施建設的階段。


過去幾年,整個產業都在努力訓練更聰明的大腦;而現在,大家開始為這個大腦裝上眼睛、耳朵與雙手。WebMCP所代表的,正是AI從「會思考」走向「會做事」的重要一步。

[AI 衝擊] 加拿大年輕人就業困境與AI時代出路

 [AI 衝擊] 加拿大年輕人就業困境與AI時代出路

摘要:加拿大青年失業惡化,入門職缺銳減,AI正改變職場規則,年輕人需及早調整方向與技能。




內容:


加拿大年輕人近年找入門級工作的難度明顯升高,尤其對即將畢業的大學生與剛離校的年輕人而言,情況相當嚴峻。節目一開始引用了多位年輕人的真實案例:有人成績優秀、實習評價良好,畢業後卻長期找不到工作;有人投出70份履歷仍無錄取通知,只能靠零售工作維生;也有人投了超過100家公司,卻連一次面試機會都沒有。這些案例顯示,問題已不只是個人努力與否,而是整體就業結構正在改變。


從數據上看,這種困境並非個案。2025年第一季度,加拿大應屆畢業生平均失業率達到11.2%,創下至少20年來、除疫情期間外的最高水平。同時,全國入門級職位空缺從高峰時超過7萬個,跌到2025年初不足3萬個,跌幅超過一半。2026年第一季度,加拿大經濟流失約9.5萬個職位,其中青年勞動者承擔了53%的失業壓力,儘管他們只占整體勞動力市場的14%。


更值得注意的是,過去「大學學位比職業證書更有保障」的傳統認知也正在被打破。根據加拿大統計資料,自2023年起,在15到24歲年齡層中,擁有學士學位的年輕人失業率,已高於僅持有職業證書的同齡人。這並不是否定大學教育價值,而是說明職場需求正在快速偏移,學歷本身不再像過去那樣天然具備優勢。


節目認為,AI正大規模削弱傳統職場發展鏈條中的初級入門崗位。那些大量依賴資料整理、模式辨識、基礎行政、初級分析與標準化產出的工作,最容易被AI吸收。原本適合應屆生進入職場、累積經驗的「第一張椅子」,正在消失。這使得許多年輕人即使做對了所有事情——好好讀書、順利畢業、積極投履歷——依然得不到理想結果。


至於為何加拿大年輕人比美國更辛苦,內容指出,這不代表AI沒有影響加拿大,反而是因為加拿大的經濟吸納能力較弱。美國雖然AI應用更普及,但其經濟成長更強,能夠創造更多新需求與新職位,把被AI擠出的年輕人重新吸納回市場。加拿大則缺乏這種足夠大的「經濟海綿」,因此青年失業問題顯得更加集中與明顯。


面對AI衝擊,節目提出人類仍有三張重要底牌。第一張是靠手藝與實體能力吃飯的工作,也就是需要真實肉身到場、動手操作、與物理世界互動的職業。第二張是需要專業執照、最終由真人承擔責任的工作,例如醫療、法律、會計與金融監管等領域。AI可以成為工具,但無法代替真正持牌並負最終責任的人。第三張則是最難被模仿的——人陪伴人,也就是以共情、在場、判斷、創造與希望為核心的工作,像心理諮商、社工、護理、教育、治療、照護、顧問、真人內容創作等,這些工作的真正價值不只是資訊,而是人與人之間的情感連結。


對還在校的大學生,節目建議應把握「還有時間」這個優勢,盡快行動而不是等待。第一個策略是積極參與co-op或各類實習計畫,提前累積真實工作經驗。因為現在許多工作雖然仍標示為初級職位,卻要求兩到三年經驗,等於樓還在,但梯子沒了。co-op、研究助理、志工專案、實習機會,都是讓自己提前站上樓層的方法。如今,這類實務經驗的重要性甚至已超過單純的GPA成績。


第二個策略是給自己增加一張執照或專業認證,建立一道AI難以跨越的門檻。專業執照不只意味著技能,還代表法律與制度層面的認可與責任承擔,因此能提高就業穩定性與薪酬水平。對於希望進一步建立職涯護城河的年輕人而言,這是一條相對清楚的路徑。


第三個重點則是學會在工作中使用AI,而不是抗拒AI。企業導入AI後,員工的工作效率普遍提升,而每天持續使用AI工具的人,在效率與職業安全感上都高於不使用者。AI可以協助整理會議紀錄、提煉長篇報告重點、撰寫郵件與提案初稿、進行資料分析、快速補足新領域知識。會用AI的人,與不會用AI的人之間的產出差距正逐漸拉大。不過也必須遵守紅線,不能把公司機密、客戶隱私、財務資料與內部文件輸入公共AI平台,並應仔細閱讀公司的AI使用政策。


針對已經在商科、IT或文科等高AI暴露專業中的學生與畢業生,節目則提出更具體的轉型方向。以商科為例,雖然初級財務分析、市場調研、行政報表與基礎客服等工作正快速被AI取代,但商科生同時也是最容易轉型的一群。第一條路是考取CPA等專業證照,讓自己從一般商科畢業生轉變為持牌專業人士;第二條路是進入金融科技、AI風險分析、合規審查等金融與科技交叉領域,並搭配CFA、CFP、FRM、CIM等認證;第三條路則是往以人際關係與信任建立為核心的工作發展,例如大客戶銷售、策略顧問、商業談判等。


整體來看,這篇內容傳達的核心不是單純渲染焦慮,而是提醒年輕人:今天的困境並非因為你不夠努力,而是時代規則變了。在AI重塑就業市場的過程中,單靠傳統升學與求職路線已不再足夠。未來真正有競爭力的人,不只是學歷高的人,而是能提早累積經驗、掌握AI工具、建立專業責任門檻,並投入那些仍然高度依賴人性、信任與陪伴價值領域的人。

[AI 複利] 個人AI作業系統的差距正在指數擴大

 [AI 複利] 個人AI作業系統的差距正在指數擴大


摘要 : 頂尖使用者把AI變成會累積流程、記憶與校驗的系統,普通人卻常每次從零開始。




內容:

YC總裁 Gary Tan 認為,頂尖使用者與一般人之間的 AI 槓桿差距,正以指數級方式拉大:現在可能差十倍,兩個月後變一百倍,再兩個月後甚至上看一千倍。關鍵不只是「會不會用 AI」,而是有沒有把每次使用都變成下一次的基礎。


Gary Tan 舉例,他在準備與 DeepMind 創辦人 Demis Hassabis 的對談時,只對 AI 說了一句「幫我準備一下」,兩分鐘內系統就整理出 Demis 近幾個月的公開觀點、傳記重點、對 AGI 時間線的判斷、研究優先順序,以及雙方立場的重合與分歧,甚至給出對談切入角度。這不是臨時搜尋,而是系統長期累積上下文後的直接調用。


這種差距來自「複利系統」與「歸零系統」的不同。一般人常在需要時才臨時蒐集資料、翻郵件、查新聞;Gary Tan 的做法則是每次接觸到某人、某公司、某議題時,系統都會持續更新,等真正要用時,資訊早已整理完成。他每次用完 AI,都會問自己一句:「這次工作結束後,有什麼東西應該留下來?」


他所累積的第一類資產是流程,也就是 skill。像會議準備、人物研究、讀書筆記這些任務,第一次手動完成後,就把步驟固化,之後系統可自動按既定流程執行,不必每次重新教 AI。第二類資產是上下文,也就是 brain。會議紀要、人物背景、公司資訊、書籍觀點與專案內容會持續進入一個結構化知識庫,彼此關聯、可檢索、可引用,讓決策起點遠高於只靠記憶與臨時搜尋的人。


第三類資產是錯誤,也就是 eval。當 AI 曾出現事實錯誤或內容瞎編時,他不只修正當次結果,而是把錯誤轉成永久規則,例如要求先交叉比對已知事實、輸出必須引用記憶頁面、不同模型分別檢查事實精度與上下文遺漏。對一般人來說,錯誤只是一次返工;對他來說,錯誤是一次系統升級。


Gary Tan 已將這套思路開源為 G-Brain,作為個人 AI 作業系統框架,核心包含 brain、skill 與 eval。但更重要的不是工具本身,而是思維方式:讓今天的工作成為明天的起點。從固定一條常用指令、保存一段常用背景資訊、寫下一條防錯規則開始,就能逐步建立屬於自己的 AI 複利系統。

[AI 分享] Loop Engineering 101:讓 AI 自主迭代交付程式碼

[AI 分享] Loop Engineering 101:讓 AI 自主迭代交付程式碼

摘要 : 介紹 AI Loop Engineering 核心概念,涵蓋迴圈設計、開放與封閉模式、品質關卡、單代理與多代理協作,以及自我學習機制。




內容:

Loop Engineering 101 是一套讓 AI 代理能夠在你不持續介入的情況下,自行完成「發現問題、規劃步驟、執行修改、驗證結果、反覆修正」的工作方法。其核心概念是把 AI 從一次性輸出工具,轉變成能自行檢查與重試的迴圈系統。


所謂的 Loop,本質上是一個會自我迭代的代理流程。最基本的循環包含五個步驟:先找出需要處理的內容,再把目標拆成可執行步驟,接著執行任務,然後驗證結果是否符合目標,最後根據差距繼續修正並再次執行。以修 bug 為例,AI 可以先重現問題、撰寫修正、重新執行測試,直到結果通過為止。這類任務通常具備幾個特徵:容易形成明確步驟、能夠重複嘗試、有可自動檢查的完成定義,而且失敗成本低。


區分了開放式迴圈與封閉式迴圈。開放式迴圈讓代理自由探索與發現,雖然靈活,但往往消耗高、容易偏離目標,甚至產生品質不穩定的結果,因此不適合作為起點。相對地,封閉式迴圈會先定義清楚目標、步驟與驗證條件,代理在限制條件內運作,因此更可預測、更省資源,也更容易控制。作者強調,在實務上封閉式迴圈更適合多數工程場景。


一個設計良好的 Loop,需要具備完整的結構。六個關鍵組件:第一是自動化機制,用來驅動整個流程;第二是工作樹或工作切分,讓不同任務能並行處理;第三是技能,包含代理在專案中需要具備的知識與操作能力;第四是插件與連接器,用來串接 PR、測試、Slack 等外部工具;第五是子代理,讓不同角色分工合作;第六是記憶,用於保存目標與關鍵上下文。不過作者也提醒,不要過早把規則與記憶全塞進對話中,也不要所有事情都靠手動觸發,更不要在還沒明確需求前就把全部組件一次建完。


在代理配置上,比較了單代理與代理艦隊兩種模式。單代理迴圈是由一個代理反覆優化自己的工作成果,當結果不夠好時就持續重跑。這種做法簡單、便宜,對大多數任務已經足夠。若任務複雜度更高,才需要採用多代理模式,也就是讓多個專業代理在協調者管理下共同完成工作。這種方式適合單一代理難以勝任的場景。


實務上,Loop 通常會被設計成一條可持續運行的流水線。系統會從磁碟或既定規則載入目標與規範,再由生成者負責產出內容、檢查者負責驗證、品質關卡負責把關。如果某一步失敗,流程就會回到前面重新迭代。這樣的設計能把「重現問題、修正、驗證」自動化,但最終是否合併與發布,仍應由人類掌控。好的 Loop 會主動提出修正並通知你,但不會自行上線。


品質關卡是整個 Loop 中非常重要的一層。若沒有品質把關,代理只會更快地產出低品質結果。因此,在成果真正送出前,必須經過嚴格的驗證。這個關卡應建立在人類無法妥協的檢查項目上,例如編譯是否通過、型別系統是否正確、整合測試與變異測試是否成功、屬性測試是否符合預期,以及靜態分析、格式檢查、CI 等是否全部通過。品質關卡不只是保護機制,更是讓整個 Loop 能持續運作的前提。


最後,「自我學習迴圈」的觀念。真正有價值的 Loop,不只是重複執行,而是能把每次失敗的教訓保留下來,讓下一輪做得更好。這代表系統需要能攜帶規則、記錄錯誤、分析原因,並把學到的經驗納入後續執行。文中建議建立專門的規則文件,例如把錯誤轉化為可重用的經驗、自己維護規則庫、信任但驗證每次輸出,並且不要讓代理自動修改最重要的檢查規則。


整體而言,這篇內容強調的不是單次提示詞怎麼寫,而是如何設計一套能持續運作、能自我修正、能受控學習的 AI 工程流程。你真正要打造的,不只是會提示代理的系統,而是會從經驗中變得更好的系統。