2026年6月17日 星期三

[AI 分享] 提升AI生產力的核心Skill架構

 [AI 分享] 提升AI生產力的核心Skill架構

摘要 : 真正拉開AI效率差距的,不是模型強弱,而是Skill配置與工作流設計。




內容:

很多人使用 AI 時,常陷入一個誤區:一直糾結到底哪個平台最強、哪個大模型最聰明。但真正決定生產力上限的,往往不只是平台本身,而是你替它配置了什麼 Skill。若底層能力沒有補齊,再強的 Agent 也可能只是空轉。


這套核心 Skill 架構大致可以分成四個部分。第一部分是原生基礎 Skill,它不直接負責執行具體任務,而更像是替 AI 裝上一個自我進化引擎,讓它能自己寫新工具,或是到外部尋找現成幫手。這是無論未來想讓 AI 做什麼,都應該最先打好的基礎。


第二部分聚焦在程式開發時常見的幻覺問題。AI 生成的程式碼經常看起來邏輯完整,但實際執行卻會報錯。因此這裡引入工程化規則,例如測試驅動開發與專家審計,讓 AI 不再憑直覺亂寫,而是依照嚴格標準來完成程式碼。


第三部分談的是前端設計。現在許多 AI 生成的網頁都有一種明顯的「AI 味」,缺少質感與耐看度。因此需要專業設計類 Skill,協助 AI 產出更成熟、更有審美與商業感的介面設計。


第四部分則是內容創作。目標不只是讓 AI 寫出好內容,而是打通從配圖、資訊圖表繪製、排版、翻譯,到一鍵多平台發布的完整流程,形成真正的自動化閉環,把大量瑣碎工作交由 Agent 處理。


在原生基礎 Skill 中,第一個重要工具是 Skill Creator,這是 Anthropic 官方推出的工具。它的核心作用,是把成熟工作流打包成可以高頻重複使用的原子工具。過去如果想自己製作 Skill,往往需要研究繁瑣格式、手動修改配置檔,稍有錯誤就容易報錯,而且做出來的效果也未必理想。


有了 Skill Creator 後,流程被大幅簡化。使用者不需要硬啃開發文件,只要像對同事交辦工作一樣,用自然語言描述流程,或者直接提供既有 SOP 與操作手冊,它就能協助生成 Skill。整體流程大致分成三步:先用口語提出需求,再由系統在後台自動測試、打磨與迭代,最後不到一分鐘,就能產出標準且可用的 Skill。這大幅降低了手寫配置與除錯的負擔。


第二個原生 Skill 是 Find Skills。它不只是傳統意義上的應用商店搜尋工具,而是把被動搜尋變成主動指派。當使用者交給 Agent 一個複雜任務,例如設計帶有一鍵結算機制的系統 UI,若 Agent 本身不具備 UI 設計能力,它不會直接卡住,而是會在後台先把需求拆解成像 UI Design 這樣的原子意圖,再連接到 skill.sh 平台,主動盤點合適的 Skill。


它會評估哪些 Skill 安裝量高、作者可靠、口碑佳,並過濾掉冗餘或廢棄的工具,再把最適合的選項呈現給使用者。確認後,還能透過一行指令自動下載安裝。簡單來說,Skill Creator 讓 Agent 能自己造工具,Find Skills 則讓它能主動尋找外援。這兩者搭配後,Agent 的能力邊界會被大幅打開。


進入實戰場景後,軟體開發是一個很重要的應用方向。這裡提到的第一個 Skill 是 Superpowers。它的核心邏輯很硬核,直接把測試驅動開發的工程標準,變成 Agent 必須遵守的規則。很多人用 AI 寫程式時,第一直覺是讓它幫忙寫測試,而 Superpowers 則把整個流程徹底制度化。


它會強制 Agent 進入標準的紅綠重構循環。第一步是先寫一個必然失敗的測試,用來證明功能尚未實現;第二步只允許撰寫最少量、剛好能讓測試通過的程式碼;第三步則是在測試通過後,再進行結構優化與程式碼重構,去除不良設計與壞味道。


更穩健的是,完成程式後它不會立刻交差,而是啟動兩輪內部交叉審計。第一層是藍圖對齊審視,重點不是只看程式碼是否能跑,而是檢查實作邏輯是否真正對齊最初需求。第二層則是高危邊界挑刺,專門去找像空指標、例外狀況與隱藏邊界條件這類問題。雖然這套流程看似更花時間,但因為第一版程式碼品質更高,能大幅降低後續反覆 debug 的成本,長期來看反而更省時間與 token。


此外,它在流程最後仍保留人工決策空間,使用者可以選擇直接 merge 合併、暫時 stay 觀察,或是 drop 作廢。這代表 AI 並不是完全接管,而是以工程化方式輔助人類做更高品質的判斷。


如果要打造的不是單一功能模組,而是完整的商業系統,那麼單靠一位程式設計師的視角通常不夠。這時候就需要更像團隊協作的工具,例如 G-Stack。這個工具由 YC 總裁 Gary Tan 推出,最大的特色是在 Agent 裡直接內建 23 個不同專家角色,例如 CEO、視覺設計師、後端架構師、安全專家與發布架構師等。使用者可以透過斜線命令直接召喚這些角色,讓 AI 在單一工作流中模擬跨職能團隊協作。

[AI 分享] 可交付AI Agent系統構建

 [AI 分享] 可交付AI Agent系統構建

摘要 : 從產品認知、上下文管理到評估體系,整理可交付AI Agent系統的實戰方法與原則。




內容:

這篇內容主要在討論:**如何構建真正可交付的 AI Agent 系統**。整體思路來自 5 月 31 日 AI Engineer 的一支 YouTube 影片,但也與企業 AI Agent 交付、AI Coding Harness 以及陪跑專案中的實際經驗高度契合,因此很值得整理分享。


全文大致可分成五個核心方向,從最底層的認知開始,談人類與 Agent 使用產品的方式差異,接著談上下文管理、狀態機制、評估體系建設,以及提示詞與技術實作上的原則。其中作者特別強調:**評估體系是最關鍵、也最容易被忽略的一環**。


首先,最核心的認知是:**人類與 Agent 消費產品的方式並不一樣**。  

以 HTML 為例,人類在看網頁時,往往是從視覺、元素、關聯與互動效果去理解;但 Agent 在處理 HTML 時,更多是從文字結構與語意關係去推斷內容。因此,當我們設計產品或資料給 AI 使用時,不能完全沿用「給人看的方式」,而要開始思考怎樣讓模型更容易抓取、總結與理解。


這也帶出第一個重要原則:**不需要把所有文件都丟給 AI**。  

因為很多通用知識模型本來就知道了,真正需要補充的,反而是那些模型最容易誤解的地方,例如產品中的特殊規則、常見踩坑點、容易混淆的邏輯等。換句話說,給 AI 的資訊不在於多,而在於是否能幫助它避開誤解。


此外,在設計產品時,也可以逐步往 **更容易被 AI 理解的結構** 靠攏。比如以往很多頁面設計是優先給人類瀏覽體驗,但未來也許需要兼顧「是否有利於 Agent 抓取、解析、摘要與推理」。這些與人的差異雖然微妙,卻會在實作過程中持續影響成效。


第二個重點是**上下文管理**。  

在 AI Coding 或 Agent 工作流中,常常有大量時間花在補充背景資訊與前置條件上,而且每次新開一個上下文,都要重新講一次,效率很低。比較好的做法,是把這些重複性高、可複用的資訊提前整理起來,做成可被調用的內容模組,例如 skills 或 agent cmd,讓模型在需要時自動載入。


這樣做的價值在於:當你發現某些背景資訊、操作說明或工作流程總是要重複提供,就應該把它們結構化,沉澱成系統能力,而不是每次人工重新輸入。這能大幅降低前置溝通成本。


不過,就算把 skills 都準備好了,也不代表模型就一定能從頭到尾穩定執行。  

因為大模型本質上仍然是機率性系統,即便 temperature 設為 0,穩定性仍有限,也可能出現幻覺或中途偏離。因此,在 AI Agent 產品中,不論是 AI Coding 還是其他 Agent 類型系統,**狀態機制** 都是很有效的處理方式,可以幫助流程更可控。


接著進入全文最重要的部分:**評估體系建設**。  

這裡引用了一個很關鍵的觀點:如果沒有評估,就沒有改進。對可交付的 AI Agent 系統來說,評估不是附屬品,而是核心能力。


曾把過去大量的人類經驗文件整理成 skills,讓 AI 在處理問題時調用,原本以為這樣效果會更好;但在建立評估體系後卻發現,**把所有 skills 都給模型時,準確率只有 70%;反而什麼 skills 都不給時,準確率可以達到 97%**。這是一個非常有啟發性的結果。


原因在於,skills 本身也會佔據上下文,而且其中可能混入過時文件、不夠精準的指導,或與當前專案結構不一致的內容。這些資訊不但沒有幫助,反而可能干擾模型判斷。因此,這裡得到一個非常重要的結論:  

**與其給模型固定規定,不如給它指導原則。**


也就是說,不要試圖用大量細碎、陳舊、僵硬的規則去束縛模型,而應該提供方向性的引導,讓模型依據當前情境做合理判斷。這被認為是整支影片中最有價值的一個觀點。


至於評估體系怎麼建立,可以分成幾個層次:


第一層是**確定性驗證**。  

例如在程式碼提交流程中,透過單元測試、Lint、Build 驗證等方式做檢查,這些屬於 CI/CD 中本來就應該存在的固定環節。AI 介入後,這些機制不能省,反而更重要,因為它們能提供穩定、可重複的品質保障。


第二層是**規則化檢查**。  

像是程式碼規範、靜態檢查、格式化與一些明確可定義的規則,這些也應該交給工具或系統做,而不是完全依賴模型的主觀判斷。


第三層才是**模型評估**。  

但這裡有個關鍵技巧:不要讓模型做過於寬泛的評價。例如不要問「這段程式碼好不好」,而應該把問題窄化成具體維度,例如:「找出這段程式碼中與需求不一致的地方」、「列出可能缺失的邊界條件」、「指出風險較高的區域」。當評估範圍被縮小後,模型的焦點會更集中,輸出品質也更穩定。


最後一層仍然是**人工審查**。  

即使前面有規則檢查與模型評估,人依然不能完全退出。對於重要程式碼、關鍵業務邏輯、風險區域,例如支付流程、核心架構、可維護性等,人還是需要親自看。也就是說,真正可交付的系統,不是把責任全部推給 AI,而是建立一個多層次驗證機制,讓 AI、規則與人工彼此補位。


因此,不只是 AI Agent,包含 RAG、Harness、AI Coding 流程,只要是要落地交付的系統,**都必須有評估體系**。這一點非常關鍵。


最後回到 skills 的問題,這段內容也再次提醒:**不是 skills 給得越多越好**。  

當模型本身的理解與執行能力越來越強時,我們需要做的,不是塞滿所有文件,而是「輕推一下」,把它引導到正確方向。真正有效的做法,不是用大量陳舊規則綁住模型,而是提供清楚、簡潔、方向明確的原則,讓模型在具體任務中靈活發揮。

[AI 反思] AI寫程式一年後,你是變強還是更依賴了?

 [AI 反思] AI寫程式一年後,你是變強還是更依賴了?

摘要 : AI能讓寫程式更快,但也可能讓獨立思考、判斷與重構能力悄悄退化,真正風險是你失去離開AI後的戰力。




內容:

這提出一個很值得所有工程師自問的問題:這一年大量使用 AI 寫程式,到底是真的變強了,還是只是變得更依賴工具?表面上看,很多原本要花很久的工作,現在只要幾分鐘就能完成,效率提升非常有感,也容易讓人產生「自己明顯進步了」的感覺。


但真正的風險不在於 AI 取代你,而在於你長期依賴它之後,獨立解決問題的能力可能正在退化。當某一天碰上 AI 幫不上忙、給錯答案,或者情境非常複雜時,你若已失去判斷與修正能力,就會發現自己既離不開它,也無法真正頂上去。這才是最危險的地方,因為那往往直接影響職場競爭力。


AI 確實在某些任務上能顯著提速。以 GitHub 的 Copilot 實驗為例,使用者完成任務的速度快了將近 56%。但這類任務往往是邊界清楚、標準答案多、重複性高的模板型工作,例如從零寫一個 HTTP 伺服器。這正是 AI 最擅長的「甜區」,並不能代表一個工程師真正的整體能力。


真正有價值、也真正困難的部分,通常不是模板工作,而是那些複雜業務邏輯、架構設計、效能瓶頸排查,或是在模糊情境下做出正確判斷。這些問題沒有單一標準答案,也很難靠模式套用解決。AI 在這類場景裡給出的內容,常常只是「看起來合理」的參考,而不是真正理解系統後的推理結果。


AI 的核心不是理解,而是模式匹配。它根據大量既有資料去猜測「下一段最像什麼」,所以面對常見題型時表現很好,但只要題目稍微偏離它熟悉的範圍,就可能產生語法正確、語氣篤定、實際卻完全不適用的答案。最可怕的不是 AI 出錯,而是它出錯時,你也剛好失去了辨識錯誤的能力。


這種「錯覺式提效」並非空談。引用一項 2025 年的實驗,讓 16 位資深開發者在自己熟悉的大型成熟專案中完成 246 個真實任務。這些人原本預期 AI 能讓自己快 24%,實際做完後主觀感受也認為快了 20%,但客觀測量結果卻是平均慢了 19%。雖然研究樣本有限,不能當成絕對定論,但至少說明一件事:連資深工程師都可能誤判自己在 AI 輔助下的真實效率。


除了效率錯覺,程式碼品質的變化也值得警惕。GitClear 分析了 2.11 億行程式碼、長達 5 年的資料後發現,2024 年 5 行以上的重複程式碼塊暴增到 8 倍;而代表整理、重構、抽象化的程式碼比例,則從 2021 年的大約 25% 一路下降到 2024 年不到 10%。更值得注意的是,2024 年成為首次「複製貼上的程式碼量超過重構整理程式碼量」的一年。


這代表整體開發行為正在改變:大家都更快地新增程式碼,卻越來越少回頭整理結構、抽象邏輯、提升可維護性。而後者恰恰是資深工程師最重要的價值所在,也是判斷力與設計能力的體現。若這部分長期不練,留下來的系統就會愈來愈像拼湊品。研究也指出,這類克隆式程式碼的缺陷率,可能比正常程式碼高出 15% 到 50%。


進一步把問題擴大到整體認知層面。根據一項針對 666 人的研究,越頻繁使用 AI 的人,批判性思維分數越低;其中關鍵機制被稱為「認知卸載」,也就是把原本應由自己完成的思考外包給工具。更值得注意的是,越年輕、越依賴 AI 的人,能力下滑的幅度越明顯。當你把「想」這件事長期交出去,自己的思考肌肉就會更快萎縮。


最後把使用者分成三類來看。第一類是新手,AI 讓他們看起來進步很快,但其實很多只是短板被工具暫時撐住,能力本身未必真的補上。第二類是中階使用者,效率感最強、爽感最高,但也最容易在不知不覺中減少親手解題的頻率,因此退化風險最大。第三類是真正的高手,他們不會只看「有 AI 時我多快」,而是更在意「拿掉 AI 之後,我還剩多少戰力」。


整篇文章的核心提醒是:當某項能力可以被工具低成本取代,市場就不再為「只會執行」的人支付高溢價。AI 已經逐漸把「會寫程式碼」這件事變成標準化能力,因此真正更值錢的,不再只是寫得快,而是你是否知道該寫什麼、為什麼這樣寫、出了問題怎麼判斷,以及能不能在沒有 AI 的情況下仍然獨立完成關鍵決策。

2026 .NET 開發者現代技術棧與實務建議

2026 .NET 開發者現代技術棧與實務建議



1. IDE 與編輯器(IDE & Editors)

  • 主力推薦:VS Code + GitHub Copilot / Cursor
  • 企業級選擇:Rider
  • 核心思維AI-assisted coding is the default now AI 輔助編碼已成為標準工作方式,而非額外加分項。

2. 測試(Testing)

  • 單元/整合測試:xUnit + NSubstitute + Shouldly
  • 容器化測試:Testcontainers
  • E2E 測試:Playwright
  • 核心思維Testcontainers changed integration testing forever 讓測試環境真正貼近真實系統依賴。

3. 日誌與可觀測性(Logging & Observability)

  • 結構化日誌:Serilog
  • 標準觀測:OpenTelemetry
  • 本機儀表板:Aspire Dashboard
  • 後端分析:Seq / Grafana
  • 核心思維If you're not using OpenTelemetry yet, start now 它已成為可觀測性的事實標準。

4. API 開發(API Development)

  • 主力框架:Minimal APIs
  • 文件介面:Scalar(OpenAPI UI)
  • HTTP Client:Refit
  • 中介處理:MediatR
  • 核心思維Minimal APIs are all you need 對大多數情境已完全足夠,大幅降低複雜度。

5. 資料與快取(Data & Caching)

  • ORM:EF Core(大多數情境)
  • 高性能查詢:Dapper(熱路徑)
  • 快取:Redis
  • 資料庫:PostgreSQL / SQL Server
  • 核心思維EF Core for most things, Dapper for hot paths

6. 驗證與安全(Auth & Security)

  • 自架方案:Keycloak
  • 雲端方案:Entra ID (Azure AD)
  • 標準協定:OAuth 2.0 / OIDC + JWT Bearer
  • 核心思維Keycloak is the go-to for self-hosted auth

7. 容器與編排(Containers & Orchestration)

  • 基礎:Docker + Docker Compose
  • .NET 整合中樞:Aspire
  • 生產環境:Kubernetes
  • 核心思維Aspire makes local dev with containers trivial

8. CI/CD

  • 主力:GitHub Actions
  • 企業級:Azure DevOps Pipelines
  • 快速部署:Aspire deployments
  • 核心思維Aspire manifest to Azure deployment in minutes

9. 雲端(Cloud)

  • 主要平台:Azure(推薦深入)、AWS、Google Cloud
  • IaC:Bicep(Azure)或其他 IaC 工具
  • 核心思維Pick one cloud and go deep

10. 前端(Frontend)

  • 企業內部工具:Blazor
  • 對外產品:React + TypeScript + Tailwind CSS
  • 核心思維Blazor for internal tools, React for public-facing

11. 訊息與背景處理(Messaging)

  • 訊息代理:RabbitMQ / Azure Service Bus
  • 抽象層:Wolverine
  • 背景工作:Background workers
  • 核心思維Wolverine abstracts the broker for you

12. 架構設計(Architecture)

  • Vertical Slices
  • Event-Driven Design
  • Microservices(視規模而定)

整體趨勢總結(2026 版)

  • AI 已成標配:Copilot / Cursor 是日常開發基礎。
  • 可觀測性標準化:OpenTelemetry 是必備。
  • 開發體驗大幅整合:Aspire 成為本機多服務 + 容器 + 觀測 + 部署的關鍵橋樑。
  • 務實混合策略:EF Core + Dapper、Blazor + React、Minimal APIs 為主。
  • 少而精:每個領域選擇 1~2 個成熟工具深入,而非廣度優先。
  • 端到端思維:現代 .NET 工程師必須掌握從開發、測試、觀測、部署到架構的全鏈路。

 

2026年6月16日 星期二

[AI 影響] WebMCP正在改變AI連接世界的方式

 [AI 影響] WebMCP正在改變AI連接世界的方式


摘要 : WebMCP有望統一AI與各類系統的連接方式,讓AI從只會回答問題,進化到能真正調用工具完成任務。




內容:

最近許多人開始討論一個新詞——WebMCP。它之所以受到開發者關注,不是因為技術本身多麼複雜,而是因為它可能解決AI目前最關鍵也最尷尬的問題:模型雖然很聰明,卻無法直接接觸現實世界中的資料與工具。


過去的大模型像是一位被困在房間裡的天才。它懂程式、懂法律、懂醫學,也懂商業分析,但它不知道企業資料庫裡有什麼,也無法直接接觸公司的內部系統、最新網頁內容,或是支付系統、工單系統與辦公軟體中的即時資訊。


因此,當企業希望AI真正幫忙做事時,往往必須額外開發各種介面、外掛與適配層。不同工具有不同接法,不同模型又有不同協議,導致開發團隊花費大量時間在重複建設連接能力。


而WebMCP想做的,就是把這些混亂的連線方式統一起來。它可以被理解為AI世界裡的USB介面。過去每接一個裝置都需要不同的線材與轉接方式,現在只要支援同一套標準,就能更直接地完成連接。


當一個系統支援WebMCP後,AI便可以透過一致的方式發現可用能力、呼叫工具並取得資料。這代表企業不必再為每一個模型單獨開發整合方式,也不必為每一套工具重新做一次適配,整體開發效率將大幅提升。


更重要的是,這背後代表一種新的工作模式正在形成。過去是人操作軟體,後來變成軟體輔助人,而現在正逐步進入第三種模式:人只需要告訴AI目標,AI就能主動調用多個系統來完成任務。


例如,銷售經理只要說一句「幫我整理本週客戶跟進情況並生成下週計畫」,AI就可以自動讀取CRM系統、檢查郵件往來、分析客戶狀態,甚至進一步安排相關會議。整個流程中,人類負責下達目標,AI則負責執行。


這也是為什麼越來越多公司開始關注MCP。因為大家逐漸意識到,大模型本身的能力提升雖然重要,但已經不是唯一瓶頸。能否順利、安全、可靠地把AI接上真實世界的工具與系統,才是下一階段競爭的核心。


誰能讓AI安全地存取工具,誰能讓AI穩定地執行任務,誰就更接近真正可用的AI助手。從這個角度來看,AI革命或許並不是已經完成,而是才剛進入基礎設施建設的階段。


過去幾年,整個產業都在努力訓練更聰明的大腦;而現在,大家開始為這個大腦裝上眼睛、耳朵與雙手。WebMCP所代表的,正是AI從「會思考」走向「會做事」的重要一步。

[AI 衝擊] 加拿大年輕人就業困境與AI時代出路

 [AI 衝擊] 加拿大年輕人就業困境與AI時代出路

摘要:加拿大青年失業惡化,入門職缺銳減,AI正改變職場規則,年輕人需及早調整方向與技能。




內容:


加拿大年輕人近年找入門級工作的難度明顯升高,尤其對即將畢業的大學生與剛離校的年輕人而言,情況相當嚴峻。節目一開始引用了多位年輕人的真實案例:有人成績優秀、實習評價良好,畢業後卻長期找不到工作;有人投出70份履歷仍無錄取通知,只能靠零售工作維生;也有人投了超過100家公司,卻連一次面試機會都沒有。這些案例顯示,問題已不只是個人努力與否,而是整體就業結構正在改變。


從數據上看,這種困境並非個案。2025年第一季度,加拿大應屆畢業生平均失業率達到11.2%,創下至少20年來、除疫情期間外的最高水平。同時,全國入門級職位空缺從高峰時超過7萬個,跌到2025年初不足3萬個,跌幅超過一半。2026年第一季度,加拿大經濟流失約9.5萬個職位,其中青年勞動者承擔了53%的失業壓力,儘管他們只占整體勞動力市場的14%。


更值得注意的是,過去「大學學位比職業證書更有保障」的傳統認知也正在被打破。根據加拿大統計資料,自2023年起,在15到24歲年齡層中,擁有學士學位的年輕人失業率,已高於僅持有職業證書的同齡人。這並不是否定大學教育價值,而是說明職場需求正在快速偏移,學歷本身不再像過去那樣天然具備優勢。


節目認為,AI正大規模削弱傳統職場發展鏈條中的初級入門崗位。那些大量依賴資料整理、模式辨識、基礎行政、初級分析與標準化產出的工作,最容易被AI吸收。原本適合應屆生進入職場、累積經驗的「第一張椅子」,正在消失。這使得許多年輕人即使做對了所有事情——好好讀書、順利畢業、積極投履歷——依然得不到理想結果。


至於為何加拿大年輕人比美國更辛苦,內容指出,這不代表AI沒有影響加拿大,反而是因為加拿大的經濟吸納能力較弱。美國雖然AI應用更普及,但其經濟成長更強,能夠創造更多新需求與新職位,把被AI擠出的年輕人重新吸納回市場。加拿大則缺乏這種足夠大的「經濟海綿」,因此青年失業問題顯得更加集中與明顯。


面對AI衝擊,節目提出人類仍有三張重要底牌。第一張是靠手藝與實體能力吃飯的工作,也就是需要真實肉身到場、動手操作、與物理世界互動的職業。第二張是需要專業執照、最終由真人承擔責任的工作,例如醫療、法律、會計與金融監管等領域。AI可以成為工具,但無法代替真正持牌並負最終責任的人。第三張則是最難被模仿的——人陪伴人,也就是以共情、在場、判斷、創造與希望為核心的工作,像心理諮商、社工、護理、教育、治療、照護、顧問、真人內容創作等,這些工作的真正價值不只是資訊,而是人與人之間的情感連結。


對還在校的大學生,節目建議應把握「還有時間」這個優勢,盡快行動而不是等待。第一個策略是積極參與co-op或各類實習計畫,提前累積真實工作經驗。因為現在許多工作雖然仍標示為初級職位,卻要求兩到三年經驗,等於樓還在,但梯子沒了。co-op、研究助理、志工專案、實習機會,都是讓自己提前站上樓層的方法。如今,這類實務經驗的重要性甚至已超過單純的GPA成績。


第二個策略是給自己增加一張執照或專業認證,建立一道AI難以跨越的門檻。專業執照不只意味著技能,還代表法律與制度層面的認可與責任承擔,因此能提高就業穩定性與薪酬水平。對於希望進一步建立職涯護城河的年輕人而言,這是一條相對清楚的路徑。


第三個重點則是學會在工作中使用AI,而不是抗拒AI。企業導入AI後,員工的工作效率普遍提升,而每天持續使用AI工具的人,在效率與職業安全感上都高於不使用者。AI可以協助整理會議紀錄、提煉長篇報告重點、撰寫郵件與提案初稿、進行資料分析、快速補足新領域知識。會用AI的人,與不會用AI的人之間的產出差距正逐漸拉大。不過也必須遵守紅線,不能把公司機密、客戶隱私、財務資料與內部文件輸入公共AI平台,並應仔細閱讀公司的AI使用政策。


針對已經在商科、IT或文科等高AI暴露專業中的學生與畢業生,節目則提出更具體的轉型方向。以商科為例,雖然初級財務分析、市場調研、行政報表與基礎客服等工作正快速被AI取代,但商科生同時也是最容易轉型的一群。第一條路是考取CPA等專業證照,讓自己從一般商科畢業生轉變為持牌專業人士;第二條路是進入金融科技、AI風險分析、合規審查等金融與科技交叉領域,並搭配CFA、CFP、FRM、CIM等認證;第三條路則是往以人際關係與信任建立為核心的工作發展,例如大客戶銷售、策略顧問、商業談判等。


整體來看,這篇內容傳達的核心不是單純渲染焦慮,而是提醒年輕人:今天的困境並非因為你不夠努力,而是時代規則變了。在AI重塑就業市場的過程中,單靠傳統升學與求職路線已不再足夠。未來真正有競爭力的人,不只是學歷高的人,而是能提早累積經驗、掌握AI工具、建立專業責任門檻,並投入那些仍然高度依賴人性、信任與陪伴價值領域的人。

[AI 複利] 個人AI作業系統的差距正在指數擴大

 [AI 複利] 個人AI作業系統的差距正在指數擴大


摘要 : 頂尖使用者把AI變成會累積流程、記憶與校驗的系統,普通人卻常每次從零開始。




內容:

YC總裁 Gary Tan 認為,頂尖使用者與一般人之間的 AI 槓桿差距,正以指數級方式拉大:現在可能差十倍,兩個月後變一百倍,再兩個月後甚至上看一千倍。關鍵不只是「會不會用 AI」,而是有沒有把每次使用都變成下一次的基礎。


Gary Tan 舉例,他在準備與 DeepMind 創辦人 Demis Hassabis 的對談時,只對 AI 說了一句「幫我準備一下」,兩分鐘內系統就整理出 Demis 近幾個月的公開觀點、傳記重點、對 AGI 時間線的判斷、研究優先順序,以及雙方立場的重合與分歧,甚至給出對談切入角度。這不是臨時搜尋,而是系統長期累積上下文後的直接調用。


這種差距來自「複利系統」與「歸零系統」的不同。一般人常在需要時才臨時蒐集資料、翻郵件、查新聞;Gary Tan 的做法則是每次接觸到某人、某公司、某議題時,系統都會持續更新,等真正要用時,資訊早已整理完成。他每次用完 AI,都會問自己一句:「這次工作結束後,有什麼東西應該留下來?」


他所累積的第一類資產是流程,也就是 skill。像會議準備、人物研究、讀書筆記這些任務,第一次手動完成後,就把步驟固化,之後系統可自動按既定流程執行,不必每次重新教 AI。第二類資產是上下文,也就是 brain。會議紀要、人物背景、公司資訊、書籍觀點與專案內容會持續進入一個結構化知識庫,彼此關聯、可檢索、可引用,讓決策起點遠高於只靠記憶與臨時搜尋的人。


第三類資產是錯誤,也就是 eval。當 AI 曾出現事實錯誤或內容瞎編時,他不只修正當次結果,而是把錯誤轉成永久規則,例如要求先交叉比對已知事實、輸出必須引用記憶頁面、不同模型分別檢查事實精度與上下文遺漏。對一般人來說,錯誤只是一次返工;對他來說,錯誤是一次系統升級。


Gary Tan 已將這套思路開源為 G-Brain,作為個人 AI 作業系統框架,核心包含 brain、skill 與 eval。但更重要的不是工具本身,而是思維方式:讓今天的工作成為明天的起點。從固定一條常用指令、保存一段常用背景資訊、寫下一條防錯規則開始,就能逐步建立屬於自己的 AI 複利系統。

[AI 分享] Loop Engineering 101:讓 AI 自主迭代交付程式碼

[AI 分享] Loop Engineering 101:讓 AI 自主迭代交付程式碼

摘要 : 介紹 AI Loop Engineering 核心概念,涵蓋迴圈設計、開放與封閉模式、品質關卡、單代理與多代理協作,以及自我學習機制。




內容:

Loop Engineering 101 是一套讓 AI 代理能夠在你不持續介入的情況下,自行完成「發現問題、規劃步驟、執行修改、驗證結果、反覆修正」的工作方法。其核心概念是把 AI 從一次性輸出工具,轉變成能自行檢查與重試的迴圈系統。


所謂的 Loop,本質上是一個會自我迭代的代理流程。最基本的循環包含五個步驟:先找出需要處理的內容,再把目標拆成可執行步驟,接著執行任務,然後驗證結果是否符合目標,最後根據差距繼續修正並再次執行。以修 bug 為例,AI 可以先重現問題、撰寫修正、重新執行測試,直到結果通過為止。這類任務通常具備幾個特徵:容易形成明確步驟、能夠重複嘗試、有可自動檢查的完成定義,而且失敗成本低。


區分了開放式迴圈與封閉式迴圈。開放式迴圈讓代理自由探索與發現,雖然靈活,但往往消耗高、容易偏離目標,甚至產生品質不穩定的結果,因此不適合作為起點。相對地,封閉式迴圈會先定義清楚目標、步驟與驗證條件,代理在限制條件內運作,因此更可預測、更省資源,也更容易控制。作者強調,在實務上封閉式迴圈更適合多數工程場景。


一個設計良好的 Loop,需要具備完整的結構。六個關鍵組件:第一是自動化機制,用來驅動整個流程;第二是工作樹或工作切分,讓不同任務能並行處理;第三是技能,包含代理在專案中需要具備的知識與操作能力;第四是插件與連接器,用來串接 PR、測試、Slack 等外部工具;第五是子代理,讓不同角色分工合作;第六是記憶,用於保存目標與關鍵上下文。不過作者也提醒,不要過早把規則與記憶全塞進對話中,也不要所有事情都靠手動觸發,更不要在還沒明確需求前就把全部組件一次建完。


在代理配置上,比較了單代理與代理艦隊兩種模式。單代理迴圈是由一個代理反覆優化自己的工作成果,當結果不夠好時就持續重跑。這種做法簡單、便宜,對大多數任務已經足夠。若任務複雜度更高,才需要採用多代理模式,也就是讓多個專業代理在協調者管理下共同完成工作。這種方式適合單一代理難以勝任的場景。


實務上,Loop 通常會被設計成一條可持續運行的流水線。系統會從磁碟或既定規則載入目標與規範,再由生成者負責產出內容、檢查者負責驗證、品質關卡負責把關。如果某一步失敗,流程就會回到前面重新迭代。這樣的設計能把「重現問題、修正、驗證」自動化,但最終是否合併與發布,仍應由人類掌控。好的 Loop 會主動提出修正並通知你,但不會自行上線。


品質關卡是整個 Loop 中非常重要的一層。若沒有品質把關,代理只會更快地產出低品質結果。因此,在成果真正送出前,必須經過嚴格的驗證。這個關卡應建立在人類無法妥協的檢查項目上,例如編譯是否通過、型別系統是否正確、整合測試與變異測試是否成功、屬性測試是否符合預期,以及靜態分析、格式檢查、CI 等是否全部通過。品質關卡不只是保護機制,更是讓整個 Loop 能持續運作的前提。


最後,「自我學習迴圈」的觀念。真正有價值的 Loop,不只是重複執行,而是能把每次失敗的教訓保留下來,讓下一輪做得更好。這代表系統需要能攜帶規則、記錄錯誤、分析原因,並把學到的經驗納入後續執行。文中建議建立專門的規則文件,例如把錯誤轉化為可重用的經驗、自己維護規則庫、信任但驗證每次輸出,並且不要讓代理自動修改最重要的檢查規則。


整體而言,這篇內容強調的不是單次提示詞怎麼寫,而是如何設計一套能持續運作、能自我修正、能受控學習的 AI 工程流程。你真正要打造的,不只是會提示代理的系統,而是會從經驗中變得更好的系統。

[AI 影響] AI會取代普通人工作嗎?

 [AI 影響] AI會取代普通人工作嗎?

摘要:AI更可能重塑工作分工,而非大規模取代多數普通人;真正先吃到紅利的,多是上游基礎設施公司。




內容:


這一年來,關於「AI可能要替代你了」的說法幾乎隨處可見。從文員、設計師、程式設計師、客服到會計,很多職位都被拿來討論,甚至還有人認為未來普通人將大規模失業。面對這種焦慮,作者提出一個相對逆向的觀點:未來十年,AI大機率不會像許多人想像的那樣,直接大規模取代絕大多數普通人的工作。


AI當然會深刻影響職場,但它更像是在改寫工作的結構、分工與流程,而不是把大部分人直接踢出職場。更重要的是,這一波AI帶來的最大產業紅利,往往不屬於普通人,而是集中在上游基礎設施領域,例如賣晶片、賣雲服務、賣算力、做資料中心、做大模型底座的公司。普通人更可能拿到的,不是產業紅利,而是工具紅利,也就是利用AI讓原本的工作做得更快、更便宜、更體面一些。


這裡的關鍵差別在於,「吃產業紅利」和「使用工具紅利」是兩回事。產業紅利屬於資本、技術、牌照、能源和基礎設施擁有者;工具紅利才與多數普通人有關。這和當年網際網路興起時很像,真正先賺大錢的是平台、支付、廣告、物流與雲服務公司,而不是每一個會做網站的人。對普通人來說,真正的機會往往來自用新工具改善效率、延伸能力,而非一夜暴富。


至於AI為什麼很難在未來十年大規模取代多數崗位,需要從更底層的邏輯來看。判斷一個崗位能否被替代,不是看AI會不會寫字、識圖、畫圖或寫程式,而是看三件事:第一,AI能不能長期穩定地把整串任務都做對;第二,它的犯錯機率是否足夠低;第三,一旦出錯,企業能不能承受代價。


這裡牽涉到機率論的問題。很多人誤以為只要AI平均表現夠高,就能替代人類。但實際上,真正決定能否替代的,不是平均水平,而是整條流程的可靠性。若一個系統每一步有95%的正確率,聽起來很高,但如果一份工作包含20個關鍵環節,而且每一環都要可靠,那整條流程全部正確的機率就會快速下降。現實中的工作往往不是解一道題,而是由理解需求、蒐集資訊、處理例外、溝通協調、做判斷、交付結果與承擔責任等多個環節串聯而成,因此AI在真實公司流程裡常常會卡住。


從資訊理論的角度看,也能理解這個問題。AI最擅長處理的是那些規則清晰、格式標準、重複度高、已經被表達出來並結構化的資訊;但它較不擅長處理上下文缺失、資訊殘缺、噪聲大、需要在不完整資訊下做判斷的情境。而人類工作中最有價值、最困難的部分,往往恰恰就是後者。


例如,主管一句「這個方案我感覺不太對,但我也說不上來,你再改改」,表面資訊量很少,實際上背後藏著大量隱性資訊,包括主管偏好、產業經驗、組織政治、資源限制、風險偏好與外部環境判斷。這些資訊沒有被完整說出來,而是散落在關係、經驗、語境與歷史決策之中。AI擅長的是明牌任務,不擅長的是暗牌任務。


所謂明牌任務,指的是規則清楚、目標明確、輸入輸出邊界清晰的工作,例如出稿、整理格式、轉換內容、摘要提煉、常見程式碼補全與標準文案生成。暗牌任務則是需求模糊、上下文複雜、利益相關者多、犯錯代價高的工作,例如商務談判、團隊管理、跨部門協調、做最終拍板、處理危機,以及理解客戶沒有明說的真實需求。這也意味著,AI短期內更可能處理標準化任務,而非直接取代複雜崗位。


即使技術上能做到,也不代表商業上值得做。這是第二層邏輯。老闆不是只看技術展示,而是要算總帳。文中引用麻省理工的一項研究指出,若按照當下成本來看,美國企業認為真正值得自動化的視覺相關工資支出,大約只有23%。這說明「替代」很多時候不是技術問題,而是經濟問題。


企業若要用AI替代員工,支付的不只是模型費用,還包括系統接入、流程改造、權限管理、風險控制、審計、維護、故障處理、人工複核等成本。最關鍵的是,一旦出事,究竟誰來負責?相較之下,一名普通員工雖然不完美,但往往更便宜、更靈活、能應變,也能在關鍵時刻承擔責任。對真實商業世界而言,很多崗位沒有被自動化,不是因為技術不行,而是因為用人依然更省心、更划算。


AI通常替代的不是整個職業,而是職業中的一部分任務。這是理解未來就業最重要的觀點之一。現代勞動經濟學更傾向認為,技術首先取代的是任務,而不是完整的職業身份。技術會把原本由人完成的一部分工作轉移給機器,但同時也會創造新的任務、新的分工與新的需求。


以影片剪輯師為例,工作內容不只是剪片,還包括找素材、配字幕、調整節奏、理解品牌風格、與客戶溝通、處理臨時改稿、決定成片情緒等。AI比較可能接手的是那些標準化、重複性高、容易模板化的部分,例如自動字幕、找相似鏡頭、粗剪、自動降噪、批量產出封面草稿等;但對於理解觀眾情緒、掌握節奏、拿捏語氣、審美判斷,以及處理客戶那些模糊難解的要求,短期內仍然是人的優勢所在。


對於自動櫃員機(ATM)的歷史案例。ATM確實取代了銀行櫃員部分標準化任務,但並沒有簡單把整個職業消滅。反而因為銀行網點營運成本下降,銀行得以開設更多據點,而櫃員的角色也逐漸轉向更複雜的服務與銷售工作。這個案例說明,技術往往是在重構任務,而不是線性抹去職業。


因此,更準確的說法是:AI最先拿走的,往往不是你的飯碗,而是你飯碗裡最無聊、最重複、最容易標準化的那一部分工作。


最後,AI有可能創造更多新崗位。因為技術進步從來不只是做減法,也會同時做加法。雖然原文最後一段未完整展開,但核心觀點很清楚:AI帶來的,不只是替代,也包括新的產業需求、新的職務類型與新的協作方式。


總結來說,AI與普通人當然有關,但這種關係更多是效率工具、分工重組與門檻再分配,而不是簡單粗暴的全面取代。面對AI,普通人真正應該做的,不是沉迷於「一夜暴富」的幻想,也不是陷入「全面失業」的恐慌,而是學會把AI當成工具,提升效率、補強能力,並把自己的價值轉向那些更難被標準化、更依賴判斷、溝通、協調與責任承擔的部分。

[AI 進階] AI Agent 學習路徑

 [AI 進階] AI Agent 學習路徑

摘要 : 學 AI Agent 不能只學框架,而要從模型、RAG、工具調用到系統部署逐步建立完整能力。


內容:


用「燈塔」作為隱喻,說明學習 AI Agents 不是一開始就衝去玩框架、接 API、做 Demo,而是要像爬燈塔一樣,一層一層往上建立能力。燈塔代表方向,梯子代表學習路徑;真正重要的不是知道有哪些工具,而是理解 AI Agent 背後的能力堆疊。


第一層是 GenAI & RAG Basics,也就是生成式 AI 與 RAG 基礎。這一層要先理解什麼是 GenAI、LLM 怎麼運作、Prompt 如何設計、資料如何前處理,以及 RAG、向量資料庫、API Wrapper、工具整合等基本概念。簡單來說,必須先知道模型能做什麼、不能做什麼,並學會讓模型連接外部知識與工具。


第二層是 AI Agent Essentials,開始從「問答系統」進入「代理系統」。這時要學習 AI Agent 與一般 Chatbot 的差異,理解 Agent 如何具備目標、狀態、工具、規劃、記憶與決策流程。接著透過 LangChain、CrewAI、AutoGen 等框架,建立第一個可執行真實任務的 Agent,例如整理郵件、摘要文件、查詢知識庫或執行工作流程。


在這個階段,更核心的是 Agent Workflow、Memory、Evaluation、Multi-Step Reasoning、Multi-Agent Systems、Action Planning 與 Safety Guardrails。也就是說,Agent 不只是會回答,而是要能拆解任務、調用工具、記住上下文、評估結果、修正錯誤,甚至和其他 Agent 分工合作。同時也要加入權限控管、敏感資料保護、輸入輸出審查與人工覆核,避免系統失控。


第三層是 Advanced Agent Skills,重點是把 Agent 從 Demo 帶進真實世界。這包括串接 Slack、Notion、Gmail、企業 API 或內部系統,建立能持續運作的 Autonomous Loops,打造自訂工具包,並優化速度、成本、錯誤率與穩定性。這時候要考慮的已經不只是「能不能跑」,而是「能不能長期穩定、安全、可維運地創造價值」。


所以真正想表達的是:AI Agent 不是單一技術,而是一套由 LLM、RAG、工具調用、工作流設計、記憶機制、評估方法、安全治理與系統工程組成的完整能力。學習路徑應該是先理解模型,再連接知識與工具,接著設計代理能力,最後進入企業整合與產品化部署。真正有價值的 AI Agent,不是炫技式 Demo,而是能在真實場景中穩定完成任務的系統能力。