2026年6月17日 星期三

2026 .NET 開發者現代技術棧與實務建議

2026 .NET 開發者現代技術棧與實務建議



1. IDE 與編輯器(IDE & Editors)

  • 主力推薦:VS Code + GitHub Copilot / Cursor
  • 企業級選擇:Rider
  • 核心思維AI-assisted coding is the default now AI 輔助編碼已成為標準工作方式,而非額外加分項。

2. 測試(Testing)

  • 單元/整合測試:xUnit + NSubstitute + Shouldly
  • 容器化測試:Testcontainers
  • E2E 測試:Playwright
  • 核心思維Testcontainers changed integration testing forever 讓測試環境真正貼近真實系統依賴。

3. 日誌與可觀測性(Logging & Observability)

  • 結構化日誌:Serilog
  • 標準觀測:OpenTelemetry
  • 本機儀表板:Aspire Dashboard
  • 後端分析:Seq / Grafana
  • 核心思維If you're not using OpenTelemetry yet, start now 它已成為可觀測性的事實標準。

4. API 開發(API Development)

  • 主力框架:Minimal APIs
  • 文件介面:Scalar(OpenAPI UI)
  • HTTP Client:Refit
  • 中介處理:MediatR
  • 核心思維Minimal APIs are all you need 對大多數情境已完全足夠,大幅降低複雜度。

5. 資料與快取(Data & Caching)

  • ORM:EF Core(大多數情境)
  • 高性能查詢:Dapper(熱路徑)
  • 快取:Redis
  • 資料庫:PostgreSQL / SQL Server
  • 核心思維EF Core for most things, Dapper for hot paths

6. 驗證與安全(Auth & Security)

  • 自架方案:Keycloak
  • 雲端方案:Entra ID (Azure AD)
  • 標準協定:OAuth 2.0 / OIDC + JWT Bearer
  • 核心思維Keycloak is the go-to for self-hosted auth

7. 容器與編排(Containers & Orchestration)

  • 基礎:Docker + Docker Compose
  • .NET 整合中樞:Aspire
  • 生產環境:Kubernetes
  • 核心思維Aspire makes local dev with containers trivial

8. CI/CD

  • 主力:GitHub Actions
  • 企業級:Azure DevOps Pipelines
  • 快速部署:Aspire deployments
  • 核心思維Aspire manifest to Azure deployment in minutes

9. 雲端(Cloud)

  • 主要平台:Azure(推薦深入)、AWS、Google Cloud
  • IaC:Bicep(Azure)或其他 IaC 工具
  • 核心思維Pick one cloud and go deep

10. 前端(Frontend)

  • 企業內部工具:Blazor
  • 對外產品:React + TypeScript + Tailwind CSS
  • 核心思維Blazor for internal tools, React for public-facing

11. 訊息與背景處理(Messaging)

  • 訊息代理:RabbitMQ / Azure Service Bus
  • 抽象層:Wolverine
  • 背景工作:Background workers
  • 核心思維Wolverine abstracts the broker for you

12. 架構設計(Architecture)

  • Vertical Slices
  • Event-Driven Design
  • Microservices(視規模而定)

整體趨勢總結(2026 版)

  • AI 已成標配:Copilot / Cursor 是日常開發基礎。
  • 可觀測性標準化:OpenTelemetry 是必備。
  • 開發體驗大幅整合:Aspire 成為本機多服務 + 容器 + 觀測 + 部署的關鍵橋樑。
  • 務實混合策略:EF Core + Dapper、Blazor + React、Minimal APIs 為主。
  • 少而精:每個領域選擇 1~2 個成熟工具深入,而非廣度優先。
  • 端到端思維:現代 .NET 工程師必須掌握從開發、測試、觀測、部署到架構的全鏈路。

 

2026年6月16日 星期二

[AI 影響] WebMCP正在改變AI連接世界的方式

 [AI 影響] WebMCP正在改變AI連接世界的方式


摘要 : WebMCP有望統一AI與各類系統的連接方式,讓AI從只會回答問題,進化到能真正調用工具完成任務。




內容:

最近許多人開始討論一個新詞——WebMCP。它之所以受到開發者關注,不是因為技術本身多麼複雜,而是因為它可能解決AI目前最關鍵也最尷尬的問題:模型雖然很聰明,卻無法直接接觸現實世界中的資料與工具。


過去的大模型像是一位被困在房間裡的天才。它懂程式、懂法律、懂醫學,也懂商業分析,但它不知道企業資料庫裡有什麼,也無法直接接觸公司的內部系統、最新網頁內容,或是支付系統、工單系統與辦公軟體中的即時資訊。


因此,當企業希望AI真正幫忙做事時,往往必須額外開發各種介面、外掛與適配層。不同工具有不同接法,不同模型又有不同協議,導致開發團隊花費大量時間在重複建設連接能力。


而WebMCP想做的,就是把這些混亂的連線方式統一起來。它可以被理解為AI世界裡的USB介面。過去每接一個裝置都需要不同的線材與轉接方式,現在只要支援同一套標準,就能更直接地完成連接。


當一個系統支援WebMCP後,AI便可以透過一致的方式發現可用能力、呼叫工具並取得資料。這代表企業不必再為每一個模型單獨開發整合方式,也不必為每一套工具重新做一次適配,整體開發效率將大幅提升。


更重要的是,這背後代表一種新的工作模式正在形成。過去是人操作軟體,後來變成軟體輔助人,而現在正逐步進入第三種模式:人只需要告訴AI目標,AI就能主動調用多個系統來完成任務。


例如,銷售經理只要說一句「幫我整理本週客戶跟進情況並生成下週計畫」,AI就可以自動讀取CRM系統、檢查郵件往來、分析客戶狀態,甚至進一步安排相關會議。整個流程中,人類負責下達目標,AI則負責執行。


這也是為什麼越來越多公司開始關注MCP。因為大家逐漸意識到,大模型本身的能力提升雖然重要,但已經不是唯一瓶頸。能否順利、安全、可靠地把AI接上真實世界的工具與系統,才是下一階段競爭的核心。


誰能讓AI安全地存取工具,誰能讓AI穩定地執行任務,誰就更接近真正可用的AI助手。從這個角度來看,AI革命或許並不是已經完成,而是才剛進入基礎設施建設的階段。


過去幾年,整個產業都在努力訓練更聰明的大腦;而現在,大家開始為這個大腦裝上眼睛、耳朵與雙手。WebMCP所代表的,正是AI從「會思考」走向「會做事」的重要一步。

[AI 衝擊] 加拿大年輕人就業困境與AI時代出路

 [AI 衝擊] 加拿大年輕人就業困境與AI時代出路

摘要:加拿大青年失業惡化,入門職缺銳減,AI正改變職場規則,年輕人需及早調整方向與技能。




內容:


加拿大年輕人近年找入門級工作的難度明顯升高,尤其對即將畢業的大學生與剛離校的年輕人而言,情況相當嚴峻。節目一開始引用了多位年輕人的真實案例:有人成績優秀、實習評價良好,畢業後卻長期找不到工作;有人投出70份履歷仍無錄取通知,只能靠零售工作維生;也有人投了超過100家公司,卻連一次面試機會都沒有。這些案例顯示,問題已不只是個人努力與否,而是整體就業結構正在改變。


從數據上看,這種困境並非個案。2025年第一季度,加拿大應屆畢業生平均失業率達到11.2%,創下至少20年來、除疫情期間外的最高水平。同時,全國入門級職位空缺從高峰時超過7萬個,跌到2025年初不足3萬個,跌幅超過一半。2026年第一季度,加拿大經濟流失約9.5萬個職位,其中青年勞動者承擔了53%的失業壓力,儘管他們只占整體勞動力市場的14%。


更值得注意的是,過去「大學學位比職業證書更有保障」的傳統認知也正在被打破。根據加拿大統計資料,自2023年起,在15到24歲年齡層中,擁有學士學位的年輕人失業率,已高於僅持有職業證書的同齡人。這並不是否定大學教育價值,而是說明職場需求正在快速偏移,學歷本身不再像過去那樣天然具備優勢。


節目認為,AI正大規模削弱傳統職場發展鏈條中的初級入門崗位。那些大量依賴資料整理、模式辨識、基礎行政、初級分析與標準化產出的工作,最容易被AI吸收。原本適合應屆生進入職場、累積經驗的「第一張椅子」,正在消失。這使得許多年輕人即使做對了所有事情——好好讀書、順利畢業、積極投履歷——依然得不到理想結果。


至於為何加拿大年輕人比美國更辛苦,內容指出,這不代表AI沒有影響加拿大,反而是因為加拿大的經濟吸納能力較弱。美國雖然AI應用更普及,但其經濟成長更強,能夠創造更多新需求與新職位,把被AI擠出的年輕人重新吸納回市場。加拿大則缺乏這種足夠大的「經濟海綿」,因此青年失業問題顯得更加集中與明顯。


面對AI衝擊,節目提出人類仍有三張重要底牌。第一張是靠手藝與實體能力吃飯的工作,也就是需要真實肉身到場、動手操作、與物理世界互動的職業。第二張是需要專業執照、最終由真人承擔責任的工作,例如醫療、法律、會計與金融監管等領域。AI可以成為工具,但無法代替真正持牌並負最終責任的人。第三張則是最難被模仿的——人陪伴人,也就是以共情、在場、判斷、創造與希望為核心的工作,像心理諮商、社工、護理、教育、治療、照護、顧問、真人內容創作等,這些工作的真正價值不只是資訊,而是人與人之間的情感連結。


對還在校的大學生,節目建議應把握「還有時間」這個優勢,盡快行動而不是等待。第一個策略是積極參與co-op或各類實習計畫,提前累積真實工作經驗。因為現在許多工作雖然仍標示為初級職位,卻要求兩到三年經驗,等於樓還在,但梯子沒了。co-op、研究助理、志工專案、實習機會,都是讓自己提前站上樓層的方法。如今,這類實務經驗的重要性甚至已超過單純的GPA成績。


第二個策略是給自己增加一張執照或專業認證,建立一道AI難以跨越的門檻。專業執照不只意味著技能,還代表法律與制度層面的認可與責任承擔,因此能提高就業穩定性與薪酬水平。對於希望進一步建立職涯護城河的年輕人而言,這是一條相對清楚的路徑。


第三個重點則是學會在工作中使用AI,而不是抗拒AI。企業導入AI後,員工的工作效率普遍提升,而每天持續使用AI工具的人,在效率與職業安全感上都高於不使用者。AI可以協助整理會議紀錄、提煉長篇報告重點、撰寫郵件與提案初稿、進行資料分析、快速補足新領域知識。會用AI的人,與不會用AI的人之間的產出差距正逐漸拉大。不過也必須遵守紅線,不能把公司機密、客戶隱私、財務資料與內部文件輸入公共AI平台,並應仔細閱讀公司的AI使用政策。


針對已經在商科、IT或文科等高AI暴露專業中的學生與畢業生,節目則提出更具體的轉型方向。以商科為例,雖然初級財務分析、市場調研、行政報表與基礎客服等工作正快速被AI取代,但商科生同時也是最容易轉型的一群。第一條路是考取CPA等專業證照,讓自己從一般商科畢業生轉變為持牌專業人士;第二條路是進入金融科技、AI風險分析、合規審查等金融與科技交叉領域,並搭配CFA、CFP、FRM、CIM等認證;第三條路則是往以人際關係與信任建立為核心的工作發展,例如大客戶銷售、策略顧問、商業談判等。


整體來看,這篇內容傳達的核心不是單純渲染焦慮,而是提醒年輕人:今天的困境並非因為你不夠努力,而是時代規則變了。在AI重塑就業市場的過程中,單靠傳統升學與求職路線已不再足夠。未來真正有競爭力的人,不只是學歷高的人,而是能提早累積經驗、掌握AI工具、建立專業責任門檻,並投入那些仍然高度依賴人性、信任與陪伴價值領域的人。

[AI 複利] 個人AI作業系統的差距正在指數擴大

 [AI 複利] 個人AI作業系統的差距正在指數擴大


摘要 : 頂尖使用者把AI變成會累積流程、記憶與校驗的系統,普通人卻常每次從零開始。




內容:

YC總裁 Gary Tan 認為,頂尖使用者與一般人之間的 AI 槓桿差距,正以指數級方式拉大:現在可能差十倍,兩個月後變一百倍,再兩個月後甚至上看一千倍。關鍵不只是「會不會用 AI」,而是有沒有把每次使用都變成下一次的基礎。


Gary Tan 舉例,他在準備與 DeepMind 創辦人 Demis Hassabis 的對談時,只對 AI 說了一句「幫我準備一下」,兩分鐘內系統就整理出 Demis 近幾個月的公開觀點、傳記重點、對 AGI 時間線的判斷、研究優先順序,以及雙方立場的重合與分歧,甚至給出對談切入角度。這不是臨時搜尋,而是系統長期累積上下文後的直接調用。


這種差距來自「複利系統」與「歸零系統」的不同。一般人常在需要時才臨時蒐集資料、翻郵件、查新聞;Gary Tan 的做法則是每次接觸到某人、某公司、某議題時,系統都會持續更新,等真正要用時,資訊早已整理完成。他每次用完 AI,都會問自己一句:「這次工作結束後,有什麼東西應該留下來?」


他所累積的第一類資產是流程,也就是 skill。像會議準備、人物研究、讀書筆記這些任務,第一次手動完成後,就把步驟固化,之後系統可自動按既定流程執行,不必每次重新教 AI。第二類資產是上下文,也就是 brain。會議紀要、人物背景、公司資訊、書籍觀點與專案內容會持續進入一個結構化知識庫,彼此關聯、可檢索、可引用,讓決策起點遠高於只靠記憶與臨時搜尋的人。


第三類資產是錯誤,也就是 eval。當 AI 曾出現事實錯誤或內容瞎編時,他不只修正當次結果,而是把錯誤轉成永久規則,例如要求先交叉比對已知事實、輸出必須引用記憶頁面、不同模型分別檢查事實精度與上下文遺漏。對一般人來說,錯誤只是一次返工;對他來說,錯誤是一次系統升級。


Gary Tan 已將這套思路開源為 G-Brain,作為個人 AI 作業系統框架,核心包含 brain、skill 與 eval。但更重要的不是工具本身,而是思維方式:讓今天的工作成為明天的起點。從固定一條常用指令、保存一段常用背景資訊、寫下一條防錯規則開始,就能逐步建立屬於自己的 AI 複利系統。

[AI 分享] Loop Engineering 101:讓 AI 自主迭代交付程式碼

[AI 分享] Loop Engineering 101:讓 AI 自主迭代交付程式碼

摘要 : 介紹 AI Loop Engineering 核心概念,涵蓋迴圈設計、開放與封閉模式、品質關卡、單代理與多代理協作,以及自我學習機制。




內容:

Loop Engineering 101 是一套讓 AI 代理能夠在你不持續介入的情況下,自行完成「發現問題、規劃步驟、執行修改、驗證結果、反覆修正」的工作方法。其核心概念是把 AI 從一次性輸出工具,轉變成能自行檢查與重試的迴圈系統。


所謂的 Loop,本質上是一個會自我迭代的代理流程。最基本的循環包含五個步驟:先找出需要處理的內容,再把目標拆成可執行步驟,接著執行任務,然後驗證結果是否符合目標,最後根據差距繼續修正並再次執行。以修 bug 為例,AI 可以先重現問題、撰寫修正、重新執行測試,直到結果通過為止。這類任務通常具備幾個特徵:容易形成明確步驟、能夠重複嘗試、有可自動檢查的完成定義,而且失敗成本低。


區分了開放式迴圈與封閉式迴圈。開放式迴圈讓代理自由探索與發現,雖然靈活,但往往消耗高、容易偏離目標,甚至產生品質不穩定的結果,因此不適合作為起點。相對地,封閉式迴圈會先定義清楚目標、步驟與驗證條件,代理在限制條件內運作,因此更可預測、更省資源,也更容易控制。作者強調,在實務上封閉式迴圈更適合多數工程場景。


一個設計良好的 Loop,需要具備完整的結構。六個關鍵組件:第一是自動化機制,用來驅動整個流程;第二是工作樹或工作切分,讓不同任務能並行處理;第三是技能,包含代理在專案中需要具備的知識與操作能力;第四是插件與連接器,用來串接 PR、測試、Slack 等外部工具;第五是子代理,讓不同角色分工合作;第六是記憶,用於保存目標與關鍵上下文。不過作者也提醒,不要過早把規則與記憶全塞進對話中,也不要所有事情都靠手動觸發,更不要在還沒明確需求前就把全部組件一次建完。


在代理配置上,比較了單代理與代理艦隊兩種模式。單代理迴圈是由一個代理反覆優化自己的工作成果,當結果不夠好時就持續重跑。這種做法簡單、便宜,對大多數任務已經足夠。若任務複雜度更高,才需要採用多代理模式,也就是讓多個專業代理在協調者管理下共同完成工作。這種方式適合單一代理難以勝任的場景。


實務上,Loop 通常會被設計成一條可持續運行的流水線。系統會從磁碟或既定規則載入目標與規範,再由生成者負責產出內容、檢查者負責驗證、品質關卡負責把關。如果某一步失敗,流程就會回到前面重新迭代。這樣的設計能把「重現問題、修正、驗證」自動化,但最終是否合併與發布,仍應由人類掌控。好的 Loop 會主動提出修正並通知你,但不會自行上線。


品質關卡是整個 Loop 中非常重要的一層。若沒有品質把關,代理只會更快地產出低品質結果。因此,在成果真正送出前,必須經過嚴格的驗證。這個關卡應建立在人類無法妥協的檢查項目上,例如編譯是否通過、型別系統是否正確、整合測試與變異測試是否成功、屬性測試是否符合預期,以及靜態分析、格式檢查、CI 等是否全部通過。品質關卡不只是保護機制,更是讓整個 Loop 能持續運作的前提。


最後,「自我學習迴圈」的觀念。真正有價值的 Loop,不只是重複執行,而是能把每次失敗的教訓保留下來,讓下一輪做得更好。這代表系統需要能攜帶規則、記錄錯誤、分析原因,並把學到的經驗納入後續執行。文中建議建立專門的規則文件,例如把錯誤轉化為可重用的經驗、自己維護規則庫、信任但驗證每次輸出,並且不要讓代理自動修改最重要的檢查規則。


整體而言,這篇內容強調的不是單次提示詞怎麼寫,而是如何設計一套能持續運作、能自我修正、能受控學習的 AI 工程流程。你真正要打造的,不只是會提示代理的系統,而是會從經驗中變得更好的系統。

[AI 影響] AI會取代普通人工作嗎?

 [AI 影響] AI會取代普通人工作嗎?

摘要:AI更可能重塑工作分工,而非大規模取代多數普通人;真正先吃到紅利的,多是上游基礎設施公司。




內容:


這一年來,關於「AI可能要替代你了」的說法幾乎隨處可見。從文員、設計師、程式設計師、客服到會計,很多職位都被拿來討論,甚至還有人認為未來普通人將大規模失業。面對這種焦慮,作者提出一個相對逆向的觀點:未來十年,AI大機率不會像許多人想像的那樣,直接大規模取代絕大多數普通人的工作。


AI當然會深刻影響職場,但它更像是在改寫工作的結構、分工與流程,而不是把大部分人直接踢出職場。更重要的是,這一波AI帶來的最大產業紅利,往往不屬於普通人,而是集中在上游基礎設施領域,例如賣晶片、賣雲服務、賣算力、做資料中心、做大模型底座的公司。普通人更可能拿到的,不是產業紅利,而是工具紅利,也就是利用AI讓原本的工作做得更快、更便宜、更體面一些。


這裡的關鍵差別在於,「吃產業紅利」和「使用工具紅利」是兩回事。產業紅利屬於資本、技術、牌照、能源和基礎設施擁有者;工具紅利才與多數普通人有關。這和當年網際網路興起時很像,真正先賺大錢的是平台、支付、廣告、物流與雲服務公司,而不是每一個會做網站的人。對普通人來說,真正的機會往往來自用新工具改善效率、延伸能力,而非一夜暴富。


至於AI為什麼很難在未來十年大規模取代多數崗位,需要從更底層的邏輯來看。判斷一個崗位能否被替代,不是看AI會不會寫字、識圖、畫圖或寫程式,而是看三件事:第一,AI能不能長期穩定地把整串任務都做對;第二,它的犯錯機率是否足夠低;第三,一旦出錯,企業能不能承受代價。


這裡牽涉到機率論的問題。很多人誤以為只要AI平均表現夠高,就能替代人類。但實際上,真正決定能否替代的,不是平均水平,而是整條流程的可靠性。若一個系統每一步有95%的正確率,聽起來很高,但如果一份工作包含20個關鍵環節,而且每一環都要可靠,那整條流程全部正確的機率就會快速下降。現實中的工作往往不是解一道題,而是由理解需求、蒐集資訊、處理例外、溝通協調、做判斷、交付結果與承擔責任等多個環節串聯而成,因此AI在真實公司流程裡常常會卡住。


從資訊理論的角度看,也能理解這個問題。AI最擅長處理的是那些規則清晰、格式標準、重複度高、已經被表達出來並結構化的資訊;但它較不擅長處理上下文缺失、資訊殘缺、噪聲大、需要在不完整資訊下做判斷的情境。而人類工作中最有價值、最困難的部分,往往恰恰就是後者。


例如,主管一句「這個方案我感覺不太對,但我也說不上來,你再改改」,表面資訊量很少,實際上背後藏著大量隱性資訊,包括主管偏好、產業經驗、組織政治、資源限制、風險偏好與外部環境判斷。這些資訊沒有被完整說出來,而是散落在關係、經驗、語境與歷史決策之中。AI擅長的是明牌任務,不擅長的是暗牌任務。


所謂明牌任務,指的是規則清楚、目標明確、輸入輸出邊界清晰的工作,例如出稿、整理格式、轉換內容、摘要提煉、常見程式碼補全與標準文案生成。暗牌任務則是需求模糊、上下文複雜、利益相關者多、犯錯代價高的工作,例如商務談判、團隊管理、跨部門協調、做最終拍板、處理危機,以及理解客戶沒有明說的真實需求。這也意味著,AI短期內更可能處理標準化任務,而非直接取代複雜崗位。


即使技術上能做到,也不代表商業上值得做。這是第二層邏輯。老闆不是只看技術展示,而是要算總帳。文中引用麻省理工的一項研究指出,若按照當下成本來看,美國企業認為真正值得自動化的視覺相關工資支出,大約只有23%。這說明「替代」很多時候不是技術問題,而是經濟問題。


企業若要用AI替代員工,支付的不只是模型費用,還包括系統接入、流程改造、權限管理、風險控制、審計、維護、故障處理、人工複核等成本。最關鍵的是,一旦出事,究竟誰來負責?相較之下,一名普通員工雖然不完美,但往往更便宜、更靈活、能應變,也能在關鍵時刻承擔責任。對真實商業世界而言,很多崗位沒有被自動化,不是因為技術不行,而是因為用人依然更省心、更划算。


AI通常替代的不是整個職業,而是職業中的一部分任務。這是理解未來就業最重要的觀點之一。現代勞動經濟學更傾向認為,技術首先取代的是任務,而不是完整的職業身份。技術會把原本由人完成的一部分工作轉移給機器,但同時也會創造新的任務、新的分工與新的需求。


以影片剪輯師為例,工作內容不只是剪片,還包括找素材、配字幕、調整節奏、理解品牌風格、與客戶溝通、處理臨時改稿、決定成片情緒等。AI比較可能接手的是那些標準化、重複性高、容易模板化的部分,例如自動字幕、找相似鏡頭、粗剪、自動降噪、批量產出封面草稿等;但對於理解觀眾情緒、掌握節奏、拿捏語氣、審美判斷,以及處理客戶那些模糊難解的要求,短期內仍然是人的優勢所在。


對於自動櫃員機(ATM)的歷史案例。ATM確實取代了銀行櫃員部分標準化任務,但並沒有簡單把整個職業消滅。反而因為銀行網點營運成本下降,銀行得以開設更多據點,而櫃員的角色也逐漸轉向更複雜的服務與銷售工作。這個案例說明,技術往往是在重構任務,而不是線性抹去職業。


因此,更準確的說法是:AI最先拿走的,往往不是你的飯碗,而是你飯碗裡最無聊、最重複、最容易標準化的那一部分工作。


最後,AI有可能創造更多新崗位。因為技術進步從來不只是做減法,也會同時做加法。雖然原文最後一段未完整展開,但核心觀點很清楚:AI帶來的,不只是替代,也包括新的產業需求、新的職務類型與新的協作方式。


總結來說,AI與普通人當然有關,但這種關係更多是效率工具、分工重組與門檻再分配,而不是簡單粗暴的全面取代。面對AI,普通人真正應該做的,不是沉迷於「一夜暴富」的幻想,也不是陷入「全面失業」的恐慌,而是學會把AI當成工具,提升效率、補強能力,並把自己的價值轉向那些更難被標準化、更依賴判斷、溝通、協調與責任承擔的部分。

[AI 進階] AI Agent 學習路徑

 [AI 進階] AI Agent 學習路徑

摘要 : 學 AI Agent 不能只學框架,而要從模型、RAG、工具調用到系統部署逐步建立完整能力。


內容:


用「燈塔」作為隱喻,說明學習 AI Agents 不是一開始就衝去玩框架、接 API、做 Demo,而是要像爬燈塔一樣,一層一層往上建立能力。燈塔代表方向,梯子代表學習路徑;真正重要的不是知道有哪些工具,而是理解 AI Agent 背後的能力堆疊。


第一層是 GenAI & RAG Basics,也就是生成式 AI 與 RAG 基礎。這一層要先理解什麼是 GenAI、LLM 怎麼運作、Prompt 如何設計、資料如何前處理,以及 RAG、向量資料庫、API Wrapper、工具整合等基本概念。簡單來說,必須先知道模型能做什麼、不能做什麼,並學會讓模型連接外部知識與工具。


第二層是 AI Agent Essentials,開始從「問答系統」進入「代理系統」。這時要學習 AI Agent 與一般 Chatbot 的差異,理解 Agent 如何具備目標、狀態、工具、規劃、記憶與決策流程。接著透過 LangChain、CrewAI、AutoGen 等框架,建立第一個可執行真實任務的 Agent,例如整理郵件、摘要文件、查詢知識庫或執行工作流程。


在這個階段,更核心的是 Agent Workflow、Memory、Evaluation、Multi-Step Reasoning、Multi-Agent Systems、Action Planning 與 Safety Guardrails。也就是說,Agent 不只是會回答,而是要能拆解任務、調用工具、記住上下文、評估結果、修正錯誤,甚至和其他 Agent 分工合作。同時也要加入權限控管、敏感資料保護、輸入輸出審查與人工覆核,避免系統失控。


第三層是 Advanced Agent Skills,重點是把 Agent 從 Demo 帶進真實世界。這包括串接 Slack、Notion、Gmail、企業 API 或內部系統,建立能持續運作的 Autonomous Loops,打造自訂工具包,並優化速度、成本、錯誤率與穩定性。這時候要考慮的已經不只是「能不能跑」,而是「能不能長期穩定、安全、可維運地創造價值」。


所以真正想表達的是:AI Agent 不是單一技術,而是一套由 LLM、RAG、工具調用、工作流設計、記憶機制、評估方法、安全治理與系統工程組成的完整能力。學習路徑應該是先理解模型,再連接知識與工具,接著設計代理能力,最後進入企業整合與產品化部署。真正有價值的 AI Agent,不是炫技式 Demo,而是能在真實場景中穩定完成任務的系統能力。

[AI 分享] Loop Engineering 迴圈工程的本質與架構拆解

 [AI 分享] 迴圈工程的本質與架構拆解


摘要 : 迴圈工程不是新技術,關鍵在於硬程與軟程分層、驗證隔離,以及避免自我進化中的三大陷阱。





內容:

先說結論,Loop Engineering 並不是什麼全新的技術發明。從架構本質來看,今天多數 agent 框架的核心,都是一個持續運行的 while 迴圈:組裝上下文、呼叫模型、執行動作、觀察結果,再把結果餵回系統,直到達成終止條件。OpenAI、Anthropic、Google、微軟、Meta 等主流做法,本質上都高度同構。


那為什麼一個早就存在的東西,現在才被正式命名、甚至突然爆紅?原因不在於技術剛誕生,而在於基礎設施已經跨過了「可用性門檻」。像是不同產品獨立收斂到相似的迴圈原語、模型單輪可靠性變高、以及頭部團隊工作方式真的轉向「寫迴圈」,這些都代表產業正在發生實質性的工程轉折。所謂 Loop Engineering,更像是替這個已經發生的轉變補上一個名字。


如果真的要把 agent 架構做對,一個重要的方法是將系統切成「硬程」與「軟程」。硬程指的是系統提示詞與核心規則,它負責定義 agent 是誰、目標是什麼、什麼結果才算好。這些內容像憲法一樣,應該穩定、少改,而且不能讓迴圈自己碰。軟程則包含 skills、記憶檔案、工具描述等,它回答的是「怎麼做」,包括領域知識、操作流程與過去經驗。這部分不是寫死的程式碼,而是可以被版本化、檢索與演化的資料。


這樣切分的價值,在於能力的進化方式不同。硬程通常只能靠人離線修改,屬於高成本決策;軟程則可以在執行、驗證、修訂的閉環中持續優化。因此,真正應該讓 agent 學習與累積的,不是把所有能力塞進提示詞,而是把可被驗證與修正的能力外接到 skills。也正因如此,持久化狀態其實不是配角,而是整個迴圈真正的靈魂。沒有持久化,系統每次都像失憶,根本談不上「進化」。


談到自我進化,最需要小心的是三個深坑。第一個是驗證標準被 agent 觸碰的風險。如果系統既能生成結果,又能修改評價結果的規則,它最終優化的往往不是品質,而是讓自己更容易通過驗證。因此,驗證函式必須被放在硬程裡,放在迴圈寫入權限之外,確保裁判無法被收買。


第二個坑是 skill 層的 slop,也就是經驗漂移。當 agent 每次成功後都往 skill 檔裡寫經驗,如果驗證訊號不夠嚴格,它很可能把偶然成功、錯誤歸因,甚至迷信儀式都記成「最佳實踐」。這些問題不會馬上爆炸,但會在長期累積後讓整個經驗庫變得混亂,讓 agent 虔誠執行大量噪聲。要避免這種情況,skill 的修訂必須像維護程式碼一樣嚴謹,要有 diff、有觸發原因、能審計、能定期清理。


第三個坑是理解債務。技術債務通常看得見,但理解債務更隱蔽。即使 agent 能穩定交付結果,也不代表人真的理解它為何成功。隨著迴圈執行時間變長、軟程越積越厚,系統實際運作方式可能逐漸偏離人的認知。等到某天出問題,團隊才發現自己其實已經看不懂這套系統。因此,定期抽查迴圈軌跡、手動 review 軟程演化紀錄,是必要的管理動作。


總結來說,迴圈工程的核心,不是把 human in the loop 直接變成 human out of the loop,而是讓人的角色重新分配。人在前端負責做架構設計,定義硬程與驗證規則;人在後端負責做最終審核,守住上線前最後一道關;中間重複性的優化與累積,才交給迴圈去完成。真正成熟的 Loop Engineering,不是自動化越多越好,而是硬程定義清楚、軟程允許進化、裁判不能被修改、演化過程有人審核。

[AI 啟發] AI創業切入點

 [AI 啟發] AI創業切入點


摘要 : AI創業不必憑空想點子,先找出人們已在付費的人力服務,再用AI輔助、替代或重塑流程。




內容:

很多人想在AI時代做點事情,最頭痛的往往不是沒有工具,而是不知道自己到底該做什麼。每天看到各種AI教學、工具和風口資訊,真正輪到自己下場時,反而容易腦中一片空白。


其實,AI創業不一定要從「想出一個全新點子」開始。更實際的方式,是直接觀察人們現在正在花錢購買什麼服務。因為凡是使用者願意持續付費的事情,就代表需求早已被市場驗證,而這正是AI最值得切入的地方。


YC有句經典話語:「創造人們想要的東西。」在AI時代,這句話可以更具體地理解為:人們正在付費請人完成的工作,就是最值得關注的機會。像是客服人員處理投訴、保險理算員審核理賠、律師助理整理卷宗、私人教練設計計畫、行政助理安排會議與處理郵件,這些都是已經存在且明確的需求。


從這個角度來看,AI創業大致可以分成三個方向。第一是「輔助」,也就是幫助專業人士把重複、低價值的工作做得更快更好。例如投資分析師每天要讀財報、追蹤產業、整理資料、搭建模型與撰寫報告,其中大量工作都可以交給AI處理,而人類則專注於判斷與決策。


第二是「替代」,也就是讓AI直接承接原本由人類完成的工作。像是律師、會計、財務、理療,甚至某些生活服務,未來都有可能由AI完成大部分流程。雖然目前還在發展階段,但方向已經很清楚:人工參與比例會逐步下降,AI承擔的工作會越來越多。


第三是「實現以前做不到的事」。這也是最具爆發力的方向。過去像律所內海量文件的逐份閱讀、分類、摘要與索引建立,因為成本過高而幾乎不可能全面執行。但現在透過AI,這些原本難以落地的大規模工作,開始變得可以被執行,而且成本還會持續下降。


AI之所以改變遊戲規則,不只是因為效率提升,更是因為市場規模被重新定義。過去SaaS產品通常按帳號收費,每月可能只收20美元;但當AI開始替代人力後,定價基準就不再只是軟體費,而是人力薪資本身。企業願意為一個能替代部分人力工作的AI支付更高費用,這也代表AI創業的市場空間比傳統軟體大得多。


如果你想開始,最好的方法不是空想,而是直接去觀察身邊的工作場景。像奶茶店仍靠人工調飲、會計事務所還在手動整理發票、寵物店用人工記錄客戶資料、公司依然用Excel管理考勤,這些看似平凡的流程,其實都可能是AI創業的起點。


具體行動上,可以用四個步驟展開。第一,列出身邊三個最常見的重複性工作。第二,判斷這些工作是否有機會被AI完成80%的內容,剩下20%再由人工兜底。第三,去相關論壇、社群或搜尋關鍵字驗證需求,看看是否已有大量使用者在抱怨低效率或尋找替代方案。第四,用現成工具快速做出一個最小可行原型,找3到5位潛在使用者試用,直接測試他們是否願意付費。


總結來說,AI創業的關鍵不是憑空發明需求,而是看見那些早已存在、而且已經有人願意付費的工作。從輔助、替代到創造新可能,真正的機會就藏在你身邊每天發生的流程裡。

[AI 分享] 迴圈工程正在重塑AI協作方式

 [AI 分享] 迴圈工程正在重塑AI協作方式


摘要 : AI互動正從提示詞工程走向迴圈工程,重點不再是逐句下指令,而是定義目標、驗證機制與安全邊界。


內容:

Loop engineering,也就是迴圈工程,正被視為AI使用方式的重要轉變。OpenClaw創辦人 Peter Steinberger 與 Anthropic 的 Boris Cherny 都提醒,與其親手逐句替AI寫提示詞,不如開始思考如何設計讓AI自動完成任務的系統。


AI互動大致經歷三個階段。第一階段是提示詞工程,使用者像微操管理者一樣,輸入指令、查看結果、再反覆修正,整個流程高度依賴人工盯控,雖然可控,但非常耗費時間與精力。


第二階段可稱為駕馭工程,也就是替AI接上搜尋、程式執行、編譯器、檔案讀寫等工具,讓它不再只是聊天,而是具備實際操作能力。不過即使工具變多,只要遇到錯誤或結果不理想,最終仍需要人回來重新下指令。


第三階段則是核心的迴圈工程。這種模式不是要求人一步步教AI怎麼做,而是直接給它明確且可驗證的目標,再搭配回饋機制。AI會自行規劃、執行、檢查結果,若發現失敗,系統會自動整理錯誤資訊回饋給AI持續修正,直到達成目標或觸發停止條件。


一套完整的迴圈系統通常包含五個核心:觸發器、明確目標、驗證者、記憶狀態與安全邊界。觸發器負責啟動流程;目標必須可客觀驗證;驗證者檢查結果是否合格;記憶狀態避免重複犯錯;安全邊界則限制重試次數、成本或時間,防止系統失控。


不過迴圈工程也有風險,主要包括「token黑洞」與「過程不可見」。前者代表AI可能在反覆自我修正中大量消耗成本,後者則是AI自動生成太多中間成果,讓人類難以理解整個過程。總體來看,未來競爭力將不再只是會寫提示詞,而是更懂得定義目標、設計驗證標準與建立工作流程。

[AI 觀點] AI時代的平庸陷阱

 [AI 觀點] AI時代的平庸陷阱


摘要 : AI本質是機率與平均值,能提效也可能削弱思考。真正改變世界的人,往往來自低機率的少數。




內容:

近期一段哈佛畢業典禮演講在矽谷引發熱議。演講者指出,這一代人的使命不是單純掌握AI,而是不要被AI定義思考邊界。這句話乍聽激烈,但背後真正要談的,其實是AI的本質問題。


AI生成答案的方式,並不是像人類一樣深度思考後得出結論,而是根據大量資料進行機率預測,找出最可能出現的詞句與答案。因此,AI提供的內容,本質上往往是人類歷史經驗中的平均值,也就是最常見、最主流、最安全的答案。


這代表當人們越依賴AI,越可能不自覺向「平均值」靠攏。無論是寫郵件、做簡報、整理思路,AI都會提供最符合大眾習慣的做法。久而久之,如果過度把思考外包給AI,個人的判斷力、創造力與獨立思考能力,都可能逐步退化。


文中也提到一個值得警惕的概念:認知債務。當人長期依賴大語言模型,大腦就像缺乏鍛鍊的肌肉一樣,會慢慢失去主動思考的能力。更進一步說,當所有人都使用AI,而AI給出的答案又逐漸成為新的標準答案時,它就不再只是工具,而可能成為限制創新的新天花板。


真正改變世界的突破,往往都不是高機率事件。無論是哥白尼提出日心說、萊特兄弟挑戰飛行、喬布斯重新定義手機,或馬斯克推動火箭回收,這些在當時都不符合主流認知,甚至會被視為荒謬。也正因如此,偉大的創新多半誕生於機率分佈的尾端,而不是平均值中心。


所以,「摧毀AI」真正的意思,不是反對技術,而是拒絕讓AI替你決定邊界。未來的人,可能會分成兩種:一種是被AI馴化的人,把思考、判斷、選擇都交給AI;另一種則是能駕馭AI的人,讓AI做執行與輔助,但把價值觀、審美、判斷與試錯能力牢牢掌握在自己手中。


最後,這篇內容傳達了三個重要提醒。第一,AI可以是燃料,但真正點火的人必須是自己;沒有專業基礎、獨立判斷與個人審美,最終不是你在使用AI,而是AI在塑造你。第二,要警惕過度迎合大眾,因為演算法、短影音與AI都在不斷把人拉向舒適與共識,而主動選擇不舒服、保有獨立性,反而會成為新的競爭力。第三,AI時代最稀缺的能力,不只是會用AI,而是敢在必要時不用AI,親自去思考、判斷、試錯,做那些低效卻重要的事。


工業革命解放了人的雙手,而AI正在解放人的大腦。但在這個過程中,人也必須警惕,不要在追求效率時,把最珍貴的思考能力一併交出去。因為歷史從來不只獎勵那些算得最準的人,而更常獎勵那些敢於試錯、敢於偏離平均值的人。

[AI 觀點整理] RAG沒死,重點是場景選型

 [AI 觀點整理] RAG沒死,重點是場景選型




摘要 : RAG並未淘汰,向量庫、Markdown、LLM Wiki各有適用場景,關鍵在於依資料型態與規模做選擇。


內容:

近來不少人認為傳統RAG已經過時,原因在於它的實作流程相對繁重。從文件解析、資料切片、向量化,到部署與維護向量資料庫,每個環節都需要投入不少時間與成本。也因此,市場上開始出現更輕量的替代方案,例如以Markdown為核心的檢索方式,以及先摘要再問答的LLM Wiki模式。


傳統向量資料庫型RAG的最大優勢,在於它具備語意搜尋能力。當面對的是海量且多樣化的資料,例如企業財報、制度文件、產品資訊等,向量檢索能更有效地處理模糊、口語化的提問,完成高品質召回。不過,它的缺點也相當明顯,像是切片品質若處理不佳,容易造成上下文斷裂;此外,整體建置與運維成本也較高。


第二種是基於Markdown儲存,加上關鍵詞檢索的方式,例如Cloud Code所採用的思路。這類方案不依賴切片、embedding或向量資料庫,幾乎可以做到零運維,開發成本也非常低。它特別適合程式碼庫、API文件、專有名詞密集的小型知識庫場景,因為這些內容通常更依賴精確匹配而不是語意理解。但它的限制也很明顯:高度依賴關鍵詞,無法真正理解語意,而且在檢索時往往需要將整份Markdown內容交給大模型,token消耗較大。


第三種則是LLM Wiki方案,也就是在資料上傳時,先透過大模型將原始內容整理成結構化筆記或摘要。它的優點在於先用算力換取結構,把知識預先整理好,後續不但方便模型讀取,也方便人直接閱讀,特別適合個人知識庫、經驗整理與高頻閱讀場景。不過,這種方式本質上是一種摘要壓縮,如果在前處理階段遺漏了某些細節,後續提問時就可能永遠無法找回原始資訊。


若回到實務選型問題,這三種方案並不是互相取代,而是分別對應不同需求。如果你的資料規模不大,內容以程式碼、API文件、技術術語為主,且需要強邏輯推理,那麼使用Markdown搭配關鍵詞檢索即可,沒必要額外承擔向量資料庫的複雜度。如果你經營的是個人知識庫,重視閱讀體驗與內容整理,那LLM Wiki會是更自然的方案。


但若你的場景是企業級知識庫,資料量巨大、來源複雜,使用者提問又充滿口語化與模糊表達,那精確匹配往往會失效。這時候,傳統RAG搭配Embedding與向量資料庫,仍然是最可靠且必要的方案。換句話說,RAG並沒有死,而是演化出了更多輕量化變體;最重要的不是追逐流行,而是根據實際場景做出合理架構選擇。


若要真正落地企業級RAG,還會面臨許多實戰痛點,例如分片策略怎麼設計、TopK限制如何處理、跨向量聚合查詢怎麼做、如何做來源追溯、文件更新怎麼同步、表格與圖片如何解析、怎麼降低模型幻覺、如何提升召回率、查詢改寫怎麼設計,以及Rerank與後處理機制應如何使用。這些都是企業在面試與專案中非常常見的核心問題。


最後,內容也補充了向量檢索的基本概念。所謂向量,本質上是把詞語、句子或更複雜的內容,轉換成可供電腦理解的數值表示。語意相近的內容,在向量空間中的距離也會更近,因此系統便能透過相似性比較,找出與查詢最相關的語料。這也是為什麼向量模型與向量資料庫,至今仍是大型語意檢索系統中的關鍵基礎設施。

[AI 分享] 一次看懂AI十個核心名詞

[AI 分享] 一次看懂AI十個核心名詞


摘要 : 從Transformer到Agent、MCP、多模態與實體AI,快速建立AI技術全貌。




內容:

十個常見的AI名詞,幫大家建立一條清晰的理解路線。看似複雜的英文術語,其實都在說同一件事:AI正從單純的聊天工具,逐步進化成能理解任務、拆解問題、呼叫工具,甚至實際執行工作的系統。


首先,內容從Transformer講起。它的基本概念可以理解為,先把文字轉成電腦能處理的數字,再加入詞語的位置資訊,讓模型知道前後順序。接著透過多重關注機制,讓每個詞去判斷和其他詞之間的關係,層層運算後,最後預測下一個最可能出現的詞。也就是說,大語言模型本質上是一個非常強大的文字預測系統。


雖然模型本身很聰明,但它其實沒有真正的記憶能力。我們平常在聊天軟體中感覺AI記得前面說過的話,是因為每次對話時,系統都會把之前的內容重新讀取一次。因此,像OpenAI ChatGPT、Chat類應用的本質,仍然是在既有上下文中持續做文字生成。


接著,當人們不再滿足於「只會回答問題」的AI,就出現了Agent。Agent可以理解成是在模型外面加上一層客戶端外殼,讓AI不只會說,還能實際去操作工具,例如讀取檔案、寫程式、執行指令、處理表格等。模型負責思考與下達任務,Agent則負責連接電腦環境並完成具體執行。


而AI要能順利呼叫外部工具,就需要一套標準協議,這就是MCP。它像是AI和各種軟體之間的通用接口,規範模型如何發出請求、工具如何回傳結果。可以把它想像成AI世界裡的USB介面,讓不同工具都能被模型穩定調用。


另外,Skill則像是AI的工作說明書。當問題本身可能存在歧義時,若先替AI設定清楚角色、任務範圍與處理方式,就能大幅提升回答品質。從最早的系統提示詞,到後來將大綱、規則、角色設定拆分管理,本質上都是在用Skill讓AI更有方向、更懂你的工作流程。


當MCP與Skill搭配使用時,Agent的能力就會大幅提升。它不只是被動回答,而是能更準確地理解任務、選擇工具、執行步驟。對一般使用者來說,這也是目前最值得優先掌握的兩個AI應用關鍵。


再往上一步,就是Agent Tech。這代表AI不只是完成單一步驟,而是能圍繞目標,自己拆解任務、推進流程、遇到失敗再調整。它讓AI開始像一位初級同事,而不只是單一工具。像建立產品原型、經營帳號、完成一整套流程,背後都需要這種更複雜的執行機制。


如果任務再變得更大,就會延伸到Multi-Agent System,也就是多智能體系統。這個概念是讓多個Agent分工合作,例如有人查資料、有人寫腳本、有人審稿、有人做標題。理想上,這可以讓複雜任務拆解得更有效率。不過實務上,多Agent協作目前仍然容易混亂,距離成熟應用還有不少挑戰。


Reasoning Model,也就是推理模型。這類模型的重點不是回得快,而是想得更清楚。它會先拆解問題、規劃步驟、檢查條件,再輸出答案。像數學、寫程式、合約分析、投資判斷等需要多步驟思考的任務,就特別適合推理模型。這也是為什麼現在許多AI產品都開始強調深度思考能力。


除了推理能力,多模態也是AI的重要方向。真正理解世界不能只靠文字,人類是透過圖像、聲音、語言與環境一起判斷的。多模態AI就是朝這個方向發展,它可以同時處理文字、圖片、音訊、影片,甚至螢幕操作。像分析冰箱食材、整理會議錄音、辨識裝修風格,都屬於多模態能力的應用場景。


再來是context window,也就是上下文視窗。由於模型每次回答都需要重新讀取當前對話內容,當聊天越長、資訊越多時,計算成本會大幅增加,回答品質也可能下降。所以在實際使用上,如果對話太長,適時清理上下文或開新視窗,通常能讓AI表現更穩定。


第九個重點是RAG。當企業想讓AI結合內部知識庫時,不可能每次都把大量文件全部丟給模型處理。更好的方式是先讓AI判斷這次是否需要查資料,再去公司內部資料庫中檢索相關內容後回覆。這樣既能提升回答準確度,也能兼顧資料安全,不必把敏感資訊上傳到雲端。


最後提到的是Physical AI,也就是實體AI。這類AI不再只存在於螢幕中,而是進一步進入真實世界,控制機器人、自動駕駛車、機械臂、無人機等設備。它不只要會回答,還要能感知環境、理解現場狀況,並做出對應行動。這也代表AI的下一步,不只是數位世界中的助手,而可能成為現實世界中的執行者。


#AI


[AI 分享] OpenClaw雙軌自進化機制

[AI 分享] OpenClaw雙軌自進化機制



摘要 : 解析Agent如何透過錯誤沉澱與成功模式封裝,持續學習並進化成更聰明的系統。


內容:

目前許多 Agent 在每次對話結束後,往往無法保留使用者偏好、糾錯紀錄或曾經犯過的錯誤,因此當下次遇到相同問題時,還是可能重複犯錯。這種情況不僅影響使用體驗,也讓 Agent 難以真正累積能力。

此外,傳統手動撰寫新技能的方式速度較慢,而單純依賴檢索知識的做法,雖然可以找回既有資訊,卻無法把新的經驗重新寫回系統中,因此無法形成真正可持續成長的技能庫。

針對這些問題,OpenClaw 提出了一種「雙軌進化」的設計。第一條軌道是 Self-improving,主要負責記錄失敗、糾正以及使用者回饋,並將這些內容沉澱成類似 Learnings.md 的文件,像是錯題本一樣幫助 Agent 逐步修正行為。

第二條軌道則是 AutoSkill,它聚焦在那些反覆成功的操作模式,將這些成熟的方法整理成 Skill.md 或可直接觸發的工作流。也就是說,Self-improving 負責從錯誤中學習,AutoSkill 則負責把成功經驗轉化成穩定技能,兩者可以同時運作。

在 Self-improving 的運作方式上,它會在每次對話中捕捉錯誤、修正與最佳實踐,並將內容存放在可編輯的 Markdown 文件中。這種方式的好處是透明、可審查、可手動調整,不像黑盒式記憶那樣難以維護。當某些經驗反覆出現後,系統便會依照規則,將它提升到 Agent.md 或獨立 Skill 中。

至於 AutoSkill,它的生命週期包括提取、維護、檢索與執行幾個階段。首先從執行軌跡中挖掘可複用步驟,再經過去重、合併與版本控制來維護技能庫。當新任務出現時,系統會利用檢索方法找出相關技能,交由執行流程使用;如果執行失敗,再回到 Self-improving 軌道做修正。

OpenClaw 社群中也有 Skill Evolution 機制,專門將對話過程蒸餾成候選 Skill。與其他方案相比,SkillCloud 更偏重真實對話蒸餾與跨端共享,而 SkillOS 則採取強化學習方式來管理技能庫,能進行新增、更新與刪除等操作。相較之下,OpenClaw 的特色在於輕量化、文件化,以及高度可審查與可直接修改。

在整合方式上,CloudHub 負責技能安裝,SkillBank 負責版本管理與索引,而 Hooks 則可在 Session 結束時觸發評估流程。這些升級後的規則會被寫入 Agent.md 或 DocIndex,確保下一次對話時就能直接套用新的經驗與能力。

OneContext 在這個閉環中則扮演流程控制的角色,會在每個 Session 結束後觸發評估,並將新的知識或技能更新回系統。它與 Self-improving 的關係可以理解為:OneContext 負責閉環運作,Self-improving 則負責經驗文件化與沉澱。

這種雙軌自進化模式特別適合長期使用的個人助手、運維任務,或內容生成流水線等高頻、可重複、可整理成 Markdown SOP 的場景。相對地,一次性腳本、合規要求極高且不允許自動寫入的環境,或完全沒有回饋機制的批次任務,就不太適合採用。

實際導入時,建議先啟用 Self-improving,先累積一到兩週的錯誤與經驗,再從中挑選最常出現、最穩定的成功模式,交由 AutoSkill 封裝成可重用技能。這樣的安排能讓 Agent 從「記住教訓」逐步走向「掌握方法」,建立真正可持續成長的自進化能力。

[AI 影響] AI知識庫:把企業隱形資產變成成長引擎

  [AI 影響] AI知識庫:把企業隱形資產變成成長引擎



摘要 : AI知識庫能將企業分散資料與員工經驗系統化,快速查找、精準問答,提升效率並降低知識流失風險。

(若對這個產品有興趣的,請留言告知)

內容:

很多企業以為最大的成本來自設備、授權或系統建置,但真正最昂貴的,往往是那些沒有被整理、沒有被保存、只存在於員工腦中的知識。表面上看不見,實際上卻每天都在吞噬企業效率。根據內容指出,員工平均每天有1.8小時耗費在找檔案、確認版本、重複提問與等待回覆上。這不只是時間浪費,更像是企業在不知不覺中持續流血。

如果把視角拉高,你會發現這不是小問題,而是管理上的結構性黑洞。每位員工一年可能因此損失22個完整工作天;若公司有100位員工,就等同每年蒸發2200個工作天。這正是思維要我們看見的關鍵:不要只想著改善找資料的流程,而是重新定義企業知識的價值,把原本零散、沉睡、難以傳承的資訊,轉化成能推動組織前進的核心動能。

AI知識庫的價值,不只是更快搜尋,而是先點出痛點,再用簡單有力的方式給出新答案。過去,員工需要翻找Email、會議紀錄、雲端資料夾,甚至還要依賴資深同事口頭傳承;現在,只需要像聊天一樣提出問題,AI知識庫就能在30秒內提供精準答案,並附上清楚來源。這不是功能升級,而是工作模式的全面翻轉。

它的厲害之處,在於背後有一套可落地的知識轉換流程。從資料匯入開始,不論是PDF、Word、錄音還是影片,都能整合進系統;接著透過清洗、萃取與蒸餾,去除雜訊、保護敏感資訊,並把重點提煉成真正可用的知識內容。最後,透過自然語言查詢與持續評量回饋,讓整個知識庫不只會回答,還會愈來愈準、愈來愈新。這讓企業第一次有機會,把雜亂資料變成可追溯、可稽核、可複製的行動指南。

更重要的是,AI知識庫不是只有大型企業或IT部門才能使用的高門檻工具。它可以服務個人、部門到整個企業。對個人來說,它能幫助整理專案資料;對部門來說,它能統一SOP與對外回應品質;對企業來說,它則能打通部門資訊斷層,保留資深員工經驗,降低離職造成的知識斷裂。這種價值,不只是效率工具,更是企業文化與能力傳承的基礎設施。

當然,這也說明了為什麼一般聊天型AI不能直接取代企業知識庫。賈伯斯最擅長的,就是讓人理解「看似相似,其實完全不同」的差距。表面上都是AI問答,但一般AI常有權限控管不足、雲端資料外洩風險、答案無法追溯、甚至產生幻覺等問題;而企業級AI知識庫則強調地端私有部署、知識單元權限控管,以及每一則答案皆附來源依據。這不是多一個聊天視窗,而是多一套企業真正敢信任的知識基礎建設。

實際應用上,它能直接改變日常工作場景。像是跨部門會議結束後,錄音可自動匯入並生成逐字稿與摘要;想查一個月前的決議,只要一句提問,答案與出處立即呈現。新人報到時,也不必再戰戰兢兢問前輩基本問題,而是能即時取得最新SOP、法規指引與作業流程。這種改變不只是快,而是讓每一個人都能在更低壓、更高品質的環境中工作。

從導入角度來看,AI知識庫也不是遙不可及的龐大工程。依據內容,從需求評估、環境建置、資料清洗到試點上線,大約8到12週即可完成。最好的方式不是一次全面鋪開,而是先從企業最痛、最常發生的問題切入,做小規模試點,快速驗證成效,再逐步複製到全公司。這也是典型的賈伯斯式推進方法:不是先講龐大藍圖,而是先讓人看見第一個具體而驚豔的成果。

最後,真正值得企業思考的,不是要不要跟上AI,而是公司裡那些尚未被系統化的知識,究竟是在默默支撐成長,還是在拖慢每一個人的效率。當知識只停留在少數人腦中,它就是風險;當知識被整理、被萃取、被傳承,它才會成為企業無法被複製的護城河。現在開始規劃AI知識庫,不只是導入一套工具,而是替企業打造下一階段成長最關鍵的引擎。


#AI

#知識庫

[AI 分享] 從零開發AI Agent的十個核心模組

[AI 分享] 從零開發AI Agent的十個核心模組


摘要 : 文章整理從零打造AI Agent所需的10項核心能力,涵蓋工具、技能、記憶、上下文等基礎架構。



內容:

分享從零開發一個完整 AI Agent 所需要具備的十個核心技能。這個專案定位為執行在客戶端上的個人 AI 助理,能夠聊天、建立文件、規劃任務,也具備記憶、能力擴展與權限限制等完整 Agent 特性。


一開始先說明,打造 Agent 的基礎不是單純接上一個大模型,而是建立一個 ReAct 迴圈,也就是 Reasoning(推理)與 Action(執行)的反覆流程。當使用者提出需求後,模型先進行判斷,如果需要呼叫工具,就透過工具取得外部資訊,再將結果回傳模型處理;若不需要工具,則直接回覆使用者。這個循環是現代 AI Agent 的基本核心。


第一個重要模組是 Tools。作者認為工具是 Agent 最基礎的能力,相當於讓大模型從只有「大腦」,變成同時擁有手腳與感官。像是讀寫檔案、執行命令、跑腳本、網頁搜尋與抓取網頁等,都是一個可用 Agent 必備的內建工具。沒有這些工具,Agent 只能算是展示型 Demo,難以真正落地使用。


第二個模組是 Skills。Skills 可以理解成技能手冊,目的是讓大模型按照預先定義好的流程、格式、輸入與輸出標準來執行任務,而不是完全自由發揮。這樣能提升結果穩定性,也更符合使用者預期。當 Skills 數量增加後,系統還需要支援技能載入、技能搜尋、技能安裝,甚至讓使用者自行創建 Skills。作者也提到,知Talk 專案會支援社群中常見的標準技能,例如 PDF 處理與內容創作類 Skills。


第三個模組是 Memory,也就是記憶。作者強調,若要做個人 AI 助理,記憶能力幾乎不可或缺。Agent 需要記住使用者的名字、興趣、職業、目標與計畫,不能只停留在單次對話。記憶又可分為短期記憶、長期記憶,以及使用者 Profile。短期記憶主要存在於當前對話,長期記憶則能跨對話保留重要資訊,而 Profile 則記錄使用者的穩定特徵。這些記憶的建立與提取,通常也會透過對應工具來完成,並搭配全文搜尋、語意相關性與時間衰減等策略來進行排序與召回。


第四個模組是 Context,也就是上下文。作者指出,大模型請求本質上是無狀態的,因此每一次請求都必須重新組裝完整上下文,才能讓模型理解當前情境。這裡面不只是單一句使用者輸入,還包括系統提示詞、歷史聊天記錄、工具資訊、技能描述,以及記憶內容等。也就是說,Context 是將 Agent 當下所需的一切資訊,打包後提供給模型,是保證回應品質的重要基礎。


整體來看,這篇內容是一份從實作角度出發的 AI Agent 架構整理。結合正在進行的專案重構經驗,試圖把 Agent 所需能力模組化、系統化,讓想從零開始開發 Agent 的人,能夠更清楚理解整體技術地圖。

[AI 普及] 2026紅杉資本看AI革命:服務化、加速化與個人機會

[AI 普及] 2026紅杉資本看AI革命:服務化、加速化與個人機會


摘要:AI革命不只是工具升級,而是服務市場重構;關鍵機會在垂直用戶、極簡產品與AI普及落差。



內容:


2026年紅杉資本對AI產業革命的新觀察,以及普通人在這波浪潮中可能抓住的機會。核心觀點是:我們正處在一個「AI普及紅利」的時代,這不只是科技升級,而是一場比過去幾十年更深、更快的變革。


首先,這次AI革命和過去的晶片、網際網路、雲端、手機、新媒體平台等技術浪潮不太一樣。過去多數科技產品本質上是工具或軟體,使用者買回去自己操作;但AI不同,它不只是給你一個工具,而是直接給你一個「會做事的助手」。它可以逐步扮演律師、醫生、會計、助理等角色,因此AI所切入的不只是軟體市場,而是更龐大的服務市場,規模可能高達數兆甚至接近十兆美元。


第二個差異是速度。AI產業的成長與擴散遠比過去的科技公司更快。過去企業做到巨額營收需要多年,但在AI時代,產品、能力、估值與商業化速度都被大幅壓縮。這表示AI不只是重要,而且它正在以極快的節奏改寫產業競爭規則。


第三個差異是,AI不只是改善資訊傳遞,而是在改變「資訊如何被處理」。網際網路解決的是資訊怎麼流通,AI進一步處理的是資訊如何思考、組合、創造。換句話說,它不只是讓世界連得更快,而是讓系統開始具備一定程度的認知與執行能力,對工作方式的改變會更徹底。


AGI(通用人工智慧)其實可能已經在悄悄滲透進人們生活,只是大多數人還沒明確意識到。原因在於,現在的AI已經不再只是簡單問答,而是可以接收任務、從失敗中調整、自己調用工具、持續執行直到完成目標。這種遞迴、自主修正與任務導向能力,已經非常接近人類員工的核心功能。


舉了幾個案例來說明AI帶來的效率躍升:原本需要一個團隊做三年的專案,可能在AI輔助下,一個工程師用幾週到幾個月就能完成;原本要半年重寫核心程式碼的工作,可能一個人一個週末就能推進;甚至大型公司過去需要數百人多年完成的重構任務,如今也能在AI協助下,短短六週內完成。這些例子要說明的是:AI帶來的變化不是未來式,而是已經開始發生。


接著,把重點拉回到「你的機會在哪裡」。這麼大的市場不可能只由少數大公司完全吃下,真正的機會會存在於大公司難以覆蓋的縫隙之中。這裡提出了一個「MAD法則」。


M代表護城河(Moat)。真正的護城河不應建立在技術本身,因為AI技術更新太快,今天領先、明天可能就被淘汰。更穩固的護城河應該建立在用戶關係、信任與垂直場景上。也就是說,圍繞客戶需求打造產品,比圍繞技術本身更重要。尤其在AI時代,被使用者長期信任、理解使用者、持續和使用者互動,才是最不容易被取代的核心能力。


A代表直觀與簡單。好的AI產品不應該讓人感覺複雜,而是要像錘子一樣直覺,讓人一看就知道怎麼用。現在很多AI工具雖然能力強,但介面複雜、學習門檻高,普通使用者根本看不懂,這恰恰就是創業或產品設計的機會。誰能把強大的AI能力包裝成最簡單、最直觀的形式,讓不懂技術的人也能立刻上手,誰就更有機會把產品推向大眾市場。


D代表普及紅利(Distribution / Democratization的概念)。AI能力的進步速度,遠遠快過企業與普通人真正採用它的速度。大量中小企業可能還停留在數年前的數位化水平,因此在最新AI能力與真實市場應用之間,存在一條巨大的落差與鴻溝。這條鴻溝本身,就是最大的機會來源。誰能幫助這些企業與普通人跨過這道門檻,誰就有可能在這一波普及過程中受益最大。


整體來看,想傳達的不是單純的技術興奮,而是一種現實提醒:AI革命已經開始,而且不是只屬於巨頭公司。對個人、創作者、創業者與中小企業來說,真正值得把握的,不是去追逐每一項最前沿技術,而是找到用戶真正需要的場景,把AI變得更簡單、更實用、更容易被普及。這個時代最大的紅利,不只是發明能力,而是讓能力真正走進千家萬戶。

[AI 分享] Codex桌面Agent入門解析

[AI 分享] Codex桌面Agent入門解析

摘要 : Codex不是桌面版ChatGPT,而是能在授權範圍內直接操作電腦檔案的AI Agent。




內容:

如果你平常有在使用 Claude 或 ChatGPT 這類主流 AI 工具,最近大概很難忽略 Codex 的討論熱度。社群上越來越多人在談它,相較之下,Claude 因為前陣子的降質爭議,聲量似乎稍微退了一些。


當團隊中有位完全不會寫程式的營運夥伴,剛開始接觸 Codex 時,第一個反應是:「這不就是放在桌面上的 ChatGPT 嗎?」,但實際上兩者差異很大。ChatGPT 的運作方式,通常是你先把檔案上傳給它,它修改後再由你下載、整理,真正執行工作的人還是你自己,因為它碰不到你的電腦。


Codex 則屬於另一種類型:住在你電腦裡的 Agent。當你提供一個工作環境並授權後,它就能在範圍內自己讀檔案、改檔案、執行工具、產生成品,不需要你反覆做上傳、下載、複製、貼上的中介流程。簡單說,ChatGPT 比較像線上回答問題的助手,Codex 則更像直接在你電腦裡幫你做事的執行者。


這類「住在電腦裡」的 Agent,還可分成桌面 App 與終端機 CLI 兩種。CLI 版本偏工程師使用,本文聚焦在對非技術使用者更友善的桌面 App。文中也提到,像 CloudCode、CloudCode Work 這類產品,本質上與 Codex 類似,都是 OpenAI 與 Anthropic 這兩大陣營推出的 AI Agent 方案。


如果你已經用過 Claude 那邊的相關產品,想單純試試 Codex,其實很適合入門,因為它有免費版本,只要有 ChatGPT 帳號就能使用。就作者個人體驗來說,Codex 在操作流暢度與使用額度上都比 Claude 的 App 更順手,也更划算。


介面方面,Codex 採用直觀的三欄式設計。左邊是對話、專案與設定區,中間是輸入指令的區域,右邊則是結果與預覽。左欄主要包含歷史對話、任務列表、專案資料夾、外掛與設定。如果只是一般提問,可以直接開新對話;但若是處理某個專案中的任務,就應該從專案資料夾旁開新對話,這樣 Codex 才能讀到正確的資料夾與上下文,例如 Agents Markdown 或事先整理好的專案背景資訊。


中間欄是與 Codex 溝通的主要場所。你可以像用 ChatGPT 一樣打字,也可以直接用語音輸入。作者特別強調語音輸入很好用,因為現代很多工作場景都在與 AI 共同寫作,長時間打字其實很容易疲勞,因此他自己大約有 80% 的時間都使用語音操作。


此外,若輸入「@」可以附加專案中的特定檔案給 Codex;輸入「/」則能檢視狀態或指定要用的 Skill。還有一個很實用的功能叫 Fork,也就是分支。每一則回覆下方都可以複製出一條新的對話分支,適合在已經提供完整背景後,針對不同方案同時展開測試。作者把它比喻成平行宇宙,也像是打電動前先存檔,之後不管哪條路走歪了,都能從原點重新開始。


右側區塊則是結果預覽區,你可以查看檔案、資料夾結構,也能預覽它生成的網頁或 HTML 報表。其中最方便的功能之一,是網頁預覽中的視覺化註解。當 Codex 幫你做出一個網頁時,你可以直接在畫面上點選某個元素,例如標題、圖片或區塊,然後直接告訴它「這個標題放大」、「這張圖換掉」、「這個區塊刪掉」。它會回頭修改底層程式碼,再把更新後的結果顯示出來。這讓不懂程式的人,也能透過所見即所得的方式和 AI 協作。


接著,真正關鍵的不只是會打開 Codex,而是要學會駕馭一個能碰你電腦的 Agent。要駕馭它,核心有四個基本功:專案、許可權、上下文,以及 Agents Markdown。


先談「專案」。Project 的概念很簡單:你在哪個資料夾中啟動 Codex,那個資料夾就會變成它的工作區。它只會在這個範圍內讀檔、改檔、新增或刪除內容。因此,若你要辦一場小型講座,就可以先建立一個「講座籌備」資料夾,把活動說明、報名名單、講者介紹、圖片素材、過去的簡報範本都放進去。這一步看似基本,卻是整件事的核心:你不是把整台電腦交給 AI,而是先劃出一塊明確範圍,讓它只在這裡做事。


當你要 Codex 處理某個檔案時,與其只給它一個關鍵字讓它自己去找,不如直接拖入資料夾、貼上完整路徑,或使用「@」附加檔案。否則它可能會在大量檔案中到處翻找,不只變慢,也會白白消耗許多 Token。讓 Codex 在特定專案資料夾中工作,不僅能讓它聚焦,也能降低誤改無關檔案的風險。


而專案資料夾內的整理,其實就是所謂的 Context Engineering,也就是上下文工程。聽起來很專業,但本質上就是把資料分類清楚、命名明確,讓任何剛加入的人——包含 AI——只看資料夾名稱就能快速找到東西。即使沒有 AI,這本來也是好習慣;到了 Agent 時代,這件事只會變得更重要。


第二個重點是「許可權」。這是新手最應該搞懂的地方,因為它直接決定 Codex 在你電腦上能做到什麼程度。文中把 Codex 的權限大致分成三種模式。


第一種是最保守的「要求核准模式」,也就是預設模式。這種情況下,Codex 可以讀檔案、和你討論,但只要它想真的修改檔案或執行指令,都必須先經過你的同意。


第二種是多數人常用的中間模式。它可以在你指定的工作資料夾中,自行讀檔、改檔、執行指令,不必每次都問你;但如果它想碰資料夾外的內容,或是需要連網,就會停下來向你確認。


第三種則是 Full Access,也就是完整存取權。這種模式下,AI 幾乎可以碰整台電腦與網路,不再逐一詢問。在 CLI 世界裡,這甚至有個別名叫 YOLO 模式,意思是「反正人生只有一次,直接衝」。作者明確提醒,不建議新手一開始就亂開,因為權限越高,雖然越省事,但如果你還不理解它的行為邏輯,風險也會成倍增加。


作者也建議,不必一開始就糾結該選哪一種模式。更聰明的做法,是先從保守模式開始,讓它多問你幾次。當你逐漸理解它會怎麼做、什麼情境下會跳出詢問視窗後,再視情況放寬權限。如果真的被提示視窗問到很煩,也可以在當下直接切換到更高權限,或選擇在這次工作階段中不再詢問。


等你熟悉之後,確實也可以直接開 Full Access 來換取流暢體驗,但前提是要搭配 Agents Markdown 做限制。例如可以明確寫下「不要刪除原始檔」這類規則,讓它即使擁有高權限,也不會隨意執行不可逆操作。


整體來看,這篇內容的重點不只是介紹 Codex 好不好用,而是幫非技術使用者建立一個正確觀念:Codex 不是單純的聊天機器人,而是一個可以直接進入工作環境、代你執行任務的 AI Agent。也因此,真正重要的不是會不會下指令,而是你能不能設好專案邊界、整理好上下文、理解權限風險,並用規則把它駕馭好。

2026年6月15日 星期一

[AI 分享] Loop Engineering:AI程式設計的新範式

 [AI 分享] Loop Engineering:AI程式設計的新範式


摘要:Loop Engineering強調用自動化閉環指揮AI工作,正逐步取代單純提示詞與harness思維。




內容:

近來矽谷AI圈開始出現一個新名詞:Loop Engineering。相較於過去大家熟悉的 prompt、context,甚至是近年熱門的 harness engineering,loop 更強調的是讓AI不只是被動執行指令,而是能在一個自動化閉環中持續工作、分派任務、檢查結果與自主改進。


從演進脈絡來看,Prompt 解決的是「如何一次把需求說清楚」;Context 解決的是「要提供AI哪些背景資訊」;Harness 則是替 agent 建立執行環境。如果說 harness 是為AI打造一台能開的車,那 loop engineering 就像是幫這台車裝上自動駕駛系統,讓它知道何時啟動、如何行動,以及怎麼驗收成果。


真正的 loop,不只是反覆執行而已,而是一套由「目標、度量、決策、行動」構成的自主改進閉環。它能根據當前觀察到的狀態,自行決定下一步該做什麼,甚至安排下一次何時再啟動。這也是它與一般自動化腳本最大的不同。


要搭建一個有效的 loop,需要五個核心元件,再加上一個記憶底座。第一是自動化,它是整個系統的心跳,不只能定時執行,更重要的是能依條件觸發,例如直到測試全數通過、程式碼規範檢查完成才停止。第二是 WorkTree,用來為多個AI提供各自獨立的工作目錄與分支,避免並行開發時發生檔案衝突。


第三是技能。由於AI每次啟動時都像重新開始,如果沒有事先定義的技能與規範,它每輪都可能重複摸索專案規則。技能就像是一份外掛式的員工手冊,能清楚寫出專案約定、建置步驟與操作方式。第四是聯結器,透過像 MCP 這樣的協議,AI得以接入資料庫、外部工具與通知系統,從只能處理本地檔案,升級為可以串連真實工作流程。


第五是 subagents,也就是將不同角色拆開處理。在無人值守的環境中,不能讓同一個AI既負責寫程式又負責審查,否則容易失去客觀性。較好的做法是由一個AI負責生成內容,另一個AI負責依照規格驗證與審核。第六個要素則是狀態記憶,這份記憶通常需要落在磁碟上,例如以 markdown 文件記錄待辦與已完成事項,讓系統在中斷後仍能無縫接續。


不過,loop engineering 並非萬能,最大的風險在於失控。如果你的系統缺少能夠對AI說「停止」的硬性機制,它就可能變成一座無情的 token 焚燒爐,在無限迴圈中持續產出看似合理、實則品質低落的垃圾程式碼。無人職守的系統,也可能無人職守地犯錯。


另一個值得警惕的問題是認知降級。當AI交付成果的速度越來越快,人類對程式碼實際狀態的理解卻可能逐漸落後。如果開發者只是全盤接受AI產出,卻不持續檢驗與思考,最終很可能導致程式碼品質惡化。無論流程多自動化,驗證責任始終還是在人的身上。


在實務上,最適合導入 loop 的任務,通常是 bug 修復或需求邊界明確的新功能開發。這類工作有清楚的驗收標準,適合形成可控的小閉環。相反地,像是「幫我優化整體系統架構」這類過於抽象的任務,若直接交給 loop 處理,往往只會讓專案快速失控。


總結來說,harness 是讓AI有工具可用,而 loop 則是讓AI工作流程真正自動運轉。未來AI程式設計的競爭力,可能不再只是誰更會下提示詞,而是誰更懂得設計高品質、可驗證、可持續運作的迴圈系統。與其當AI的打字員,不如成為 loop 的架構師。

2026年6月14日 星期日

[AI 分享] RAG檢索最佳化全解析

 [AI 分享] RAG檢索最佳化全解析



摘要 : RAG效果關鍵不在模型本身,而在檢索設計。本文整理多種最佳化策略、原理、優缺點與適用場景。


內容:

很多人以為RAG只是「查資料+生成答案」,只要接上 embedding 和 LLM 就算完成,但真正上線後常會遇到檢索不準、上下文斷裂、回答品質不穩定等問題。其實,RAG 系統之間 90% 的效果差距,往往就藏在檢索策略的設計裡。

這篇內容系統性整理了多種 RAG 最佳化方法,從最基礎的 Simple-RAG 開始,一路講到語意切分、重排序、文件增強、上下文壓縮、使用者回饋迴圈,以及知識圖譜等進階方案,幫助讀者理解工業級 RAG 系統到底是怎麼設計的,也能作為面試、競賽與實務落地的參考。

最基礎的方法是 Simple-RAG。它的邏輯很直接:先把原始文件切成多個 chunk,將每個 chunk 向量化後存入向量資料庫;當使用者提問時,再把 query 轉成向量,找出最相近的 chunk,交給模型生成答案。這種方法實作簡單、成本低,但常用的固定長度硬切分會直接把句子或段落攔腰截斷,破壞語意完整性,因此在真實場景中效果有限。

為了解決硬切分的問題,進一步有了語意切分(Semantic Chunking)。這種方法不是按固定字數分塊,而是根據相鄰句子之間的語意相似度來決定是否切分。當主題一致時就合併成同一塊,主題轉折明顯時再切開。這樣可以讓每個 chunk 的內部語意更完整,提升模型理解能力,但仍然可能因 chunk 太小而失去更大的上下文。

接著是 Small-to-Big Retriever,核心概念是「用小塊查、用大塊答」。系統先用細粒度的小塊做精準檢索,找到最相關的內容後,再映射回所屬的父段落或更完整的大塊,提供給模型生成答案。這種方式同時兼顧檢索精度與上下文完整性,是實務上非常有效的一種平衡方案。

另一種較輕量的做法是 Context-Enriched Retrieval,也就是上下文增強檢索。當系統找到最相關的 chunk 後,不只回傳它自己,也把它前後相鄰的 chunk 一起帶回。這能補足孤立句子的語境,幫助模型理解前因後果。它的優點是結構簡單、容易整合進現有流程,能有效降低資訊片段化的問題。

文件增強(Document Augmentation)則是換一個角度思考:既然最終都是要回答問題,那在建立索引時,不如就為每個 chunk 額外生成可能對應的問題。換句話說,除了存文本,也存「這段內容可能被怎麼問」。這能讓查詢和文件之間的匹配更貼近使用者真實提問方式,因此在高精度需求場景中特別有價值,雖然代價是需要更多計算資源。

如果相關資訊並不是散落在單一 chunk,而是分布在連續段落中,就可以使用基於滑動視窗的連續片段檢索策略。這種方法會先找出高分 chunk,再以它們為中心,向前後延伸一定範圍,用加權方式計算整段連續內容的綜合分數,最後回傳得分最高的完整片段。這對法律文件、科研論文、長篇報告等需要跨段理解的場景特別有效。

在實際檢索結果中,常常還會夾雜大量無關內容,因此上下文壓縮也是非常重要的一步。做法是利用大模型對召回內容進行篩選、提煉與壓縮,只保留與查詢直接相關的資訊。這樣不只可以減少 token 浪費,也能降低背景噪音對最終回答的干擾,讓生成更聚焦、更準確。

除了靜態最佳化,內容中也提到一個更動態的方向:基於使用者反饋的 Feedback Loop。系統在回答後收集使用者的評分與評論,再將這些反饋結構化儲存,逐步調整文件權重與排序方式。簡單說,就是讓系統記住哪些內容過去曾經幫助使用者獲得好答案,未來遇到類似問題時就優先召回。這種方法雖然設計較複雜,但代表了 RAG 從靜態檢索走向持續學習的重要方向。

Self-RAG 則進一步讓系統具備「先判斷、再檢索」的能力。當使用者提問時,模型會先評估自己是否能直接依靠內部知識回答;若不確定,再啟動檢索流程。檢索回來後,也不是直接使用,而是再評估哪些內容真正相關、哪些只是表面關鍵詞相似。這種方法能減少不必要的檢索成本,也能提升回答可靠性,特別適合對正確性要求高的場景。

最後,內容也談到了知識圖譜型的 RAG 設計。這種做法會把資訊轉換成節點與邊,構成圖結構來表示人物、概念、事件與它們之間的關係。當使用者提問時,系統不只是找文字片段,而是沿著關係圖進行查詢與推理,因此特別擅長處理跨文件、跨章節、具關聯性的複雜問題。這代表 RAG 不只是做文字匹配,而是朝向結構化知識理解與推理發展。

整體來看,這篇內容的核心觀點非常明確:RAG 的真正競爭力,不在於是否接上 LLM,而在於檢索策略是否足夠成熟。從硬切分到語意切分,從局部檢索到上下文補全,從靜態索引到反饋學習,從純文本搜尋到知識圖譜推理,每一種策略都在解決不同層面的檢索問題。


如果你正在做畢業設計、參加 AI 競賽、準備面試,或想打造可落地的企業級 AI 系統,這些 RAG 最佳化方法都不是可有可無的附加技巧,而是直接決定系統效果上限的核心能力。

[AI 分享] RAG知識客服原理拆解

 [AI 分享] RAG知識客服原理拆解



摘要 : 解析RAG核心流程,從文件分片、向量化到召回生成,理解知識庫問答如何落地。


內容:

RAG 是 Retrieval Augmented Generation 的縮寫,中文通常翻成「檢索增強生成」。它的核心概念其實不複雜,就是先從資料中找出和問題相關的內容,再根據這些內容生成答案。因此,RAG 目前被廣泛用在知識助手、企業客服與智慧問答系統中。

如果想打造一個能回答公司產品問題的智慧客服,單靠大模型本身是不夠的。因為模型並不知道企業內部的產品資料、操作手冊或規範文件。乍看之下,好像只要把整本手冊連同問題一起丟給模型就行,但這樣做會遇到幾個明顯問題,包括模型的上下文視窗有限、輸入成本過高,以及推理速度會明顯變慢。尤其當文件長達上百頁甚至上千頁時,模型不但無法穩定吸收全部資訊,回答品質也會受到影響。

RAG 的價值就在這裡。它不會把整份文件全部交給模型,而是先將文件切成多個片段。當使用者提出問題時,系統會先在這些片段中找出最相關的內容,只把少量真正有用的片段連同問題一起交給模型。這樣一來,模型看到的資訊更聚焦,不但能降低成本,也能提升回答速度與準確率。

整體來看,RAG 流程大致可分成兩大部分。第一部分是提問前的資料準備,也就是先把文件處理好,這通常包含「分片」與「向量化儲存」。第二部分是提問後的回答流程,會依序經過「召回」、「重排」與「生成」等步驟。這些環節彼此配合,才能讓系統在大量知識中快速找到最適合回答問題的內容。

所謂分片,就是把一整份文件拆成多個小段落。切分方式可以很多元,例如依字數切分、依段落切分、依章節切分,甚至依頁碼切分。切分的目的,是讓後續檢索能更精準地定位內容,而不是每次都處理一整本文件。片段切得是否合理,會直接影響後續問答品質。

完成分片後,下一步就是把每個片段做 Embedding,也就是將文字轉換成向量。這個步驟會把文字內容映射成一組數值,讓電腦能從數學角度理解文本之間的語意關係。之後,系統會把原始片段內容以及對應的向量一起存進向量資料庫中,作為後續檢索的基礎。

向量本身是數學概念,可以理解為一串有方向與大小的數值。雖然在 RAG 中使用的向量通常維度很高,無法直接視覺化,但它能有效承載語意資訊。通常維度越高,向量所能表達的細節也越豐富,因此在語意理解與比對上會更可靠。

Embedding 的重點,在於讓語意相近的文本轉成彼此接近的向量。例如「馬克喜歡吃水果」與「馬克愛吃水果」意思很接近,因此轉換後的向量距離也會很近;而像「天氣真好」這類無關句子,其向量就會離得比較遠。正因如此,當使用者提出問題時,系統也能先把問題轉成向量,再透過向量相似度去找出語意最接近的知識片段。

而所謂向量資料庫,簡單來說,就是專門用來儲存文字片段與其向量,並支援快速相似度搜尋的資料庫。它的作用不是取代原始文本,而是幫助系統在龐大知識中快速找到相關內容。因此,實際儲存時,通常會同時保留文字內容與向量表示,方便後續召回與生成階段使用。

總結來說,RAG 的核心不是讓模型直接讀完所有資料,而是先把知識拆解、向量化、儲存起來,等到使用者發問時,再從大量片段中找出最相關的資訊交給模型回答。這樣的設計,正是現代高品質知識客服與企業知識庫系統能夠落地的關鍵。

[AI 分享] 三句話建立陌生客戶信任

 [AI 分享] 三句話建立陌生客戶信任

摘要 : 用三句黃金溝通法,從推銷者轉為顧問,快速建立信任,提升陌生客戶成交與長期合作機會。


內容:

很多銷售都遇過一個常見問題:加了客戶好友、發完產品介紹後,對方就不再回應,整段溝通直接中斷。問題往往不在產品,而是在溝通方式。當銷售只是一味發資料、講產品,站在客戶角度看,這其實更像是沒有鋪墊的廣告推送,容易讓人產生防備,甚至直接忽略。

真正能持續成交、建立長期客戶關係的人,靠的不是硬推銷,而是思維上的轉變。關鍵在於,從「我想賣東西給你」的推銷者角色,轉換成「我能幫你解決問題」的顧問角色。當客戶感受到你不是來賺他錢,而是真心想幫助他,他才會放下戒心,願意交流,進而產生信任。

想快速和陌生客戶建立信任,可以運用一套「三句黃金溝通法」,讓對話自然推進,逐步完成破冰、認同與信任建立。

第一句話的重點,是讓客戶感受到你對他的專屬關注。不要一開口就用制式化的自我介紹,而是先透過客戶的動態、產業資訊、公司近況等公開內容,找到具體細節作為切入點。當你能說出你觀察到的內容,客戶會明顯感受到你不是群發廣告,而是有做功課後的針對性交流。這時再適度放低姿態,表明只是想交流、互相學習,就能有效降低對方的防備心。

第二句話的核心,是展現你的專業,幫客戶點出他可能尚未明確意識到的問題。很多客戶即使有困擾,也不一定會主動說出來,甚至他自己都還沒完全理清問題在哪裡。這時,優秀的銷售應該像顧問一樣,根據對方的行業、職位與情境,直接列出幾個常見的高頻痛點,讓客戶用選擇題的方式回應。這樣不但降低溝通成本,也更容易讓客戶產生共鳴。一旦你精準說中他的處境,對方就會開始認可你的專業,願意進一步打開話題。

第三句話的重點,是透過真實案例證明你有解決問題的能力。客戶不會因為你把產品功能講得多厲害就買單,他真正關心的是:你能不能幫我改善現況,能不能帶來實際成果。因此,比起空談優勢,更有效的方法是分享一個與客戶背景相似的真實案例。這個案例最好能清楚呈現客戶原本的困境、你採取的解決方法,以及最後得到的具體成果。當客戶從案例中看到和自己相似的情境,就更容易代入,也更能建立信任。

在這三句話之後,記得用開放式提問作為收尾,把選擇權交還給客戶。不要施壓,也不要急著成交,而是讓對方有空間思考,主動表達需求。這樣的溝通方式,會讓整個過程更自然,也更容易讓客戶產生合作意願。

整體來說,這套方法的邏輯很清楚:第一句先破冰,讓客戶願意聊;第二句展現專業,讓客戶願意信;第三句用案例佐證,讓客戶願意合作。當你不再只關注產品,而是開始關注客戶、問題與結果,你在客戶心中的角色就會從業務員,逐漸變成值得信任的合作顧問,陌生客戶也更有機會轉化為長期穩定的合作對象。

AI知識庫:把企業隱性資產變成營運戰力

 [AI 應用] AI知識庫:把企業隱性資產變成營運戰力



摘要 : AI知識庫可整合企業分散資料與資深員工經驗,縮短找資料時間、降低知識流失風險,並在8到12週內快速試點導入。

(若對這個產品有興趣的,請留言告知)


內容:

企業每天都在承受一個看不見卻代價高昂的問題:員工平均每日花費1.8小時找檔案、確認版本、重複詢問同樣問題。長期累積下來,每人每年約損失22個完整工作天;若公司有100位員工,就等於一年蒸發2200個工作天,形成巨大的隱性成本黑洞。

比設備或軟體更昂貴的,往往是卡在資深員工腦中的知識與經驗。這些未被系統化保存的實戰智慧,一旦員工休假或離職,就可能讓團隊被迫重回起點,重新踩坑、重新摸索,這正是知識孤島帶來的核心風險。

AI知識庫的價值,在於把原本耗時的資訊搜尋濃縮成30秒內完成。使用者只要以自然語言提問,系統就能快速整理出精準答案,並附上清楚的資料來源改變過去翻找文件、會議記錄與對話紀錄的低效率模式

其運作方式可概括為六個步驟:匯入各類文件、錄音與影片;清洗重複雜訊並遮蔽敏感資訊;萃取重點;蒸餾成可用知識;提供自然語言查詢問答;再透過評量、稽核與回饋持續更新,讓知識庫維持可追溯且可信賴的狀態。

AI知識庫不只適用於IT部門,而是能從個人部門一路延伸到全企業。它可協助個人整理專案資料,幫部門管理SOP與專案流程,也能打通跨部門資訊壁壘,將資深員工的經驗有效傳承,提升整體回應一致性與營運效率。

相較一般AI聊天機器人,企業級AI知識庫更重視安全與治理,包括地端私有部署、細緻權限控管、答案可追溯與可稽核。導入也不一定漫長,通常可在8到12週內完成,並建議先從最痛的場景試點,快速驗證投資報酬,再逐步擴展到全公司,讓知識真正成為企業競爭力


#AI


[AI 知識分享] AI從聊天到幹活的進化

 [AI 知識分享] AI從聊天到幹活的進化


摘要 : 用規劃案例,串起LLM、Prompt、RAG、MCP、Agent、Skill等概念,說明AI如何一步步從回答問題進化到真正執行任務。


內容:

這兩年 AI 領域出現了非常多熱門名詞,像是 LLM、Token、Prompt、RAG、MCP、Agent、Skill 等,常讓人一開始看得眼花撩亂。其實這些概念並不是憑空冒出的術語,而是 AI 發展過程中,為了解決一個又一個實際問題而誕生的工具與方法。


先從最基本的情境切入:如果你週末想去玩,隨口問 AI 該怎麼安排,AI 能很快回覆你。這背後的核心就是 LLM,也就是大語言模型。它會把人類輸入的文字拆解成 Token,並透過預測下一個最可能出現的 Token,逐步生成完整答案。你對 AI 所說的話,就是 Prompt,也就是提示詞。


如果只是隨口一問,AI 的回答通常比較泛泛;但當你把需求描述得更清楚,例如加入預算、天數、偏好等條件,AI 的回覆就會更精準、更實用。這種把需求說清楚、讓模型更好理解的方式,就叫做 Prompt Engineering,也就是提示詞工程。


接著, AI 為什麼能記住你前面說過的條件。原因在於每次對話時,系統通常會把之前的聊天內容一併傳給模型,這就是 Context,也就是上下文。不過模型能處理的上下文長度有限,對話一長,就可能忘記前面的重點。為了解決這個問題,系統會把先前的內容壓縮成關鍵資訊,這份被提煉過的內容就是 Memory,也就是記憶。


但即使如此,模型仍然無法憑空知道你私人收藏的旅遊攻略或內部資料。這時就需要 RAG,也就是檢索增強生成。RAG 會先把你的私有資料切分、存入知識庫,在你提問時再檢索出最相關的內容,與問題一起提供給模型,幫助它生成更真實、更有依據的回答。許多 AI 客服、AI 問答系統,其實都是建立在這種能力之上。


不過,RAG 仍然只是幫助模型「回答得更好」,還不代表它真的能替你做事。例如你叫 AI 幫你查高鐵票,它可能只會告訴你該去哪個網站查。這時就需要 Function Calling。這套機制讓模型能夠根據需求輸出結構化的工具呼叫指令,再由外部程式真正去執行查詢、搜尋、訂票等操作,最後把結果回傳給模型整合成答覆。


但如果每接一個工具都要重新寫一套對接方式,工程成本會很高,因此 MCP 就出現了。MCP 的作用,是統一第三方工具的接入方式,讓 AI 應用只要對接一種標準協議,就能使用多種工具。文章也特別強調,Function Calling 和 MCP 並不相同:前者是讓模型知道如何發出工具呼叫指令,後者則是讓工具本身採用統一規格,方便整體接入與複用。


當 AI 已經能理解上下文、讀取資料、呼叫工具之後,就進一步發展成 Agent。Agent 不只是被動回答問題,而是能在收到目標後,自行拆解任務、規劃步驟、使用工具、記錄過程,逐步完成工作。也就是說,Agent 是把大模型、記憶、檢索、工具使用等能力整合起來,變成一個可以獨立執行任務的系統。


現在市面上很多 AI 產品,本質上都能視為不同形式的 Agent。差別在於它們能自主規劃到什麼程度、能否直接操作系統、能否主動與人協作。像一些桌面助理之所以受歡迎,就是因為它們不只會聊天,還真的能操作電腦、定時執行工作、透過通訊軟體和使用者互動,更像是真正的數位助手。


然而,即使 Agent 已經很強,使用者往往還是需要反覆交代偏好與規則。於是 Skill 的概念就出現了。Skill 可以理解成可重複使用的任務規範或能力模組,你可以把自己常用的要求、流程、限制條件整理進去,讓 Agent 在面對類似任務時直接參考執行。它和一次性的 Prompt 不同,Skill 更像是可持續使用、結構化管理的能力資產,也能節省上下文與 Token 成本。


最後,一個很重要的問題:AI 能力越強,出錯時的風險也越高。當 Agent 能直接操作工具、下指令、甚至付款時,如果沒有約束,就可能造成嚴重後果。因此需要額外的控制與防護機制,為 Agent 設定清楚的邊界、提供完整上下文、加入任務驗收與修正流程,讓它在可控範圍內發揮最大效率,避免失控或造成損失。


總結來說,把一連串 AI 概念串成一條清楚的主線:從 LLM 的文字生成開始,到 Prompt 改善提問品質、Context 與 Memory 管理對話、RAG 讀取外部知識、Function Calling 與 MCP 接入工具,再到 Agent 自主執行任務、Skill 沉澱經驗與規則,最後再加上安全約束機制。這也讓人更容易理解,AI 是如何一步一步從「只會聊天」走向「真的能幫你做事」。

2026年6月13日 星期六

[AI 分享] Agent是什麼?一次搞懂LM、Workflow與Agent的差異

 [AI 分享] Agent是什麼?一次搞懂LLM、Workflow與Agent的差異


摘要 : 解析LLM、Workflow與Agent差別,並說明Agent的五大組成與自主工作核心能力。


內容:

今天的重點,是搞懂「Agent到底是什麼」。Agent通常可翻成智慧體或代理,但若想真正理解它,最好先從LM與Workflow開始看起。


首先,像DeepSeek、ChatGPT這類產品,本質上都是基於LLM的大語言模型聊天機器人。可以先把它理解成一個很強的百科全書。它最基本的工作方式很簡單,就是「輸入→模型處理→輸出」。例如你輸入「給我一份會議紀要模板」,模型就會直接產出一份模板。


但如果你進一步問「我上一次會議是什麼時候」,單靠LLM其實無法回答,因為它沒有你的個人資料。這時就需要替它接入工具,例如日曆。它才能先查詢日曆,再回覆你答案。若再進一步要求「幫我把上一次會議紀要總結後寄到我的信箱」,事情就不只是問答,而會變成一連串步驟:先取得上次會議紀錄,再用模型摘要,最後接入郵件系統發送。這種由多個步驟串起來的流程,就是Workflow,也就是工作流。


Workflow的核心特徵在於:不管中間有多少節點、流程多複雜,本質上都還是人事先設計好的固定路線,AI只是照著既定步驟執行。因此,即便流程有一百個節點,也不能直接稱為Agent。


Agent的不同之處,在於它不是照單全收地執行預設流程,而是會自己決定下一步該做什麼。舉例來說,當你要求它「幫我把上一次會議紀要總結後寄到我的信箱」,Agent會先自己思考:要取得會議紀要,得先知道上次會議時間。它可能先查日曆,若查不到,再改去連接騰訊會議或其他系統尋找記錄。找到資料後,它再呼叫模型進行摘要。接著它還會繼續判斷:使用者雖然說要寄信,但沒提供收件信箱,那是否應該先詢問確認?整個過程中,Agent會持續思考、決策並調整行動,這才是Agent的真正特徵。


一句話總結,Workflow是執行人預先規定好的步驟;Agent則是能根據目標,自主決定要執行哪些步驟。


接著談Agent的構成。最容易理解的方法,是把Agent想像成一位「數字員工」。就像公司裡有不同崗位一樣,Agent也是一種數字化崗位。它可以24小時待命、不用請假,成本通常也比真人低,因此現在很多企業都對這種數字勞動力非常感興趣。如果把打造Agent想成在招聘一位實習生,那麼一個完整的Agent大致由五個部分組成。


第一是LLM,也就是大腦。像ChatGPT、DeepSeek、豆包等,都可以作為這個大腦。它負責理解人類語言、分析任務、制定計畫。沒有這個核心,大部分功能都無法成立。


第二是Prompt,也就是提示詞。這可以理解成崗位說明書。你不會只對新進客服說「你去做客服吧」,而是會告訴他職責、規則、處理方式與回覆風格。Prompt就是在做這件事,它負責定義Agent的角色、限制條件與輸出風格。


第三是Memory,也就是記憶。如果一位實習生每隔30秒就失憶一次,那肯定無法工作。Memory的作用,就是幫助Agent記住上下文、追蹤任務進度,並逐步累積經驗。


第四是Knowledge,尤其是External Knowledge,也就是外部知識。模型可能具備通用知識,但不一定知道公司的內部資訊。因此,還需要把企業知識庫、產品文件、制度規範等資料提供給它,讓它能基於特定場景工作。


第五是Tools,也就是工具。這是非常關鍵的一部分。所謂工具,不是實體工具,而是各種可被調用的數位能力,例如發郵件、下訂單、製作Excel、做PPT、查詢系統資料等。當Agent擁有操作這些工具的權限後,它就不只是「會聊天」,而是真正開始「會做事」。


不過,要特別注意的是,擁有這五個部分,並不代表它一定就是Agent。真正決定它是不是Agent的,不是零件有沒有備齊,而是它有沒有「自主完成工作」的能力。這裡就要提到一個重要概念:Agent Loop,也就是智慧體迴圈。其中一個經典框架叫ReAct,意思不是前端框架React,而是Reasoning與Acting,也就是「推理」與「行動」。


例如你對普通聊天機器人說「幫我做競品分析」,它通常只會回你一段分析文字;但Agent會先自己打開網頁、搜尋競爭對手、蒐集資料、整理資訊、畫出圖表,然後再檢查結果是否符合要求。如果結果不理想,它還會自己修改並持續迭代,直到滿意為止。這個「思考→行動→檢查→再修正」的過程,就是Agent Loop。它最核心的能力,在於不只是執行,而是會自己驗證成果。如果結果不好,它不會直接交差,而是會繼續調整。這種圍繞目標持續迭代的能力,才是Agent最關鍵的本質。


最後總結來說,把Agent想成數字員工會非常好理解。LLM是它的大腦,Tools是它的手腳,Memory是記憶,Knowledge是資料庫,Prompt是崗位說明書。但真正讓它成為Agent的,不是元件數量,而是它是否能圍繞目標自主工作,具備推理、行動、檢查與持續迭代的能力。


另外,關於Agent的組成,市面上其實會看到很多不同版本。這並不代表誰對誰錯,而是因為Agent目前仍處於高速發展階段,尚未形成全行業一致的官方標準。不同的工程團隊、產品公司、寫作者與一般使用者,會從不同角度理解與定義Agent,因此出現多種說法是很正常的。

[AI 衝擊] 人工智慧重塑就業

 [AI 衝擊] 人工智慧重塑就業

摘要 : AI正快速改變就業結構,白領職位首當其衝,但真正全面替代尚未發生,現在仍是準備與轉型的關鍵視窗期。


內容:

人工智慧正在成為這一代人必須面對的重要就業議題。從勞動經濟學的角度來看,大家最關心的問題是:技術進步是否一定導致失業?回顧過去百年的電氣化、資訊化與自動化歷程,技術雖然曾引發就業焦慮,但也不斷創造新職業與新需求。許多今天常見的工作,在數十年前其實並不存在,因此技術進步並不必然只帶來崗位消失,也可能帶來新的就業機會。

這一次AI浪潮與過去不同,關鍵在於它替代的不只是體力,而是人的腦力。過去的技術進步多半取代重複性的操作工作,但生成式AI開始介入理解、推理、創作、判斷等認知任務,這些原本正是白領工作的核心能力。像會計、編輯、銷售、程式設計師等職位,都屬於AI暴露度較高的職業;相較之下,餐飲服務、產業工人、家政服務等藍領工作,目前受影響相對較低。

另一個重大差異是,AI技術的部署速度極快、成本極低。傳統技術革新通常需要設備採購、產線改造與長時間推進,因此舊崗位的消失往往是漸進式的,也為新崗位的形成留下時間。但生成式AI可以透過雲服務、API與開源模型迅速擴散,企業與個人都能低成本使用。這使得AI對工作內容的影響可能是全球同步、跨行業發生,也代表就業調整的視窗期可能比過去更短。

針對AI如何影響就業,研究者提出了三種重要分析方法。第一種是「AI暴露指數分析法」,它把職業拆解成具體任務,再評估AI是否能完成其中超過一半的工作內容。這種方法顯示,AI暴露度高的工作並不等於一定會被取代,因為真正的結果還取決於工作內部任務之間是互補還是替代關係。也就是說,AI可能提高生產率,也可能壓縮人力需求,不能只看表面暴露度。

第二種方法是「AI整合崗位分析法」,它直接觀察企業是否開始招聘專門負責導入與整合AI的人才。研究發現,採用AI的企業中,初級崗位的招聘明顯放緩,高級崗位則大致穩定甚至增加。這表示AI目前首先衝擊的,未必是已在職場中的存量員工,而是新進人員與初階崗位。換句話說,AI對就業的影響可能先表現在「不再新增職缺」,而不是立即大量裁員。

第三種方法則是根據AI工具的實際使用資料來分析,也就是觀察人們在與大模型互動時,究竟拿它來完成哪些任務。相關研究發現,目前AI更常扮演「增強」而非「替代」的角色。它更多是在提升工作效率,幫助人更快完成任務,而不是真的完全取代人。例如理論上某些技術職位的高比例任務可由AI完成,但實際使用中,AI參與的範圍遠低於理論估計。這說明現實中仍存在模型能力限制、法規合規、人類驗證與系統整合等障礙。

綜合來看,AI對就業的真實衝擊尚未完全落地,但方向已經非常明確。它正在重塑工作內容、改變招聘結構,也讓部分高暴露職業率先面臨壓力。不過,從目前證據來看,AI更多是先改變工作方式,再逐步改變用人需求,而不是立即全面取代人類。因此,我們當前仍處在一個非常寶貴的準備期。

真正重要的問題,不是AI會不會來,而是我們能否利用這段視窗期及早調整。未來更被需要的人,可能不是單純重複執行任務的人,而是能與AI協作、能跨任務整合、具備判斷力、創造力與實際解決問題能力的人。這也意味著,面對AI時代,與其被動擔心被淘汰,不如主動提升自身在新工作格局中的適應力與競爭力。

[AI 信任危機] 如何因應AI時代的到來

 [AI 信任危機] 如何因應AI時代的到來


摘要 : 生成式AI不只衝擊工作,更在削弱社會對資訊、影像與事實的信任基礎。

內容:
很多人以為AI最大的風險是取代工作,但維基百科共同創辦人吉米・威爾士指出,更深層的問題是:AI正在讓整個社會的信任體系變得更脆弱。

近年來,人們本來就越來越難完全相信新聞、政治人物與企業說法;而生成式AI的快速發展,正在進一步放大這種不信任。尤其在影片領域,過去多數人看到監控畫面、演講影片或現場影像時,通常會先相信其真實性,如今這種預設正在改變。

因為AI生成影片愈來愈逼真,大家看到影像後的第一反應,開始從「相信」轉為「懷疑」。真正危險的不只是假的影片變多,而是真的影片也可能因此失去公信力。

當公眾逐漸失去判斷真假的能力,未來最有價值的就不再只是資訊本身,而是「可信度」。誰能有效證明自己是真實的,誰就會擁有新的競爭優勢。因此,數位身分驗證、真人認證與內容溯源等技術,正受到越來越多機構重視。

相較之下,維基百科反而沒有明顯受到AI衝擊。威爾士認為,AI並不適合用來撰寫百科條目,因為百科內容最重要的不是語句流暢,而是事實查核、來源驗證與社群共識。

目前許多AI公司與研究機構也已開始正視相關風險,包括AI失控、深度偽造擴散,以及社會信任下降等問題。當AI讓資訊生產變得前所未有地容易,未來最稀缺、也最昂貴的資源之一,可能正是那句最基本的話:這是可信賴的。

#AI

簡化 .NET 安裝與版本管理的 Installs with dotnetup

簡化 .NET 安裝與版本管理的 Installs with dotnetup

摘要 : .NET Up 以跨平台、一致化方式簡化 .NET 安裝、更新與版本管理,提升開發者與自動化代理的使用體驗。


內容:

在這場 Build 分享中,講者介紹了微軟正在開發的新工具「Installs with dotnetup」,目標是解決目前 .NET 在不同平台上的安裝與版本管理過於分散、複雜的問題。現今使用者安裝 .NET 的方式很多,包含 Visual Studio、VS Code 擴充功能、Winget、Homebrew、官方安裝腳本,以及各種社群版本管理工具,如 DNVM、asdf 等,造成使用體驗不一致,也增加維護與支援難度。

尤其在 Linux 環境中,.NET 安裝情境更加複雜。開發者常需在發行版套件、微軟提供的套件、手動安裝腳本與本地版本管理工具之間做選擇,還要考量是否需要特定 feature band、不同專案是否要使用不同 SDK 版本,以及本地安裝與全域安裝之間可能產生的衝突。這些問題不只讓使用者困擾,也讓微軟在除錯與支援時更難確認安裝來源與正確性。

為了解決這些痛點,.NET 團隊提出 Installs with dotnetup。這是一個跨平台、快速、輕量的工具,採用 Native AOT,主打「使用者層級的全域安裝」,也就是安裝在使用者自己的目錄中,不需系統管理員權限,也不影響同一台機器上的其他使用者。它希望提供一致的操作方式,讓任何作業系統上的開發者都能用相同方法安裝與管理 .NET。

.NET Up 的核心理念之一,是延續現有開發者已經熟悉的設定方式,例如 global.json。工具能讀取專案中的 SDK 需求,自動安裝符合版本規則的 .NET SDK,並支援更新與版本追蹤。除了安裝外,.NET Up 也會記錄目前系統中安裝了哪些 SDK、追蹤哪些版本通道,讓後續更新可以更自動、更有脈絡,而不是單純地下載壓縮檔後自行管理。

講者展示了 .NET Up 的實際操作流程。使用者只需初始化 .NET Up,它就能下載最新 SDK,並自動設定 shell 環境,讓後續終端機可直接使用 .NET 與 .NET Up。接著進入某個專案目錄後,執行安裝命令,.NET Up 會根據 global.json 自動判斷該專案需要的 SDK 版本,例如安裝特定 feature band 或依 rolling forward 規則選擇對應版本,讓開發者不必再手動比對版本與處理相容性。

這項能力對開源貢獻、團隊協作與自動化代理特別重要。過去開發者常在 clone 專案後才發現本機 SDK 版本不符,導致 build 失敗,還要自行找出正確版本。現在透過 .NET Up,可以在本機端像 CI/CD 一樣,自動依照專案需求補齊所需 SDK,降低進入專案的門檻與設定成本。

除了 SDK 管理,Installs with dotnetup 也進一步處理 runtime 安裝需求。講者以多目標測試情境為例,說明開發者可能只想使用最新 SDK 進行建置,但測試時仍需要 .NET 8、9、10 等不同 runtime。過去這通常得安裝多套完整 SDK 才能解決,但其實並不高效。.NET Up 的方向是讓開發者只保留需要的 SDK,再依測試與執行需求額外安裝對應 runtimes,讓環境更精簡也更合理。

在工具設計上,Installs with dotnetup 不只是一個命令列工具,也規劃成未來可供其他工具整合的基礎元件。團隊希望它的安裝記錄、版本資訊與簽章驗證機制,未來能與 Dependabot、Renovate 等生態系整合,成為 .NET 工具鏈供應鏈管理與自動化治理的一部分。這不只是安裝工具,更可能成為 .NET 開發環境管理的共同基礎。

安全性也是 Installs with dotnetup 的重要方向。團隊正與 .NET 發行團隊合作,讓 SDK、runtime 與相關 manifests 都具備完整簽章驗證,確保使用者取得的是微軟正式提供的內容。這能提升來源可信度、供應鏈安全性與審計能力,補足以往使用者層級安裝方式在安全與可追蹤性上的不足。

未來規劃方面,內部預覽版將聚焦於穩定版 SDK 管理、nightly/daily SDK 安裝,以及 one-shot execution 功能。這項功能可讓開發者指定某個 .NET 版本來執行特定命令,例如比較 .NET 10 與 .NET 11 preview 執行 build 的差異,方便進行 A/B 測試與快速回報問題,而不影響目前全域環境。

公開預覽階段則會加入 Installs with dotnetup 自我更新、更新通知、完整簽章驗證,以及提供給 AI/LLM 與自動化代理使用的技能與操作規範,讓代理工具可以更安全、正確地使用 .NET Up,而不再透過片段文件自行下載、解壓與設定環境。這將讓人類開發者與自動化系統都能有一致且可靠的體驗。

整體來看,.NET Up 的定位非常明確:它不是用來取代正式生產環境中的套件管理,而是專為開發階段打造的 .NET 工具鏈管理方案。它希望讓開發者只需 clone 專案、執行安裝命令,就能快速進入可工作的狀態,同時也讓代理、CI/CD 與版本測試流程更簡單、更安全。如果後續落地順利,.NET Up 有機會成為 .NET 開發生態中極具代表性的基礎工具。

[AI 分享] CodeX入門實戰全指南 2

 [AI 分享] CodeX入門實戰全指南

摘要:從安裝、介面、權限到網站、文件、影片與自動化任務,帶你真正上手CodeX。


內容:

CodeX 不是傳統的聊天型 AI,而是更接近「會直接幫你做事的 AI 員工」。一般聊天 AI 比較像顧問,你問問題,它給答案;但真正執行、整理、建立文件、操作工具的人還是你自己。CodeX 則屬於 agent 類型,不只會思考,還能直接把任務一步步完成,從建文件、整理資料、執行程式,到操作瀏覽器都能處理。

對一般人來說,CodeX 很可能是目前最值得學習的 AI agent 之一。尤其對學生、上班族、知識工作者而言,看完後很可能會改變對 AI 的理解。因為它不只是「回答你」,而是能逐步成為你真正可用的數位助手。

在使用前,主要需要準備 GPT 帳號。若是高頻重度使用者,可以考慮升級到 Pro;一般使用者使用 Plus 通常已經足夠,免費方案也能體驗,只是額度較少。安裝並登入後,如果介面是英文,可以到左下角設定中把語言切換成中文,之後就會更容易上手。

CodeX 的介面主要分成幾個部分。左側上方有新對話、搜尋、外掛與技能、自動化等功能。中間最重要的是「專案」與「對話」兩種結構:對話比較適合零碎型任務,像查資料、問問題;專案則更像一個對應電腦資料夾的工作空間,你在裡面產生的程式碼、PPT、文件等都會保存下來。每個專案下還能開很多對話,用來分別處理不同工作。

建立專案後,就可以直接在輸入框中用中文描述需求。下方可以設定使用的模型、思考強度與速度。思考強度通常分為低、中、高、超高,日常任務用中等即可;複雜任務則可調高。速度則分標準與快速兩種,趕時間時可以切換。若不想打字,也能直接使用語音輸入需求。

輸入區旁邊還有幾個很重要的功能。第一是上傳資料,可將本地檔案或資料夾交給 CodeX 使用。第二是「計畫模式」,開啟後它會先跟你討論方案,不會直接修改檔案,特別適合做網站、開發專案、流程設計等較複雜任務。第三是權限模式,通常有預設權限、自動審查與完全訪問三種。對新手來說,建議先用預設或自動審查,不要一開始就開完全訪問,以免 AI 做出你不想要的操作。

 CodeX 的工作場景與使用邏輯,讓使用者能理解它不只是聊天工具,而是能在本地、專案、雲端等不同環境裡協助你執行任務。這種能力,讓它更像是「可操作、可交付結果」的工作助手。

在實作案例中,CodeX 展示了多種應用。像是影片製作,只要給出需求,搭配對應外掛,就能生成影片、動畫、音樂等內容。即使只是簡單指令,也能快速做出可預覽的成果;若有更明確的腳本、素材或畫面要求,還能持續與 AI 對話,逐幀調整畫面細節與效果。

除了影片,它也能幫你產出表格、SEO 文件、Word 文件等各類辦公內容。過去這類工作往往需要查資料、整理資訊、排版校對,可能要花上好幾個小時;現在透過 CodeX,可以大幅縮短製作時間,而且還能在生成後直接預覽,若不滿意再請它持續修改。

外掛與 skill 的概念。外掛像是給 CodeX 增加能力模組,而 skill 則像是把一整套工作規則與流程,整理成可重複使用的標準操作手冊。例如圖片生成的流程,可以先定義畫面描述、風格與模型調用方式,再把這些規則寫成 markdown 文件,讓 CodeX 在不同對話中都能依照一致標準執行。

這裡特別提到一個實用技巧:在專案根目錄建立 `agents.md` 文件。因為 CodeX 在不同對話視窗之間不一定會記得先前所有規則,所以把重要規範、風格、流程寫進這份文件,就像給 AI 一份入職手冊。之後每次開新對話,它都能依據這份手冊做事,形成穩定、可複用的長期記憶與工作標準。

自動化則是 CodeX 的另一個高價值功能。如果你每天都要重複整理資料、搜尋熱門話題、彙整報告,就可以直接用自然語言建立自動化任務,例如「每天早上九點幫我搜集今日熱門資料並生成報告」。設定後,CodeX 就會定時執行。你也能在自動化頁面中調整執行時間、模型、思考強度、環境與任務描述,並隨時暫停或刪除任務。

在正式建立自動化之前,影片也建議先手動跑一次流程,確認輸出符合預期,再交給自動化執行,避免浪費額度。這是一個很實際的使用建議,特別適合剛開始接觸的人。

關於額度管理,CodeX 也提供清楚的查看方式。你可以在左下角設定中查看五小時內與本週剩餘額度,也可以透過對話中的狀態指令查看上下文與使用情況。若達到上限,不必太緊張,因為系統通常會按照滾動時間重新釋出額度。若真的不夠,再考慮升級方案即可。

另一個節省額度的重要方式是管理上下文。當一段任務完成後,可以手動壓縮上下文,讓模型把注意力聚焦到新任務上,這樣不只提升效率,也能減少不必要的消耗。

最後,直接請 CodeX 製作一個寵物貓咪主題首頁,並開啟計畫模式,讓 AI 先提出完整方案,再逐步確認風格、內容、設計方向。確認後,它便開始初始化專案、生成內容,最後完成網站頁面。內建瀏覽器還能直接預覽成果,並透過批註功能即時提出修改意見,再重新整理檢視更新效果。

整體來看,這支內容不只是介紹 CodeX 是什麼,更重要的是讓人理解它和傳統 AI 的本質差異:一個偏向建議型助手,另一個則是能幫你真正完成工作的 agent。從安裝設定、權限控制、文件生成、影片製作、網站開發,到 skill 與自動化任務,影片用大量實操案例展示了 CodeX 如何成為個人工作流中的 AI 員工。

第一性原理看科學世界

 [AI 回顧] 第一性原理看科學世界


摘要 : 這本書用第一性原理串起引力、量子、粒子與宇宙學,幫助非科學背景讀者快速理解科學底層邏輯。


內容:

第一性原理 試圖解決一個常見困擾:很多人一聽科學就覺得艱深難懂。作者馬克思·喬恩提出,不必背下繁雜知識,只要抓住各領域最根本、無需再被證明的「第一性原理」,再沿著邏輯逐步推演,就能理解整個知識框架。這也是他能把量子計算機講給完全沒有科學背景的聽眾聽懂的原因。

書中先從引力談起。引力的第一性原理很簡單:任何兩個有質量的物體都會彼此吸引。雖然引力在四種基本作用力中最弱,但因為它只有吸引、沒有抵消效果,當物體質量累積到足夠大時,就能主導天體形狀與運動,例如讓大型天體趨近球形,也讓月球繞地球、公轉天體繞太陽運行。

牛頓的重要突破,在於把地上的蘋果落地與天上的月球運行看成同一種力的結果,進一步建立萬有引力與平方反比定律,打通了天地規律。由此不只解釋行星軌道,也能說明潮汐現象。潮汐本質上不是單純「月亮拉海水」,而是月球對地球不同位置造成的引力差,甚至連岩石地層與大型科學設施都會出現微小的固體潮汐效應。

在微觀世界裡,量子理論顛覆了日常直覺。原子與粒子具有不連續性、波粒二象性、疊加態與量子糾纏等特徵;粒子在被觀測前可以同時處於多種狀態,但在宏觀世界中,因為持續與環境互動,疊加態會快速消失,這就是退相干。雖然量子現象反常識,但其應用早已深入生活,包括雷射、半導體、醫學影像與量子計算等。

進一步到粒子物理,標準模型統整了電磁力、強力與弱力,並將基本粒子分為構成物質的費米子與傳遞作用力的波色子。希格斯場與希格斯波色子則提供了粒子質量的來源,電弱統一更顯示不同基本力在高能條件下可能原本是一體的。不過標準模型仍無法納入引力,也無法完整解釋暗物質與中微子質量,因此科學家仍在尋找更底層的統一理論,例如弦理論。

在宇宙學部分,作者指出現代宇宙學的核心原理是:宇宙正在膨脹,並起源於約138億年前的大爆炸。哈勃定律與宇宙背景輻射為此提供了強力證據,但現代理論仍面臨暗物質、暗能量等重大未解問題。整體來看,這本書不是要讀者死背科學細節,而是教人用第一性原理掌握世界運作的底層邏輯,從而更有效率地理解科學。

[AI 衝擊] AI價格戰將成主戰場

 [AI 衝擊] AI價格戰將成主戰場

摘要 : OpenAI擬降價迎戰Anthropic,AI競爭重心正從模型能力轉向成本與商業化效率。


內容:

AI產業最激烈的競爭,未必是比誰的模型更聰明,而可能是比誰的價格更低。OpenAI正考慮大幅調降AI服務價格,目標是提前應對主要競爭對手Anthropic的壓力。

過去兩年,企業大量導入AI應用,包括程式生成、客服自動化、內容生產與資料分析等,幾乎各環節都在使用AI。然而隨著使用量快速增加,企業也發現AI雖然提升效率,但成本上升得更快,原本數萬美元的支出可能迅速膨脹到數十萬甚至上百萬美元。

當不同AI模型之間的能力差距逐漸縮小,企業評估重點也開始改變,不再只看效果,而是更重視成本配置。誰能提供更低價格,誰就更有機會取得預算,這也成為OpenAI考慮降價的重要背景。

Anthropic憑藉Claude系列模型,特別是在程式設計相關場景中快速擴張,吸引不少企業客戶。一些開發團隊甚至開始將原本使用OpenAI的工作流程轉移出去。對OpenAI而言,真正的風險不只是流失少數客戶,而是市場一旦形成「模型同質化」認知,使用者切換平台的門檻就會愈來愈低。

同時,整個產業也面臨更大壓力。愈來愈多企業開始採用更便宜的開源模型,或來自不同供應商的低成本方案,甚至透過自動路由系統,把任務分配給最便宜且夠用的模型處理。過去需要頂級模型完成的工作,如今可能以十分之一甚至更低的成本達成。

如果OpenAI與Anthropic正式展開價格戰,使用者與企業將是直接受益者,AI部署門檻與開發成本都會下降。但對AI公司而言,訓練與運行頂級模型本就需要巨額資金與算力,一旦降價速度快過收入成長,利潤空間將迅速被壓縮。未來AI產業的勝負,可能不只取決於誰的模型最強,而是誰能以更低成本提供強大能力。


#AI


[AI 分享] Codex實戰 superpowers 用需求拆解打造新聞稿生成工具

 [AI 分享] Codex實戰 用需求拆解打造新聞稿生成工具

摘要 : 透過實際案例說明,如何用Codex與技能工具梳理需求,打造新聞稿、簡報與公眾號內容生成網頁。


內容:

主題不再只是簡單的網頁或小功能,而是進一步進入真實需求的開發情境。整個過程大約花了 30 分鐘,從開啟連結、進入網址內容,到把素材拖入網頁中,逐步建立出一個可落地的新聞稿生成工具。

這次案例的核心目標,是製作一個能生成高品質新聞稿的 HTML 網頁工具,甚至延伸成新聞稿、圖文簡報、公眾號內容等多種輸出形式。對於沒有網頁或程式背景的使用者而言,最重要的不是直接開發,而是先學會如何提需求,特別是先釐清「輸入是什麼、輸出是什麼」。

在輸入端,需要明確提供的內容包括:新聞主題、參與人員、活動基本資訊、活動照片、圖文作者,以及最後的落款時間。此外,也可以直接說明素材放在哪個資料夾,或支援拖拽上傳到網頁中。這些都是需求規劃時必須先整理清楚的部分。

而在輸出端,則要先定義最終要產出的形式,例如是新聞稿、簡報,還是同時輸出多種宣傳內容。這裡的關鍵觀念是,不要一開始就急著讓系統開發,而是先讓工具幫忙把需求補完整、把結構梳理清楚,避免後續開發偏離目標。

過程中提到了一個名為 superpowers 的技能工具。這個技能的作用,是把原本零散的想法與功能點,整理成能夠真正落地的產品需求,並釐清目標、邊界、流程與輸出標準。它不只是單純整理文字,而是協助使用者把專案的輸入、輸出、限制條件與執行方案具體化。

superpowers 還包含多種商業功能,例如需求分析、目標與邊界說明、方案設計、writing plan,以及技術與欄位說明等。分享中也提到一個重要的學習方法:不需要一開始就把所有功能研究透徹,而是先從最基礎、最實用的功能開始用,邊做邊理解,這樣比一次想搞懂全部內容更有效率。

在實際規劃產品需求時,系統先協助定義這是一個「高校活動報導的本地 HTML 工具」,再進一步讓使用者選擇產品定位。例如可選擇新聞稿裁剪助手、素材自動整理成稿工具,或是新聞稿加簡報排版工具。最終更符合實際需求的定位,是一套能同時處理新聞稿、圖文簡報、活動快訊甚至公眾號出稿的整合型工具。

不過,考量開發成本與複雜度,分享中也提到不需要一開始就把所有功能都做滿,而是先聚焦在較實用的組合,例如「新聞稿+簡報+公眾號內容」這類中等規模的輸出形式,既符合新媒體使用情境,也比較容易落地。

在需求細化時,還進一步討論了素材輸入方式,例如是拖入整個資料夾、拖入多個檔案,還是以表單填寫為主。最適合的方案,是讓使用者直接拖入整包素材或資料夾,因為這樣更接近真實工作場景,也能減少手動整理資料的負擔。

此外,素材目錄結構是否需要規範,也是需求設計的重要一環。若完全自動混放,雖然最省事,但辨識錯誤率較高;若有一定的結構要求,則能提升生成品質與穩定性。分享中傾向先採取較簡單、較低門檻的方式,再依需求逐步優化。

整體來看,這次分享的重點不只是教大家如何做一個新聞稿生成工具,更重要的是示範了一種實戰思維:在開發之前,先用工具把需求講清楚、拆清楚、選清楚。透過一步步的選擇與界定,讓 Codex 更準確理解需求,降低反覆修改的成本,也減少 token 浪費,最終提高內容生成的精準度與可用性。

最後也點出一個值得延伸思考的方向:如果未來要把這類產品做得更智慧化,接入 AI 大模型幾乎會是必要條件。雖然這次流程中還沒有完整談到這一點,但這將會是後續產品升級的重要基礎。