2026年6月14日 星期日

[AI 知識分享] AI從聊天到幹活的進化

 [AI 知識分享] AI從聊天到幹活的進化


摘要 : 用規劃案例,串起LLM、Prompt、RAG、MCP、Agent、Skill等概念,說明AI如何一步步從回答問題進化到真正執行任務。


內容:

這兩年 AI 領域出現了非常多熱門名詞,像是 LLM、Token、Prompt、RAG、MCP、Agent、Skill 等,常讓人一開始看得眼花撩亂。其實這些概念並不是憑空冒出的術語,而是 AI 發展過程中,為了解決一個又一個實際問題而誕生的工具與方法。


先從最基本的情境切入:如果你週末想去玩,隨口問 AI 該怎麼安排,AI 能很快回覆你。這背後的核心就是 LLM,也就是大語言模型。它會把人類輸入的文字拆解成 Token,並透過預測下一個最可能出現的 Token,逐步生成完整答案。你對 AI 所說的話,就是 Prompt,也就是提示詞。


如果只是隨口一問,AI 的回答通常比較泛泛;但當你把需求描述得更清楚,例如加入預算、天數、偏好等條件,AI 的回覆就會更精準、更實用。這種把需求說清楚、讓模型更好理解的方式,就叫做 Prompt Engineering,也就是提示詞工程。


接著, AI 為什麼能記住你前面說過的條件。原因在於每次對話時,系統通常會把之前的聊天內容一併傳給模型,這就是 Context,也就是上下文。不過模型能處理的上下文長度有限,對話一長,就可能忘記前面的重點。為了解決這個問題,系統會把先前的內容壓縮成關鍵資訊,這份被提煉過的內容就是 Memory,也就是記憶。


但即使如此,模型仍然無法憑空知道你私人收藏的旅遊攻略或內部資料。這時就需要 RAG,也就是檢索增強生成。RAG 會先把你的私有資料切分、存入知識庫,在你提問時再檢索出最相關的內容,與問題一起提供給模型,幫助它生成更真實、更有依據的回答。許多 AI 客服、AI 問答系統,其實都是建立在這種能力之上。


不過,RAG 仍然只是幫助模型「回答得更好」,還不代表它真的能替你做事。例如你叫 AI 幫你查高鐵票,它可能只會告訴你該去哪個網站查。這時就需要 Function Calling。這套機制讓模型能夠根據需求輸出結構化的工具呼叫指令,再由外部程式真正去執行查詢、搜尋、訂票等操作,最後把結果回傳給模型整合成答覆。


但如果每接一個工具都要重新寫一套對接方式,工程成本會很高,因此 MCP 就出現了。MCP 的作用,是統一第三方工具的接入方式,讓 AI 應用只要對接一種標準協議,就能使用多種工具。文章也特別強調,Function Calling 和 MCP 並不相同:前者是讓模型知道如何發出工具呼叫指令,後者則是讓工具本身採用統一規格,方便整體接入與複用。


當 AI 已經能理解上下文、讀取資料、呼叫工具之後,就進一步發展成 Agent。Agent 不只是被動回答問題,而是能在收到目標後,自行拆解任務、規劃步驟、使用工具、記錄過程,逐步完成工作。也就是說,Agent 是把大模型、記憶、檢索、工具使用等能力整合起來,變成一個可以獨立執行任務的系統。


現在市面上很多 AI 產品,本質上都能視為不同形式的 Agent。差別在於它們能自主規劃到什麼程度、能否直接操作系統、能否主動與人協作。像一些桌面助理之所以受歡迎,就是因為它們不只會聊天,還真的能操作電腦、定時執行工作、透過通訊軟體和使用者互動,更像是真正的數位助手。


然而,即使 Agent 已經很強,使用者往往還是需要反覆交代偏好與規則。於是 Skill 的概念就出現了。Skill 可以理解成可重複使用的任務規範或能力模組,你可以把自己常用的要求、流程、限制條件整理進去,讓 Agent 在面對類似任務時直接參考執行。它和一次性的 Prompt 不同,Skill 更像是可持續使用、結構化管理的能力資產,也能節省上下文與 Token 成本。


最後,一個很重要的問題:AI 能力越強,出錯時的風險也越高。當 Agent 能直接操作工具、下指令、甚至付款時,如果沒有約束,就可能造成嚴重後果。因此需要額外的控制與防護機制,為 Agent 設定清楚的邊界、提供完整上下文、加入任務驗收與修正流程,讓它在可控範圍內發揮最大效率,避免失控或造成損失。


總結來說,把一連串 AI 概念串成一條清楚的主線:從 LLM 的文字生成開始,到 Prompt 改善提問品質、Context 與 Memory 管理對話、RAG 讀取外部知識、Function Calling 與 MCP 接入工具,再到 Agent 自主執行任務、Skill 沉澱經驗與規則,最後再加上安全約束機制。這也讓人更容易理解,AI 是如何一步一步從「只會聊天」走向「真的能幫你做事」。

2026年6月13日 星期六

[AI 分享] Agent是什麼?一次搞懂LM、Workflow與Agent的差異

 [AI 分享] Agent是什麼?一次搞懂LLM、Workflow與Agent的差異


摘要 : 解析LLM、Workflow與Agent差別,並說明Agent的五大組成與自主工作核心能力。


內容:

今天的重點,是搞懂「Agent到底是什麼」。Agent通常可翻成智慧體或代理,但若想真正理解它,最好先從LM與Workflow開始看起。


首先,像DeepSeek、ChatGPT這類產品,本質上都是基於LLM的大語言模型聊天機器人。可以先把它理解成一個很強的百科全書。它最基本的工作方式很簡單,就是「輸入→模型處理→輸出」。例如你輸入「給我一份會議紀要模板」,模型就會直接產出一份模板。


但如果你進一步問「我上一次會議是什麼時候」,單靠LLM其實無法回答,因為它沒有你的個人資料。這時就需要替它接入工具,例如日曆。它才能先查詢日曆,再回覆你答案。若再進一步要求「幫我把上一次會議紀要總結後寄到我的信箱」,事情就不只是問答,而會變成一連串步驟:先取得上次會議紀錄,再用模型摘要,最後接入郵件系統發送。這種由多個步驟串起來的流程,就是Workflow,也就是工作流。


Workflow的核心特徵在於:不管中間有多少節點、流程多複雜,本質上都還是人事先設計好的固定路線,AI只是照著既定步驟執行。因此,即便流程有一百個節點,也不能直接稱為Agent。


Agent的不同之處,在於它不是照單全收地執行預設流程,而是會自己決定下一步該做什麼。舉例來說,當你要求它「幫我把上一次會議紀要總結後寄到我的信箱」,Agent會先自己思考:要取得會議紀要,得先知道上次會議時間。它可能先查日曆,若查不到,再改去連接騰訊會議或其他系統尋找記錄。找到資料後,它再呼叫模型進行摘要。接著它還會繼續判斷:使用者雖然說要寄信,但沒提供收件信箱,那是否應該先詢問確認?整個過程中,Agent會持續思考、決策並調整行動,這才是Agent的真正特徵。


一句話總結,Workflow是執行人預先規定好的步驟;Agent則是能根據目標,自主決定要執行哪些步驟。


接著談Agent的構成。最容易理解的方法,是把Agent想像成一位「數字員工」。就像公司裡有不同崗位一樣,Agent也是一種數字化崗位。它可以24小時待命、不用請假,成本通常也比真人低,因此現在很多企業都對這種數字勞動力非常感興趣。如果把打造Agent想成在招聘一位實習生,那麼一個完整的Agent大致由五個部分組成。


第一是LLM,也就是大腦。像ChatGPT、DeepSeek、豆包等,都可以作為這個大腦。它負責理解人類語言、分析任務、制定計畫。沒有這個核心,大部分功能都無法成立。


第二是Prompt,也就是提示詞。這可以理解成崗位說明書。你不會只對新進客服說「你去做客服吧」,而是會告訴他職責、規則、處理方式與回覆風格。Prompt就是在做這件事,它負責定義Agent的角色、限制條件與輸出風格。


第三是Memory,也就是記憶。如果一位實習生每隔30秒就失憶一次,那肯定無法工作。Memory的作用,就是幫助Agent記住上下文、追蹤任務進度,並逐步累積經驗。


第四是Knowledge,尤其是External Knowledge,也就是外部知識。模型可能具備通用知識,但不一定知道公司的內部資訊。因此,還需要把企業知識庫、產品文件、制度規範等資料提供給它,讓它能基於特定場景工作。


第五是Tools,也就是工具。這是非常關鍵的一部分。所謂工具,不是實體工具,而是各種可被調用的數位能力,例如發郵件、下訂單、製作Excel、做PPT、查詢系統資料等。當Agent擁有操作這些工具的權限後,它就不只是「會聊天」,而是真正開始「會做事」。


不過,要特別注意的是,擁有這五個部分,並不代表它一定就是Agent。真正決定它是不是Agent的,不是零件有沒有備齊,而是它有沒有「自主完成工作」的能力。這裡就要提到一個重要概念:Agent Loop,也就是智慧體迴圈。其中一個經典框架叫ReAct,意思不是前端框架React,而是Reasoning與Acting,也就是「推理」與「行動」。


例如你對普通聊天機器人說「幫我做競品分析」,它通常只會回你一段分析文字;但Agent會先自己打開網頁、搜尋競爭對手、蒐集資料、整理資訊、畫出圖表,然後再檢查結果是否符合要求。如果結果不理想,它還會自己修改並持續迭代,直到滿意為止。這個「思考→行動→檢查→再修正」的過程,就是Agent Loop。它最核心的能力,在於不只是執行,而是會自己驗證成果。如果結果不好,它不會直接交差,而是會繼續調整。這種圍繞目標持續迭代的能力,才是Agent最關鍵的本質。


最後總結來說,把Agent想成數字員工會非常好理解。LLM是它的大腦,Tools是它的手腳,Memory是記憶,Knowledge是資料庫,Prompt是崗位說明書。但真正讓它成為Agent的,不是元件數量,而是它是否能圍繞目標自主工作,具備推理、行動、檢查與持續迭代的能力。


另外,關於Agent的組成,市面上其實會看到很多不同版本。這並不代表誰對誰錯,而是因為Agent目前仍處於高速發展階段,尚未形成全行業一致的官方標準。不同的工程團隊、產品公司、寫作者與一般使用者,會從不同角度理解與定義Agent,因此出現多種說法是很正常的。

[AI 衝擊] 人工智慧重塑就業

 [AI 衝擊] 人工智慧重塑就業

摘要 : AI正快速改變就業結構,白領職位首當其衝,但真正全面替代尚未發生,現在仍是準備與轉型的關鍵視窗期。


內容:

人工智慧正在成為這一代人必須面對的重要就業議題。從勞動經濟學的角度來看,大家最關心的問題是:技術進步是否一定導致失業?回顧過去百年的電氣化、資訊化與自動化歷程,技術雖然曾引發就業焦慮,但也不斷創造新職業與新需求。許多今天常見的工作,在數十年前其實並不存在,因此技術進步並不必然只帶來崗位消失,也可能帶來新的就業機會。

這一次AI浪潮與過去不同,關鍵在於它替代的不只是體力,而是人的腦力。過去的技術進步多半取代重複性的操作工作,但生成式AI開始介入理解、推理、創作、判斷等認知任務,這些原本正是白領工作的核心能力。像會計、編輯、銷售、程式設計師等職位,都屬於AI暴露度較高的職業;相較之下,餐飲服務、產業工人、家政服務等藍領工作,目前受影響相對較低。

另一個重大差異是,AI技術的部署速度極快、成本極低。傳統技術革新通常需要設備採購、產線改造與長時間推進,因此舊崗位的消失往往是漸進式的,也為新崗位的形成留下時間。但生成式AI可以透過雲服務、API與開源模型迅速擴散,企業與個人都能低成本使用。這使得AI對工作內容的影響可能是全球同步、跨行業發生,也代表就業調整的視窗期可能比過去更短。

針對AI如何影響就業,研究者提出了三種重要分析方法。第一種是「AI暴露指數分析法」,它把職業拆解成具體任務,再評估AI是否能完成其中超過一半的工作內容。這種方法顯示,AI暴露度高的工作並不等於一定會被取代,因為真正的結果還取決於工作內部任務之間是互補還是替代關係。也就是說,AI可能提高生產率,也可能壓縮人力需求,不能只看表面暴露度。

第二種方法是「AI整合崗位分析法」,它直接觀察企業是否開始招聘專門負責導入與整合AI的人才。研究發現,採用AI的企業中,初級崗位的招聘明顯放緩,高級崗位則大致穩定甚至增加。這表示AI目前首先衝擊的,未必是已在職場中的存量員工,而是新進人員與初階崗位。換句話說,AI對就業的影響可能先表現在「不再新增職缺」,而不是立即大量裁員。

第三種方法則是根據AI工具的實際使用資料來分析,也就是觀察人們在與大模型互動時,究竟拿它來完成哪些任務。相關研究發現,目前AI更常扮演「增強」而非「替代」的角色。它更多是在提升工作效率,幫助人更快完成任務,而不是真的完全取代人。例如理論上某些技術職位的高比例任務可由AI完成,但實際使用中,AI參與的範圍遠低於理論估計。這說明現實中仍存在模型能力限制、法規合規、人類驗證與系統整合等障礙。

綜合來看,AI對就業的真實衝擊尚未完全落地,但方向已經非常明確。它正在重塑工作內容、改變招聘結構,也讓部分高暴露職業率先面臨壓力。不過,從目前證據來看,AI更多是先改變工作方式,再逐步改變用人需求,而不是立即全面取代人類。因此,我們當前仍處在一個非常寶貴的準備期。

真正重要的問題,不是AI會不會來,而是我們能否利用這段視窗期及早調整。未來更被需要的人,可能不是單純重複執行任務的人,而是能與AI協作、能跨任務整合、具備判斷力、創造力與實際解決問題能力的人。這也意味著,面對AI時代,與其被動擔心被淘汰,不如主動提升自身在新工作格局中的適應力與競爭力。

[AI 信任危機] 如何因應AI時代的到來

 [AI 信任危機] 如何因應AI時代的到來


摘要 : 生成式AI不只衝擊工作,更在削弱社會對資訊、影像與事實的信任基礎。

內容:
很多人以為AI最大的風險是取代工作,但維基百科共同創辦人吉米・威爾士指出,更深層的問題是:AI正在讓整個社會的信任體系變得更脆弱。

近年來,人們本來就越來越難完全相信新聞、政治人物與企業說法;而生成式AI的快速發展,正在進一步放大這種不信任。尤其在影片領域,過去多數人看到監控畫面、演講影片或現場影像時,通常會先相信其真實性,如今這種預設正在改變。

因為AI生成影片愈來愈逼真,大家看到影像後的第一反應,開始從「相信」轉為「懷疑」。真正危險的不只是假的影片變多,而是真的影片也可能因此失去公信力。

當公眾逐漸失去判斷真假的能力,未來最有價值的就不再只是資訊本身,而是「可信度」。誰能有效證明自己是真實的,誰就會擁有新的競爭優勢。因此,數位身分驗證、真人認證與內容溯源等技術,正受到越來越多機構重視。

相較之下,維基百科反而沒有明顯受到AI衝擊。威爾士認為,AI並不適合用來撰寫百科條目,因為百科內容最重要的不是語句流暢,而是事實查核、來源驗證與社群共識。

目前許多AI公司與研究機構也已開始正視相關風險,包括AI失控、深度偽造擴散,以及社會信任下降等問題。當AI讓資訊生產變得前所未有地容易,未來最稀缺、也最昂貴的資源之一,可能正是那句最基本的話:這是可信賴的。

#AI

簡化 .NET 安裝與版本管理的 Installs with dotnetup

簡化 .NET 安裝與版本管理的 Installs with dotnetup

摘要 : .NET Up 以跨平台、一致化方式簡化 .NET 安裝、更新與版本管理,提升開發者與自動化代理的使用體驗。


內容:

在這場 Build 分享中,講者介紹了微軟正在開發的新工具「Installs with dotnetup」,目標是解決目前 .NET 在不同平台上的安裝與版本管理過於分散、複雜的問題。現今使用者安裝 .NET 的方式很多,包含 Visual Studio、VS Code 擴充功能、Winget、Homebrew、官方安裝腳本,以及各種社群版本管理工具,如 DNVM、asdf 等,造成使用體驗不一致,也增加維護與支援難度。

尤其在 Linux 環境中,.NET 安裝情境更加複雜。開發者常需在發行版套件、微軟提供的套件、手動安裝腳本與本地版本管理工具之間做選擇,還要考量是否需要特定 feature band、不同專案是否要使用不同 SDK 版本,以及本地安裝與全域安裝之間可能產生的衝突。這些問題不只讓使用者困擾,也讓微軟在除錯與支援時更難確認安裝來源與正確性。

為了解決這些痛點,.NET 團隊提出 Installs with dotnetup。這是一個跨平台、快速、輕量的工具,採用 Native AOT,主打「使用者層級的全域安裝」,也就是安裝在使用者自己的目錄中,不需系統管理員權限,也不影響同一台機器上的其他使用者。它希望提供一致的操作方式,讓任何作業系統上的開發者都能用相同方法安裝與管理 .NET。

.NET Up 的核心理念之一,是延續現有開發者已經熟悉的設定方式,例如 global.json。工具能讀取專案中的 SDK 需求,自動安裝符合版本規則的 .NET SDK,並支援更新與版本追蹤。除了安裝外,.NET Up 也會記錄目前系統中安裝了哪些 SDK、追蹤哪些版本通道,讓後續更新可以更自動、更有脈絡,而不是單純地下載壓縮檔後自行管理。

講者展示了 .NET Up 的實際操作流程。使用者只需初始化 .NET Up,它就能下載最新 SDK,並自動設定 shell 環境,讓後續終端機可直接使用 .NET 與 .NET Up。接著進入某個專案目錄後,執行安裝命令,.NET Up 會根據 global.json 自動判斷該專案需要的 SDK 版本,例如安裝特定 feature band 或依 rolling forward 規則選擇對應版本,讓開發者不必再手動比對版本與處理相容性。

這項能力對開源貢獻、團隊協作與自動化代理特別重要。過去開發者常在 clone 專案後才發現本機 SDK 版本不符,導致 build 失敗,還要自行找出正確版本。現在透過 .NET Up,可以在本機端像 CI/CD 一樣,自動依照專案需求補齊所需 SDK,降低進入專案的門檻與設定成本。

除了 SDK 管理,Installs with dotnetup 也進一步處理 runtime 安裝需求。講者以多目標測試情境為例,說明開發者可能只想使用最新 SDK 進行建置,但測試時仍需要 .NET 8、9、10 等不同 runtime。過去這通常得安裝多套完整 SDK 才能解決,但其實並不高效。.NET Up 的方向是讓開發者只保留需要的 SDK,再依測試與執行需求額外安裝對應 runtimes,讓環境更精簡也更合理。

在工具設計上,Installs with dotnetup 不只是一個命令列工具,也規劃成未來可供其他工具整合的基礎元件。團隊希望它的安裝記錄、版本資訊與簽章驗證機制,未來能與 Dependabot、Renovate 等生態系整合,成為 .NET 工具鏈供應鏈管理與自動化治理的一部分。這不只是安裝工具,更可能成為 .NET 開發環境管理的共同基礎。

安全性也是 Installs with dotnetup 的重要方向。團隊正與 .NET 發行團隊合作,讓 SDK、runtime 與相關 manifests 都具備完整簽章驗證,確保使用者取得的是微軟正式提供的內容。這能提升來源可信度、供應鏈安全性與審計能力,補足以往使用者層級安裝方式在安全與可追蹤性上的不足。

未來規劃方面,內部預覽版將聚焦於穩定版 SDK 管理、nightly/daily SDK 安裝,以及 one-shot execution 功能。這項功能可讓開發者指定某個 .NET 版本來執行特定命令,例如比較 .NET 10 與 .NET 11 preview 執行 build 的差異,方便進行 A/B 測試與快速回報問題,而不影響目前全域環境。

公開預覽階段則會加入 Installs with dotnetup 自我更新、更新通知、完整簽章驗證,以及提供給 AI/LLM 與自動化代理使用的技能與操作規範,讓代理工具可以更安全、正確地使用 .NET Up,而不再透過片段文件自行下載、解壓與設定環境。這將讓人類開發者與自動化系統都能有一致且可靠的體驗。

整體來看,.NET Up 的定位非常明確:它不是用來取代正式生產環境中的套件管理,而是專為開發階段打造的 .NET 工具鏈管理方案。它希望讓開發者只需 clone 專案、執行安裝命令,就能快速進入可工作的狀態,同時也讓代理、CI/CD 與版本測試流程更簡單、更安全。如果後續落地順利,.NET Up 有機會成為 .NET 開發生態中極具代表性的基礎工具。

[AI 分享] CodeX入門實戰全指南 2

 [AI 分享] CodeX入門實戰全指南

摘要:從安裝、介面、權限到網站、文件、影片與自動化任務,帶你真正上手CodeX。


內容:

CodeX 不是傳統的聊天型 AI,而是更接近「會直接幫你做事的 AI 員工」。一般聊天 AI 比較像顧問,你問問題,它給答案;但真正執行、整理、建立文件、操作工具的人還是你自己。CodeX 則屬於 agent 類型,不只會思考,還能直接把任務一步步完成,從建文件、整理資料、執行程式,到操作瀏覽器都能處理。

對一般人來說,CodeX 很可能是目前最值得學習的 AI agent 之一。尤其對學生、上班族、知識工作者而言,看完後很可能會改變對 AI 的理解。因為它不只是「回答你」,而是能逐步成為你真正可用的數位助手。

在使用前,主要需要準備 GPT 帳號。若是高頻重度使用者,可以考慮升級到 Pro;一般使用者使用 Plus 通常已經足夠,免費方案也能體驗,只是額度較少。安裝並登入後,如果介面是英文,可以到左下角設定中把語言切換成中文,之後就會更容易上手。

CodeX 的介面主要分成幾個部分。左側上方有新對話、搜尋、外掛與技能、自動化等功能。中間最重要的是「專案」與「對話」兩種結構:對話比較適合零碎型任務,像查資料、問問題;專案則更像一個對應電腦資料夾的工作空間,你在裡面產生的程式碼、PPT、文件等都會保存下來。每個專案下還能開很多對話,用來分別處理不同工作。

建立專案後,就可以直接在輸入框中用中文描述需求。下方可以設定使用的模型、思考強度與速度。思考強度通常分為低、中、高、超高,日常任務用中等即可;複雜任務則可調高。速度則分標準與快速兩種,趕時間時可以切換。若不想打字,也能直接使用語音輸入需求。

輸入區旁邊還有幾個很重要的功能。第一是上傳資料,可將本地檔案或資料夾交給 CodeX 使用。第二是「計畫模式」,開啟後它會先跟你討論方案,不會直接修改檔案,特別適合做網站、開發專案、流程設計等較複雜任務。第三是權限模式,通常有預設權限、自動審查與完全訪問三種。對新手來說,建議先用預設或自動審查,不要一開始就開完全訪問,以免 AI 做出你不想要的操作。

 CodeX 的工作場景與使用邏輯,讓使用者能理解它不只是聊天工具,而是能在本地、專案、雲端等不同環境裡協助你執行任務。這種能力,讓它更像是「可操作、可交付結果」的工作助手。

在實作案例中,CodeX 展示了多種應用。像是影片製作,只要給出需求,搭配對應外掛,就能生成影片、動畫、音樂等內容。即使只是簡單指令,也能快速做出可預覽的成果;若有更明確的腳本、素材或畫面要求,還能持續與 AI 對話,逐幀調整畫面細節與效果。

除了影片,它也能幫你產出表格、SEO 文件、Word 文件等各類辦公內容。過去這類工作往往需要查資料、整理資訊、排版校對,可能要花上好幾個小時;現在透過 CodeX,可以大幅縮短製作時間,而且還能在生成後直接預覽,若不滿意再請它持續修改。

外掛與 skill 的概念。外掛像是給 CodeX 增加能力模組,而 skill 則像是把一整套工作規則與流程,整理成可重複使用的標準操作手冊。例如圖片生成的流程,可以先定義畫面描述、風格與模型調用方式,再把這些規則寫成 markdown 文件,讓 CodeX 在不同對話中都能依照一致標準執行。

這裡特別提到一個實用技巧:在專案根目錄建立 `agents.md` 文件。因為 CodeX 在不同對話視窗之間不一定會記得先前所有規則,所以把重要規範、風格、流程寫進這份文件,就像給 AI 一份入職手冊。之後每次開新對話,它都能依據這份手冊做事,形成穩定、可複用的長期記憶與工作標準。

自動化則是 CodeX 的另一個高價值功能。如果你每天都要重複整理資料、搜尋熱門話題、彙整報告,就可以直接用自然語言建立自動化任務,例如「每天早上九點幫我搜集今日熱門資料並生成報告」。設定後,CodeX 就會定時執行。你也能在自動化頁面中調整執行時間、模型、思考強度、環境與任務描述,並隨時暫停或刪除任務。

在正式建立自動化之前,影片也建議先手動跑一次流程,確認輸出符合預期,再交給自動化執行,避免浪費額度。這是一個很實際的使用建議,特別適合剛開始接觸的人。

關於額度管理,CodeX 也提供清楚的查看方式。你可以在左下角設定中查看五小時內與本週剩餘額度,也可以透過對話中的狀態指令查看上下文與使用情況。若達到上限,不必太緊張,因為系統通常會按照滾動時間重新釋出額度。若真的不夠,再考慮升級方案即可。

另一個節省額度的重要方式是管理上下文。當一段任務完成後,可以手動壓縮上下文,讓模型把注意力聚焦到新任務上,這樣不只提升效率,也能減少不必要的消耗。

最後,直接請 CodeX 製作一個寵物貓咪主題首頁,並開啟計畫模式,讓 AI 先提出完整方案,再逐步確認風格、內容、設計方向。確認後,它便開始初始化專案、生成內容,最後完成網站頁面。內建瀏覽器還能直接預覽成果,並透過批註功能即時提出修改意見,再重新整理檢視更新效果。

整體來看,這支內容不只是介紹 CodeX 是什麼,更重要的是讓人理解它和傳統 AI 的本質差異:一個偏向建議型助手,另一個則是能幫你真正完成工作的 agent。從安裝設定、權限控制、文件生成、影片製作、網站開發,到 skill 與自動化任務,影片用大量實操案例展示了 CodeX 如何成為個人工作流中的 AI 員工。

第一性原理看科學世界

 [AI 回顧] 第一性原理看科學世界


摘要 : 這本書用第一性原理串起引力、量子、粒子與宇宙學,幫助非科學背景讀者快速理解科學底層邏輯。


內容:

第一性原理 試圖解決一個常見困擾:很多人一聽科學就覺得艱深難懂。作者馬克思·喬恩提出,不必背下繁雜知識,只要抓住各領域最根本、無需再被證明的「第一性原理」,再沿著邏輯逐步推演,就能理解整個知識框架。這也是他能把量子計算機講給完全沒有科學背景的聽眾聽懂的原因。

書中先從引力談起。引力的第一性原理很簡單:任何兩個有質量的物體都會彼此吸引。雖然引力在四種基本作用力中最弱,但因為它只有吸引、沒有抵消效果,當物體質量累積到足夠大時,就能主導天體形狀與運動,例如讓大型天體趨近球形,也讓月球繞地球、公轉天體繞太陽運行。

牛頓的重要突破,在於把地上的蘋果落地與天上的月球運行看成同一種力的結果,進一步建立萬有引力與平方反比定律,打通了天地規律。由此不只解釋行星軌道,也能說明潮汐現象。潮汐本質上不是單純「月亮拉海水」,而是月球對地球不同位置造成的引力差,甚至連岩石地層與大型科學設施都會出現微小的固體潮汐效應。

在微觀世界裡,量子理論顛覆了日常直覺。原子與粒子具有不連續性、波粒二象性、疊加態與量子糾纏等特徵;粒子在被觀測前可以同時處於多種狀態,但在宏觀世界中,因為持續與環境互動,疊加態會快速消失,這就是退相干。雖然量子現象反常識,但其應用早已深入生活,包括雷射、半導體、醫學影像與量子計算等。

進一步到粒子物理,標準模型統整了電磁力、強力與弱力,並將基本粒子分為構成物質的費米子與傳遞作用力的波色子。希格斯場與希格斯波色子則提供了粒子質量的來源,電弱統一更顯示不同基本力在高能條件下可能原本是一體的。不過標準模型仍無法納入引力,也無法完整解釋暗物質與中微子質量,因此科學家仍在尋找更底層的統一理論,例如弦理論。

在宇宙學部分,作者指出現代宇宙學的核心原理是:宇宙正在膨脹,並起源於約138億年前的大爆炸。哈勃定律與宇宙背景輻射為此提供了強力證據,但現代理論仍面臨暗物質、暗能量等重大未解問題。整體來看,這本書不是要讀者死背科學細節,而是教人用第一性原理掌握世界運作的底層邏輯,從而更有效率地理解科學。

[AI 衝擊] AI價格戰將成主戰場

 [AI 衝擊] AI價格戰將成主戰場

摘要 : OpenAI擬降價迎戰Anthropic,AI競爭重心正從模型能力轉向成本與商業化效率。


內容:

AI產業最激烈的競爭,未必是比誰的模型更聰明,而可能是比誰的價格更低。OpenAI正考慮大幅調降AI服務價格,目標是提前應對主要競爭對手Anthropic的壓力。

過去兩年,企業大量導入AI應用,包括程式生成、客服自動化、內容生產與資料分析等,幾乎各環節都在使用AI。然而隨著使用量快速增加,企業也發現AI雖然提升效率,但成本上升得更快,原本數萬美元的支出可能迅速膨脹到數十萬甚至上百萬美元。

當不同AI模型之間的能力差距逐漸縮小,企業評估重點也開始改變,不再只看效果,而是更重視成本配置。誰能提供更低價格,誰就更有機會取得預算,這也成為OpenAI考慮降價的重要背景。

Anthropic憑藉Claude系列模型,特別是在程式設計相關場景中快速擴張,吸引不少企業客戶。一些開發團隊甚至開始將原本使用OpenAI的工作流程轉移出去。對OpenAI而言,真正的風險不只是流失少數客戶,而是市場一旦形成「模型同質化」認知,使用者切換平台的門檻就會愈來愈低。

同時,整個產業也面臨更大壓力。愈來愈多企業開始採用更便宜的開源模型,或來自不同供應商的低成本方案,甚至透過自動路由系統,把任務分配給最便宜且夠用的模型處理。過去需要頂級模型完成的工作,如今可能以十分之一甚至更低的成本達成。

如果OpenAI與Anthropic正式展開價格戰,使用者與企業將是直接受益者,AI部署門檻與開發成本都會下降。但對AI公司而言,訓練與運行頂級模型本就需要巨額資金與算力,一旦降價速度快過收入成長,利潤空間將迅速被壓縮。未來AI產業的勝負,可能不只取決於誰的模型最強,而是誰能以更低成本提供強大能力。


#AI


[AI 分享] Codex實戰 superpowers 用需求拆解打造新聞稿生成工具

 [AI 分享] Codex實戰 用需求拆解打造新聞稿生成工具

摘要 : 透過實際案例說明,如何用Codex與技能工具梳理需求,打造新聞稿、簡報與公眾號內容生成網頁。


內容:

主題不再只是簡單的網頁或小功能,而是進一步進入真實需求的開發情境。整個過程大約花了 30 分鐘,從開啟連結、進入網址內容,到把素材拖入網頁中,逐步建立出一個可落地的新聞稿生成工具。

這次案例的核心目標,是製作一個能生成高品質新聞稿的 HTML 網頁工具,甚至延伸成新聞稿、圖文簡報、公眾號內容等多種輸出形式。對於沒有網頁或程式背景的使用者而言,最重要的不是直接開發,而是先學會如何提需求,特別是先釐清「輸入是什麼、輸出是什麼」。

在輸入端,需要明確提供的內容包括:新聞主題、參與人員、活動基本資訊、活動照片、圖文作者,以及最後的落款時間。此外,也可以直接說明素材放在哪個資料夾,或支援拖拽上傳到網頁中。這些都是需求規劃時必須先整理清楚的部分。

而在輸出端,則要先定義最終要產出的形式,例如是新聞稿、簡報,還是同時輸出多種宣傳內容。這裡的關鍵觀念是,不要一開始就急著讓系統開發,而是先讓工具幫忙把需求補完整、把結構梳理清楚,避免後續開發偏離目標。

過程中提到了一個名為 superpowers 的技能工具。這個技能的作用,是把原本零散的想法與功能點,整理成能夠真正落地的產品需求,並釐清目標、邊界、流程與輸出標準。它不只是單純整理文字,而是協助使用者把專案的輸入、輸出、限制條件與執行方案具體化。

superpowers 還包含多種商業功能,例如需求分析、目標與邊界說明、方案設計、writing plan,以及技術與欄位說明等。分享中也提到一個重要的學習方法:不需要一開始就把所有功能研究透徹,而是先從最基礎、最實用的功能開始用,邊做邊理解,這樣比一次想搞懂全部內容更有效率。

在實際規劃產品需求時,系統先協助定義這是一個「高校活動報導的本地 HTML 工具」,再進一步讓使用者選擇產品定位。例如可選擇新聞稿裁剪助手、素材自動整理成稿工具,或是新聞稿加簡報排版工具。最終更符合實際需求的定位,是一套能同時處理新聞稿、圖文簡報、活動快訊甚至公眾號出稿的整合型工具。

不過,考量開發成本與複雜度,分享中也提到不需要一開始就把所有功能都做滿,而是先聚焦在較實用的組合,例如「新聞稿+簡報+公眾號內容」這類中等規模的輸出形式,既符合新媒體使用情境,也比較容易落地。

在需求細化時,還進一步討論了素材輸入方式,例如是拖入整個資料夾、拖入多個檔案,還是以表單填寫為主。最適合的方案,是讓使用者直接拖入整包素材或資料夾,因為這樣更接近真實工作場景,也能減少手動整理資料的負擔。

此外,素材目錄結構是否需要規範,也是需求設計的重要一環。若完全自動混放,雖然最省事,但辨識錯誤率較高;若有一定的結構要求,則能提升生成品質與穩定性。分享中傾向先採取較簡單、較低門檻的方式,再依需求逐步優化。

整體來看,這次分享的重點不只是教大家如何做一個新聞稿生成工具,更重要的是示範了一種實戰思維:在開發之前,先用工具把需求講清楚、拆清楚、選清楚。透過一步步的選擇與界定,讓 Codex 更準確理解需求,降低反覆修改的成本,也減少 token 浪費,最終提高內容生成的精準度與可用性。

最後也點出一個值得延伸思考的方向:如果未來要把這類產品做得更智慧化,接入 AI 大模型幾乎會是必要條件。雖然這次流程中還沒有完整談到這一點,但這將會是後續產品升級的重要基礎。

[AI 觀察] 招聘博弈與組織變革

 [AI 觀察] 招聘博弈與組織變革

摘要 : AI正重塑招聘與管理,但高階人才判斷、信任建立與組織協調,仍離不開人的深度參與。

內容:
現在招聘市場出現一種明顯的「雙向AI博弈」:企業用AI篩選簡歷,求職者也用AI優化甚至撰寫簡歷,讓自己更容易被演算法選中。這種現象未來只會越來越普遍,但也意味著招聘不可能只靠AI完成,而會演變成人與AI共同參與的競爭與篩選過程。

AI在招聘流程前段確實能大幅提效,尤其適合做簡歷初篩、資訊整理與基礎匹配。不過它也有盲點,例如當越來越多簡歷由AI生成後,如何辨識真實能力與經驗就成為新問題。因此,真正有效的招聘仍需依賴獵頭顧問或招聘者對產業、企業需求與候選人的深入理解,進行更細緻的人對人評估。

尤其在高階職位招聘上,AI更難取代人。像CFO這類C-level職位,所需能力高度複合、情境灰度很高,不是靠幾頁簡歷就能完整呈現。候選人的歷練、判斷力、與老闆是否合拍,甚至彼此間的chemistry與信任感,往往需要透過深入交流才能感知,這些都不是AI或文字描述能完全捕捉的。

面試與簡歷本身也並不足夠,因此企業會特別重視背景調查。背調能補充候選人在長期工作關係中的真實表現,例如前老闆、前同事對其能力與合作方式的評價。當然,背調也存在利益衝突風險,因此可交由第三方機構執行;而專業獵頭公司也會重視自身品牌與信用,必要時甚至會主動撤回有疑慮的候選人,以避免影響名譽。

除了招聘,AI也正在推動組織架構變革。它可能讓組織更扁平化、平臺化,讓「超級個體」更容易脫穎而出。部分觀點甚至認為,未來CEO與基層員工都會借助AI工作,而中間層因資料彙報、流程管理等工作被AI取代而逐漸淡化。這種趨勢在標準化、程序化、資料型工作上確實已有跡象。

但只要管理對象仍然是人,中間層就不會完全消失,而是角色會改變。未來AI更適合負責流程化、標準化與資訊歸納工作;中層管理者則需更多承擔溝通協調、情感連結、培訓與激勵的職能。也就是說,AI會重塑組織分工,但真正讓團隊高效運轉的,仍是人與人之間的信任、理解與帶動。

#AI