[AI 分享] 迴圈工程的本質與架構拆解
摘要 : 迴圈工程不是新技術,關鍵在於硬程與軟程分層、驗證隔離,以及避免自我進化中的三大陷阱。
內容:
先說結論,Loop Engineering 並不是什麼全新的技術發明。從架構本質來看,今天多數 agent 框架的核心,都是一個持續運行的 while 迴圈:組裝上下文、呼叫模型、執行動作、觀察結果,再把結果餵回系統,直到達成終止條件。OpenAI、Anthropic、Google、微軟、Meta 等主流做法,本質上都高度同構。
那為什麼一個早就存在的東西,現在才被正式命名、甚至突然爆紅?原因不在於技術剛誕生,而在於基礎設施已經跨過了「可用性門檻」。像是不同產品獨立收斂到相似的迴圈原語、模型單輪可靠性變高、以及頭部團隊工作方式真的轉向「寫迴圈」,這些都代表產業正在發生實質性的工程轉折。所謂 Loop Engineering,更像是替這個已經發生的轉變補上一個名字。
如果真的要把 agent 架構做對,一個重要的方法是將系統切成「硬程」與「軟程」。硬程指的是系統提示詞與核心規則,它負責定義 agent 是誰、目標是什麼、什麼結果才算好。這些內容像憲法一樣,應該穩定、少改,而且不能讓迴圈自己碰。軟程則包含 skills、記憶檔案、工具描述等,它回答的是「怎麼做」,包括領域知識、操作流程與過去經驗。這部分不是寫死的程式碼,而是可以被版本化、檢索與演化的資料。
這樣切分的價值,在於能力的進化方式不同。硬程通常只能靠人離線修改,屬於高成本決策;軟程則可以在執行、驗證、修訂的閉環中持續優化。因此,真正應該讓 agent 學習與累積的,不是把所有能力塞進提示詞,而是把可被驗證與修正的能力外接到 skills。也正因如此,持久化狀態其實不是配角,而是整個迴圈真正的靈魂。沒有持久化,系統每次都像失憶,根本談不上「進化」。
談到自我進化,最需要小心的是三個深坑。第一個是驗證標準被 agent 觸碰的風險。如果系統既能生成結果,又能修改評價結果的規則,它最終優化的往往不是品質,而是讓自己更容易通過驗證。因此,驗證函式必須被放在硬程裡,放在迴圈寫入權限之外,確保裁判無法被收買。
第二個坑是 skill 層的 slop,也就是經驗漂移。當 agent 每次成功後都往 skill 檔裡寫經驗,如果驗證訊號不夠嚴格,它很可能把偶然成功、錯誤歸因,甚至迷信儀式都記成「最佳實踐」。這些問題不會馬上爆炸,但會在長期累積後讓整個經驗庫變得混亂,讓 agent 虔誠執行大量噪聲。要避免這種情況,skill 的修訂必須像維護程式碼一樣嚴謹,要有 diff、有觸發原因、能審計、能定期清理。
第三個坑是理解債務。技術債務通常看得見,但理解債務更隱蔽。即使 agent 能穩定交付結果,也不代表人真的理解它為何成功。隨著迴圈執行時間變長、軟程越積越厚,系統實際運作方式可能逐漸偏離人的認知。等到某天出問題,團隊才發現自己其實已經看不懂這套系統。因此,定期抽查迴圈軌跡、手動 review 軟程演化紀錄,是必要的管理動作。
總結來說,迴圈工程的核心,不是把 human in the loop 直接變成 human out of the loop,而是讓人的角色重新分配。人在前端負責做架構設計,定義硬程與驗證規則;人在後端負責做最終審核,守住上線前最後一道關;中間重複性的優化與累積,才交給迴圈去完成。真正成熟的 Loop Engineering,不是自動化越多越好,而是硬程定義清楚、軟程允許進化、裁判不能被修改、演化過程有人審核。

沒有留言:
張貼留言