[AI 經驗] 想要成為一個好的AI工程或架構師。遠比你想的困難多了
今天一整天接受到1個挑戰,他是一個非常簡單的工作流,我全程都想要用AI Agent 來把它實作出來,並且想要創建出一個AI Native的應用程式,這期間遇到了許多問題,每個問題其實又有多種的解法。 每個解法又有各自的優缺點。 把這整個的過程拆解成不同的節點的話。 就會變得十分錯綜複雜,但最後必須要能夠滿足當初的需求設定。 結論是到現在為止。 這樣的挑戰還沒有成功。 我自己。大概只有到,70%完成度。
首先看到的就是。若要這樣的系統變成可以在正式環境下可以運作,它的穩定度與可靠度將會面臨到嚴苛的挑戰。我這次所做的。練習全程都是在一個AI Agent 下來執行。我曾嘗試用我的同樣一個需求提示詞。 對AI代理人嚇出五次以上的請求,得到的結果就是他使用五種不同的做法來幫我解決問題。 有些時候他使用的是一個腳本。 有些時候他就在大語言模型之內立即生成一小段程式來幫我執行。 這兩個的差別在於前者需要我自己去執行。 或者則是由AI代理人自動來幫我執行。
另外,他使用的方法也會不同。有些時候透過skill來處理。有些時候,他嘗試的去網路找看看有沒有更適合的CLI工具。 總之,我自己覺得這樣的結果是十分混亂。 那也許大家會說,你可以把提示詞寫得更明確吧。 這就會造成了第2個所看到的問題。 一開始要用AI代理人來解決問題。 我們要怎麼知道要告訴AI代理人,一定要使用某種特殊的做法來幫我解決這個問題呢? 還是要AI代理人自己去創造自己的想像力。 找到1個合適的做法。
不過面對這樣的狀況。 若是在進行軟體系統開發的過程中。 這樣的問題我已經找到了解決辦法。 並且在各種不同的專案底下獲得了驗證。 也就是。 不管AI代理人要怎麼幫我解決問題。 最終AI代理人產出的結果。 都會符合在我的預期。 而且所使用的技術或者程式碼。 原則上都在我可以接受的範圍。 剖析這樣的做法,其實也滿單純的。 因為對於軟體開發的過程,我自己也蠻了解的。 所以我給他架設了很多邊界條件。 讓他不要做。 許多事情但是我要求的需求必須要能夠幫我做好。
接下來就是費用的問題。 我這次使用的AI代理人。 採用的是每個月20美元的額度,也就是說。 我每5個小時將會被在特定的額度底下才能夠運作。 由於這是一個長期的輪轓需求。 所以AI代理人每隔10秒鐘就必須去查詢系統上的狀態。 根據我的要求做出適當的反應動作。 每一次他做的任何一個動作。 都要耗費大語言模型的算力。 也就是說,每一個動作都是要花錢的。其實有這樣5個小時或者每週的額度限流。我個人認為這樣的設計是不錯的。最起碼不會造成你的帳單爆表。讓AI代理人做了一個晚上的工作。早上一起來看到你收到了可能是10萬塊美金的帳單。那時候你應該會覺得整個天都塌下來了。
接下來則是可靠度的問題。 也許在前面的5個小時運作都很正常。 但是也許在接下來的時間,網路可能會突然斷線。 類似這樣的異常狀況發生。 那麼AI代理人是否能夠偵測到這樣的狀況? 自我進行排除或者是暫緩排程工作,等待下一次繼續來執行。 對於排成類的工作若某一段時間沒有去執行。 那這一段時間的排成工作是否會重新再執行一次? 因為如果沒有這樣的話。 在有些系統設計上,將會造成資料有所遺失。 這也是大家所不願意看到的狀況。
最後更嚴峻的挑戰就是。 如何把上面的所有過程? 讓他可以在一個穩定的架構下來執行。 蒐集到各種例外狀況,記錄下每個時期的執行狀況。最終將它可以變成一個反覆執行的。 系統或者程式。 那這個程式或系統又該如何的來驗證它的可靠度? 以及它的穩定度? 對於部屬到正式環境下。 又還會遇到什麼樣的問題? 會不會執行到1半? 就會遇到了額度不夠的問題。 當場系統就被鎖住了。 而這是一個正式要用的環境。你是否允許讓你這樣的系統可以被遠端的大語言模型廠商?鎖住兩個小時不能使用嗎?
我原本以為AI工程或者架構師的工作不外乎就是我會用AI代理人來解決工作上的問題。單就剛剛所講的幾個簡單狀況。就需要不斷的花時間來做復盤,分析他的各種不同狀況。 以便在未來要做同樣或類似工作的時候。 可以擬定出一個比較好的策略。 而相對這樣的工作。 不會是只有一次的。 每個AI代理人的工作都需要延續這樣的做法。 而這樣的一些經驗以及過程。也就需要被記錄下來。這些事情想到了就頭很大。 那麼這樣的工作真的還值得繼續往下做嗎? 畢竟在現代這樣的狀況。 也沒有人可以說得準。 該如何來做這些事情? 畢竟這樣的技術與經驗也就在2026年初才剛開始萌芽。 大家有什麼樣的看法呢?
沒有留言:
張貼留言