2026 年 6 月 21 日·約 6 分鐘

做一次給它看,它就接手:當 AI 開始用「示範」取代「指令」

過去要讓電腦替你做一件重複的事,你得把它拆成它聽得懂的步驟 — 寫巨集、寫腳本、或至少把指令打得夠清楚。OpenAI 為 Codex 加上的 Record & Replay 換了個方向:你像帶新人那樣,把流程做一次給它看,它自己把這趟操作整理成一個可重用、可修改的『技能』。從『寫指令』到『做給它看』,門檻挪動的位置,比功能本身更值得想。

收進

本文涉及工具

前言

要讓電腦替你做一件重複的事,長久以來的路徑只有一條:把這件事拆成它聽得懂的形式。早年是寫巨集、錄一串固定動作;後來是寫腳本、串 API;就算是這兩年的 AI agent,你多半還是得把需求「講」清楚 — 用文字把流程描述到它不會誤解。

OpenAI 最近為 Codex 加上的 Record & Replay,換了個方向。它的說法很短:把一個流程做一次給 Codex 看,它就能把這趟操作變成一個可重用的技能。你不用寫,你用「示範」。

這個換位看起來只是介面上的小調整,但它動到的其實是一個更底層的問題:我們到底是怎麼把一件事「交給」機器的。

它實際在做什麼

拆開來看,整件事是三段:錄、生成、重播。

錄的時候,你就照平常那樣把事情做一遍 — 官方舉的例子包括報帳、訂停車位、把試算表裡的資料逐筆建成設定好的工單、發佈影片、下載每週固定要拉的報表。Codex 在旁邊看著你的操作和視窗內容,但它記的不是「滑鼠移到座標 (840, 220) 按一下」,而是試著看懂你這一步想完成什麼。

生成這一段是關鍵差異。看完之後,Codex 不是吐回一段錄影,而是草擬出一份「技能」說明:這個技能什麼時候該用、需要你給哪些輸入、分成哪幾步、最後怎麼驗證有沒有做對。這份東西是可讀、可改的 — 它寫得不對,你可以直接修。

重播則是把這份技能套到新資料上。你在新的對話裡叫出這個技能、換一組輸入,Codex 就用它當下能用的工具把整套流程跑完:該操作電腦的操作電腦、該開瀏覽器的開瀏覽器、該呼叫外掛的呼叫外掛。

換句話說,你示範的那一次,被它整理成了一份「做這件事的說明書」,而且這份說明書它自己讀得懂、也執行得了。

為什麼「示範」會比「指令」門檻低

值得停下來想一下這兩種方式的差別。

「寫指令」的世界裡,瓶頸從來不是你會不會做這件事,而是你會不會「把這件事翻譯成機器聽得懂的形式」。一個天天在做退費流程的客服,腦袋裡清清楚楚每一步;但要他把這套流程寫成腳本、或描述到 AI 不會誤解,中間隔著一層他不一定跨得過去的翻譯。

「做給它看」想拆掉的就是這層翻譯。它把要求從「你會不會表達」退回到「你會不會做」。會做的人,理論上就能教 — 不必先變成會寫程式或會寫提示詞的人。

對一個天天在後台重複貼資料、月底手動兜報表的人來說,這個方向的吸引力很實在:你最熟的那件事,第一次有機會不透過工程師、直接被你自己交出去。這也是為什麼這類功能乍看會讓人眼睛一亮 — 它承諾的不是「更強的工具」,而是「更少的中間人」。

不過「示範」也不是全無代價。它有一種容易被忽略的稅:它只學得到你「做給它看的那一次」。你那次剛好沒遇到的狀況 — 某個欄位偶爾要填別的值、某種例外要繞一下、某筆資料長得不太一樣 — 它就沒看過,也不會自己補上。會做一件事,和「會把這件事的所有岔路都示範清楚」,其實是兩種不同的熟練。換句話說,門檻沒有憑空消失,它只是從「翻譯成程式」挪到了「把流程示範得夠完整」。這個挪動仍然是真的省事,但省的程度,取決於你的流程有多少藏在你下意識裡、卻沒被你示範出來的判斷。

乍看驚喜,但前提寫在小字裡

只是,越是聽起來省事的東西,越要把前提看清楚。

第一層前提是它自己畫的線:截至本文撰寫時,Record & Replay 官方頁面把它列為 macOS 可用,初期不對歐洲經濟區與英國、瑞士開放,並需要 Computer Use 可用並啟用。這裡值得順手分清楚一件常被混為一談的事 — Record & Replay,和它底層倚賴的 Computer Use,不是同一層:Computer Use 本身在 Codex 應用裡 macOS 與 Windows 都支援,而 Record & Replay 目前列在 macOS;至於需要哪種帳號方案、以及地區與開放範圍,都會隨時間變,實際以 OpenAI 官方頁面為準。這些是此刻的門檻,不是永久的判決。

第二層前提更要緊,寫在官方明確畫出的適用邊界裡:它最穩的場景,是「步驟固定、成功標準清楚」的流程。反過來說,只要你的流程介面常改版、或每一步都要看情況做判斷,它就容易在某個環節歪掉。報帳、拉固定報表這類「長得一樣、對錯分明」的事,是它的主場;而那些需要你臨機應變、或一步錯就麻煩的工作,現在還不適合整段交出去。

這裡有個和「示範」本質綁在一起的取捨:因為它記的是意圖、不是死板的座標,所以它對小改版比較有韌性;但也正因為它在「理解」而不是「複製」,它對你意圖的解讀,就不保證每次都和你心裡想的一致。傳統巨集會因為介面變了而當場壞掉,壞得很明顯;意圖式的重播則可能照跑不誤、卻在你沒注意的地方做了不是你要的事。前者的失敗很吵,後者的失敗很安靜 — 而安靜的失敗,往往更難在事後抓到。

所以實際要不要把一件事交給它,與其問「它做不做得到」,不如先問自己:這件事萬一它某次做歪了,我承不承擔得起、又看不看得出來。

它真正改變的,是「會用電腦」這件事的形狀

把限制都擺上桌之後,Record & Replay 比較耐想的地方,其實不在「能自動化」 — 自動化的夢做了幾十年。它比較新的地方,是把「我會用這套系統做這件事」這種一直鎖在個人腦袋裡的隱性知識,變成了一份具體、可交接的東西。

過去,公司裡那位「只有他知道月結怎麼跑」的同事,他的本事是帶不走、也教不快的。示範式自動化給了一個新的可能:他做一次,那套流程就被沉澱成一份可讀、可改、可重用的技能檔 — 別人看得懂,系統也跑得動。會用電腦,從一種綁在某個人身上的手感,開始有機會變成一種能被盤點、被傳遞的資產。

這也是為什麼這件事值得多看兩眼。第一眼是「哇,做一次它就學會了」的驚喜;但真正會慢慢發酵的,是它背後那個更安靜的轉變 — 我們交辦工作的方式,可能正從「寫清楚」滑向「做一遍」。當交辦的成本下降,真正稀缺的東西也會跟著換位:過去稀缺的是「會把流程寫成程式的人」,接下來稀缺的,可能是「清楚知道哪些流程值得、也禁得起被交出去的人」。判斷要不要自動化,會比有沒有能力自動化更要緊。

把鏡頭拉遠一點,這一步其實只是一條更長的線上的起點,而那條線有兩個方向特別耐想。一個是「形式」:Codex 整理出來的那份技能,並不是它自己發明的私有格式,而是一套源自開放標準、正被多家 agent 產品採用的共同寫法 — 這件事本身,可能比單一功能更值得留意。我把它放到下一篇來談:大家都在 SKILL.md:當 AI agent 的能力收斂成同一份說明書。另一個是「歷史」:「錄一次、之後自動重播」聽起來很新,但這個夢其實做了幾十年 — 它這次解掉了哪些老問題、又留下哪些,值得冷靜算一次帳,那是第三篇想做的事:自動化的舊夢:這次真的不一樣嗎。

眼前可以先記住的是:當門檻從「會不會寫」挪到「會不會做」,被影響到的人,遠比會寫程式的那一小群要多 — 而被影響,不一定等於被取代,更可能是被要求學會一件新事:把自己腦袋裡那套「我都馬這樣做」的手感,講到連機器都接得住。

常見問題

Codex 的 Record & Replay 是什麼?

它是 OpenAI 為 Codex 桌面應用加上的功能:你在 Mac 上把一件重複的工作流程實際做一次,Codex 一邊看你的操作與畫面,一邊把它整理成一個可重用的「技能」(skill) — 內含什麼時候該用、需要哪些輸入、有哪些步驟、怎麼確認做對了。之後你換一組新資料,就能叫它把整套流程重跑一遍,不必再逐步交代。

它和傳統的巨集、螢幕錄製有什麼不同?

傳統巨集多半記錄「在第幾個像素點一下」這種固定動作,介面一改版就失效。Record & Replay 記的是「意圖」:它試著理解你這一步想達成什麼,再用自己當下能用的工具(操作電腦、操作瀏覽器、呼叫外掛)去達成同一個目的。理論上對小幅改版較有韌性,但也因此多了一層不確定 — 它對意圖的理解不一定每次都和你想的一樣。

不會寫程式的人也能用嗎?

這正是它想改變的地方。過去要自動化一件事,門檻在「會不會把流程翻譯成程式或設定」;示範式的做法把門檻挪到「你自己會不會做這件事」。會做,就能教。對天天在後台重複貼資料、整理報表的人來說,這個方向值得留意 — 但要不要真的交給它,仍取決於這件事容不容許偶爾出錯。

現在誰能用、有什麼限制?

截至本文撰寫時,Record & Replay 官方頁面把它列為 macOS 可用,初期不對歐洲經濟區、英國、瑞士開放;它需要 Computer Use 可用並啟用 — 而 Computer Use 本身在 Codex 應用裡 macOS 與 Windows 都支援,Record & Replay 目前則列在 macOS。確切的方案、地區與開放範圍都以 OpenAI 官方頁面為準。它最穩的場景是「步驟固定、成功標準清楚」的流程;介面常變、判斷成分高的工作,目前仍不適合整段託付。

📚 收進你的工具

For AI Reading Era

把這篇文章交給你日常用的工具——做研究、整理筆記，或當 AI 的 context。

延伸閱讀