OpenAI Codex 負責人說:PM 和工程師的邊界正在消失
2026年7月4日 · HW SHU · 7 分鐘閱讀
AIPM 會寫 code 了,那工程師要做什麼?
> Meta Shift
去年十一月,Andrew Ambrosino 差點把 Codex desktop app 推出去。
時機看起來是對的——OpenAI 內部已經有一群人在用,反饋也不錯。但他沒有。他等了,等到今年二月才正式發布。事後他說,如果當時上線,「這個 app 大概就死了」。
原因不是 bug 太多,也不是功能不夠。而是底層模型還不夠強。同樣的 UI、同樣的 feature set,但模型能力差了那麼一截,用戶體驗就是天差地遠。這個決定背後的邏輯很簡單:AI 產品跟傳統軟體最大的差異,是你的核心競爭力有一大半不在你手上。你可以把 UI 做得再漂亮、workflow 設計得再順,但如果底層模型還沒到位,用戶開口問一個問題,答案讓他失望,一切都白搭。
這件事讓我覺得有意思的地方是,這不是一個普通的 PM 或 PM 框架能做出的判斷。Andrew 自己的背景橫跨工程、設計、product management,還創過公司。他現在的 title 是 Codex desktop app 的負責人,但他在 Lenny's Newsletter 的訪談裡說,他的目標是把 Codex 做成「史上最好的 desktop app,沒有之一」。
這種野心本身不稀奇。稀奇的是,他有能力評估「現在的模型夠不夠撐起這個野心」——這件事,傳統意義上的 PM 根本做不到。
Codex 是什麼、OpenAI 為什麼要做這個
Codex 不是一個新名字。OpenAI 早在幾年前就有 Codex 這個 code generation 模型,後來 GitHub Copilot 就是建在上面的。但現在的 Codex desktop app 是另一回事——它是一個獨立的 desktop 產品,目標是把 AI coding 的體驗做成一個完整的工作環境,而不只是 IDE 裡的一個 plugin。
從市場角度來看,這個戰場已經非常擁擠。Cursor 在 2024 年據報導年化營收突破一億美金(來源:多家科技媒體報導),Copilot 背後有 Microsoft 整個生態系,Windsurf 也在搶這塊。OpenAI 自己做 desktop app 有點像是親自下場跟自己的 API 客戶競爭——這個邏輯之前在 ChatGPT 出來的時候也發生過一次。
但 Andrew 的訪談裡透露了一個更大的野心:Codex 不只是 coding tool,而是一個「home base」,會去協調 ChatGPT、Codex,以及用戶現有的各種工具。Atlas(目前 OpenAI 正在開發的另一個項目)也被提到了,方向是跨工具的 workflow orchestration。換句話說,OpenAI 在下的棋,不是「AI 幫你寫 code」,而是「AI 幫你完成整個產品工作流」。
現在 OpenAI 內部接近 100% 的員工每週都在用 Codex,而且不只工程師——這個數字本身就是一個很強的信號(來源:Andrew Ambrosino 訪談,Lenny's Newsletter)。
角色邊界正在消失,但不是你想的那樣
訪談裡最有料的部分,是 Andrew 談他的團隊怎麼運作。
他說,他的團隊把傳統的角色定義「collapse」掉了——PM、engineer、designer 的邊界模糊化。每個人都可以做跨職能的事。但他同時強調,「把 role 的概念完全取消是個大錯誤」。
這兩句話放在一起,其實是一個很精準的觀察。現在大家很喜歡說「AI 之後每個人都能 ship 產品,角色都不重要了」,但 Andrew 的立場是:能力邊界在模糊,但責任邊界不能消失。你可以讓一個 PM 用 Codex 自己做 prototype,但這不代表你不需要有人對技術 debt、scalability、security 負責。
他用了一個「zone defense」的比喻來描述 OpenAI 的 PM 怎麼運作。在傳統的 man-to-man 模式下,PM 對接固定的工程師團隊;但現在因為每個人都可以 build,PM 的工作變成是守區域、找優先級、確保整體方向正確——而不是卡在每一個細節的執行。
這讓我想到打 WoW arena 的分工邏輯。你不會要求每個人打一樣的角色,但你需要每個人知道自己在整個 comp 裡的定位是什麼。Codex 改變的是每個人的「可操作範圍」,但不代表整體 strategy 可以沒有人負責。
真正的稀缺資源:taste
Andrew 在訪談裡反覆提到一個詞——taste。
他認為,在 AI 工具讓每個人都能快速產出的世界裡,taste 才是真正的差異化能力。這裡的 taste 不只是美學品味,而是更廣義的判斷力:你知道什麼是好的、什麼是對的、什麼是值得做的。
這跟 Linear 的 head of product Nan Yu 的觀點很接近(他也被這篇訪談 referenced)。當工具的門檻降低,execution 本身的稀缺性就下降,判斷力的稀缺性就上升。以前你需要一個工程師的原因,是「他會寫 code,我不會」;現在這個理由的比重在下降,但「他判斷得出哪個方向值得 build、哪個 trade-off 可以接受」的比重在上升。
老實說,這不是什麼新發現——好的產品人和工程師一直都需要 taste。但 AI 讓這件事被放大了:以前你沒有 taste 但執行力強,還是能做出可用的東西;現在執行本身越來越便宜,沒有 taste 的人會更快做出一大堆沒人要的東西(來源:Andrew Ambrosino 訪談,Lenny's Newsletter)。
Meta 判讀:這是 Meta Shift,不是 Patch Note
有些人會把「AI coding 工具讓 PM 能寫 code」這件事,看成是一個 Patch Note——漸進式的效率提升,改變幅度有限,適應一下就好。
我不這樣看。
這件事的量級更接近一次 Meta Shift。類比的歷史事件,我會拿 iPhone 出來之前的「手機市場」跟之後做對比。諾基亞的工程師很強、Motorola 的設計也不差,但他們對「好的手機是什麼」的定義,在 2007 年之後就不再適用了。不是他們能力下降,是整個 meta 換了。
現在發生的事情類似。「工程師寫 code、PM 寫 spec」這個分工模型,是建立在「寫 code 需要專業訓練、門檻高」這個前提上的。這個前提在過去五年裡已經開始鬆動,接下來兩三年會繼續加速。
不是說工程師要失業——Andrew 自己也很清楚,他的 Codex 讓工程師更有生產力,而不是取代他們。但「工程師的核心價值在哪裡」這個問題,答案正在被重寫。以前是「他會寫 code」,現在越來越多是「他知道怎麼 build 一個能 scale 的系統、知道 trade-off 是什麼、知道什麼時候要說不」。
這跟 Andrew 說的 taste 是同一件事,只是從工程師的角度說。
從投資角度看,我覺得 OpenAI 在這個方向上的佈局(Codex desktop + Atlas + 跨工具 orchestration)方向是對的,但競爭非常激烈,而且有一個根本的結構問題:當底層模型是你的核心優勢,你的 moat 就很大程度上取決於你的模型是不是最強的那個。Anthropic 也在這個賽道,Google 也在,護城河比想像中窄。如果是讓我評估,Codex 這個 desktop app 的產品方向值得追,但不會是贏家全拿的局面。
對工程師的實際影響
幾個我覺得值得注意的方向:
學會做產品決策。 如果你只能 execute spec,而判斷「這個 spec 對不對」的能力都在 PM 那邊,那你在 AI 工具普及之後的價值會快速下降。不是說你要去搶 PM 的工作,而是你需要有能力參與那個對話。
Taste 是可以練的。 多用你覺得好的產品、分析為什麼好、對自己 build 的東西保持高標準——這不是玄學,是可以刻意練習的判斷力。Andrew 自己的背景跨工程、設計、PM,這不是偶然的。
不要只會用工具,要理解工具的邊界。 知道 Codex、Cursor 能做什麼,更重要的是知道它們在哪裡會出錯、什麼情況下不能信任它。這個判斷力,是純靠工具產出的人沒有的。
Andrew 沒有宣布 PM 要消失,也沒有說工程師要全部轉型。他說的是,遊戲規則在變,而 taste 和判斷力是在新規則下最保值的能力。
我覺得這個觀察是準的。
HW SHU
9年媒體人
這篇文章對你有幫助嗎?
每週一篇 — 技術趨勢背後的商業邏輯
AI 產業在變什麼、工程師該注意什麼——拆清楚寄到你的信箱。


