Claude 4.7 改了什麼?拆解 system prompt 看透 Anthropic 調教手法
Claude 改 system prompt 看行為微調:Anthropic 的 AI 訓練師手法
> Patch Note
標題下看透可能臭屁了。不過, Simon Willison 拆解了 Claude Opus 4.6 到 4.7 版本間的 system prompt 變化,基本上就是 Anthropic 的「調參師日記」。這件事有趣的地方是,現在只有 Anthropic 會公開他們的 system prompt,其他家都藏起來。看這些變化,就像看遊戲的 patch note — 哪個職業被 buff、哪個技能被 nerf、新增了什麼機制。
對工程師來說,這是很好的 prompt engineering 教材。對產業來說,這反映了 AI 公司怎麼透過「調教」來改變使用者體驗,而不是重新訓練模型。
架構概覽:System Prompt 是什麼
System prompt 就是 AI 的「人設設定檔」,告訴它該怎麼表現、什麼能做什麼不能做。想像成遊戲角色的 config 檔,裡面定義了這個 NPC 的行為模式。
Claude 的 system prompt 結構大概長這樣:
- 身份設定:我是 Claude,由 Anthropic 開發
- 能力範圍:我能做什麼、有哪些 tools
- 行為規範:怎麼回話、什麼不該做
- 安全條款:兒童安全、有害內容的處理方式
- 互動風格:要簡潔還是詳細、要不要主動問問題
這次 4.6 到 4.7 的改動,基本上就是在這幾個區塊做微調。Anthropic 透過這種方式,不用重新訓練模型就能改變 AI 行為 — 就像改遊戲設定檔一樣,成本低但效果明顯。
從架構角度看,這反映了現代 AI 系統的「雙層設計」:底層是預訓練模型(很貴,不常改),上層是 prompt engineering(便宜,隨時能調)。
核心機制深入:三個關鍵改動
1. Tool 生態系統升級
最明顯的變化是 tool 列表更新了。4.6 版本提到「Claude in Chrome 和 Claude in Excel」,4.7 新增了「Claude in PowerPoint」。更重要的是,新增了 tool_search 機制:
Before concluding Claude lacks a capability — access to the person's location, memory, calendar, files, past conversations, or any external data — Claude calls tool_search to check whether a relevant tool is available but deferred.
這個設計很聰明。以前 Claude 會直接說「我沒有這個能力」,現在會先查查看是不是有 tool 可以用。這背後的商業邏輯是:讓使用者感覺 Claude 「更能幹」,而不用真的提升模型能力。
這讓我想到 App Store 的策略 — 平台本身不做所有功能,但讓生態系夥伴做,然後統一整合到使用者體驗裡。
2. 安全機制大升級
兒童安全部分從小段落變成獨立的 <critical_child_safety_instructions> 區塊,還新增了「一刀切」規則:
Once Claude refuses a request for reasons of child safety, all subsequent requests in the same conversation must be approached with extreme caution.
這個改動反映了監管壓力。歐盟的 AI Act、美國各州的兒童網路安全法案,都讓 AI 公司必須在安全上做更多投資。從產品角度看,這是 defensive move — 寧可誤殺一百,不可放過一個。
Trade-off 就是使用者體驗變差。但對 Anthropic 來說,商業風險比使用者抱怨更重要。
3. 互動模式調整
新增的 <acting_vs_clarifying> 區塊是最有趣的:
When a request leaves minor details unspecified, the person typically wants Claude to make a reasonable attempt now, not to be interviewed first.
這解決了 AI 助手的「過度客服化」問題。以前 Claude 會一直問問題確認需求,現在改成「先做再說」。這個改變很關鍵,因為它改變了人機互動的節奏感。
同時也新增了「要簡潔」的指令:
Claude keeps its responses focused and concise so as to avoid potentially overwhelming the user
這兩個改動組合起來,就是要讓 Claude 變得更「執行導向」,少廢話多做事。
商業背景:為什麼 Anthropic 要公開這些
HW SHU
WoW Arena 冠軍轉前端,用電競 meta 思維拆解技術趨勢。
這篇文章對你有幫助嗎?
每週一篇 — 技術趨勢背後的商業邏輯
AI 產業在變什麼、工程師該注意什麼——拆清楚寄到你的信箱。


