
Karpathy 的研究筆記曝光 — 頂尖 AI 研究者怎麼記錄想法
頂尖 AI 研究者的筆記系統:從 Karpathy 的 idea file 看知識工作的新范式
> Meta Shift
4 月某個平常的週末,Andrej Karpathy 在 GitHub 上丟了一個 gist,標題很樸素:「LLM Wiki」。沒什麼宣傳,就是把他平常記 AI 研究想法的筆記系統分享出來。結果這個 gist 在幾天內就拿到 5000+ 星星,被 fork 了 2500+ 次。
為什麼一個筆記方法會讓這麼多人瘋狂?我看完之後覺得,這不只是筆記術,這是知識工作的典範轉移。
從 Tesla 到 OpenAI 的筆記大師
Karpathy 這個人在 AI 圈的地位不用多介紹了。Stanford PhD、前 Tesla Autopilot 主管、OpenAI 創始團隊成員,現在是 AI 教育領域的 KOL。他的 CS231n 課程影響了一整代 Computer Vision 工程師,YouTube 頻道 "Andrej Karpathy" 有將近 50 萬訂閱。
但讓他真正出名的,是他對複雜技術的拆解能力。不管是解釋 Transformer 架構還是分析 GPT 的訓練過程,他總能用最直觀的方式把硬核概念講清楚。這種能力背後,其實就是他這套知識管理系統在發揮作用。
在 AI 研究這個變化超快的領域,每天都有新 paper、新想法、新突破。一般研究者的做法是建個 Notion 資料庫或者用 Obsidian 做筆記。但 Karpathy 的這套 "LLM Wiki" 系統,本質上是讓 AI 來當他的知識管理助手。
從 RAG 到 Wiki:知識累積的演化
大部分人用 LLM 處理文件的方式,就是標準的 RAG(Retrieval-Augmented Generation)流程:上傳一堆文件,需要時讓 LLM 檢索相關片段,然後生成答案。ChatGPT 的文件上傳、NotebookLM、各種 RAG 系統都是這樣運作的。
但 Karpathy 指出了 RAG 的根本問題:每次都要重新發現知識。你問一個需要整合五篇論文的複雜問題,LLM 得先找到相關段落,再拼湊出答案。下次問類似問題,又要重複同樣的過程。沒有累積,沒有記憶。
他的 LLM Wiki 系統完全不同。LLM 不是在查詢時才去翻文件,而是預先建立並維護一個結構化的知識庫。每當你加入新資料,LLM 會:
- 讀取內容並提取關鍵信息
- 更新相關的實體頁面
- 修訂主題摘要
- 標記新舊資料的矛盾之處
- 強化或挑戰既有的知識結構
核心概念是「知識編譯一次,持續更新」,而不是每次查詢都重新推理。交叉引用已經建立,矛盾已經標記,綜合分析已經反映了你讀過的所有內容。
實戰中的協作模式
Karpathy 描述他的實際工作流程很有意思:一邊開著 LLM agent,一邊開著 Obsidian。LLM 負責編輯和維護 wiki,他負責瀏覽結果——跟著連結走、看圖譜視圖、讀更新的頁面。
用他的話說:「Obsidian 是 IDE,LLM 是 programmer」。
這個比喻很精準。傳統的知識工作是你自己當 programmer — 讀資料、做摘要、建立連結、維護結構。現在是你當 product manager,負責方向和品質控制,LLM 負責執行層面的苦工。
這種協作模式的效率提升是指數級的。想像你要研究某個新技術領域,傳統方式是讀一堆 paper,做筆記,慢慢建立知識架構。現在是你丟一堆資料給 LLM,它幫你建好整個知識圖譜,你只需要驗證和調整。
Meta 判讀:知識工作的新範式
用我的 meta 分析框架來看,這是標準的 Meta Shift。
這不是工具的漸進改良(Patch Note),而是知識工作方式的根本性改變。類比一下,這就像從手工記帳到用 Excel,或者從 FTP 上傳到 Git workflow。工作的本質沒變,但方式完全不同了。
更深層的含義是:AI 開始承擔認知勞動中的基礎建設工作。以前我們說 AI 是 copilot,現在更像是 infrastructure。你不是在跟 AI 對話,而是在 AI 建立的知識結構上工作。
這讓我想到遊戲中的 meta 演進。以前大家都在拼操作技巧,現在頂尖玩家比的是資訊整理和戰術分析能力。知識工作也一樣,純粹的閱讀和記憶能力變得不那麼重要,關鍵是如何設計好的問題,如何驗證 AI 產出的品質。
從商業角度看,這也解釋了為什麼各大公司都在 all-in AI Agent。真正有價值的不是聊天機器人,而是能夠承擔複雜認知任務的專業助手。
對工程師的啟發
如果你是軟體工程師,這個趨勢有幾個值得注意的點:
首先,重新思考你的學習方式。與其花時間做筆記,不如花時間設計更好的 prompt 和驗證機制。如何讓 AI 幫你建立技術知識體系,如何快速驗證它產出的內容是否正確。
其次,這套方法論可能比具體工具更重要。Karpathy 用的是 Obsidian + ChatGPT,但你可以用 Notion + Claude,或者任何其他組合。關鍵是那個「讓 AI 維護結構化知識庫」的核心想法。
<h2>延伸閱讀</h2> <ul> <li><a href="/blog/anatomy-of-agent-harness">拆解 Agent Harness — 你以為的 AI Agent 其實 90% 是 harness</a></li> <li><a href="/blog/agent-design-behind-50000-stars-architectural-breakdown-of-bytedance-deerflow-20">五萬顆星背後的 Agent 設計:ByteDance DeerFlow 2.0 的架構拆解</a></li> <li><a href="/blog/the-first-40-months-of-the-ai-era">AI 這 40 個月都發生了什麼?一個技術人的冷靜回顧</a></li> </ul>Waiting7777
WoW Arena 冠軍轉前端,用電競 meta 思維拆解技術趨勢。
這篇文章對你有幫助嗎?
每週一篇 — 技術趨勢背後的商業邏輯
AI 產業在變什麼、工程師該注意什麼——拆清楚寄到你的信箱。


