- +1
特斯拉AI前成員卡帕西給Agent潑冷水:真正成熟還需十年
2025年被稱為智能體Agent之年,當行業的熱潮席卷全球之際,OpenAI創始成員、特斯拉前AI總監安德烈·卡帕西(Andrej Karpathy)近日在接受播客節目“Dwarkesh Patel Show”采訪時給這股熱潮潑下一盆冷水,他直言,當前AI Agent技術尚處早期,還存在“無法持續學習、非真正的多模態、不能自如操作電腦”等核心缺陷,要實現真正的實用化還需要十年左右。

OpenAI創始成員、特斯拉前AI總監安德烈·卡帕西(Andrej Karpathy)近日在接受播客節目采訪。
AGI為何還需要十年
卡帕西認為,盡管當前大語言模型展現出令人驚嘆的能力,但Agent真正能夠使用的標志是它成為一個員工或實習生,人類愿意雇傭它和自己一起干活、工作。顯然,Agent當前還做不到這一步。
原因在于Agent還存在三大核心缺陷:無法持續學習、非真正的多模態、不能自如操作電腦。現在的AI無法記住和用戶的每一次互動,當關掉對話窗口后,它就會忘掉。它無法像人類一樣,通過日常經歷持續學習鞏固。
AI雖然能看圖寫字,但無法真正理解并完成復雜任務??ㄅ廖髋e例,AI能寫代碼,但無法制作一張精美的PPT,因為超出了本質是文本處理器的能力范圍。同時,AI操作電腦、點擊軟件的能力還非常初級和不可靠。
卡帕西借用其在特斯拉開發自動駕駛的經驗提出,從“演示”到“產品”有著巨大的鴻溝,“這是一場向數字‘9’的進軍,一個在90%的情況下能工作的演示達成了第一個9,但要達到99.99999%的可靠性,還有更多的‘9’需要走。這就是為什么這些事情要花這么長時間?!?/p>
強化學習很糟糕
談及強化學習(Reinforcement Learning),卡帕西直言,“強化學習很糟糕,只是碰巧之前的其他方法更糟糕。”
在強化學習中,試圖找到一個問題的解決方案,AI可能會進行數百種不同的嘗試?!熬拖褡鲞x擇題,它蒙了100次,只有最后1次對了,但它會把整個蒙題過程都當成‘正確經驗’,這種學習方式存在嚴重的效率問題。而?類永遠不會這樣做?!逼渲械脑蚴堑谝?,現實世界?類不會進行數百次試運行;第二,當人類找到解決?案時,會有?個相當復雜的反思復盤過程。
另一個深層問題是模型坍塌(model collapse)。模型生成的內容多樣性會悄然減少,分布范圍變窄,即使單個輸出看起來仍然合理??ㄅ廖髋e例,你可以讓 ChatGPT講個笑話,但它反復輸出的可能只是少數幾個模式化的笑話。這一特性阻礙了AI實現持續學習,而如果讓AI使用自己產出的數據,就會導致模型在自有數據上產生更加同質化的內容,陷入惡性循壞。
雖然人類也會存在類似的思維定式,但可以通過交流、閱讀等方式來對抗這一趨勢。兒童之所以是高效的學習者,正因為他們不擅長記憶,反而被迫去發現通用模式。當前AI缺乏這種主動尋求并整合多樣性的內在機制,必須依賴人類產生的真實數據,這是個很大的瓶頸。
但卡帕西同時也深刻認識到,強化學習仍是當前AI發展道路上不可或缺的一環。原因在于,傳統的監督學習(Supervised Learning)存在明顯的天花板。監督學習嚴重依賴大量、高質量的標注數據。但對于“好代碼”、“好決策”這類無法明確定義、無法通過標注數據學習的概念,只能通過設計一個獎勵函數來讓模型自己摸索什么是“好”。這正是強化學習的應用場景。
AGI的漸進式路徑
卡帕西堅持AGI的早期定義——能執行任何具有經濟價值任務的人類水平系統。但目前AI的實際影響仍有限,其應用高度集中在編碼等高度結構化、文本驅動的領域?!叭藗儼盐锢淼臇|西都拿走了,只是在討論數字知識工作,這是一個相當重大的讓步。原始定義是人類可以做的任何任務,包括舉起一件東西?!?/p>
與很多人對AGI“奇點”時刻的想象不同,卡帕西認為,AGI不會在某一天突然降臨并引爆智能爆炸,而是會像蒸汽機、電力和互聯網等歷史上的通用技術一樣,緩慢地融入并延續過去2.5個世紀來約2%的年度GDP增長趨勢。
卡帕西一直試圖在GDP(Gross Domestic Product,國內生產總值)的增長趨勢中找到AI對其產生的明顯影響,理論上GDP應該顯著上升。“但后來我看了?些我認為?常具有變?性的其他技術,?如計算機或移動電話等。你在GDP中找不到它們,GDP是同樣的指數?!?他進一步舉例,即使人們認為2008年iPhone 推出是個重?的地震式變化,而實際上不是,一切都如此分散、如此緩慢地擴散,以?于?切最終都被平均到同樣的指數中。
這種漸進性源于技術革命的本質:新技術從演示到成熟產品的擴散需要時間。就像自動駕駛關于一場向數字“‘9’的進軍”,每一個“9”的可靠性提升都需要付出巨大努力。AGI的發展同樣會遵循這條路徑,先自動化一些封閉、結構化的任務,再逐步攻克更復雜的工作,其間社會需要時間來調整基礎設施、法律和技能體系。
卡帕西相信未來將會是多個AI實體逐漸增強自主性,與人類社會協同演進。因此人們擁有寶貴的窗口期進行準備,可以系統地調整教育、社會保障和法律法規,以確保人類在AGI時代能夠持續繁榮。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司




