- +1
GPT-4.1上線,和你的工作有什么關系

5月15日,OpenAI最新版本的非推理大語言模型GPT-4.1正式上線,首先向付費用戶開放。接下來,OpenAI還將推出GPT-4.1 mini,它將取代GPT-4o mini成為所有ChatGPT用戶(包括免費用戶)的默認版本。
GPT-4.1與之前的版本相比,兼顧了高性能和低成本。OpenAI表示,4.1擅長編寫代碼和遵循指示,它的速度更快,在日常的代碼需求上可以很好地替代o3和o4 mini。
值得注意的是,GPT-4.1是專注于為企業應用提供的模型,它的出現也標志著,我們已經可以將先進的AI技術應用于企業實踐。
這不僅是大模型行業的發展趨勢,也是所有行業即將被改變的起點。

文/承天蒙
/01/
以企業為中心的模型
GPT-4.1從一開始就以企業級實用性為設計目標,優先考慮開發者的使用需求。
GPT-4.1的API版本中,上下文容量擴展到100萬個token。這允許API用戶將大規模的法律和財務文檔、或是整個代碼庫直接輸入模型,從而讓AI協助審查和分析。
OpenAI表示,在輸入量極大的情況下,大模型性能會有所下降。但目前的企業測試看來,即使在輸入量高達10萬個token的情況下,GPT-4.1的性能表現依然穩定。
在SWE-bench Verified軟件工程基準測試中,GPT-4.1比GPT-4o的評分提高了21.4分;在Scale的MultiChallenge基準測試中,指令執行任務的得分提高了10.5分。與其他模型相比,它還將冗長程度降低了50%,在早期測試中受到了企業用戶的稱贊。
ChatGPT目前沒有像API版一樣提供擴展的上下文窗口,但OpenAI暗示未來會提供支持。

/02/
幻覺更低、更便宜
GPT-4.1是在GPT-4.5的基礎上升級而來。
2025年2月,GPT-4.5首次亮相,就強調了表現更好的無監督學習、更豐富的知識庫和更少的幻覺,幻覺比例從GPT-4o的61.8%下降到37.1%,并展示了更加細膩的情感差別和長篇寫作方面的改進。
盡管取得了這些進步,GPT-4.5仍因其高昂的價格飽受批評,其通過API輸出每百萬個token的價格高達180美元,另外,與o系列相比,它在數學和編碼的基準測試中也表現不佳。
在此基礎上,GPT-4.1希望成為一種速度更快,更專注的替代方案。雖然它缺乏GPT-4.5的知識廣度和擴展情感模型,但它更適合輔助用戶的編碼,并能更可靠地執行用戶指令。在API中,GPT-4.1目前的價格每百萬個輸入token為2美元,每百萬個緩存token為0.5美元,每百萬個輸出token為8美元。
對于尋求更低成本,愿意犧牲一點速度和智能的用戶來說,OpenAI也提出了更經濟的選擇。GPT-4.1 mini的價格為每百萬個輸入token 0.4美元,每百萬個緩存token 0.1美元,每百萬個輸出token 1.6美元。
谷歌的Flash-Lite和Flash模型起價每百萬個輸入token為0.075-0.1美元,每百萬個輸出令牌0.3-0.4美元,不到GPT-4.1基礎價格的十分之一。GPT-4.1價格較高,但它的軟件工程基準測試分數更高,指令執行更精確,更適合注重可靠性的企業級用戶。

/03/
更專注于實用性的發展趨勢
GPT-4.5是大模型領域的一個規模化里程碑,而 GPT-4.1 則專注于實用性。它并非成本最高,也并非多模態性最強,但它在企業關注的領域——準確性、部署效率和成本上取得了顯著的提升。
這種重新定位反映了AI領域的行業趨勢,不再不惜一切代價構建最大的模型,而是致力于讓性能強大的模型更便宜、更容易獲取。GPT-4.1就是秉持著這樣的理念,為那些想將AI更深入地應用于工作的企業團體提供了一個靈活、可立即投入生產的工具。
隨著OpenAI不斷改進其模型產品,GPT-4.1在讓先進的AI技術應用于企業生產上邁出了重要的一步。
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司




