- +1
阿里千問3系列發(fā)布并開源:稱成本大幅下降,性能超越DeepSeek-R1
備受期待的千問3.0在五一節(jié)前面世。
4月29日凌晨,阿里巴巴宣布開源新一代通義千問模型Qwen3(簡稱千問3),包含2款參數(shù)規(guī)模分別為30B和235B的混合專家(MoE)模型,以及大小從0.6B到32B的6款密集模型。據(jù)介紹,千問3模型家族是國內(nèi)首個混合推理模型系列,235B模型的參數(shù)量僅為DeepSeek-R1的三分之一,成本大幅下降,性能全面超越R1、OpenAI-o1等全球頂尖模型,登頂全球最強開源模型。
在本次開源的系列模型中,旗艦?zāi)P蚎wen3-235B-A22B的總參數(shù)量為235B,激活僅需22B。千問3預(yù)訓(xùn)練數(shù)據(jù)量達(dá)到36T,和千問2.5相比翻了兩倍,并在后訓(xùn)練階段進行多輪強化學(xué)習(xí),將非思考模式整合到思考模型中。同時,千問3的部署成本大幅下降,僅需4張H20即可部署千問3滿血版,顯存占用僅為性能相近模型的三分之一。
在推理、指令遵循、工具調(diào)用、多語言能力等方面,千問3的性能均大幅增強:在奧數(shù)水平的AIME25測評中,千問3以81.5分的成績刷新開源紀(jì)錄;在考察代碼能力的LiveCodeBench評測中,千問3的表現(xiàn)甚至超過Grok3;在評估模型人類偏好對齊的ArenaHard測評中,千問3的分?jǐn)?shù)超越了OpenAI-o1和DeepSeek-R1。

千問3旗艦版和32B版本在部分基準(zhǔn)測試中的得分。來源:通義千問
為了迎接智能體Agent和大模型應(yīng)用的集中爆發(fā),千問3也在這方面提供了支持。在評估模型Agent能力的BFCL評測中,千問3創(chuàng)下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等頂尖模型。同時,千問3原生支持MCP(模型上下文協(xié)議),并具備強大的工具調(diào)用(function calling)能力,將大大降低編碼復(fù)雜性。
對于開發(fā)者而言,千問3醞釀已久的發(fā)布為開源領(lǐng)域帶來新的動力。和前代一樣,千問3系列模型依舊采用寬松的Apache2.0協(xié)議開源,首次支持119多種語言,全球開發(fā)者、研究機構(gòu)和企業(yè)均可免費在魔搭社區(qū)、HuggingFace等平臺下載模型并商用,或通過阿里云百煉調(diào)用千問3的API服務(wù)。個人用戶可立即通過通義APP直接體驗,夸克也即將全線接入千問3。
有業(yè)內(nèi)人士在經(jīng)過實測后指出,千問3在邏輯推理、寫作等方面的表現(xiàn)都不錯,在生成復(fù)雜代碼、數(shù)學(xué)推理等方面,思考模式的表現(xiàn)明顯好于非思考模式。通義千問團隊表示,未來計劃從多個維度提升模型,以實現(xiàn)幾個關(guān)鍵目標(biāo),包括擴展數(shù)據(jù)規(guī)模、增加模型大小、延長上下文長度、拓寬模態(tài)范圍、推進強化學(xué)習(xí)以進行長周期推理。
今年以來,通義千問團隊表現(xiàn)活躍,先后開源發(fā)布旗艦?zāi)P蚎wen2.5-Max、推理模型QwQ-32B和首個全模態(tài)大模型Qwen2.5-Omni。目前,阿里通義已開源200余個模型,全球下載量超3億次;千問衍生模型數(shù)超10萬個,已超越美國Llama,成為全球第一開源模型。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司




