1. <acronym id="vwv6e"><var id="vwv6e"></var></acronym>
    2. 午夜福利国产精品视频,中文字幕日韩有码av,av午夜福利一片免费看久久,欧美牲交a欧美牲交aⅴ图片,国产精品亚洲二区在线播放,四虎在线成人免费观看,麻豆国产成人AV在线播放,亚洲av永久无码精品网站
      澎湃Logo
      下載客戶端

      登錄

      • +1

      訓練成本大降超九成!阿里開源下一代基礎模型架構,引入混合注意力機制

      澎湃新聞記者 胡含嫣
      2025-09-12 13:15
      來源:澎湃新聞
      ? 10%公司 >
      字號

      阿里開源全新架構Qwen3-Next,80B參數新模型只需激活3B即可實現旗艦性能。

      9月12日,阿里通義發布下一代基礎模型架構Qwen3-Next和基于新架構的模型Qwen3-Next-80B-A3B,包含兩個版本:更擅長理解和執行指令的指令(Insctruct)模型,以及更擅長多步推理和深度思考的推理(Thinking)模型。

      據介紹,相比Qwen3的MoE(混合專家)模型結構,Qwen3-Next進行了以下核心改進:混合注意力機制、高稀疏度MoE結構、一系列訓練穩定友好的優化,以及提升推理效率的多token預測機制(簡稱MTP,Multiple-Token Prediction)。

      在核心技術方面,新模型采用全球首創混合架構,75%用Gated DeltaNet(線性注意力),25%用原創Gated Attention(門控注意力),總參數80B只需激活3B,就可以在性能上媲美Qwen3旗艦版235B模型,算力利用率約為3.7%,幫助用戶“極致省錢”。

      在訓練成本方面,Qwen3-Next模型較今年4月發布的密集模型Qwen3-32B大降超90%,長文本推理吞吐量提升10倍以上。新模型在Qwen3預訓練數據的子集15T tokens上進行預訓練,僅需Qwen3-32B所用GPU計算資源的9.3%,便能訓練出性能更好的Qwen3-Next-Base基座模型,大幅提升了訓練效率。

      阿里通義團隊指出,高稀疏MoE架構是Qwen3-Next面向下一代模型的最新探索。當前,MoE是主流大模型都采用的架構,通過激活大參數中的小部分專家完成推理任務。此前,Qwen3系列的MoE專家激活比約為1比16,而Qwen3-Next通過更精密的高稀疏MoE架構設計,實現了1比50的極致激活比,創下業界新高。

      在性能表現方面,Qwen3-Next指令模型的性能表現與參數規模更大的Qwen3-235B-A22B-Instruct-2507持平,思維模型表現優于谷歌閉源模型Gemini-2.5-Flash-Thinking。

      Qwen3-Next-80B-A3B-Instruct指令模型性能評測圖。來源:阿里通義

      目前,新模型已在魔搭社區和HuggingFace開源,開發者也可通過Qwen Chat免費體驗,或直接調用阿里云百煉平臺提供的API服務。

      關于Qwen3-Next模型值得注意的創新點,Pine AI聯合創始人、首席科學家李博杰對澎湃新聞記者表示,Qwen3-Next采用了混合注意力機制和高稀疏MoE架構,從而大幅提升效率;除了這兩大創新點以外,Qwen3-Next還在預訓練時采用了多Token預測技術MTP(Mutiple-Token Prediction),模型推理速度大幅提升。

      李博杰表示,雖然以上三種技術創新在學界已有研究,但阿里證明了其在工業界的實用性,同時還保持了開源:“Qwen3-Next第一次證明了這些技術能夠放在一起共同運作,并且能夠在實際的業務場景中展現出很好的能力表現。從評測結果和模型架構來看,Qwen3-Next已經達到了谷歌Geimini 2.5 flash的水平。”

      近期,阿里通義動作頻頻,包括推出超萬億參數的Qwen3-Max-Preview、文生圖及編輯模型Qwen-Image-edit、語音識別模型Qwen3-ASR-Flash等。全球AI開源社區HuggingFace的最新數據顯示,通義千問Qwen衍生模型數已超17萬,穩坐全球第一開源模型。

      9月1日,國際權威市場調研機構沙利文(Frost&Sullivan)發布了最新的《中國GenAI市場洞察:企業級大模型調用全景研究,2025》,報告顯示,中國企業級大模型調用呈爆發式增長,2025年上半年日均調用量較2024年底實現363%的增長,目前超10萬億Tokens。其中,阿里通義占比17.7%位列第一,是中國企業選擇最多的大模型。

        責任編輯:孫扶
        圖片編輯:沈軻
        校對:張艷
        澎湃新聞報料:021-962866
        澎湃新聞,未經授權不得轉載
        +1
        收藏
        我要舉報
                查看更多

                掃碼下載澎湃新聞客戶端

                滬ICP備14003370號

                滬公網安備31010602000299號

                互聯網新聞信息服務許可證:31120170006

                增值電信業務經營許可證:滬B2-2017116

                ? 2014-2025 上海東方報業有限公司

                反饋
                主站蜘蛛池模板: 99久久婷婷国产综合精品青草漫画 | 欧美性xxxxx极品| 在线精品国产成人综合| 精品一区二区三区东京热| 国产精品麻豆成人av网| 九九视频热最新在线视频| 天天拍夜夜添久久精品大| 在线亚洲午夜片av大片| 日本欧美大码a在线观看| 高级艳妇交换俱乐部小说| 美女内射福利大全在线看| 男女爽爽无遮挡午夜视频| 蜜桃av亚洲精品一区二区| 亚洲乱码精品久久久久..| 国产精品亚洲二区在线播放| 亚洲国模精品一区二区| 精品视频在线观看免费观看| 在线高清免费不卡全码| 又色又爽又黄的视频网站| 国产精品蜜臀av在线一区| 亚洲欧美人成人综合在线播放| 亚洲国产日韩a在线播放| 久久国产精品波多野结衣av| 国产精品中文字幕第一页| 亚洲精品免费一二三区| 毛片大全真人在线| 亚洲无av中文字幕在线| 久久婷婷成人综合色综合| 在线观看免费人成视频色| 天天狠天天透天天伊人| 国产精品视频免费一区二区| 国内视频偷拍久久伊人网| 北川| 日韩大片高清播放器| 国偷自产一区二区三区在线视频| 国产精品自拍中文字幕| 亚洲精品网站在线观看不卡无广告 | 精品一区二区不卡免费| 国产一区二区三区内射高清| 亚洲国产精久久久久久久春色| 最新亚洲人成网站在线影院|