千问3开源,仅需DeepSeek-R1三分之一核心语义
81
7
千问3:阿里巴巴开源新一代模型,性能全面超越全球顶尖模型
近日,阿里巴巴宣布开源新一代通义千问模型Qwen3(简称千问3)。这款模型参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能却全面超越R1、OpenAI-o1等全球顶尖模型,成为全球最强开源模型。
混合推理模型,快慢思考集成
千问3是国内首个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型。对于简单需求,千问3可以低算力“秒回”答案;对于复杂问题,则可以进行多步骤“深度思考”,大大节省算力消耗。
![]()
混合专家架构,性能全面增强
千问3采用混合专家(MoE)架构,总参数量235B,激活仅需22B。预训练数据量达36T,并在后训练阶段多轮强化学习,将非思考模式无缝整合到思考模型中。在推理、指令遵循、工具调用、多语言能力等方面,千问3均大幅增强,创下所有国产模型及全球开源模型的性能新高。
奥数水平测评,刷新开源纪录
在奥数水平的AIME25测评中,千问3斩获81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中,千问3突破70分大关,表现甚至超过Grok3;在评估模型人类偏好对齐的ArenaHard测评中,千问3以95.6分超越OpenAI-o1及DeepSeek-R1。
部署成本大幅下降,仅需4张H20即可部署
性能大幅提升的千问3的部署成本也大幅下降。仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。
以上就是一盒网游原创的《千问3:阿里巴巴开源新一代模型,性能全面超越全球顶尖模型》解析,更多深度好文请持续关注本站。
外卖逆袭!堂食遭重创,多家门店营业额锐减半,餐饮市场风云突变