阿里发布并开源千问3 成本仅需DeepSeek-R1三分之一

3 0

千问3:阿里巴巴开源的全新模型,性能超越全球顶尖

近日,阿里巴巴集团宣布开源新一代通义千问模型Qwen3,简称千问3。这款模型在4月29日凌晨正式亮相,以其卓越的性能和成本效益,成为了全球最强的开源模型之一。

千问3的参数量仅为DeepSeek-R1的1/3,这意味着在保持高性能的其成本大幅下降。千问3在性能上全面超越了R1、OpenAI-o1等全球顶尖模型,成为当之无愧的“最强开源模型”。

混合推理模型,快慢思考一网打尽

千问3是国内首个“混合推理模型”,它将“快思考”与“慢思考”集成进同一个模型中。对于简单需求,千问3可以低算力“秒回”答案;而对于复杂问题,它则可以进行多步骤的“深度思考”,大大节省了算力消耗。

阿里发布并开源千问3 成本仅需DeepSeek-R1三分之一

这种独特的混合架构使得千问3在处理各种问题时都能表现出色,无论是简单的查询还是复杂的分析,都能迅速给出准确的答案。

全面增强,性能刷新纪录

千问3采用了混合专家(MoE)架构,总参数量为235B,激活仅需22B。其预训练数据量达到了36T,并在后训练阶段进行了多轮强化学习,将非思考模式无缝整合到思考模型中。

在推理、指令遵循、工具调用、多语言能力等方面,千问3都实现了大幅增强。在奥数水平的AIME25测评中,千问3斩获81.5分,刷新了开源纪录;在考察代码能力的LiveCodeBench评测中,千问3突破了70分大关,表现甚至超过了Grok3;在评估模型人类偏好对齐的ArenaHard测评中,千问3以95.6分超越了OpenAI-o1及DeepSeek-R1。

成本大幅下降,部署更加便捷

尽管性能大幅提升,千问3的部署成本却大幅下降。仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

这样的成本效益使得千问3更加适合广泛应用于各种场景,无论是企业级应用还是个人用户,都能轻松享受到其带来的便利。

以上就是一盒网游原创的《千问3:阿里巴巴开源的全新模型,性能超越全球顶尖》解析,更多深度好文请持续关注本站。