阿里发布并开源千问3 成本仅需DeepSeek-R1三分之一

3 0 2025-05-03 2025-04-29

千问3：阿里巴巴开源的全新模型，性能超越全球顶尖

近日，阿里巴巴集团宣布开源新一代通义千问模型Qwen3，简称千问3。这款模型在4月29日凌晨正式亮相，以其卓越的性能和成本效益，成为了全球最强的开源模型之一。

千问3的参数量仅为DeepSeek-R1的1/3，这意味着在保持高性能的其成本大幅下降。千问3在性能上全面超越了R1、OpenAI-o1等全球顶尖模型，成为当之无愧的“最强开源模型”。

混合推理模型，快慢思考一网打尽

千问3是国内首个“混合推理模型”，它将“快思考”与“慢思考”集成进同一个模型中。对于简单需求，千问3可以低算力“秒回”答案；而对于复杂问题，它则可以进行多步骤的“深度思考”，大大节省了算力消耗。

阿里发布并开源千问3 成本仅需DeepSeek-R1三分之一

这种独特的混合架构使得千问3在处理各种问题时都能表现出色，无论是简单的查询还是复杂的分析，都能迅速给出准确的答案。

全面增强，性能刷新纪录

千问3采用了混合专家（MoE）架构，总参数量为235B，激活仅需22B。其预训练数据量达到了36T，并在后训练阶段进行了多轮强化学习，将非思考模式无缝整合到思考模型中。

在推理、指令遵循、工具调用、多语言能力等方面，千问3都实现了大幅增强。在奥数水平的AIME25测评中，千问3斩获81.5分，刷新了开源纪录；在考察代码能力的LiveCodeBench评测中，千问3突破了70分大关，表现甚至超过了Grok3；在评估模型人类偏好对齐的ArenaHard测评中，千问3以95.6分超越了OpenAI-o1及DeepSeek-R1。

成本大幅下降，部署更加便捷

尽管性能大幅提升，千问3的部署成本却大幅下降。仅需4张H20即可部署千问3满血版，显存占用仅为性能相近模型的三分之一。

这样的成本效益使得千问3更加适合广泛应用于各种场景，无论是企业级应用还是个人用户，都能轻松享受到其带来的便利。

以上就是一盒网游原创的《千问3：阿里巴巴开源的全新模型，性能超越全球顶尖》解析，更多深度好文请持续关注本站。