阿里开源Qwen3,性能提升参数优化
阿里巴巴在“五一”节前开源了新一代通义千问Qwen3,一口气推出8个版本。Qwen3被称为“思深,行速”,是中国首个混合推理模型,能根据问题选择“快、慢思考”。最新数据显示,Qwen系列累计下载达3亿次,衍生模型超10万个,居全球首位。Qwen3提供多种参数模型,30B参数MoE模型仅激活3B就可达上代性能,32B稠密模型超越上代72B性能。开发者反馈小参数量模型表现突出,性价比高,适合不同场景部署。
尽管有报道称Qwen3性能全面碾压DeepSeek R1,但第三方测试显示,Qwen3仅在部分指标领先,并非全面超越。业内认为,Qwen3整体表现略好,但相比R1并无太大突破。随着算力成本降低和性能提升,Qwen3为智能体Agent和大模型应用爆发提供了支持。然而,通用Agent在工程和技术上仍面临挑战。阿里云CTO周靖人表示,大模型发展需与云体系深度结合,市场空间巨大,欢迎共同推动AI产业发展,最终由客户决定谁领先。