阿里开源Qwen3,性能提升参数优化

阿里巴巴在“五一”节前开源了新一代通义千问Qwen3,一口气推出8个版本。Qwen3被称为“思深,行速”,是中国首个混合推理模型,能根据问题选择“快、慢思考”。最新数据显示,Qwen系列累计下载达3亿次,衍生模型超10万个,居全球首位。Qwen3提供多种参数模型,30B参数MoE模型仅激活3B就可达上代性能,32B稠密模型超越上代72B性能。开发者反馈小参数量模型表现突出,性价比高,适合不同场景部署。

阿里开源Qwen3,性能提升参数优化

尽管有报道称Qwen3性能全面碾压DeepSeek R1,但第三方测试显示,Qwen3仅在部分指标领先,并非全面超越。业内认为,Qwen3整体表现略好,但相比R1并无太大突破。随着算力成本降低和性能提升,Qwen3为智能体Agent和大模型应用爆发提供了支持。然而,通用Agent在工程和技术上仍面临挑战。阿里云CTO周靖人表示,大模型发展需与云体系深度结合,市场空间巨大,欢迎共同推动AI产业发展,最终由客户决定谁领先。

最新快讯
  1. 中国坚决反制美国关税战

    2025-05-02 14:43
  2. 日元贬值压力下,日本央行暗示可能调整政策

    2025-05-02 14:38
  3. KAVA币发行总量 KAVA币最新消息

    2025-05-02 14:37
  4. Ava Labs推出Avalanche链间代币转移(Avalanche ICTT)解决方案

    2025-05-02 14:37
  5. 怎样选一只好基金?如何选择一只好基金?

    2025-05-02 14:33