阿里通义千问更新 Qwen3-30B 非思考模型:AI 性能媲美 GPT-4o,推理、代码、数学等能力全面跃升

时间:2025-07-30 14:36:01来源:互联网

下面小编就为大家分享一篇阿里通义千问更新 Qwen3-30B 非思考模型:AI 性能媲美 GPT-4o,推理、代码、数学等能力全面跃升,具有很好的参考价值,希望对大家有所帮助。

alixixi 7 月 30 日消息,阿里通义千问今天(7 月 30 日)在 X 平台发布推文,宣布推出 Qwen3-30B-A3B 非思考模式的更新版本,命名为 Qwen3-30B-A3B-Instruct-2507。

新模型主要提升指令跟随、逻辑推理、文本理解、数学、科学、编程和工具使用等通用能力,官方表示在激活 3B 参数的情况下,性能接近 GPT-4o 和 Qwen3-235B-A22B Non-Thinking。

alixixi援引官方博文内容,Qwen3-30B-A3B-Instruct-2507 模型的参数总量为 305 亿,但激活参数为 33 亿,非嵌入层数量为 299 亿,网络层数为 48 层,专家数为 128 个,激活专家数为 8 个,上下文长度原生支持 262144 个 tokens。

该模型仅支持非思考模式,在输出中不会生成 <think></think> 块。同时,不再需要指定 enable_thinking=False。官方表示新模型大幅增加了多种语言的长尾知识覆盖,且在主观和开放式任务中与用户偏好更加一致,能够提供更有帮助的回答和更高质量的文本生成。

本站部分内容转载自互联网,如果有网站内容侵犯了您的权益,可直接联系我们删除,感谢支持!