阿里通义发布国内首个“混合推理模型” Qwen3 :支持两种思考模式

Qwen团队发布最新大型语言模型。开源8款混合推理模型,包括两款MoE模型(Qwen3-235B-A22B和Qwen3-30B-A3B)和六个Dense模型(Qwen3-32B至Qwen3-0.6B)。旗舰模型Qwen3-235B-A22B在代码、数学和通用能力测试中表现优异,与顶级模型DeepSeek-R1等相当。Qwen3支持119种语言和方言,具备思考模式和非思考模式,可灵活切换推理深度和响应速度。 [原文链接]

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注