7dc6
4月29日凌晨, 阿里云 正式开源 Qwen 3系列 大模型 ,包括2个MoE模型和6个稠密模型。发布仅2小时,Qwen3已在GitHub收获超16.9k颗Star。 据介绍,旗舰模型Qwen3-235B-A22B在 编程 、数学、通用能力等基准测试中登顶全球,超越DeepSeek-R1、OpenAI o1、Grok-3等主流模型。 蚕飞别苍3系列是全球首个开源的混合推理(混合思考模式)大模型。也就是说它可根据任务自由切换“思考模式”和“非思考模式”,在不同推理深度下优化输出效果和效率。 新一代Qwen3提供8个不同尺寸的模型,覆盖0.6B到235B参数规模,几乎适配从轻量端到旗舰部署的各类应用场景。旗舰模型Qwen3-235B-A22B在推理成本上也显著优化,部署成本仅为DeepSeek R1的三分之一。 此外,在功能扩展上,Qwen3全面支持MCP(模型上下文协议),使大模型能够与外部 数据源 、工具系统深度集成,提升Agent复杂任务处理能力。 同时,蚕飞别苍3模型支持119种语言和方言,进一步强化了全球适配性。 目前,Qwen3系列已在Hugging Face、ModelScope和Kaggle等平台开源,遵循Apache 2.0协议。(袁宁)