Qwen

阿里巴巴 AI 研究团队的旗舰大语言模型系列,以开放权重和高性能著称。

Qwen3.6-27B(2026-04-22)

首个密集开放权重模型,在 Agentic 编码基准上超越 397B MoE 模型。核心参数:

  • 27B 参数密集模型
  • Apache 2.0 许可证发布
  • 专为代码代理、仓库级推理和前端开发优化

意义:证明中等规模密集模型可以在特定任务上超越超大 MoE 模型,降低了高性能编码 AI 的部署门槛。来源:MarkTechPost。

FlashQLA 线性注意力核库(2026-04-29)

Qwen 团队开源的高性能线性注意力核库:

  • 在 NVIDIA Hopper GPU 上实现最高 3 倍加速
  • 为长序列推理提供基础设施优化
  • 属于 AI 推理基础设施层面的技术贡献

多模态/3D 世界理解方向补充(2026-05-24)

有关“浙大联合腾讯让 AI 看懂三维世界”的报道提到腾讯混元与 Qwen 等中文模型生态在 3D world understanding 方向上的推进。尽管公开细节有限,但它说明中文大模型竞争正在继续从通用文本能力外溢到更复杂的多模态与空间理解任务,3D 感知可能成为下一阶段模型差异化的重要方向之一。来源:新浪财经。

参见

  • deepseek — 另一家中国 AI 公司,华为芯片路线
  • Cloud — AI 基础设施