ITCOW牛新网 9月29日消息,DeepSeek今日正式推出DeepSeek-V3.2-Exp实验性模型,该版本已全面开源。作为向新一代架构过渡的中间版本,V3.2-Exp在V3.1-Terminus基础上引入了创新的DeepSeek稀疏注意力机制(DSA),专门针对长文本处理的训练和推理效率进行了优化探索。

DeepSeek发布V3.2-Exp实验性模型

据ITCOW牛新网了解,新采用的细粒度稀疏注意力机制在几乎不影响模型输出质量的前提下,显著提升了长文本场景下的处理效率。为确保评估的严谨性,官方将V3.2-Exp的训练设置与V3.1-Terminus保持严格对齐,在多个领域的公开评测集上表现基本相当。

DeepSeek发布V3.2-Exp实验性模型

目前,DeepSeek官方应用程序、网页端及小程序均已同步更新至V3.2-Exp版本。本次更新还带来了API价格的大幅调整,开发者调用成本降低超过50%,显著降低了使用门槛。

DeepSeek发布V3.2-Exp实验性模型

虽然新模型已在公开测试中验证了其有效性,DeepSeek仍建议用户在真实使用场景中进行更广泛的大规模测试。为方便对比评估,官方临时保留了V3.1-Terminus的额外API访问接口。

DeepSeek-V3.2-Exp模型现已在Hugging Face和魔搭平台开源,相关技术论文也已同步公开,供研究社区参考和进一步探索。