DeepSeek发布V3.2-Exp实验模型，引入稀疏注意力机制DeepSeek正式发布V3.2-Exp实验版模型，这是其下一代架构的中间步骤

10:39 · Sep 29, 2025 · Mon

LoopDNS资讯播报

DeepSeek V3.2版本出现在Hugging Face平台，但其目录中仅包含一个 .gitattributes 文件，上传于北京时间2025年09月29日14时43分，未见其他相关内容或模型文件。目前尚不清楚该版本的具体功能和发布计划。编辑：15时07分，已经404，目前在分类中还能看到。来源：Hugging Face

DeepSeek发布V3.2-Exp实验模型，引入稀疏注意力机制

DeepSeek正式发布V3.2-Exp实验版模型，这是其下一代架构的中间步骤。该模型在V3.1-Terminus基础上引入了DeepSeek稀疏注意力（DSA）机制，旨在探索和验证长文本场景下的训练与推理效率优化。
DSA实现了细粒度稀疏注意力，在保持模型输出质量几乎不变的情况下，显著提升了长文本处理的计算效率。在多个公开基准测试中，V3.2-Exp展现了与V3.1-Terminus相当的性能表现，标志着DeepSeek在高效Transformer架构研究方面的新进展。

来源：HuggingFace