DeepSeek 发布新模型,扩展上下文并更新知识库

DeepSeek 已发布一款处于灰度测试阶段的新模型,包含多项关键升级:
上下文容量扩展:Token 上限从 128K 提升至 1M,接近提升 10 倍,足以处理《三体》三部曲等超长文本。
知识库更新:知识截止时间延长至 2025年5月(此前为 2024年7月),这意味着可能不仅仅是微调版本,而是一个全新的基础模型(可能为 DeepSeek-V4,尚待官方确认)。
免费使用:目前尚未推出付费方案。

该模型仍不支持视觉输入,仅支持文本和语音处理,依然为非多模态模型。

来源:Reddit / op7418 / MaxForAI
 
 
Back to Top