华为昇腾、寒武纪、海光信息适配DeepSeek最新模型
9月29日,深度求索公司正式发布新一代大语言模型DeepSeek-V3.2-Exp,并于HuggingFace平台同步开源,模型引入稀疏 Attention 架构,这种架构能够降低计算资源消耗并提升模型推理效率。
随后,华为昇腾、寒武纪、海光信息均同步宣布完成适配,其中昇腾实现0day支持并开源推理代码,寒武纪完成适配且开源推理引擎,海光信息达成无缝适配与深度调优,共同以软硬件协同助力国产AI生态发展。
来源:东方财富网
9月29日,深度求索公司正式发布新一代大语言模型DeepSeek-V3.2-Exp,并于HuggingFace平台同步开源,模型引入稀疏 Attention 架构,这种架构能够降低计算资源消耗并提升模型推理效率。
随后,华为昇腾、寒武纪、海光信息均同步宣布完成适配,其中昇腾实现0day支持并开源推理代码,寒武纪完成适配且开源推理引擎,海光信息达成无缝适配与深度调优,共同以软硬件协同助力国产AI生态发展。
来源:东方财富网