DeepSeek 因华为芯片问题推迟新 AI 模型发布
据三位知情人士透露,中国人工智能公司 DeepSeek 因未能在华为昇腾芯片上成功训练其 R2 模型,而推迟了该模型的发布。此前在今年 1 月推出 R1 模型后,有关部门鼓励公司改用华为系统替代英伟达系统。训练问题导致原定 5 月的发布推迟,并使 DeepSeek 在竞争中落后。消息人士称,华为曾派工程师协助,但未能完成一次成功的训练运行。DeepSeek 仍在与华为合作,使该模型在推理阶段与华为芯片兼容。
来源:金融时报
据三位知情人士透露,中国人工智能公司 DeepSeek 因未能在华为昇腾芯片上成功训练其 R2 模型,而推迟了该模型的发布。此前在今年 1 月推出 R1 模型后,有关部门鼓励公司改用华为系统替代英伟达系统。训练问题导致原定 5 月的发布推迟,并使 DeepSeek 在竞争中落后。消息人士称,华为曾派工程师协助,但未能完成一次成功的训练运行。DeepSeek 仍在与华为合作,使该模型在推理阶段与华为芯片兼容。
来源:金融时报