深度求索突击发布R2模型 中国AI逆势突围引发全球芯片博弈
中国AI独角兽深度求索(DeepSeek)正加速推出新一代R2大模型,原定5月的发布日期或将提前。这家由高飞量化创始人梁文峰创立的神秘公司,凭借仅用1.2万块英伟达A100芯片训练出对标OpenAI的R1模型,引发全球资本市场巨震後,再次以"成本杀手"模式冲击行业格局。据悉,R2将突破英语推理限制并提升代码能力,其采用的混合专家架构(MoE)使訓練成本仅为欧美同行的2-3%。尽管中国证监会曾对该公司囤积芯片行为提出质疑,但随美国2022年实施A100芯片禁运,深度求索提前部署的算力优势获得政府背书。国家发改委数据显示,已至少有13个地方政府和10家能源央企部署其AI系统,百度、腾讯等科技巨头亦接入其技術。但该公司的迅速崛起引发多国警觉,意大利、韩国近期以隐私风险为由下架其應用,美国AI企业Scale AI更指控其秘密持有5万块高端芯片。在梁文峰确认"芯片断供是企业最大挑战"的背景下,这场全球算力竞赛正演变为人工智能时代的地缘政治角力场。
来源:路透社
中国AI独角兽深度求索(DeepSeek)正加速推出新一代R2大模型,原定5月的发布日期或将提前。这家由高飞量化创始人梁文峰创立的神秘公司,凭借仅用1.2万块英伟达A100芯片训练出对标OpenAI的R1模型,引发全球资本市场巨震後,再次以"成本杀手"模式冲击行业格局。据悉,R2将突破英语推理限制并提升代码能力,其采用的混合专家架构(MoE)使訓練成本仅为欧美同行的2-3%。尽管中国证监会曾对该公司囤积芯片行为提出质疑,但随美国2022年实施A100芯片禁运,深度求索提前部署的算力优势获得政府背书。国家发改委数据显示,已至少有13个地方政府和10家能源央企部署其AI系统,百度、腾讯等科技巨头亦接入其技術。但该公司的迅速崛起引发多国警觉,意大利、韩国近期以隐私风险为由下架其應用,美国AI企业Scale AI更指控其秘密持有5万块高端芯片。在梁文峰确认"芯片断供是企业最大挑战"的背景下,这场全球算力竞赛正演变为人工智能时代的地缘政治角力场。
来源:路透社