微软在开源项目 VibeVoice 中发布并开源 VibeVoice-ASR
一个统一的语音转文本模型,目标是在一次推理中处理最长约 60 分钟的连续音频。该模型基于长上下文(官方描述为 64K token),在单次推理里联合完成语音识别、说话人区分与时间戳对齐,输出包含 Who(说话人)、When(时间戳)和 What(内容)的结构化转录结果
VibeVoice-ASR 支持用户自定义上下文/热词(如专有名词、技术术语、背景信息)以引导识别、提升领域内容的转录效果;官方提供在线 Playground 试用,并在 Hugging Face 发布权重(GitHub README 中标注为 “VibeVoice-ASR-7B”,模型卡显示约 9B 参数),许可证为 MIT。
huggingface
一个统一的语音转文本模型,目标是在一次推理中处理最长约 60 分钟的连续音频。该模型基于长上下文(官方描述为 64K token),在单次推理里联合完成语音识别、说话人区分与时间戳对齐,输出包含 Who(说话人)、When(时间戳)和 What(内容)的结构化转录结果
VibeVoice-ASR 支持用户自定义上下文/热词(如专有名词、技术术语、背景信息)以引导识别、提升领域内容的转录效果;官方提供在线 Playground 试用,并在 Hugging Face 发布权重(GitHub README 中标注为 “VibeVoice-ASR-7B”,模型卡显示约 9B 参数),许可证为 MIT。
huggingface
FlashLabs Chroma 1.0 发布
GitHub README 披露了模型结构:Reasoner 基于 Qwen2.5-Omni-3B,Backbone/Decoder 基于 Llama3,音频 codec 采用 24kHz 的 Mimi;项目声明模型语言为英文、许可证为 Apache-2.0。FlashLabs 于 2026 年 1 月 22 日宣布开源发布 Chroma 1.0,定位为“端到端、实时、speech-to-speech”的语音 AI 模型,并提供个性化语音克隆能力
Chroma 以“原生语音”方式工作,试图绕开传统“ASR→LLM→TTS”级联链路带来的延迟;其宣称端到端首响应时间(TTFT)低于 150ms,并在接入 SGLang 后可做到约 135ms。配套技术报告将关键机制归因于交错的文本-音频 token 调度(1:2)与流式生成;摘要给出的实验指标包括 Real-Time Factor(RTF)0.43,以及在说话人相似度上相对“人类基线”提升 10.96%。
Github
GitHub README 披露了模型结构:Reasoner 基于 Qwen2.5-Omni-3B,Backbone/Decoder 基于 Llama3,音频 codec 采用 24kHz 的 Mimi;项目声明模型语言为英文、许可证为 Apache-2.0。FlashLabs 于 2026 年 1 月 22 日宣布开源发布 Chroma 1.0,定位为“端到端、实时、speech-to-speech”的语音 AI 模型,并提供个性化语音克隆能力
Chroma 以“原生语音”方式工作,试图绕开传统“ASR→LLM→TTS”级联链路带来的延迟;其宣称端到端首响应时间(TTFT)低于 150ms,并在接入 SGLang 后可做到约 135ms。配套技术报告将关键机制归因于交错的文本-音频 token 调度(1:2)与流式生成;摘要给出的实验指标包括 Real-Time Factor(RTF)0.43,以及在说话人相似度上相对“人类基线”提升 10.96%。
Github
去年DeepSeek R1的论文刚出来时,引起英伟达短期大跌,我说是跌错了,因为这个开源模型其实是利好,加速了技术扩散,整个模型还是基于GPU的。
前几天DeepSeek刚发的Engram架构,我认为是不亚于R1的优秀论文,但却是对GPU真正的利空。因为它实现了将常识性的内容分流到CPU上,让GPU专注于深度思考,需要世界知识时再去CPU调用,大幅提升了模型的计算效率。
消融实验发现用20%的参数记忆知识,80%的参数计算推理,性能达到最佳,例如简单的问题“法国的首都是哪里?”,普通模型得GPU算到第20层才知道答案是巴黎,Engram模型在第2层去CPU查个表,就心里有数了。
xueqiu.com
长江电新
马斯克在世界经济论坛表示,Tesla和SpaceX将分别建设100GW光伏制造产能,预计用3年时间落地。
马斯克此次表态大超市场预期,一是Tesla近期审厂透露的产能规模是40-50GW,但实际目标翻倍增长;二是SpaceX落地100GW产能保障太空算力需求,预计其在7月上市将加速该目标实现;三是产能落地时间点明确,而且3年时间比市场预期更快。
马斯克在世界经济论坛表示,Tesla和SpaceX将分别建设100GW光伏制造产能,预计用3年时间落地。
马斯克此次表态大超市场预期,一是Tesla近期审厂透露的产能规模是40-50GW,但实际目标翻倍增长;二是SpaceX落地100GW产能保障太空算力需求,预计其在7月上市将加速该目标实现;三是产能落地时间点明确,而且3年时间比市场预期更快。
TikTok官宣美国方案,两公司共同运营,字节保留算法知识产权
北京时间1月23日,TikTok发布公告称,已成立TikTok美国数据安全合资有限责任公司(TikTok USDS Joint Venture LLC)。该合资公司将负责TikTok美国的数据保护、算法安全、内容审核及软件保障。公告提到,TikTok美国数据安全合资公司中,甲⻣⽂、银湖资本、MGX各持股15%。其他投资⽅包括海纳国际集团关联企业Vastmere战略投资有限责任公司、Alpha Wave Partners等多家企业。其中,字节跳动保留19.9%的股份,仍为合资公司最大单一股东。合资公司还将由一个七人组成的董事会管理,董事会成员包括TikTok CEO周受资等。
来源:同花顺
北京时间1月23日,TikTok发布公告称,已成立TikTok美国数据安全合资有限责任公司(TikTok USDS Joint Venture LLC)。该合资公司将负责TikTok美国的数据保护、算法安全、内容审核及软件保障。公告提到,TikTok美国数据安全合资公司中,甲⻣⽂、银湖资本、MGX各持股15%。其他投资⽅包括海纳国际集团关联企业Vastmere战略投资有限责任公司、Alpha Wave Partners等多家企业。其中,字节跳动保留19.9%的股份,仍为合资公司最大单一股东。合资公司还将由一个七人组成的董事会管理,董事会成员包括TikTok CEO周受资等。
来源:同花顺
阿里巴巴计划推动其人工智能芯片制造部门平头哥独立上市
阿里巴巴集团控股有限公司正准备将其芯片制造部门平头哥(T-Head)上市,以吸引投资者对少数几家渴望在热门的人工智能加速器业务领域与英伟达公司竞争的公司表现出的浓厚兴趣。
知情人士透露,阿里巴巴计划首先将该部门重组为一家部分由员工持股的公司。他们还表示,公司随后将考虑进行首次公开募股但具体时间和估值尚不明确。由于讨论的是内部计划,知情人士要求匿名。
bloomberg.com
阿里巴巴集团控股有限公司正准备将其芯片制造部门平头哥(T-Head)上市,以吸引投资者对少数几家渴望在热门的人工智能加速器业务领域与英伟达公司竞争的公司表现出的浓厚兴趣。
知情人士透露,阿里巴巴计划首先将该部门重组为一家部分由员工持股的公司。他们还表示,公司随后将考虑进行首次公开募股但具体时间和估值尚不明确。由于讨论的是内部计划,知情人士要求匿名。
bloomberg.com
欧洲议会暂停推进美欧贸易协议,抗议特朗普格陵兰相关举动
欧洲议会已决定暂停有关欧盟与美国贸易协议的工作,以抗议美国总统特朗普寻求控制格陵兰岛并威胁对反对其计划的欧洲盟友加征关税。许多议员抱怨美欧去年7月底在苏格兰达成的贸易协议失衡:欧盟需要削减大部分进口关税,而美国则继续维持普遍15%的税率。欧洲议会贸易委员会原定于1月26日至27日进行投票表决。但这一安排现已推迟。
来源:新浪财经
欧洲议会已决定暂停有关欧盟与美国贸易协议的工作,以抗议美国总统特朗普寻求控制格陵兰岛并威胁对反对其计划的欧洲盟友加征关税。许多议员抱怨美欧去年7月底在苏格兰达成的贸易协议失衡:欧盟需要削减大部分进口关税,而美国则继续维持普遍15%的税率。欧洲议会贸易委员会原定于1月26日至27日进行投票表决。但这一安排现已推迟。
来源:新浪财经
冰山指数
上周冰山70指数月环比 -0.89%,上上周 -1%,跌幅持续收窄。
其中收窄幅度最大的是一线城市,目前一线月环比 -0.51%,其中上海月环比 -0.3%,北京 -0.7%,深圳 -0.4%,广州 -0.7%,周环比来看上海已经止跌。
上周冰山70指数月环比 -0.89%,上上周 -1%,跌幅持续收窄。
其中收窄幅度最大的是一线城市,目前一线月环比 -0.51%,其中上海月环比 -0.3%,北京 -0.7%,深圳 -0.4%,广州 -0.7%,周环比来看上海已经止跌。
记者1月21日从国家税务总局上海市长宁区税务局获悉,上海寻梦信息技术有限公司(“拼多多”平台运营主体)未按照《互联网平台企业涉税信息报送规定》的要求报送涉税信息,被税务机关责令限期改正。企业虽已进行整改但未在规定期限内完成,该局依法依规对“拼多多”作出罚款10万元的处罚决定。
来源:第一财经
来源:第一财经
Anthropic CEO:向中国出口AI半导体等同于向朝鲜出售核武器
从事AI开发的美国初创企业Anthropic首席执行官达里奥·阿莫代伊日前表示,向中国出口AI半导体“就像把核武器卖给朝鲜一样”。他是在瑞士举行的世界经济论坛(WEF)年会(达沃斯会议)期间,接受美国彭博社采访时作出上述表态的。美国政府此前一直限制美国英伟达公司的AI半导体“H200”出口至中国,但美国总统特朗普在2025年12月突然转而允许出口。阿莫代伊表示:“这将对国家安全产生无法估量的影响。出口半导体是一个重大的错误”。
来源:日经新闻
从事AI开发的美国初创企业Anthropic首席执行官达里奥·阿莫代伊日前表示,向中国出口AI半导体“就像把核武器卖给朝鲜一样”。他是在瑞士举行的世界经济论坛(WEF)年会(达沃斯会议)期间,接受美国彭博社采访时作出上述表态的。美国政府此前一直限制美国英伟达公司的AI半导体“H200”出口至中国,但美国总统特朗普在2025年12月突然转而允许出口。阿莫代伊表示:“这将对国家安全产生无法估量的影响。出口半导体是一个重大的错误”。
来源:日经新闻