探究计算复杂性理论,打破模型浅层结构,重构推理建模范式|来自Hierarchical Reasoning Model的尝试
人脑在进行复杂推理时,并不是一个统一的处理器在工作,而是展现出一种层级化和多时间尺度的特性。比如,我们大脑中负责战略规划的高级区域思考得比较“慢”,负责处理具体细节的区域则运转得非常“快”。
因此,这篇论文的核心动机是:我们能否借鉴人脑这种“快慢结合、层级分明”的计算模式,设计一种新型的AI架构,让它能够真正地进行“深度思考”,从而摆脱对CoT“拐杖”的依赖,高效地解决复杂的推理任务。
source
人脑在进行复杂推理时,并不是一个统一的处理器在工作,而是展现出一种层级化和多时间尺度的特性。比如,我们大脑中负责战略规划的高级区域思考得比较“慢”,负责处理具体细节的区域则运转得非常“快”。
因此,这篇论文的核心动机是:我们能否借鉴人脑这种“快慢结合、层级分明”的计算模式,设计一种新型的AI架构,让它能够真正地进行“深度思考”,从而摆脱对CoT“拐杖”的依赖,高效地解决复杂的推理任务。
source