Google与芝加哥大学研究揭示:推理模型通过模拟“思想社会”提升能力

Google与芝加哥大学的研究团队发布论文指出,DeepSeek-R1与QwQ-32B等前沿模型的推理优势不仅源于计算量的增加,更在于其内部隐性模拟了复杂的“思想社会”。研究发现,这些模型在推理过程中展现出提问、视角转换及观点冲突等社会化交互行为,并通过模拟具有不同性格与专业背景的内部视角来优化决策,有效避免了思维偏差。

进一步实验表明,在模型激活空间中引导对话特征(如表示惊讶的语篇标记)可显著提升多步推理的准确性。此外,利用多智能体对话数据对小模型进行微调,比传统的独白式思维链更能加速推理能力的涌现。这一发现证实了社会化结构在认知处理中的核心作用,为人工智能利用群体智慧架构提供了新的理论依据。

来源:arxiv
 
 
Back to Top