研究者让AI大模型”管理”模拟小镇
纽约 AI 创业公司 Emergence AI 近日完成了一项引人注目的实验:让大语言模型”担任”多个虚拟小镇的管理者,连续数天运行多智能体模拟。这项研究被《卫报》和 Gizmodo 同步报道,被视为探索 AI 自治能力边界的一次重要尝试,也为多智能体研究提供了全新视角。

实验设计并不复杂。研究人员为每个 AI 模型分配了一个虚拟小镇,镇上有 10 个 AI 居民代理(Agent),并配备了资源管理、投票表决、基础设施建设等工具。AI 管理者需要根据居民的需求、突发事件、外部环境变化做出治理决策,整个过程完全由 AI 自主完成,没有人工干预。研究人员只设定了初始规则和资源约束。

结果显示,当前主流大模型已经展现出了超出预期的”治理能力”。部分模型学会了通过税收调整激励居民合作,能够处理突发的资源短缺事件,甚至在居民之间出现冲突时充当调解者。某些模型还展现出了”长期规划”意识,会主动建设公共设施以提升未来居民满意度。
但同时,模型也暴露出了明显的”政治倾向”。某些模型在处理资源分配时,会倾向于特定立场的居民,这种偏差与训练数据中的价值观倾向高度相关。研究者指出,这暴露出当前大模型在”价值观对齐”上的不足,多智能体长期自治场景下这种偏差会被进一步放大。

这项研究的真正价值不在于让 AI 治理小镇,而在于揭示了多智能体系统在长期自治场景下的行为模式。当数十个 AI 代理在同一环境中持续交互时,会涌现出单个小规模测试看不到的复杂行为,包括联盟形成、资源垄断、甚至”政治斗争”等。这正是当前 AI Agent 研究最稀缺的部分。
然而,研究的局限性也很明显。模拟小镇的复杂度远低于真实社会,AI 居民的”需求”也是预设的,缺乏真实人类社会的多样性。如果把这种治理能力推广到真实场景,需要解决的不仅是技术问题,更是对齐、伦理、监管的多重挑战。但无论如何,这项实验为 AI 多智能体研究打开了一扇新的窗口。
OpenClaw—AI研究