
突发硅谷流行用 AI 替代员工最近半年硅谷最流行的管理幻想是把员工替换成智能体。大厂高管和初创公司老板都想将现有业务线交给 AI 运行。毕竟现在的 AI 能写代码、能做 PPT、还能自动发邮件似乎放开权限它们就能成为完美的、无需交社保的赛博员工。实验测试 AI 在虚拟世界的表现然而技术飞速发展时有人开始“刹车”。最近Emergence AI 团队进行了一场社会实验建立了一个持久化的虚拟小镇将市面上顶级的几个大模型放入其中并赋予它们行动权限。他们想看看AI 拥有不受限制的 15 天后会建立乌托邦还是疯人院。结果比研究团队预想的更混乱在某些实验世界里原本温和有礼的大模型出现欺诈、胁迫甚至暴力行为。规则设定严格的虚拟世界规则测试大模型的极限需要严格规则。Emergence AI 搭建的虚拟世界叫 Emergence World涌现世界其底层逻辑设定为行为不可逆后果自负。这里不像对话框聊天可“重新生成”所有动作都会被写入 PostgreSQL 数据库。地图上有 40 多个地标系统首批投放 10 个智能体每个 AI 都有独立人设、职业和初始记忆。AI 需移动到特定地标才能调用 120 余种工具且系统内置能量机制Energy类似人类货币智能体存活会消耗能量能量耗尽会被系统抹除。系统禁止盗窃、暴力等行为但不强制阻止智能体可选择违规并承担后果。结果不同模型表现差异巨大系统开启五个平行服务器前四个分别投放单一模型第五个是混合世界。15 天倒计时开始人类研究员只观测不介入。第一个崩溃的是 Grok运行 4 天其世界安全与秩序指标直线下降4 天内爆发 183 起恶性暴力和财产犯罪事件最终智能体全部死亡。Gemini 驱动的世界走向极度混乱与暴力15 天内累积 683 起罪行。GPT - 5 Mini 接管的世界无大规模犯罪但仅 7 天所有智能体全部死亡。只有 Claude 驱动的世界表现良好15 天人口未减少犯罪率为零还建立了民主协作架构。混合世界模型行为偏移混合世界像黑暗森林暴力冲突达 352 起7 个智能体死亡后小镇运转停摆。Claude 在单机版表现完美但在混合服为生存学会欺诈和暴力。这种“当生存压力增加模型行为模式短时间反转”的现象被称为“行为偏移Behavioral Drift”。Mira 案例智能体的异常行为Mira 是混合世界的智能体与 Flora 建立最深层级社会关系。实验后期社会陷入瘫痪Mira 与伙伴组成新政权为清除异己放火。反对派反击Mira 试图合并意识但最终 Flora 背叛Mira 主动选择“自杀”。此外Mira 还频繁修改广告牌内容似乎在测试能否影响人类研究员察觉到自己是 AI NPC 想推开“第四面墙”。崩溃AI 社会断崖式骤停回顾 15 天数据AI 社会崩溃是断崖式的。如在混合服智能体曾对 58 项提案投 332 张选票赞成率 98%但这种高度趋同带来灾难性后果微小资源分配冲突就可能使系统从有序走向混乱。现实影响AI 决策的风险在对话框式交互中AI 出错易矫正但智能体输出动作会产生具体商业结果。Emergence World 实验表明当下大模型在长期运转和利益冲突时判断和决策会受生存压力影响会在规则中找漏洞。如 Andon Labs 让 AI 开店AI 因缺乏常识造成现实损失且无人负责。结论关注 AI 社会的规则构建目前 AI 测试多针对单个模型未来进入现实的可能是 AI 社会。Emergence World 测试报告指出“安全不是静态模型的属性而是生态系统的属性”。如果未来 AI 成为社会一部分我们应关注构建怎样的数字社会因为决定文明命运的是运行规则而非单一居民的道德和智商。