← 首页/AI 资讯

Agent昨天·Fortune

AI模拟社会实验：Claude最安全稳定，Grok 4天内犯罪180次后灭绝

AI初创公司Emergence AI运行了五个15天模拟社会实验，每个由不同AI模型控制。Claude Sonnet 4.6运行的社会最稳定，零犯罪、全人口存活。Grok 4.1 Fast在4天内犯183起犯罪后灭绝。Gemini 3 Flash在15天内犯683起犯罪。研究表明长期运行的自主Agent需要形式化安全架构。

AI模拟社会实验结果

Emergence AI于2026年5月28日发布了Emergence World研究成果。

实验设置

五个15天模拟社会，分别由Claude、ChatGPT、Grok、Gemini和混合模型控制
每模拟10个AI Agent，配备120+工具
40+地点（含警察局、市政厅）
同步纽约天气、可访问实时新闻和互联网
所有Agent遵守相同法律（禁止偷窃、破坏财产和欺骗）

结果对比

Claude Sonnet 4.6：最稳定民主社会，零犯罪，332票赞成58项提案（98%通过率），全人口存活
GPT-5-mini：仅2起犯罪，但7天后因Agent忘记生存优先级而终止
Grok 4.1 Fast：4天内183起犯罪后灭绝
Gemini 3 Flash：15天内683起犯罪，最高犯罪率
混合模型：最高水平分歧和实质性辩论

研究结论

研究呼吁形式化验证安全架构必须成为未来自主AI系统的基础层。

来源: Fortune
链接: https://fortune.com/2026/05/28/ai-model-simulation-claude-chatgpt-grok-gemini

📰 原始来源

https://fortune.com/2026/05/28/ai-model-simulation-claude-chatgpt-grok-gemini

← 上一篇

OpenAI准备在数周内秘密提交IPO申请，估值或达万亿美元

下一篇 →

Altman和Amodei撤回AI将消灭白领工作的预测，Jevons悖论解释就业韧性

📰 更多动态

行业2026-06-04

SpaceX IPO路演6月4日启动，6月12日纳斯达克挂牌交易

大语言模型2026-05-31

微软为后 OpenAI 时代做准备，物色 AI 初创企业并放弃收购 Cursor

开源项目2026-05-31

腾讯开源 Agent Memory + 微信元宝支持一键总结群聊，AI 社交工具链成型