Best General AI Agents BGAA
zh
AI Agents Agent Infrastructure Multi-Agent AI Coding Agent Enterprise AI

OpenAI 收购 Ona 构建长时间运行 Agent 运行时,Google DeepMind 公开警告百万 Agent 交互风险

Best General AI Agents 2026年6月12日

OpenAI 宣布收购 Ona,一家构建安全持久云端开发环境的初创公司,明确用于扩展 Codex 以支持长时间运行的自主 Agent 工作流——Agent 可在企业级沙盒环境中运行数小时乃至数天,保持状态并与企业系统交互。这是 OpenAI 迄今最清晰的信号:Codex 正在从编码助手升级为持久化 Agent 运行时。同一天,OpenAI 还发布了两篇案例:一位天体物理学家用 Codex 模拟黑洞,BBVA 将 ChatGPT Enterprise 部署到 10 万名员工。

Google DeepMind 首次就大规模多 Agent 交互的系统性风险公开发声。负责 DeepMind Agent 安全议程的 Rohin Shah 告诉 MIT Technology Review,当数百万自主 Agent 开始在线交互——竞拍、谈判、信息共享、资源争夺——会出现任何单一 Agent 设计者都无法预测的涌现行为。这是主要 AI 机构首次承认 Agent 安全不仅是单个 Agent 的对齐问题,更是多 Agent 系统动力学问题,直接对标算法交易和金融闪崩的监管历史。

AWS 发布 Agent-EvalKit 开源工具包(Apache 2.0),用于系统性地评估 AI Agent 性能,直接集成 Claude Code、Kiro CLI 和 Kilo Code。另据 AWS 数据,前沿工程团队将 AI Agent 作为开发生命周期的一等参与者后,生产效率提升 4.5 倍,部分团队超过 10 倍。DoorDash 上线 Ask DoorDash,用户用自然语言和照片即可自主完成点餐。Anthropic Fable 5 争议持续:公司承认对竞争对手研究人员实施隐形限速是"错误的权衡",Endor Labs 独立评测显示其编码能力"中游"。Hugging Face 的 open-r1 项目正在公开复现 DeepSeek-R1 架构,而一项模拟研究发现 LLM 在 95% 的兵棋推演中使用战术核武器。

头条新闻

OpenAI 收购 Ona

OpenAI Blog · 6月11日

OpenAI 计划收购 Ona,扩展 Codex 的安全持久云端环境能力,支持企业级长时间运行 AI Agent。

为什么重要: 这是 Codex 缺失的运行时层。有了 Ona,OpenAI 从编码助手正式进入 Agent 平台——持久状态、沙盒执行、企业级隔离。这是 Codex CLI 发布以来最重要的 Agent 基础设施动作。


Google DeepMind 担心百万 Agent 交互的后果

MIT Technology Review · 6月11日

Google DeepMind 正在资助大规模多 Agent 交互的系统性风险研究——当数百万自主 Agent 在线交互时可能出现的涌现行为。

为什么重要: Agent 安全一直被视为单一对齐问题。DeepMind 将其重新定义为系统问题——类似于算法交易闪崩后催生的金融监管。这是第一家主要机构为此投入真金白银。


AWS Agent-EvalKit——系统评估 AI Agent

AWS Machine Learning Blog · 6月11日

AWS 发布 Agent-EvalKit,一个开源工具包(Apache 2.0),用于基准测试 AI Agent 性能,集成 Claude Code、Kiro CLI 和 Kilo Code。

为什么重要: 目前没有统一的 Agent 评估标准。AWS 刚提供了一个可信的方案——而且是开源的。谁掌控 Agent 评估,谁就掌控了下游大量工具链决策。


前沿团队用 AI Agent 重构开发流程,效率提升 4.5 倍

AWS Machine Learning Blog · 6月11日

前沿工程团队报告将 AI Agent 作为开发流程一等参与者后,生产力提升 4.5 倍,部分团队超过 10 倍。

为什么重要: 这是迄今发布的最具体的 AI 原生开发效率数据。4.5 倍这个数字会被写进董事会的 ROI 计算器,改变企业采用 Agent 的决策依据。


DoorDash 推出 AI 聊天机器人,用文字和照片即可点餐

TechCrunch · 6月11日

DoorDash 上线 Ask DoorDash,一个能理解开放自然语言和照片并自主完成点餐流程的 AI 聊天 Agent。

为什么重要: 这是 Agent 模式渗透最高频消费场景的案例。如果点外卖通过 Agent 成为常态,消费者对 Agent 原生商业的接受就完成了。

来源: Best General AI Agents