Gemini 3.5 Flash 的电脑使用功能
Computer use in Gemini 3.5 Flash

原始链接: https://blog.google/innovation-and-ai/models-and-research/gemini-models/introducing-computer-use-gemini-3-5-flash/

为了降低智能体在实际运行环境中面临的部分提示注入风险,我们在 Gemini 3.5 Flash 的计算机使用功能中采用了针对性的对抗训练。我们还发布了两个可选的企业级保障系统,支持企业实现以下功能:要求用户针对敏感或不可逆的操作进行明确确认;若检测到间接提示注入,则自动停止任务。我们鼓励开发者采取“深度防御”策略,将这些功能与安全沙箱、人工介入验证及严格的访问控制相结合。有关安全措施的更多信息,请参阅我们的最佳实践文档。我们已经看到客户通过计算机使用功能获得了实际价值,以下是部分客户的反馈:

这篇 Hacker News 讨论聚焦于谷歌近期关于 Gemini 1.5 Flash“计算机使用”(Computer Use)功能的博文。 用户对谷歌的营销宣传持怀疑态度,指出在提供的性能图表中,尽管视觉呈现上显示谷歌胜出,但 Gemini 的实际表现其实逊于 Claude 3.5 Opus 和 GPT-4o(评论者称其为 5.5)等竞争对手。 除性能指标外,对话还强调了显著的功能局限性。用户指出,官方 Gemini 网络应用不支持模型上下文协议(MCP),这阻碍了该模型与外部工具及现实数据进行有效交互的能力——例如通过图像分析筛选特定租赁条件。由于这些限制,一些高级用户更倾向于使用基于命令行的替代方案,而非官方 Gemini 界面,这凸显了市场对官方产品进行更深层集成及实现更好功能对齐的强烈需求。
相关文章

原文

To mitigate some of the prompt injection risks for agents operating in live environments, we use targeted adversarial training for computer use in Gemini 3.5 Flash. We’re also releasing two optional enterprise safeguard systems that enable enterprises to:

  • Require explicit user confirmation for sensitive or irreversible actions.
  • Automatically stop tasks if an indirect prompt injection is identified.

Taking a “defense-in-depth” approach, we encourage developers to combine these features with secure sandboxing, human-in-the-loop verification and strict access controls. Additional information on safety measures can be found in our best practices documentation.

We are already seeing customers drive value with computer use. Here’s what some of them have to say:

联系我们 contact @ memedata.com