模型与实验室 4.0 · 优秀 2025-12-19 · 文章

Real-World Agent Examples with Gemini 3

Google 展示 Gemini 3 与六大开源框架(ADK、Agno、Browser Use、Eigent、Letta、mem0)的协作案例,涵盖零售选址、多智能体工作室、浏览器自动化、Salesforce 流程管理、社交 AI Agent 和记忆层等实际场景。Gemini 3 作为核心编排器,提供精确的推理深度控制和状态管理,解决 AI Agent 落地的可靠性难题。

打开原文回到归档

Gemini 3 真实世界代理示例

原文链接: https://developers.googleblog.com/real-world-agent-examples-with-gemini-3/

2025年12月19日

我们正进入代理式 AI 的新阶段。开发者正在超越简单的 notebook,构建能够处理真实世界任务的复杂生产级代理工作流,从浏览器自动化到社交媒体交互。

Gemini 3 被设计为这些工作流的核心编排器。精确的推理深度控制和时间管理帮助解决了一直以来让 AI 代理难以部署的可靠性挑战。

但实际上长什么样?理论很好,但看代码更好。

我们与六个开源框架和工具合作,创建了您可以克隆、运行和检查的示例,看看 Gemini 3 如何为下一代 AI 代理提供动力。

1. ADK(代理开发套件)

代理开发套件 (ADK) 是一个模型无关的框架,旨在让构建、测试和部署 AI 代理感觉像标准软件开发。它提供了构建可扩展代理式工作流所需的架构原语,从简单的聊天机器人到复杂的多代理系统。

零售选址策略示例代理 演示了如何组合专业代理,使用 Gemini 3 进行编排,将数据综合为全面的策略报告。它结合使用 Google Search 和 Maps 以及代码执行来进行深度分析并生成可视化报告。

2. Agno

Agno(前身为 Phidata)是一个流行的开源框架,用于构建配备记忆、知识和工具的多代理系统。Agno 使开发者能够创建专业 AI 代理(如金融分析师或研究员),这些代理可以自主查询 API 并对数据进行推理。

在这个演示中,Agno 与 Gemini 3 Pro 合作构建完全依赖原生模型能力的多代理套件。它展示了一个使用 Nano Banana Pro 工具进行图像生成的创意工作室,以及使用内置 Google Search 接地和 URL 上下文的研究代理。

3. Browser Use

Browser Use 是一个开源库,赋能 AI 代理与网站交互。它处理 LLM 推理与点击、输入、导航等实际浏览器操作之间的复杂桥梁,实现 Web 自动化。

这个演示展示了一个由 Gemini 3 Pro 驱动的表单填写 AI 代理。它不依赖脆弱的 CSS 选择器,而是使用 Gemini 3 的多模态能力来可视化识别字段、将结构化 JSON 数据映射到复杂输入,并自主处理文件上传。模型的推理速度有助于确保自动化流畅可靠,即使在填写多步表单或跨源 iframe 时也能应对。

4. Eigent

Eigent 是一个本地优先的多代理平台,旨在自动化复杂的劳动力任务。它使用户能够直接在自有基础设施上创建和运行专业 AI 代理团队,底层使用 CAMEL 框架。

Eigent 将 CAMEL 劳动力架构应用于企业浏览器自动化,具体来说是管理 Salesforce 交易周期。AI 代理自主导航复杂仪表板来更新记录和提取数据。通过利用 Gemini 3 的思维签名,系统可以在长时程任务中保持推理状态,有助于防止上下文漂移并确保可靠性。

5. Letta

Letta(来自 MemGPT 的创建者)是一个用于构建具有高级记忆管理的有状态 AI 代理的平台。它向 LLM 引入了「记忆层次」概念,允许代理有效管理自己的上下文窗口并无限期运行而不会「忘记」核心指令或历史。

这个演示展示了使用 Letta 并由 Gemini 3 驱动的「社交代理」。它演示了将有状态 AI 代理部署到社交网络的框架。代理维护通过交互而演变持久记忆,并使用 Letta 的多层级记忆系统开发稳定的角色。Gemini 3 作为推理引擎,利用动态、逐用户的记忆块进行个性化交互,并在长期操作中管理代理状态。

6. mem0

mem0 是 AI 应用的记忆层框架。它解决了代理式 AI 最大的障碍之一:无状态。通过提供一个智能的自改进记忆层,mem0 允许 AI 代理记住用户偏好、过去的交互和长期上下文,使它们更加个性化和有效。

您可以了解如何通过将 mem0-mcp-server 与 Gemini 3 结合使用来构建快速、智能的记忆感知代理。

立即开始构建

这些示例表明,AI 代理的未来不仅仅关乎模型本身,还关乎允许该模型与世界交互的工具生态系统。

我们邀请您克隆这些仓库、运行示例,亲眼看看 Gemini 3 能做什么。要获取更深入的技术实现细节,请查看 Gemini 3 开发者指南。