Agent 是 AI 范畴近期中最受存眷的热词之一。2024 岁尾,谷歌在宣布 Gemini 2.0 的同时夸大 Agentic era 的到来。2025 年终,谷歌团队宣布了 Agent 主题的白皮书,片面地先容了对于 Agent 的基础观点、与 LLM 的差别、中心架构、任务道理及在现实中的利用等。同时,在讲演中,还剖析了 Agent 与传统 LLM 之间的差别。讲演指出,Agent 是 LLM 在常识获取方法、会话治理才能、东西与逻辑层实现等方面才能的拓展,而 LLM 常识范围于练习数据,则无需这些才能。目次01. Agent 是什么?与传统的 LLM 有何差别?Agent 是什么?缘何而来?与传统的 LLM 哪些差别??对 Richard Sutton 推重的连续进修有何影响?02. Agent 详细是怎样任务的?为什么编排层才是中心?Agent 与外界情况停止交互的东西是什么?怎样更无效地晋升 Agent 的机能?03. Agent 怎样经由过程东西与情况停止交互?Agent 与外界情况停止交互的东西是什么?04. 交互情况过于庞杂怎样办?怎样晋升 Agent 的机能?怎样更无效地晋升 Agent 的机能?01 Agent 是什么?与传统的 LLM 有何差别?白皮书中具体先容了对于 Agent 的观点、中心架构以及任务道理。同时,在讲演中,还剖析了 Agent 与传统 LLM 之间的差别。讲演指出,Agent 是 LLM 在常识获取方法、会话治理才能、东西与逻辑层实现等方面才能的拓展,而 LLM 常识范围于练习数据,则无需这些才能。1、人类在处置庞杂义务时经常借助东西来弥补常识并得出论断,相似地,天生式 AI 模子也可被练习应用东西以获取及时信息或履行现实举动。比方,模子能应用数据库检索东西获取客户购置汗青等信息来天生特性化购物推举,或依据用户查问停止 API 挪用以发送邮件或实现金融买卖等。这种联合推理、逻辑跟外部信息拜访才能且与天生式 AI 模子相连的方法,引出了 Agent 的观点,即超出天生式 AI 模子自力才能的顺序。① Agent 为处理天生式 AI 模子在现实利用中的范围性供给了思绪,使得模子可能更好地应答庞杂义务,经由过程自立计划跟履行义务,以及与外部体系交互获取及时信息,年夜年夜扩大了模子的利用范畴跟才能界限,在浩繁范畴展示出潜伏的宏大代价,推进了 AI 技巧向更适用、更智能的偏向开展。2、Agent 的任务道理能够归纳综合为一个认知架构,这个架构包含三个中心组件:模子、东西跟编排层。① 模子是 Agent 的「年夜脑」,担任处置信息、天生决议跟输出成果。它能够是一个或多个言语模子,具有基于指令的推理跟逻辑框架才能。② 东西是 Agent 与外部天下交互的「四肢」,使 Agent 可能获取及时信息、履行现实操纵。③ 编排层则是衔接模子跟东西的「桥梁」,它担任治理信息流、决议进程跟义务履行的次序。3、 Agent 功效是基于模子功效的基本上,在常识获取方法、会话治理才能、东西与逻辑层实现等方面才能的拓展。① 模子的常识范围于其练习数据,而 Agent 经由过程东西与外部体系衔接,可能扩大常识范畴,获取及时信息,从而更好地应答多样化的义务需要。② 模子平日基于用户查问停止单次推理,除非专门请求,模子个别不斟酌会话汗青或持续高低文,而 Agent 可能斟酌会话汗青,基于用户查问跟编排层决议停止多轮推理,实现更连接、高低文相干的交互。③ 模子自身无原生东西实现跟逻辑层,用户需经由过程构建特定提醒或应用推理框架领导模子猜测;Agent 则原生实现了东西跟认知架构,应用如 CoT、ReAct 等推理框架或其余预构建的代办框架,使代办可能更自立、智能地履行义务。02 Agent 详细是怎样任务的?为什么编排层才是中心?在白皮书中,具体地先容了 Agent 的任务道理,包含怎样网络、处置信息以及决议下一步举措等。此中,讲演特殊提到,编排层是 Agent 认知架构的中心...... 存眷