
工具:AI Agent 与世界交互的媒介,主要分为扩展程序(Extensions)、函数(Functions)以及数据存储(Data Stores)三类。基础模型尽管在文本和图像生成方面表现出色,但因无法与外界互动而受到限制。工具弥补了这一不足,使代理能够与外部数据和服务交互,并拓展了基础模型单独运行时无法实现的行动范围。据谷歌《Agents》白皮书,Google 模型能够与三种主要工具类型进行交互:扩展程序(Extensions)、函数(Functions)和函数(Data Stores)。扩展程序以标准化方式弥合了 API 和 Agent 之间的差距,使 Agent 能够无缝执行 API,而无需考虑其底层实现。函数通过分工提供更细致的开发者控制,允许 Agent生成可在客户端执行的函数参数。数据存储为 Agent 提供对结构化或非结构化数据的访问,从而实现数据驱动的应用程序。