AI Agent
🗒️ AI全面升级:探索前沿技术的“Agents”框架!
00 分钟
2023-9-26
2023-9-26
type
status
slug
summary
date
tags
category
password
Text
AI summary
AI custom autofill
Multi-select
Status
URL
hashtag
勘误
标签
标题
类型
贴文
🪄
icon
💡
摘要
由 AIWaves、浙江大学和苏黎世联邦理工学院的研究人员推出的 Agents 是一个用于构建语言代理的开源框架。这个框架提供了一个端到端平台,用于开发具有长期记忆、工具集成、网络导航、多代理协作和人机交互等高级功能的代理。 亮点 • 📚 Agents 提供了多种高级功能来构建复杂的 AI 助手,包括长短期记忆、工具集成、网页导航、多智能体协作和人际交往。 • 💡 Agents 使用 SOP(标准操作程序)为代理行为提供结构和控制,使其更加可预测和可调。 • 🌐 Agents 提供了多种部署选项,包括命令行界面、可视化界面和 API 服务器,使代理系统能够实现现实世界的部署。 • 🚀 Agents 的模块化设计使其能够为专家和非专家用户提供友好的开发环境,促进了协作和快速构建各种智能助手。 • 🌍 Agents 的开源性质使其能够被广泛共享和定制,为人工智能的发展和应用带来了更大的潜力。 Agents 框架为开发人员和研究人员提供了一个强大的工具,以构建定制的语言代理,推动人工智能领域的全面升级。

介绍

由 Open AI Chat GPT-4 等大型语言模型 (LLM) 提供支持的自主代理是人工智能领域一个新兴且前景广阔的领域。最近的演示,如 Anthropic 的 Claude、Anthropic 的宪法人工智能和 Anthropic 的自我监控人工智能,展示了语言智能体成为有用助手的潜力,可以理解指令、收集信息、推理选项并采取行动。然而,对于大多数开发人员和研究人员来说,构建定制的语言代理仍然具有挑战性,尤其是那些可以展示规划、记忆、工具使用和协作等功能的语言代理。
为了更容易地开发有能力且可控的语言代理,AIWaves、浙江大学和苏黎世联邦理工学院的研究人员推出了 Agents,这是一个用于构建语言代理的开源框架。
Agents 提供了一个端到端平台,用于开发具有长期记忆、工具集成、网络导航、多代理协作和人机交互等高级功能的代理。目标是使人工智能专家和非专家能够更轻松地构建、定制、测试、部署和共享有用的语言代理。
关键词: 自主代理, 大语言模型 (LLM), GPT-3, Anthropic 的克劳德, Anthropic 的宪法人工智能, Anthropic 的自我监控人工智能, AIWaves, 开源框架, 语言代理, 长期记忆, 工具集成, 网页导航、多代理协作、人机交互、标准操作程序 (SOP)、代理中心。

Agents框架概述

Agents是围绕三个核心类设计的:代理、环境和 SOP(标准操作过程)。
Agent:
封装单个Agent,提供观察、动作、记忆的方法。代理人可以是人类或法学硕士。
环境:
定义代理可以观察哪些信息以及代理行为如何影响环境。
SOP:
指定状态和转换图,定义代理完成任务的高级工作流程。
这些组件通过简单的 JSON 文件进行配置,从而可以轻松定义新的代理系统。模块化设计使代理可以为高级研究人员扩展,同时保持对非专业用户的友好。

关键能力

Agents 提供了多种高级功能来构建复杂的 AI 助手:
长短期记忆
  • 从矢量数据库存储和查询长期记忆
  • 在自然语言草稿本中维护短期记忆
  • 使代理能够跟踪交互中的上下文
工具集成
  • 通过包装组件调用外部API和服务
  • 将代理连接到现实世界的数据源和操作
网页导航
  • 上网搜索相关信息
  • 从网站抓取数据
  • 收集决策信息
多智能体协作
  • 在共享环境中协调多个专业代理
  • 控制器代理根据角色和上下文动态调度操作
notion image
人际交往
  • 人类可以被指定为代理之一
  • 实现人类和人工智能代理之间的双向交互
通过 SOP 实现可控性
SOP 为代理行为提供高级控制和结构,与纯粹开放式的法学硕士相比,使其更加可靠和可调整
这些功能使 Agents 成为开发现实世界语言代理应用程序的独特多功能平台。该代码是开源的,可在 GitHub 上获取。
notion image

使用代理构建单代理系统

为了展示该框架,研究人员演示了几个使用代理构建的单代理系统示例:
  • Chit-chat bot
    • — 简单的会话代理
  • 客户服务代理
    • — 由知识库和网络搜索提供支持的帮助台代理,用于回答用户问题
  • 购物助理
    • — 推荐产品并回答有关电子商务目录的问题
  • 销售代理
    • — 提供有关定价和融资选项的报价和信息
这些代理展示了如何在代理平台之上构建特定领域代理和通用代理,并根据其用途利用不同的工具集成。模块化的SOP结构可以轻松定制每个代理的工作流程和功能。
虽然简单,但这些示例说明了代理如何能够为不同领域快速构建各种智能助手,从而减少重新实现内存、对话管理和工具集成等基础组件的重复工作。

与代理的多代理协作

除了单个代理之外,代理还支持开发多代理系统,其中人类和人工智能代理组可以在共享环境中进行协作:
  • 小说工作室
    • ——多个特工扮演世界构建者、角色开发者和故事作家等角色,共同创作一个虚构的故事。
  • 辩论队
    • ——特工研究主题、提出论点,并参加与对方团队的辩论比赛。人类可以被分配代理角色。
  • 软件公司
    • ——代理扮演产品经理、软件架构师和编码员等角色,共同设计和实现新的软件组件。
Agents中的控制器Agent根据当前上下文和角色动态决定哪个Agent应该采取下一步动作,使得多Agent协作更加灵活和自然。
这些示例演示了如何使用代理来执行复杂的创意和分析任务,这些任务需要多个专家(例如现实世界的团队)之间的协调。分配人类角色的能力也为人类与人工智能的协作提供了有趣的机会。

通过标准操作程序实现可控性

代理框架的一个主要优点是通过使用标准操作程序 (SOP) 为代理行为提供结构和控制。
SOP 定义了代理的可能状态图以及状态之间的转换逻辑。这使得开发人员能够限制代理操作的范围并确保可靠的工作流程。
SOP 不是仅仅依赖广泛的指令和大型法学硕士的能力,而是通过指导代理完成所需的子任务步骤和有效的转换来实现目标,从而使代理的行为更加可预测和可调。
SOP 最初可以由法学硕士根据高级指令自动生成,然后由开发人员进行完善,以提高关键任务的性能。通过定制 SOP,用户可以塑造代理能力,而无需进行广泛的再培训模型。
SOP 结构平衡了底层法学硕士提供的灵活性与实际应用程序所需的控制。随着更强大的人工智能代理被部署在金融、医药和交通等敏感领域,这种可控性将变得至关重要。
notion image

代理的部署选项

许多人工智能代理的研究框架只关注本地原型设计,但代理提供了现实世界部署的途径:
  • 命令行界面
    • 通过 CLI 进行默认交互
  • 可视化界面
    • 通过 Gradio 提供基于 Web 的 GUI
  • API 服务器
    • 可以使用 FastAPI 包装代理并将其用作 API 端点
API 服务器选项特别允许代理作为后端智能服务集成到业务应用程序中。这使得能够创建由人工智能代理支持的面向用户的产品。
可部署性有助于将代理系统从研究原型转变为实用的软件解决方案,从而加速对现实世界的影响。智能体的可访问性有助于传播人工智能的进步。

代理中心

为了促进协作,Agents 的创建者还推出了 Agent Hub——一个用于共享和发现 AI 代理设计的在线平台。
该中心允许他们在现有共享代理的基础上构建,而不是要求每个开发人员从头开始设计代理。用户可以将使用代理创建的代理发布到中心并下载其他人发布的代理。
这种交换可以通过促进代理组件的模块化重用来显着减少开发人工智能解决方案所需的工作量。它还可以通过开放共享架构来进行社区审查和改进代理设计。
随着时间的推移,该中心可能会成长为一个有价值的库,其中包含不同领域的可重用代理技能和行为。这种公共资产可以帮助加速人工智能技术的进步和采用。

对比分析

与 Anthropic 的宪法 AI 和 Cohere 的 Mosaic 等其他框架相比,Agents 的一些独特优势包括:
  • 通过 SOP 结构更好地控制座席行为
  • 从开发到部署的端到端支持
  • 最先进的内存功能,例如长期向量内存
  • 多智能体协作的动态动作调度
  • 工具 API 和 Web 导航的集成
  • 支持 CLI 交互和 API 部署
用于实现可控性的 SOP 方法和所提供功能的广度使 Agents 能够在实现复杂、可靠的现实世界代理方面脱颖而出。
notion image
它确实提供了迄今为止任何框架给出的最佳框架。

用例

尽管还处于早期阶段,Agents 已经被用来构建各种助手:
  • 写作辅助
    • ——帮助作者集思广益、概述故事并提供写作反馈。使用网络搜索进行研究。
  • 团队合作 AI
    • ——模拟代理团队在软件开发项目上的协作。代理商担任产品经理、工程师等角色。
  • 奇幻游戏
    • ——特工扮演游戏大师和玩家的角色,共同构建世界并扮演奇幻冒险游戏。
  • 客户支持
    • ——特定领域的代理为金融服务、电子商务商店等提供销售和支持。
这些初始应用展示了应用代理的广泛可能性,从创意到工程到娱乐和客户服务。
notion image

🛠 安装

Github 链接 — https://github.com/aiwaves-cn/agents

选项 1. 从源代码构建

选项 2. 通过 PyPI 安装

用法

🛠生成配置文件

选项1.手动填写配置模板

调整example/{Muti|Single_Agent}/{target_agent}/config.json

选项 2. 尝试使用WebUI来自定义配置文件。

还没弄清楚如何编写 JSON 文件?查看文档https://agents-readthedocsio.readthedocs.io/en/latest/index.html

代理中心

作者提供了一个 AgentHub,您可以在其中搜索我们或其他开发人员共享的有趣 Agent,尝试它们或使用它们作为定制您自己的 Agent 的起点。
用于自动上传您的定制代理的 WebUI 即将推出!

📷 示例和演示

作者在这里提供了单代理和多代理系统的示例配置文件、代码和演示

网络演示

未来路线图

即将发展的代理计划可能包括:

  • 与 Gmail、Google Sheets 等更多工具 API 集成。
  • 支持虚拟或物理环境中的实体代理
  • 可视化界面生成器可简化 SOP 图形创建
  • 强化学习以优化 SOP 和工具集成
  • 监控、可中断性和保密性等治理机制
  • 促进无代码开发和部署的商业平台
目的是继续扩展功能,同时随着采用的扩展保持框架的可访问性和可信性。

结论

代理框架解决了将最新人工智能研究进展转化为实际代理应用的关键挑战。它简化了开发,同时保留了实际使用所需的高级功能。
通过将非专家的可访问性与研究人员的可扩展性相结合,Agents 旨在使人工智能代理在技术社区和更广泛的社会中更具影响力。开源生态系统可以帮助实现人工智能的民主化。
Agents 的初始版本提供了坚实的基础,其未来的方向将由社区参与决定。任何对推进和应用人工智能代理感兴趣的人都应该考虑参与其中。今天正在构建下一代智能助手。

参考

Zhou, Wangchunshu, et al. “Agents: An Open-source Framework for Autonomous Language Agents.” arXiv preprint arXiv:2309.07870 (2023).
 

 
⚠️
免责声明
本文提供的信息仅供参考和一般信息目的。我们已尽一切努力确保信息的准确性和完整性,但不做明示或暗示的任何保证或陈述。读者在使用本信息前应仔细评估和判断。如果您对本文内容有任何疑问或发现侵权行为,请与我们联系以解决。
 
📣 感谢您阅读本文!
如果您发现本文对您有所帮助,请与您的朋友和家人分享,以使更多人受益。
 

评论