昆仑万维「天工 SkyAgents」Beta 版全网测试

12月25日,昆仑万维AI Agents开发平台「天工SkyAgents」Beta版正式开放测试,用户可在 https://model-platform.tiangong.cn/立即体验。

昆仑万维「天工SkyAgents」AI Agents开发平台,基于昆仑万维「天工大模型」打造,具备从感知到决策,从决策到执行的自主学习和独立思考能力。用户可以通过自然语言构建自己的单个或多个“私人助理”,并能将不同任务模块化,通过操作系统模块的方式,实现执行包括问题预设、指定回复、知识库创建与检索、意图识别、文本提取、http请求等任务。

在大模型技术高速发展、AI Agents应用不断进步的当下,昆仑万维「天工SkyAgents」是我们在智能体领域的一次探索与尝试。这个平台也许并不完美,但我们希望与广大开发者们携手共建、互助成长,不断开拓人工智能技术的应用边界。现在不完美是为了未来的完美,我们一直在技术追求的过程中,坚信而勇于突破。

大模型时代,交互式AI有望成为未来大模型技术的主流落地方向。历史告诉我们,新兴事物的演进总会找到一个稳定的术语来描述这种载体,而AI Agents(智能体)已经显现出了巨大潜力。

目前,全球对智能体的关注异常热烈,OpenAI高度关注智能体领域,并在OpenAI dev day发布会上发布了自定义GPTs以及Assistance API;DeepMind的联合创始人最近也提到下一代人工智能技术的发展方向将是交互式AI,而不是生成式AI。这种交互式AI很大程度上与智能体的描述是相符的,用户可以通过要求智能体完成各种任务,而智能体则可以操作软件或与人类协作,完成复杂场景的工作。

在技术范式上,昆仑万维也在不断思考驱动智能体技术快速发展的底层技术和架构。我们同时也清楚地认识到,即使在大模型的语言交互能力的加持下,我们离一个完全可以自动做决策并执行任务的智能体还有距离。

今天,昆仑万维正式开放「天工SkyAgents」Beta版,作为我们在AI Agents技术能力和应用能力上的一次探索。我们希望通过此次探索,能让越来越多的用户与开发者能够将大模型技术应用到工作生活中,打造出满足日常需求、激发灵感创新的专属AI Agents。我们也希望更多对AI Agents感兴趣的朋友们能够与我们一同携手共创。欢迎广大伙伴们提出建议与意见。

Agent一般译为“智能体”或“代理”,其概念最早由麻省理工学院人工智能实验室(MIT AI Lab)创始人之一Marvin Minsky在其1986年出版的《思维的社会》一书中提出。它由社会与社会行为概念被引入计算系统内,指的是在某一环境下,能持续自主地发挥作用的计算实体。

AI Agents指的则是由人工智能技术驱动,能够感知环境、进行决策和执行动作的智能实体。

AI Agents并不是一个新兴的概念,自人工智能技术学科建立以来,就陆续有围绕AI Agents的研究出现。2012年深度神经网络浪潮兴起后,有一支以强化学习训练AI Agents的学术派系诞生,轰动全球的围棋机器人AlphaGo可以看作是这一流派的研究成果。不过,此类AI Agents更适合对抗性游戏场景,在真实世界中较难落地。

然而,大模型的出现改变了这一切。

2023年,随着大模型技术在自然语言理解、工程能力、数据能力、存储能力等领域的突破,大量对话交互类“GPT”涌现,以大模型技术驱动的AI Agents在通用性、实用性、可落地性等都得到了飞速发展,在全球掀起了又一阵AI Agents热潮。

传统大模型应用大多基于Prompt(用户提示词)实现,Prompt的质量将直接影响大模型的回答效果,缺乏提示词工程能力的普通用户难以将大模型的真正能力发挥到极致。而AI Agents只需要用户给定工作目标,就可以通过独立思考、调用工具去逐步完成任务,极大降低大模型技术应用门槛。

根据复旦大学论文《The Rise and Potential of Large Language Model Based Agents: A Survey》,AI Agents可以划分为大脑(Brain),感知(Perception)、执行(Action)三大模块化能力。

(图片来源:《The Rise and Potential of Large Language Model Based Agents: A Survey》)

1. 大脑(Brain)

大脑是AI Agents的“核心信息处理中心”,具备理解当前环境并形成“记忆(Memory)”的能力,同时也具备存储并检索长期记忆的能力。“大脑”可以根据“记忆”和当前接收的信息进行逻辑推理,并将复杂问题拆解成可实现的子任务,应对复杂场景任务。同时,通过RAG(检索增强生成)技术,AI Agent可以根据当前场景和用户设定的目标进行进一步决策,实现独立思考、规划(Planning)和推理(Reasoning)。

2. 感知(Perception)

感知模块能够让AI Agents基于当前的环境和场景获取足够的信息,这正是其与传统RPA系统的区别之处。RPA系统在面对大量未知信息、难以预测的环境时无法进行工作,AI Agents则可以通过感知信息并做出对应的思考和行动,从而实现感知、理解和自主探索世界。

3. 执行(Action)

执行模块赋予了AI Agents执行任务的权限和能力。AI Agents在接收到用户任务指令后,结合由感知模块收集的当前场景信息,通过大脑进行总结和推理后,输出到执行模块中,使AI Agents能够根据用户需求完成指令。同时,AI Agents拥有调用、使用工具(Tool use)的能力,这些工具可以帮助Agents更高效地完成复杂任务,同时也提高了其在某些具体场景中的可信度和灵活度,相关应用场景包括让AI Agents购买飞机票、点外卖、完成企业IT/客服/法律任务等。

「天工SkyAgents」基于昆仑万维「天工大模型」打造,拥有专属“大脑”、“感知”、“执行”模块。

个人用户/开发者可以通过「天工SkyAgents」进行自然语言和简单操作,无需代码编程能力,即可在几分钟之内部署属于自己的AI Agents,完成行业研究报告、单据填写、商标设计、甚至健身计划、旅行航班预定等多项私人定制需求。

企业用户/开发者则可以将「天工SkyAgents」的众多能力按需拼装成企业IT、智能客服、企业培训、HR、法律顾问等众多个性化的应用,并支持一键服务部署,确保其在不同业务系统中的无缝接入。

「天工SkyAgents」的AI能力背后,是昆仑万维AI Agents技术在模块化任务组件、智能知识库构建、第三方工具调用、个性化AI Agents一键分享等领域的能力积累。

1. 模块化任务组件,零代码打造专属AI Agents

当前,多数用户既不具备代码开发经验,也不具备训练大模型提示词工程(Prompt Engineering)的能力,难以将众多日常生活的实际需求通过对话问答形式快速实现,无法将大模型能力发挥到极致。为了解决这一问题,「天工SkyAgents」将大量任务组件模块化,集成了智能对话、信息加工、信息提取、信息分类、第三方数据获取、向量检索等能力。

2. 智能知识库构建,支持大规模知识导入

大模型能力虽强,但也有其天生的弱项。一方面,大模型通过参数训练获得的知识只能停留在某一时点,更新成本很高;另一方面,大模型的训练数据通常以通用知识为主,细分领域的数据往往缺乏。为了解决这一问题,「天工SkyAgents」支持导入更多格式和更大规模的数据和知识,给大模型增加了“知识库外脑”。

3. 第三方工具调用,多场景随心应对

4. 个性化AI Agents一键分享

能力更全面、应用更智能、分享更便捷、平台更好用。本次「天工SkyAgents」beta版的正式开放内容,将进一步推动大模型技术的普惠化,帮助缺乏代码开发能力的个人与中小企业积极拥抱大模型技术,助力大模型走入千家万户,为人工智能生态发展贡献力量。

扫码进入“天工开放平台” ,快速构建AI Agent