科技巨头押注AI Agent,将如何重新定义人机交互?

    2024-11-15 10:36
    头豹研报

    2024年中国AI Agent行业研究:创新驱动,智能技术革新(独占版)

    2024-07-12



    *本文参考报告:《2024年中国AI Agent行业研究:创新驱动,智能技术革新》,首发于头豹科创网。

     

    近期,华为、荣耀、苹果和小米相继推出搭载AI Agent和AI操作系统的智能手机新品,集中展示了各自在AI领域的最新成果。自去年开始就热度不减的AI Agent概念,终于在今年年底迎来了多家厂商的实际应用成果。

     

    AI Agent的诞生,使智能手机从传统“人找信息”的被动获取模式,逐渐向“机器感知人、主动提供服务”的交互模式转变。对于手机厂商而言,AI Agent无疑提供了新的增长机会,成为了链接用户与庞大数字生态系统的有效桥梁。

     

    不仅在手机端,AI Agent还广泛应用于智能家居、汽车、医疗等领域。例如,在智能家居中,AI Agent可以学习用户的作息习惯并进行场景自动化控制;在汽车领域,它可帮助驾驶者分析路况、优化驾驶体验;在医疗行业,AI Agent还能通过用户数据分析健康状况,提供个性化健康建议。

     

    未来,随着AI Agent技术不断完善,将为用户提供更丰富的个性化和主动式智能服务,不仅提升了用户体验,也重新定义了人机交互方式,推动智能设备向“全场景智能化”发展。

     

    本文,头豹研究院将对中国AI Agent行业的发展现状、市场规模以及应用场景等进行分析,以期对未来发展方向进行研判。

    01

    AI Agent行业综述

     

    AI Agent(人工智能体)是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的人工智能,AI Agent具备通过独立思考、调用工具去逐步完成给定目标的能力。AI Agent和大模型的区别在于,大模型与人类之间的交互是基于prompt实现的,用户prompt是否清晰明确会影响大模型回答的效果。而AI Agent的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。 

     

    一个基于大模型的AI Agent系统可以拆分为LLM(大模型)、记忆(Memory)、任务(Planning)以及工具使用(Tool)的集合。在LLM为基础的AI Agent系统中,大模型为AI Agent系统的大脑负责计算,并需要其他组件进行辅助。

     

    基于大模型的Agent不仅可以让每个人都有增强能力的专属智能助理,还将改变人机协同的模式。带来更加广泛的人机融合。生成式AI带来的人机协同,将会呈现三种模式:嵌入模式(Embedding)、副驾驶模式(Copilot)和智能体模式(Agent)。相较于嵌入模式、副驾驶模式,智能体模式的人机协同模式更为高效,或将成为未来人机协同的主要模式。

     

    嵌入(Embedding)模式:用户通过与AI进行语言交流,使用提示词来设定目标,然后AI协助用户完成这些目标,比如普通用户向生成式AI输入提示词创作小说、音乐作品、3D内容等。在这种模式下,AI的作用相当于执行命令的工具,而人类担任决策者和指挥者的角色。 

     

    副驾驶(Copilot)模式:在这种模式下,人类和AI更像是合作伙伴,共同参与到工作流程中,各自发挥作用。AI介入到工作流程中,从提供建议到协助完成流程的各个阶段。例如,在软件开发中,AI可以为程序员编写代码、检测错误或优化性能提供帮助。人类和AI在这个过程中共同工作,互补彼此的能力。AI更像是一个知识丰富的合作伙伴,而非单纯的工具。 

     

    智能体(Agent)模式:人类设定目标和提供必要的资源(如计算能力),然后AI独立地承担大部分工作,最后人类监督进程以及评估最终结果。这种模式下,AI充分体现了智能体的互动性、自主性和适应性特征,接近于独立的行动者,而人类则更多地扮演监督者和评估者的角色。

     

    智能体的基本特征在于其自主性、交互性、反应性和适应性,这些特征使得智能体能够在不同的环境中独立行动,与其他智能体或人类进行交互,对外部刺激做出反应,并根据经验调整自身的行为。

     

    在类别上,智能体目前可分为自主智能体(Autonomous Agent)和生成智能体(Generative Agent)。

     

    国内陆续推出多款AI Agent产品,多基于国产大模型+开源Agent框架打造。主流产品包括阿里云的ModelScopeGPT、实在智能的TARS-RPA-Agent、联汇科技的OmBot欧姆智能体、澜起科技的Ask Xbot等。

    欲查看完整高清版图表,请前往文末获取

     

    AI Agent行业生态结构自下而上可分为基础设施层、平台框架层和垂直应用层。其中,基础设施层包括AI算力、传感器等相关基础设施,部分平台框架层企业也具备垂直领域应用开发的能力

    欲查看完整高清版图表,请前往文末获取

     

    学术界对于AI Agent的主流分类包括:1)Logic Agent,基于对输入语言、多模态的理解再次生成语言和多模态输出的一类Agent;2)Task Agent,面向具体任务,分解计划执行对应操作,过程中没有长期状态记忆的Agent;3)Job Agent,面向较为抽象的工作职责和总体目标,感知环境,记忆过程状态,自生子目标推动工作前进的Agent。 

     

    Task Agent涉及的非成熟技术相对较少,只有1项;Job Agent涉及到5项非成熟技术和1个疑难项;自我演进Agent涉及的关键技术基本全都是疑难项。目前,国内外主要AI Agent产品集中在Task Agent上,这种智能体涉及的技术较为成熟,容易复制推广,这类智能体数量将会快速增加。未来短期内,Job Agent发展速度加快,并持续朝着具备自主学习能力的自我演进型Agent发展。

    02

    AI Agent应用分析


    AI Agent应用场景广泛且多样,其正在各行业领域加速渗透。目前,在金融、电商零售、教育、医疗、制造、交通、媒体娱乐、能源、物流、政务等行业领域出现较多AI Agent架构与产品。 

     

    AI Agent在金融行业的应用成熟度和数据可获取性上均最高,其在金融行业可实现智能风控、智能客服、智能营销等功能,并可在各种场景中提供实时性的数据,解决传统大模型方法中训练时缺乏时效性的问题。在日前举办的ArchSummit全球架构师峰会深圳站上,天弘基金就分享了其团队在金融行业内开发的基于大模型的AI Agent。 

     

    AI Agent在电商零售行业的应用,与金融行业一样具备广阔的市场空间。然而,在数据可获取性上不及金融行业,其数据获取渠道主要来源于电商平台、销售系统及顾客反馈。AI Agent在电商零售行业可从产品列表、促销材料等用户内容中自我学习并智能响应,增强用户信任,优化购物流程。在销售中,AI Agent化身贴心导购,引导客户精准发现心仪产品,实时推送促销信息,并通过AI语言分析解码客户查询,完善购物体验。 

     

    AI Agent在政务领域的应用成熟度和数据可获取性上均不及以上九大行业领域,主要由于政务数据具备敏感性,难以获取,且多数市政服务系统相对封闭。

     


     

    “读研报 找头豹!”

     

    本文推荐阅读

    长按扫描下方二维码阅读内容

    若需购买报告,请使用PC端打开阅读页链接进行操作

    本文来源于头豹科创网,原创内容,作者:头豹研究院。转载或合作请联系 support@leadleo.com,违规转载法律必究,详见说明。如您有商务合作需求,请联系我们,我们将尽快与您取得联系。