*本文参考报告:《2024年中国端侧大模型行业研究:算力优化与效率革命,如何重塑行业生态》,首发于头豹科创网。
2024年巴黎奥运会正在如火如荼地进行中,除了运动员们在赛场上的精彩表现,中国的AI(人工智能)技术也成为了本次赛事的一大亮点。这些“中国黑科技”不仅出现在赛事转播、比赛设备,还涉及到了场馆建设等多个方面。
阿里巴巴的通义大模型成为了奥运会上首个AI大模型应用的技术提供者,被应用于赛事解说、360度直播以及视觉搜索等领域,此外,商汤科技的日日新等其他AI技术也被广泛采用。
值得注意的是,AI技术还在服务跳水、游泳、田径、体操、蹦床、攀岩等多支国家队的日常训练和巴黎奥运会的备战工作中发挥了重要作用。从技术角度来看,这些应用的背后离不开端侧大模型的支持。
此外,端侧大模型的应用远不止于特定领域,它们正在智能家居、医疗健康、教育培训、金融服务、零售、交通出行、娱乐媒体及能源管理等多个领域中都发挥着重要作用。
本文,头豹研究院将梳理端侧大模型行业市场规模、产业链上中下游、竞争格局及发展趋势等。
01
中国端侧大模型行业概述
AI大模型通常在数据中心或云端进行训练,使用大规模的计算资源和海量数据。相比之下,端侧大模型由于资源限制,往往需要在设计和训练阶段进行模型压缩和优化。
在推理方式上,AI大模型通常运行在服务器或云端,通过强大的计算能力处理复杂的任务。然而,这种云端推理方式依赖于网络连接,会带来延迟和隐私问题。端侧大模型则是在本地设备上进行推理。
参数量是AI大模型和端侧大模型的一个显著区别。AI大模型通常具有数十亿甚至上百亿的参数,如GPT-3的1,750亿参数。这种巨大的参数量使得大模型能够捕捉复杂的数据模式并在多种任务中表现出色。然而,端侧设备的计算能力和存储资源有限,因此端侧大模型的参数量通常较小。
通过模型压缩技术,如知识蒸馏、剪枝和量化,端侧大模型的参数量可以减少到几百万或更少。例如,MobileBERT的参数量仅为BERT的1/4左右,但依然能够在移动设备上高效运行。
端侧大模型在成本、能耗、可靠性、隐私和个性化方面相比云端推理具有显著优势,并能够以低能耗提供高效且安全的AI处理,减少延迟并保护用户隐私,适合个性化的AI应用。
受实际落地情况的影响,2023年中国端侧大模型市场规模达8亿元,持乐观态度估计,预计2024年中国端侧大模型市场将达到21亿元。
生成式AI市场的蓬勃兴起,正驱使大模型厂商积极探索端侧应用新蓝海,以此作为增长的新引擎。
端侧大模型通过在设备本地运行,有效降低了数据传输延迟,增强了隐私保护,拓宽了AI应用场景的广度与深度。例如,智能手机集成的AI摄影功能,能实时识别场景并优化图像质量;可穿戴设备利用端侧模型监测健康指标,提供即时反馈。
与此同时,随着AI芯片等算力市场带动,为端侧大模型打开新的市场空间。高性能、低功耗的AI芯片设计使得复杂模型能够在手机、物联网设备等终端高效运行,无需依赖云服务,显著提升响应速度与用户体验。
2021年全球AI芯片市场规模达到200亿美元,预计到2025年将超过700亿美元,其中端侧AI芯片占比快速提升,成为增长的重要动力。
下游市场需求的强劲增长,特别是手机与自动驾驶行业的蓬勃发展,正强力拉动端侧大模型市场的扩张。
手机作为个人智能终端的核心,正集成更先进的AI功能以提供个性化服务与优化用户体验,如荣耀Magic系列利用端侧AI大模型实现偏好理解与多模态交互。
同时,自动驾驶领域对实时性与安全性要求极高,推动了BEV+Transformer等技术与端侧大模型的融合,百度Apollo ADFM等L4级自动驾驶大模型的推出,标志着该领域迈向商用新阶段。
欲查看完整高清版图表,请前往文末获取
02
中国端侧大模型行业产业链分析
中国端侧大模型上游主要包括AI芯片供应商、云计算服务商以及数据服务商,中游为端侧大模型科技厂商和端侧科技企业,主要通过设备企业最终应用到汽车、教育等各行各业。
欲查看完整高清版图表,请前往文末获取
通过知识蒸馏,端侧大模型能够在保持较高性能的同时,大幅减少模型参数量和计算复杂度。这种技术使得复杂的AI模型可在资源受限的端侧设备上高效运行,实现低能耗、高响应速度和高准确度的AI推理。
AI芯片作为加速端侧大模型的关键技术,提供高效计算和能耗比,使得大规模模型在端侧设备上高效运行,研发人员及显卡成本需兼顾,确保研发经济可持续。
取决于行业对数据安全、隐私保护的需求、行业本身智能设备的普及程度以及AI大模型技术的成熟度,这些因素的相互作用和共同推动,端侧大模型将推动各行业智能化发展的步伐。
端侧大模型能在保障数据隐私的同时,实现低延迟的实时计算,并提供高度个性化的服务,因此基于对数据隐私、计算实时以及个性化等强需求,AI手机、自动驾驶和机器人成为端侧大模型核心应用场景。
随着技术的不断进步和应用场景的拓展,端侧大模型各业务场景中存在差异,文本生成和图片生成场景相对较成熟,音频生成场景逐步发展,视频生成和多模态生成场景尚处于起步阶段。
03
中国端侧大模型行业分析
中国政府将人工智能产业视为中国国家战略核心,在端侧大模型方面展现出积极的支持立场。在AI基础设施以及生成式AI方面设立规范,整体政策环境对AI产业及端侧大模型的健康发展表现有利。
头部大模型厂商依托其深厚的技术积累和成熟的生态系统,正加速布局端侧大模型市场。
一方面,这些厂商利用在云端大模型领域的技术优势,通过算法优化、模型压缩等先进技术,有效解决了端侧算力限制问题,使得复杂的AI功能能够在移动设备、物联网终端等平台上高效运行,满足用户对即时性、隐私保护及离线使用的需求;另一方面,通过构建开放的生态平台,整合上下游资源,赋能开发者与行业伙伴,共同探索端侧AI的多元化应用场景。
随着端侧大模型技术的日益成熟,未来中国端侧大模型行业的竞争格局将呈现出技术深度融合与创新驱动的新态势。技术融合将成为竞争的核心要素。厂商不再局限于单一技术的优化,而是趋向于跨领域技术的集成,如将自然语言处理、计算机视觉、边缘计算等技术与大模型结合,打造综合型AI解决方案。
在端侧大模型的部署与应用中,单一企业的力量难以覆盖全部产业链环节,因此构建开放合作的生态系统,促进技术、数据、应用和服务的共享,将成为提升竞争力的重要途径。
这包括与芯片制造商、硬件供应商、软件开发商、行业应用提供商等多方面的深度合作,形成共生共赢的生态体系。
例如端侧大模型推动AI芯片市场发展,2023年全球边缘AI芯片出货预计达22.86亿颗。此外,创新的合作模式,如联合研发、数据共享协议、灵活的IP授权方式等,将促进资源优化配置,加速技术产品的迭代与市场拓展。
欲查看完整高清版图表,请前往文末获取
此外,我们还在报告中完整分析了端侧大模型行业代表企业案例等,可前往文末获取完整版报告。
“读研报 找头豹!”
本文推荐阅读
长按扫描下方二维码阅读内容
若需购买报告,请使用PC端打开阅读页链接进行操作