本报告或文章可用于微博、微信公众号、新闻网站等一般性转载,或用于企业的公开市场宣传,或用于企业投融资咨询、上市咨询等用途。这些引用可能是免费的,也可能产生额外的授权费用,头豹将根据您的引用需求向报告或文章发布者取得相应授权,并派专人与您进一步联系。
请务必如实填写引用需求并按授权范围使用本报告或文章,如头豹发现您最终的引用目的超出所引用需求相应的授权范围,头豹有权要求您停止引用并就头豹因此遭受的损失追究您相应的法律责任。
纠错
*本文参考报告:《2023年中国AIGC细分赛道研究报告》,首发于头豹科创网。
日前,首部AI生成长篇电影《Our T2 Remake》在洛杉矶正式举行线下首映礼。
该片翻拍自卡梅隆执导的经典科幻片《终结者2》(1991年),呈现了一个人类对抗ChatGPT统治的世界,探讨当代AI发展的影响。
由50位AI领域的艺术家分段创作,他们借助ChatGPT、Midjourney、Pika、Kaiber等人工智能技术,影片创作全程都由AI完成。
虽然由AI生成的场景相对粗糙,很多细节经不起推敲,但不可否认的是,“这将成为AI在电影制作应用中的一个重要里程碑,他们向世界展示了,通过AI创作自己喜欢的史诗级故事的能力”,正如该片制作团队在首映礼上所说。
如果说2023年是生成式人工智能技术“狂奔的一年”,那么2024年则有望成为人工智能应用大发展的“元年”。随着AI生成视频技术的迅速发展和广泛应用,也将为各行各业带来新机遇。
本文,头豹研究院聚焦于AI技术在虚拟人和音视频生产领域的应用研究,从结合技术架构、应用场景、商业模式与落地案例、以及国内外代表性企业案例等分析维度,给出对AIGC行业发展的解读与研判。
01
虚拟人生成
虚拟人是综合运用文本、图像、音频等生成技术,打造综合外观、表情等产出全面拟人化的数字内容。其中,非交互式虚拟人的生成依赖于输入的内容,真人驱动的虚拟人依赖于真人的实时反映,交互式虚拟人可以全自动化。
2022年内容消费型虚拟人和工具型虚拟人应用占比分别未86.9%和13.10%。未来随着虚拟人生成技术的成熟和成本的下滑,2030年内容消费型虚拟人占比下滑至58.5%,工具型和内容生产型虚拟人上升至27.7%和13.8%。
欲查看完整高清版图表,请前往文末获取
工具型虚拟人商业模式以通过定制来收取定制费用或租赁费为主,由于存在技术壁垒和成本过高问题,商业变现空间有限。内容型虚拟人以IP盈利为主,商业模式更为成熟,目前IP商业模式市场竞争激烈。
C端虚拟人粉丝群体较为年轻化,15-34岁的用户群体占比在60%,虚拟人外观、内容质量和性格是影响用户成为虚拟人粉丝群体和脱离虚拟人粉丝群体的前三大因素。
02
音视频生成
AI生成音频是指以语言模型为中介,对音乐数据进行双向转化,进而实现合成模拟人的音调的语音、音乐作曲等。以谷歌的AudioLM模型为例,该模型有51.2%的成功率能够让人类分辨不出是AI生成的。
AI生成音频的应用场景包括TTS场景和乐曲/歌曲生成场景,TTS应用成熟度高于乐曲生成。国内短视频平台、音乐平台等头部尝试均开始研发和实践AI作曲,均未实商业化应用。
AI生成视频指基于文本、图像和视频数据库,通过模型训练后,达到文本转图像后转视频或文本转视频的效果。目前市面上主流的AI视频生成工具以海外工具为主,包括Make-A-Video、Phenaki等,均未实现商业化。
欲查看完整高清版图表,请前往文末获取
AI深度合成视频自2021年始进入爆发性增长阶段,数量达到24,317条,其视频的内容数量最多的为影视娱乐。从AI视频生成的落地场景来看,视频属性编辑落地最广和技术最浅,视频部分生成落地较少,技术难度最高。
相关推荐
2024年中国大语言模型综合能力评析(四):大模型综合能力评析及趋势研究(摘要版)
AI大模型的综合能力实际上是一个多维度交织、全方位体现AI智能水平的概念集合,它不仅囊括了AI智能体所展现的适应性学习与决策智慧,还涵盖了对专业文本深度挖掘分析的专业素养,以及在处理超长文本时保持内容连贯和精确度的卓越实力。这种综合能力的构建,如同一个精密的万花筒,各个关键组成部分相互映照、互补,共同铸就了大语言模型在实际应用中的高效性与可靠性。具体来说,在AI智能体这一领域,大语言模型体现了其强大的自主学习机制和环境适应性,能够灵活应对各种任务挑战,根据情境需求制定出合理且智能化的行为策略,模拟人类般的复杂思维过程。而在专业文本处理上,大语言模型展示了深入知识图谱的核心能力,凭借对特定行业或学科专业知识的精准把握,能够穿透术语迷雾,揭示深层次信息结构,并据此作出精准而有洞察力的判断分析。针对超长文本场景,大语言模型则展现出非凡的信息组织与整合能力,无论面对多么庞大的文本数据量,都能保持叙事的连贯性和逻辑的严密性,同时确保信息提取和转述的准确性,有效驾驭大量文本信息洪流。正是通过对这些维(包括任务拆解的精细化、目标执行的高效化、多轮对话的记忆连续性以及超长文本生成的质量把控等)进行持续优化与提升,大模型得以在各类复杂的应用环境中发挥最大的价值。
2024年中国大模型行业应用研究:大模型引领智能时代,助力各行业全面升级(摘要版)
尽管大模型技术在推动各行各业的数字化转型和智能化升级方面展现出巨大潜力,其在行业应用中仍面临技术门槛高、需求定义模糊、数据获取困难等挑战,同时还需考虑战略定位和投资回报,以及与现有系统的集成和用户培训问题。然而,这一技术在中国市场上已呈现强劲增长态势,市场规模达到891.2亿元,特别是基于语言的大模型人工智能市场表现尤为突出,规模高达668.3亿元。大模型技术的快速发展正助力气象、药物、金融、政务、教育、电商、法律、农业、工业和医疗等多个领域的创新升级,提升服务质量和工作效率。随着大模型技术与实体经济的深度融合,我们将迎来一个充满机遇和挑战的新时代,各行各业将利用先进的大数据和AI技术实现可持续发展的目标。面对这些挑战,行业和企业需积极探索解决方案,确保大模型技术在推动行业发展中发挥最大作用
2024年中国大语言模型综合能力评析(四):大模型综合能力评析及趋势研究(独占版)
AI大模型的综合能力实际上是一个多维度交织、全方位体现AI智能水平的概念集合,它不仅囊括了AI智能体所展现的适应性学习与决策智慧,还涵盖了对专业文本深度挖掘分析的专业素养,以及在处理超长文本时保持内容连贯和精确度的卓越实力。这种综合能力的构建,如同一个精密的万花筒,各个关键组成部分相互映照、互补,共同铸就了大语言模型在实际应用中的高效性与可靠性。具体来说,在AI智能体这一领域,大语言模型体现了其强大的自主学习机制和环境适应性,能够灵活应对各种任务挑战,根据情境需求制定出合理且智能化的行为策略,模拟人类般的复杂思维过程。而在专业文本处理上,大语言模型展示了深入知识图谱的核心能力,凭借对特定行业或学科专业知识的精准把握,能够穿透术语迷雾,揭示深层次信息结构,并据此作出精准而有洞察力的判断分析。针对超长文本场景,大语言模型则展现出非凡的信息组织与整合能力,无论面对多么庞大的文本数据量,都能保持叙事的连贯性和逻辑的严密性,同时确保信息提取和转述的准确性,有效驾驭大量文本信息洪流。正是通过对这些维(包括任务拆解的精细化、目标执行的高效化、多轮对话的记忆连续性以及超长文本生成的质量把控等)进行持续优化与提升,大模型得以在各类复杂的应用环境中发挥最大的价值。
2024年中国大模型行业应用研究:大模型引领智能时代,助力各行业全面升级(独占版)
尽管大模型技术在推动各行各业的数字化转型和智能化升级方面展现出巨大潜力,其在行业应用中仍面临技术门槛高、需求定义模糊、数据获取困难等挑战,同时还需考虑战略定位和投资回报,以及与现有系统的集成和用户培训问题。然而,这一技术在中国市场上已呈现强劲增长态势,市场规模达到891.2亿元,特别是基于语言的大模型人工智能市场表现尤为突出,规模高达668.3亿元。大模型技术的快速发展正助力气象、药物、金融、政务、教育、电商、法律、农业、工业和医疗等多个领域的创新升级,提升服务质量和工作效率。随着大模型技术与实体经济的深度融合,我们将迎来一个充满机遇和挑战的新时代,各行各业将利用先进的大数据和AI技术实现可持续发展的目标。面对这些挑战,行业和企业需积极探索解决方案,确保大模型技术在推动行业发展中发挥最大作用
2024年中国高中生在AI时代的专业选择
2024年中国高中生在AI时代的专业选择
头豹的程序员小GG强烈建议您使用谷歌浏览器(chrome)以获得最佳用户体验。