语音合成又称文语转换(Text to Speech,TTS)技术,是语音处理领域的一个重要研究方向,旨在让机器生成自然动听的人类语音。语音合成技术既可以单独适用于不同的场景之内,也可以作为尾部环节嵌入到语音交互的整体方案之中。语音合成的应用可以划分为单向语音输出类和交互类,单一使用单向语音输出类或交互类的场景并不多见,导航技术、阅读、配音、语音播报等场景下,单向语音输出应用比例较大,智能客服、智能机器人、泛娱乐产业、教育等场景下,交互类语音合成使用较多。
语音合成的产业链上中下游呈现一定的一体化趋势,尤其是上中游融合趋势较为明显,中游竞争格局已初步显现,下游应用场景多样,商用化落地实现盈利成为重点。为了满足企业自我的语音合成训练的要求,部分大型互联网企业建立自有语音标准公司。同时,语音合成产业链上游由于产业自身存在一定局限,因此,产业链上中游一体化或将成为重要发展趋势。随着5G时代的来临,通讯业逐渐发展,社会整体需要快捷高效的信息传播方式,而语音相比于文字的信息传播速度更高。城市的扩大,人口密度的增加也为用户带来大量碎片化时间,语音内容受到社会欢迎,因此,语音合成也找到了用武之地。
头豹研究院通过设立研发力、产品力及企业力评估体系,对语音合成声学行业的企业进行全面综合评估。
头豹研究院根据评估体系评选中国语音合成声学行业年度综合实力标杆企业和语音合成声学行业年度最佳投资回报企业,特此重磅推出「头豹行企指南」,一图为您介绍并梳理。
年度最佳品牌
(排名不分先后)
科大讯飞:世界领先的智能语音技术企业,产品具有高自然度、低错误率和丰富的语种特点
科大讯飞股份有限公司是一家专业从事语音及语言、自然语言理解、机器学习推理及自主学习等人工智能核心技术研究,人工智能产品研发和行业应用落地的国家级骨干软件企业。科大讯飞作为中国人工智能产业的先行者,在人工智能领域深耕二十年,公司始终坚持为经济社会发展提供阳光健康、高技术屏障、高附加值的社会价值,乃至能够代表区域、国家参与全球高科技竞争的独特社会价值,在发展过程中形成了显著的竞争优势。
深声科技:赋能小爱同学,携手OPPO共塑个性化智能语音服务
广州深声科技有限公司(Deepsound)是一家专注于智能语音和数字人技术研发和业务落地的人工智能公司,成立于2018年。深声拥有一支顶级的人工智能团队,自主研发了行业领先的情感语音合成、声音定制、语音识别、自然语言处理、数字人等AI技术。公司致力于将语音AI与数字人技术带入人们生活的方方面面,赋予企业和用户以创新与科技力量来创造更美好的世界。
云知声:全球AI独角兽32强,提供云端芯一体化产业支持
云知声,是国内头部人工智能独角兽企业。以人工智能语音技术为核心,通过全栈式技术链条,为企业和用户提供智能语音技术和综合解决方案。以“算法-算力-大数据”三驾马车为基础,打造完全自主知识产权的感知分析、生成转换和认知决策全栈式 AI 技术能力。
倒映有声:构建无人驱动数字分身,赋能企业降本增效
倒映有声是一家以技术为核心的科技创新公司和无人驱动数字分身技术解决方案供应商,通过自研神经渲染技术、数字孪生技术、以及独创的TTSA技术,从语义到声音图片,再到连续帧视频画面,实现多姿态的数字分身IP生成,并实现基于文本实时生成高质量语音(音频)和动画(视频),最终实现无人驱动数字分身的行业技术突破,致力于成为全球领先的AI数字人神经渲染引擎。旗下拥有一视同人数字分身内容创作平台和有声读物制作交易平台,落地场景可覆盖媒体播报、有声读物制作、互动游戏、虚拟直播、娱乐等应用场景,满足企业用户降本增效的需求,促进企业业务形态创新和增长,构建以无人驱动数字分身为载体的虚拟世界新生态。
百度:AI专利数量中国第一,提供免费多样的服务助力开发
百度以技术创新为信仰,在创新投入、研发布局、人才引进方面均走在国际前列。百度语音合成技术通过百度语音开放平台向广大开发者提供流畅自然、免费多样的服务。百度全球AI专利申请量已超过1万件,其中中国专利9000多件,位列中国第一,并在深度学习技术、智能语音、自然语言处理、自动驾驶、知识图谱、智能推荐等多个领域排名国内第一。
有道智云:依托于有道词典,支持超过30多个国家和地区方言的语音合成
网易有道旗下一个为开发者、企业和政府机构等提供自然语言翻译、文字识别OCR等服务以及行业解决方案的云服务平台。致力于提供安全,可靠和高效的云服务。
思必驰:拥有全链路的智能语音语言技术,为车联网、IoT等众多行业场景提供自然语言交互解决方案
思必驰是国内专业的对话式人工智能平台公司,拥有全链路的智能语音语言技术,自主研发了新一代人机交互平台(DU川),和人工智能芯片(TH1520);为车联网、IoT及政务、金融等众多行业场景合作伙伴提供自然语言交互解决方案。思必驰被列入国家发改委“互联网+”重大工程和人工智能创新发展工程、工信部人工智能与实体经济深度融合创新项目、江苏省工业和信息产业转型升级项目、江苏省科技计划项目等,并累计参与40余项国家标准、行业标准制定。2020年,思必驰完成pe-PO轮融资;2021年3月,思必驰完成股份制改造,正式更名为:思必驰科技股份有限公司。
魔珐科技:全栈自研智能化工业化虚拟内容制作、虚拟直播及AI虚拟人技术,构建三大虚拟世界关键产品线
魔珐科技构建虚拟世界"1+2+3+X"生态发展格局,全栈自研了智能化工业化虚拟内容制作核心技术、虚拟直播核心技术及A虚拟人核心技术。构建了三大虚拟世界关键平台化产品线,包括三维虚拟内容协同制作智能云平台、虚拟直播和线下实时互动产品、全智能虚拟数字人能力平台。三大产品线均已商业化落地,赋能各行各业,推动可持续发展。
声智科技:拥有多模态远场感知和多技能异构云脑等能力,构建“端边云”一体的IDA机器人和SDA数智人等标准
声智创立于2016年,基于自主研发的Azero(壹元)人工智能开发框架,以声光感知和交互智能为特色,融合人工智能、大数据、云计算和物联网等技术,拥有多模态远场感知和多技能异构云脑等能力,构建“端边云”一体的IDA机器人和SDA数智人等标准,面向智慧健康、智慧城市、智慧生活和智慧能源等领域,提供基于Azero开发框架的衍生产品、技能和服务,致力于推进人、机、物从物理世界到数字世界的互联互通、数字映射和交互决策,实现“让万物互联更智能”的使命,达成“用智慧科技改变生活”的愿景。