全球首个AI合成女主播亮相两会 “搜狗分身”技术全球领先
中新网3月5日电 3月3日,全球首个ai合成女主播“新小萌”正式上岗新华社,而她的第一个工作任务,便参与到十三届全国人大二次会议(后文简称两会)报道中。对此,“今日俄罗斯”电视台网站、英国Daily Mail、美国Futurism等海外媒体进行了大幅报道,并表示“近年来,中国已成为全球领先的人工智能发展中心之一”。
作为第一个登上两会的ai合成女主播,人们在惊叹和称赞之余,对于其背后由搜狗所开发的人工智能技术都无比好奇:这个在镜头前播报新闻的“新小萌”,是如何诞生的呢?它未来又将有哪些应用价值呢?
什么是ai合成主播?
比起机器千篇一律的冰冷面孔,用户期待的是一个有温度的真人形象。所谓ai合成主播,顾名思义,指的就是依靠搜狗的“分身”技术,来模拟出一个类似人类的ai主播进行播报。搜狗的这款产品就是以新华社主播屈萌为原型,她不仅会用和真人一样的声音进行播报,就连唇形、面部表情也能完全吻合。从新华社的新闻播报视频来看,栩栩如生的ai合成女主播“新小萌”,在镜头前的形象与真人主播几乎没有区别。
ai合成主播在2018年的互联网大会期间首次亮相,就引起了网络上的一片热议,被国内外诸多媒体进行报道。2019年2月21日,ai合成主播宣布再次升级,从过去的“坐着播新闻”升级成结合肢体动作的“站立式播报”,进一步提升了合成主播的表现力,保持了搜狗在这一领域的全球领先。本次首个ai合成女主播参与两会报道,更是成为了中国人工智能与传媒业大胆融合并付诸规模化应用的典型案例。
作为开发ai合成主播的基础,“搜狗分身”是搜狗人工智能的核心技术之一,诞生于搜狗“自然交互+知识计算”这一人工智能理念之下,它能通过人脸关键点检测、人脸特征提取、人脸重构、唇语识别、情感迁移等多项前沿技术,并结合语音、图像等多模态信息进行建模训练后,生成与真人无异的ai分身模型,进而帮助人类提高信息表达和传递的效率。
得益于前沿技术的加持,ai合成主播前期只需经过少量的数据训练,就能呈现与真人相差无几的播报状态,同时还支持个性化定制,满足用户的不同需求。ai合成主播不仅可以将新闻稿快速地转变为播报视频,还能快速学习用户音色、韵律、情感等多维度特征,妥善处理声调起伏、语言风格、情感韵律等,并提供全天候不间断的播报服务,极大地提高广电行业的传播效率。
随着“搜狗分身”技术能力的不断提高,ai主播的定制周期也大为降低,合成效果和稳定性也有着显著提升。仅靠少量用户真实音视频数据,即可快速定制出高逼真度的分身模型。本次在新华社两会报道中惊艳亮相的首个ai合成女主播,正是“搜狗分身”技术持续复制不同类型、不同特点ai合成主播能力的一个有力体现。
为不同职业赋能,搜狗分身的未来远不止于主播
在两会期间,ai合成女主播的首次登场亮相,即引发了媒体和网友关于主播行业的激烈讨论,可见当科技融入到生活后所带来的冲击感是非同凡响的。宛如科幻大片一般的场景,正在逐步成为现实。和真人主播相比,通过“搜狗分身”技术打造的ai合成主播能够不知疲倦地工作24小时,同时还掌握多国语言,大大提升了效率、降低了成本。
然而,ai合成主播仅仅只是一个开始。伴随着人工智能技术的不断升级,个性化内容生产的门槛大为降低,应用范围愈发广泛。未来,“搜狗分身”技术还将应用于娱乐、医疗、健康、教育、法律、金融等多个领域,通过提供个性化的行业解决方案,为不同场景展开赋能。根据不同场景而创造出虚拟教师、虚拟客服、虚拟管家、虚拟医生等职业,深度参与到人类的内容表达和信息传递场景之中,提供服务并发挥更多价值。届时,各行各业都将迎来ai技术下的新一轮变革。