10 月 21 日,天猫双 11 预售首日,李佳琦再次刷新了直播记录:39款商品几乎秒光,星图登陆4个多小时累积突破3000万围观。与这些相伴而生的是:白炽灯下,直播主们超负荷的直播时间。就连朋友圈都曾有朋友对直播主的超长待机表示担忧,“机器可以出故障,可以死机重装,人呢?”
李佳琦曾讲过,“只要你休息了,你的粉丝很有可能就被其他的9999场直播吸引走了,他就再也不来看你了。”而主播薇娅也说,我现在只要休息,就很紧张。也有媒体采访称,李佳琦一个人变成了算法,那么,与之相对的,当算法变成“李佳琦”,是否可以再造一个甚至更多个“李佳琦”?
尤其是在这个每个人都要疯狂加购物车,一年一度的购物节里。毕竟,李佳琦已经成了一个坐标:同行拿他对比,媒体解读他背后的消费现象、自我认同焦虑,自媒体传播他的励志鸡汤,就连隔壁的张阿姨都要拿他和自己喜欢的直播主对比,来告诉女儿:看,我买的东西错不了。
AI“李佳琦”:卖货不行,播新闻可以
事实上,已经有公司在行动了。今年9月杭州造物节上,科大讯飞公布了一段利用AI技术合成李佳琦的直播视频。
视频中,AI李佳琦演绎了一段眼药水和方便面的带货直播。只是在当前的技术环境下,“AI只能实现比较简单的情感共鸣”,AI“李佳琦”远没有真人的“活灵活现”,微博中不乏“眼神空洞”、“没有灵魂的带货视频”之类的评论。
因此,科大讯飞在AI李佳琦的角色设置上,也选择了比较讨巧的角度——AI新闻官,不强调带货,而是播报造物节的新鲜趣闻。“播音员,从事的工作是将信息准确传达给每个人,传达的信息是提前确定的,所以过程中更讲究准确规范和字正腔圆,而没有个人的发挥。经过训练的虚拟播音员,在准确规范、字正腔圆上,能很接近真人。”洪泰基金执行董事金海燕对CV智识表示。
不止科大讯飞,不少AI公司开始试水虚拟新闻主播。
“长三角铁路计划停运多趟列车”、“浙江启动防台风Ⅱ级应急响应”、“杭州萧山国际机场目前有20个航班取消”、“省防指提升防台风应急响应至Ⅰ级”......
台风“利奇马”向浙江沿海地区靠近期间,钱江频道编导人员在Web端编辑后台输入实时的新闻文本或者语音信息,AI主播“小范儿”便可以快速输出以上新闻播报视频。
同时,编导还可以插入与播放内容相关的图片和视频, 并且可以随意切换担单人主持和双人主持模式。
据AI主播“小范儿”背后的技术提供商相芯科技介绍,虚拟主播的原型是以钱江频道王牌主持人“范大姐”,在技术上,通过计算机图形学、语音动画合成和深度学习技术,对真人主播声音、唇形、表情动作等特征进行提取,实现虚拟主播像真人一样的实时播报能力。“有了这一技术,不仅可以让主播24小时全天候进行播报,还节省了视频制作时间,提升了视频制作效率。”相芯科技技术研发部产品经理马骁驰对CV智识表示。
的确,24小时随时Stand By的虚拟主播,或许可以帮助一些电视台,通过更精简的预算,实现开设24小时不间断新闻台的目的。年初的央视网络春晚上,虚拟撒贝宁“小小撒”以及以朱迅、高博、龙洋为原型的“朱小迅”、“高小博”,“龙小洋”组成了虚拟主持团队;两会期间,新华社推出AI虚拟主播“新小萌”,人民日报推出AI虚拟主播“小晴”;五一期间,北京电视台推出AI虚拟主播“小萌花”“小萌芽”,央视五四晚会推出AI虚拟主播“小灵”;军运会期间,AI主播每日以“昨日赛况”、“今日赛事”和“奖牌榜”三个板块,分别对军运会的赛况赛事进行梳理……
“2019年是虚拟主播元年”,一位行业人士对CV智识表示,“无论是中国市场还是国际市场,虚拟主播都如雨后春笋出来了。”媒体对于直播的天然需求,使得它成为虚拟主播最先也是最快落地的领域。现在,媒体上的AI虚拟主播更多是真人主播虚拟化,比如小小撒、康晓辉、朱小迅等,但问题是,真人主播和虚拟主播之间的关系是什么?显然,不会是替代,毕竟技术的发展并不允许,“有时主播是需要对观众情绪有所回应,需要随机应变,灵活控制场面,这是‘智慧’”,目前的虚拟主播显然不具备这些“智慧”。
搜狗AI交互事业部总经理王砚峰也曾表示,“AI技术的大使命从来都是赋能人,而不是替代人”。如果是互补,虚拟主播补弱的投入产出比例是否划算?对此,相芯科技表示,技术的进步总是需要一个过程,如果与市场的接轨,可以加快技术的进步,避免AI虚拟主播的发展走入“死胡同”,也未尝不是一件好事。
虚拟主播,不只是真人
“虚拟主播是一个半新生事物”。
早在2001年,英国PA New Media公司曾推出世界上第一个虚拟主持人阿娜诺娃(Ananova)——只有头部动画,可根据新闻脚本快速制作视频,并可24小时持续播报。
此后,日本推出了寺井有纪(Yuki),中国推出了小龙,美国推出了薇薇安(Vivian),韩国推出了露西雅(Lusia)。
但当时“无论是从语音的自然度、虚拟主播面部的自然度都跟实际用户能接受的这种程度差距比较大,所以尝试也就浅尝辄止。”
马骁驰将阿娜诺娃的时代称为虚拟主播1.0时代,现在的2.0时代则要从2016年“绊爱”出现在YouTube上开始说起。与前面提到的真人虚拟主播相比,绊爱最大的区别在于,她是二次元形象,并且拥有完整的少女人设:身着白色公式服,戴着粉色心形发箍,爱喝牛奶,16岁,经常说自己是美少女。今年6月30日,绊爱还在上海举行了线下官方生日会,并宣布正式进入中国市场。在此之前,绊爱的个人频道“A.I.Channel”和游戏频道“A.I.Games”都有超过百万粉丝。
与传统的真人主播一样,二次元虚拟主播的商业化路径其实也是类似:通过视频发布来吸引人气,依靠聚集起来的流量实现最终变现:TV动画配音、个人电视节目、联动游戏、线下Live、发售单曲、代言游戏和日用品牌等。之前日本旅游局还邀请绊爱担任访日促进大使,宣传日本旅游。
中国绝大多数虚拟主播也基本上是全面借鉴日系虚拟主播的人设塑造和运营方式。在国内,这一类型的虚拟主播的主要活动阵地在B站。今年第一季度财报发布会,哔哩哔哩董事长兼CEO陈睿在随后举行的财报电话会议上回答分析师提问时提到,该季度有超过来自全世界的6000虚拟主播在B站开播,观看的观众人数接近6000万。
2.0时代,一面是强内容驱动的TO C二次元虚拟主播,小众,粉丝粘性很强,付费意愿也强;另一面则是技术切入的TO B方向,主打实用便捷性性和定制化。“实用便捷性主要指公有化服务,也就是让用户打开电脑,登录相应网站,输入账号密码,在里面简单的输入文字,然后就可以去生成相应的虚拟主播视频;私有化部署则可以满足很多深度用户对效果的追求。”有些公司也在尝试将将AI技术与虚拟偶像的“养成”玩法结合起来。
9月,斗鱼官宣将与人工智能公司偶邦共同推出斗鱼首个AI女主播,让用户将全程参与虚拟主播IP打造的过程,包括全网征集人设、参与设计环节和评选环节。在虚拟主播运营方面,也制定了详细的IP运营计划。从1.0到2.0,虚拟主播发展的主要动能就是AI技术。
目前来看,在语音领域,有科大讯飞、思必驰、云知声等企业,在自然语言处理领域,市场上已涌现了诸如谷歌、微软等企业;在语音动画合成技术领域上,也涌现了诸如百度、相芯科技、搜狗等企业。
“现在无论是硬件还是软件的发展,尤其是计算机图形学的发展,星图登陆在技术层面基本上已经可以做到了应用的级别。”2017年,科大讯飞、搜狗、百度就曾对外公布语音识别准确率均达到97%。
“虚拟人物,能在哪些领域应用,核心看人物身份所需要的‘能力’在技术上是否ready了。”在马骁驰看来,接下来的迭代重点是虚拟主播在整个形象表现力方面和语音的语音语调表现方面。“形象表现力部分,现在的虚拟主播可以随着说话,做一些比较自然地表达的肢体动作,但是表现力是一个没有量化指标,也无止境的,就是要感觉越来越像真人;语音语调部分,现在用的是语音合成的技术,虽然可以把这个事情很抑扬顿挫地说出来,但是里面包含的情感信息会相对来说少一些。”
AI人像的未来,你怎么看?
从1.0到2.0,从二次元到真人,虚拟主播背后核心的发展动能就是AI技术。人们对于技术总有一种莫名的“崇拜感”:机器比人靠谱,所以虚拟主播不会犯错。但就在去年乌镇峰会上,以新华英文台的主持人形象示人的英语“AI主播”在播报的一则关于进口博览会的新闻当中,将阿里巴巴创始人马云的名字“Jack Ma”误读成了“Jack Massachusetts”。
原因在于,语音合成系统读到这部分文字稿的时候,判断“MA”两个字母是美国马萨诸塞州的缩写。比念错字更让人担忧的还在于:这种仿真技术一旦被心怀不轨的人利用,是否会出现诈骗、假新闻等问题?
9月,AI“李佳琦”出现后,就有媒体在微博上做了一个调查:对于AI合成人像技术的未来,你怎么看呢?其中“加速出台法律保障各方权益”以48.2%的投票率排在第一,“如不严控会造成巨大危险”、“控制AI合成的使用流向”、“技术还很粗糙不用担心”分列二、三、四位。
经过两三年的市场教育,面对各种隐私问题不断爆出,人们对于AI技术是否能够“善良”的担心越来越显现出来。这样一来,无论是从企业产品规则还是国家法律层面,都应该仔细想一想:这些新的技术到底应该怎么样去使用。