打印本文 打印本文 关闭窗口 关闭窗口

“VR技术先行者”伏英娜:直播新时代,如何让虚拟照进现实?

作者:佚名 文章来源:本站原创 点击数 更新时间:2017-1-4 13:51:58 文章录入:贯通日本语 责任编辑:贯通日本语

导读:从文字到图片再到视频的社交时代,人们总在致力创造更新鲜的信息表达方式,而直播无疑是当下非常火爆的一种形态。截至今年7月,中国至少有200个直播产品诞生,网络直播的用户规模已经达到了3.25亿,其中所有直播平台的日用户活跃量已经达到了2000多万。


伏英娜和她的appMagics则致力于通过虚拟和现实间的仿真融合、表情动作捕捉和交互控制等方面的技术创新,增强直播中的趣味性和表达的丰富性,其正创建出了这样一种新颖的直播表达方式:直播时,如果主播不打算露脸,便可以用卡通人物做替身,虚拟的卡通人像可以像个表情帝那样扮乖、卖萌、耍帅,而如果主播打算秀真实的五官,这时则可以添加多种虚拟表情特效,让面部展现出动画表演般的夸张神态。而屏幕另一面的用户,也由此可以更生动地感知VR/AR的魅力:比如视频里展现的是动态的虚拟卡通头像,但它的一颦一笑其实都是主播控制的。


在这篇《直播新时代,如何让虚拟照进现实?》的演讲中,出身微软的伏英娜聊了聊她投身虚拟现实技术领域创业的灵感来源,她对互联网下个阶段发展走向的思考。她也回答了业界关注的一些问题:比如,直播的本质到底是什么?庞大的直播市场里,到底还蕴含哪些新机会?



用户需求在演进:3.25亿人为何爱上了直播?


短短一两年的时间,中国已经出现了至少200个直播产品诞生了,用户规模已经达到了3.25亿,其中所有直播平台的日用户活跃量已经达到了2000多万。在用户使用习惯碎片化的时代里,这真是一个不可思议的现象。


早在去年上半年,当美国的Meerkat(现在已被并购了)切入直播市场时,我就在想,中国的直播业务可能会比美国还要有市场。为什么这么说?由于中国的环境限制以及亚洲人的含蓄习惯,很多时候人们面对面沟通时,往往比隔着屏幕聊天还不自在,我想直播这种虚拟的可视化表达方式,应该会是让中国人接受和喜欢的。直播市场今年果真很火。


看一看过去十年的用户需求迭代和升级,我们可以发现,互联网的传播从文字开始,后来发展到有图像、有图片作为辅助,可以用视觉化的传达来承载更多内容,再后来,视频内容火了,2006年前后,优酷、酷6、六间房、土豆等等一系列视频平台逐渐广为人知,后来UGC视频也火了起来,Youtube的最初定位并不是内容发布平台,它其实是以UGC为主体的视频分享平台,里面也出现了越来越多的短视频分享。


这种进化尤其是可视化的进化,其实意味着用户在需求层面的进化。毫无疑问,一张静态图片的承载内容通常远比不过一段视频的,从图片分享时代进化到视频和短视频分享时代,也是社会发展的必然。而直播的出现呢,意味着用户在实时交互层面的需求有了进化。总结说来,从文字短消息到图片到视频再到直播,大致承载了两个纬度的演进:一个是内容表现形态的演讲;另一个是时间轴上的需求演讲,也就是说内容分享从即时走向了实时。



那么,直播的本质到底是什么呢?刚才说到UGC,很多人在同一时刻看某一段视频的时候,其实是有互动需求和表达需求的,后来我们看到弹幕诞生了。弹幕最早源于日本市场,是在二次元的视频市场上发生的,弹幕其实在某种程度上,反应了我们在同一时间点对某一件事情的一种共鸣,承载在视频上就是我们看到的飞来飞去的字幕,这是实时互动需求下的一种产品呈现。而直播本质上展现的,也是一种互动需求渴望,它是视频时代里的一种三维时空延展,这种视频形态突破了物理空间的限制,传达到了场外更广的人群里。



颜值经济也有隐忧:直播形态需要何样的演进?


庞大的直播市场,到底还蕴含哪些机会?它的未来会是怎样?


我们看到,直播的产品形态已经多种多样了,早期的PC时代就开启了秀场模式,从YY开始,又不止是YY,今天的移动互联时代又出现了映客等推崇的素人直播模式。在直播当中,高颜值的美女和网红,从与粉丝的互动中的确得到了很多经济收益,以至有些95后毕业生甚至干脆不去工作,直接做网红赚钱去了。出现这种社会现象后,我也在思索一些问题,比如这种颜值经济究竟能不能持续?有一天用户会不会产生审美疲劳?直播到底能不能产生更好的内容沉淀?


在我看来,有价值的东西才能持久,颜值之类的东西,有可能会如昙花一现的浮云。尽管很多直播平台已经在内容和产品形态方面做了很多差异化的尝试和探索,但整个直播行业还是免不了出现越来越同质化竞争的问题。


我也一直在思考,直播如何才能沉淀内容?如何才能服务垂直的人群?比如我现在正在做演讲,究竟怎么才能把演讲内容通过直播分享给更多人观看呢?这也会是一些有意义的内容尝试。在思考这个问题的同时,我也在想,直播会不会真的变成未来的一种应用标配呢?这意味着它是一个常规功能,而不只是一种产品形态,也不会去依附某个产品存在。但到底如何才能把直播变成每个APP都需要的东西呢?直播会不会有一天真的衍生成了一种能力呢?


让我们再往前设想一下:不远的未来,直播会不会从2D向3D延展呢?


在我看来,互联网正进入一个视觉化的新阶段,现在正处于新阶段的起始点。互联网的下一个发展方向,一定是视觉化的。我们仍然是物理的存在,但我们会需要更多视觉化的因素,我们会生活在可视化的时空里,我们的表达方式不只是文字和静态图片。行业中某些热点现象,比如VR和AR的火爆,也正印证着我的观察,而有了VR和AR技术和相关设备,直播更是可以突破现实空间限制,它正承载整个互联网向下个阶段进化的关键。


但我们现在看到的直播产品形态,主要还是社区模式的产品形态,是以内容为主导的社区型视频直播形态,它是一个金字塔式的用户结构,只金字塔最顶端的那些大V主播,跟它的用户有更多的实时互动,它还没有进化到人人都有动力去互动的扁平化用户结构。微信的用户结构就是扁平化、去中心化的,里面的每个个体都是平等的,在我看来,未来的直播,也应该有另一种产品形态存在,这种形态以一种扁平化的用户结构而存在。


我们appMagics也正进行这方面的一些探索,我们也和映客有了深度合作,共同去看看能不能打造一种更扁平化的用户结构,我认为这可能会是中国直播市场上的又一个引爆点。以往的直播形态,多是把现实中发生的事情记录下来,然后同步分享给更多人观看。而我们的做法是,直播的过程中,还要在现实空间中叠加一层虚拟的东西,我们appMagics正致力于为映客这些直播应用做这样一种技术解决方案:如何为现实的视觉画面叠加虚拟元素。比如在做万圣节方面的一些话题直播时,我们就能不能透过对万圣节的理解和想象,构建出一些虚拟元素,把南瓜也好,各种小精灵也好,吸血鬼也好,叠加进直播画面里来,类似的事情就是我们正在思考和解决的,用户透过电子屏幕,一边在获取数字化的现实元素,一边也在获取很多叠加进来的虚拟增强元素。



哈利波特城堡的启迪:让虚拟IP叠加进现实世界


让虚拟照进现实,听起来挺抽象的。我是从哪儿得到灵感的呢?创立appMagics,是来源于我在微软西雅图总部时的一次旅行,在奥兰多哈利波特城堡游玩时,我得到了灵感。当看到哈利波特电影里的场景就在我眼前出现时,我仿若真的置身那个奇妙的电影世界中了,这种感觉相当美妙,顿时也给了我很大的启发:这些电影场景我们原本看不到摸不着,但把虚拟的场景构建进现实世界里之后,我们却可以身临其境,体会一种虚拟和现实混合的奇幻感。


于是我开始思考,到底如何才能把虚拟和现实的混合魔术推广进更多的空间呢?哈利波特城堡是通过构建一个实体建筑,让虚拟照进了现实,但更容易普及的结合载体,其实是电子屏幕。我想要做的,就是以电子屏幕为载体,让虚拟元素构建进现实世界里,这就是我创立appMagics的灵感由来。我们目前正在探索的,就是要给直播加料,在实时记录之外,增强主播表达的趣味性、丰富性,让直播变得更好玩,也更能表达年轻人的想象力。


我们是怎么切入的呢?一个做法是虚拟化IP形象。比如在漫威构建的世界里,有人钢铁侠这个IP形象,有人喜欢美国队长这个IP形象,这些经典形象往往承载了很多人性方面的东西,也承载了人类的想象力。我们将这些IP形象作为虚拟元素的源头,再用黑科技的技术方式,比如CV+CG(CV是计算机视觉,CG是计算机图形),把黑科技和影漫游里的经典IP形象结合起来,构建出全新的虚拟元素,然后叠加进直播画面里,以满足用户想象力层面的需求。



我们是一家技术驱动型公司,在获取人类表情和精细眼球方面,我们也有自己的技术积累,可以实现虚拟和现实之间的仿真融合和交互控制。我们现在推出了两款产品:一个是appMagics Avatar,可以制作各种定制化IP形象,从而帮助不愿展示五官的主播们用虚拟形象进行直播,映客新推出的二次元直播已应用了这项技术;另一个是appMagics SDK,它是VR/AR算法集合,可以基于面部表情和五官提供各种虚拟特效,我们用SDK的形式让每个APP都可以具备输出虚拟现实的能力,为用户创造超现实的表达方式和体验。


我们也在输出新的虚拟IP,我们推出了二次元直播,或者叫跨次元直播,因为它实现的是在三次元和二次元之间的切换和交互,唐唐是我们推出第一个虚拟IP形象,我们也正和合作伙伴尝试开发更多的IP形象。


我们正致力于把混合现实技术的魔力呈现在每个消费者的眼前。事实上,我们的跨次元直播,已经不只局限在视频直播领域,我们也渗透进了音频直播领域,已经和声网有了深度合作,未来我们希望能给更多领域插上虚拟现实结合的翅膀,给用户带去更多的惊喜。





打印本文 打印本文 关闭窗口 关闭窗口