目前,音视频技术的应用越来越火爆,这也让音视频技术从曾经一个比较小的子系统,越来越让人瞩目,而市场的需求与人才的缺乏也越来越成为一个亟需解决的矛盾。
LiveVideoStack特别采访了陆宵吴经理,请他以资深从业者的角度,讲述了他对音视频技术的理解。
讲师信息
陆宵吴,CRI中国的技术经理,是一名从事游戏行业14年的老兵,曾参与过项目《Roland DTX》《装甲核心》《装甲尖兵》《梦战纪》《古剑破天》《元素战姬》《爆裂魔女》等项目制作,拥有丰富的从业经验以及对游戏音频的深刻理解。
以下内容由LiveVideoStack与陆宵吴的采访整理而成。
01
—
CRI的目标:中间件让更多人产生惊喜
CRI在日本应算得上是一家拥有相当技术积累的中间件厂商了。
早在1983年,日本东京成立了一家名为CSK Research Institute Co.,Ltd.的集团公司。而CRI的名称由来就是取CSK的“C”、Research的“R”、Institute的“I”。当时已经开始研发人工智能、音视频技术和CD-ROM媒体技术了。
90年代的CRI开始对多流技术和声音压缩技术进行全面研究,参与SEGA的多款知名游戏项目的研发,为家用游戏主机平台“SEGA Saturn™”提供机音频技术、视频技术、口型动画技术上中间件支持。也因此CRI的产品的CRI ADX、CRI Sofdec、CRI Clipper(CRI ADX LipSync的前生)在业内名声大噪。
2001年,正式成立CRI Middleware Co., Ltd.为“Sony PlayStation®2”“ NINTENDO GAMECUBE®”和“Xbox®”提供中间件支持。
2005年,开始为家用视频游戏机“PlayStation®3”“PSP®”“ Xbox 360™”提供中间件。
2006年,推出了一个新品牌“ CRIWARE”,其中显示了产品组的通用名称。
2010年,ADX、Sofdec全面升级成了“ADX2”“Sofdec2”。
2019年,设立中国子公司“上海希艾维信息科技有限公司”。收购了Web Technology,并发布“OPTPiX ImageStudio 8”,这是一种具有高质量纹理转换功能的图像优化工具。收购了音频工作室“TWOFIVE”,并拥有了业内一流的游戏音频制作业务的团队和作曲家资源。推出了“CRI ADX LipSync”,它是一种语音分析中间件,可将语音数据自动转换并生成自然的口型动作。
综合上述,CRI的音视频技术特点具有三大特性:
1) 历史悠久,技术成熟,积累雄厚;
2)多元化产品涵盖范围广,多平台支持便于部署,兼容性良好适用于各大游戏引擎甚至自研引擎;
3)优秀的技术服务团队是用户坚强的后盾。
CRI无论是在过去、现在,还是将来,一直以成熟的中间件产品为基础秉持勇于创新、突破极限的精神。不断创造令世人惊喜的新技术,使我们在各种领域的应用更加方便、快捷、高效地实现目的。如今的CRI已经不仅仅在游戏行业有着令人刮目相看的成绩,更在车载、安防监控、网络视频、医疗等领域不断创造惊喜。
因此,CRI的目标是:“中间件让更多人产生惊喜。”
02
—
CRI中国化进程
CRI中国成立至今可谓一年半载,时间不算长,踩过的坑不少,趟过的水不浅。虽然CRI在日本业界是有相当地位的,但在中国还处于萌芽阶段。在游戏产业中,游戏音频本身起步不久,还处于比较初期阶段,需让更多的人从认识到认知,再到认可。
团队初创时,我们当时人手不足,加上老板也就3个人。每个人都身兼多职,那段日子大家真的都很辛苦,回想起来仿佛昨天历历在目。
我在这个团队担任技术经理一职,我主要负责售后技术支持、技术培训等工作。当然,对外的技术交流与合作也不能落下拖后腿。所以这次也很荣幸地接触到了你们LiveVideoStack,借此机会能够将CRI的优秀产品和先进技术分享给大家。
03
—
国内、外游戏行业的发展状态
关于国内外游戏行业的解读不敢妄言,至今我也在不断学习和提升的过程中。大致说下我的一些看法吧。
首先,电子游戏这个东西本是一个外来之物,在我心目中始终对它非常敬畏。说它是一门科学并不言过。我们当代的电子游戏当然包括手机游戏的设计理念,当然避不开早年埋藏在心里的种子。潜移默化之中,无论是日系的、欧美的种种, 80、90甚至00后们,童年记忆深处电子游戏世界观,如今在为这个国家、这个行业大放异彩。我想说,当今游戏行业的从业者正是融合东西方文化的开拓者,他们奔跑在一条崭新的大道上。
我从2006年开始进入这个行业,从PC端游做到页游,再从页游转到手游。特别是从2013年到2019年这6年,对于中国游戏行业来说可谓是一个高速发展期。说句实在话,很多事物的发展都有着非常相似的规律。就说中国制造业发展至今,经过依赖高密度劳动力从粗陋、低附加值产品,到现在的自动化高标准化、高附加值产品,付出了几代人的努力。
中国游戏工业的迭代速度已经不知道比制造业快出多少倍了,但某些方面和国外团队有一定差距,比如说动作捕捉、自动口型动画生成、表情动画捕捉、音视频编解码等等。虽然我们现在享受着Unity、Unreal、Cocos等带来的福利,但别忘记这些底层的基础游戏科学领域我们并不扎实。同样,基于高密度劳动力和人口红利带来的优势,其生命很快会走到尽头,吾辈任重而道远!
04
—
国内音频和视频技术生态
目前我对于国内视频行业还不是很了解,我先说说音频行业吧。
中国传统音频圈的人还真不少,有体制内的,也有体制外的。游戏音频的从业者大多数都是来自体制内的,少部分是体制外的(被体制内的称为野路子)。我就是属于这种野路子,不是科班毕业,但依然热爱音乐,热爱音频技术,是能从事自己热爱的行业的幸运儿。国内游戏音频的圈子那就小很多了,当然游戏音频刚开始的时候,从传统音频行业里转行过去的人为多。近几年随着游戏行业的蓬勃发展,对游戏音乐制作的要求和数量也在飞速提高着。除了原先传统音频圈的老司机们,还有各大院校、高职、社会培训机构输送给养。他们有些成为了游戏厂商的音频团队Leader,有些成立了音频工作室,为游戏厂商提供音频制作等外包服务,更有些从事音频、甚至游戏音频的教育培训工作。从这个行业目前的规模和人员结构来看,音频行业目前还是处于比较初期的阶段,大多数音频技术人员都活跃于应用技术层面,而很少有人研发底层技术(比如编码、压缩、DSP等),甚至相关的行业。因此严格意义上来说,我们只能算是半个音频技术人员。
我想,视频行业也同样面临着这样的问题吧。
那我么现在面对的情况也非常明确,既要保持高水平的应用技术,还要补上底层基础科学不足,我认为这是对于整个音频行业来说的巨大挑战。
CRI中国一直秉持开放的态度迎接音视频技术之路上一起奔跑的小伙伴们,不断为他们提供相关技术的提高、学习、探讨的良好环境而努力。在我们官方网站目前能提供CRI技术的相关学习和探讨内容,小伙伴们可以很方便地找到想要的知识。
05
—
音视频技术的未来发展前景
除了游戏行业,音视频在其他场景的应用也越来越火爆,比如在线学习、远程工作、在线会议,以及直播等众多场景。有人说,现在是音视频技术发展的好时代。
非常同意这个观点,好的机遇、好的市场环境、好的时代应该联系起来看。
中国是个充满机遇的国度,短短几年成就一批行业大亨。中国的市场环境很好,全世界你找不到第二个综合素质如此高的环境(包括人口基数、消费能力、营商环境)。那么这个时代能有多辉煌,还是由行业里众人来创造。
未来可能并不太远。音视频技术其实就是解决人们感官上的数字技术问题。而对于中间件厂商来说所追求的依然是,如何使其高效、多元化地融入我们这个以互联网商业模式为主导的大环境中。这是一个综合性的考量,这也是对于如何生存的考量。先要活下来,再要活得好些,然后活得长久。
06
—
一些建议
参加工作确实已有15载,不说阅人无数,但认识的同事早已是百位数了。我觉得一个人能在公司里人人都说你好,那几乎是不可能的事情,但只求问心无愧就好。至于什么样的人比较讨人喜欢,或者素质比较高呢?我可能比较喜欢这种人:得意不忘形,失意不失态。
对于年轻人来说,无论在哪个行业,你都要尊重科学,要有敬畏之心。刚认得点皮毛便自觉天下无敌那可是万万要不得。最后再奉劝一句,你能学习掌握很多知识,但会越发感觉更多的未知。面对未知的态度,决定了能看多远和能行多远。
编辑:Cindy Chen