AIGC可能是当前科技圈最不容许忽视的趋势。根据咨询公司预测*,2023年中国AIGC产业规模约为143亿元,随着底层算力与大模型的完善,有望在2030年突破至惊人的万亿级。
AIGC技术的落地正被无数双眼睛殷切关注着。在与商业价值联结最为紧密的应用层,生成式语音、图像及视频、虚拟数字人无不与多媒体生态息息相关。可以预见,AIGC的热潮必然在多媒体领域中激起千层浪,带来从生产端到消费端全链条的巨大变革。
今年内,音视频领域中的头部玩家布局AIGC的消息纷至沓来。以抖音、快手为代表的短视频平台保持着AI滤镜频繁的上线频率,并将AI能力引入旗下的“剪映” “快影”等应用以更好地为创作者助力;芒果TV自研AIGC产品平台“点位魔方”,通过提升对长视频的理解及检索能力,提高媒资数据的复用率,围绕IP生成短视频、封面海报等内容;小红书上线了“此刻”功能,为笔记智能配图,并提供更多的创作灵感。在交谈中,某社区平台APP的AI负责人向我们表示,AIGC是“不得不做的业务”已经成为了业界共识,怀抱着它能成长为“下一个增长点”的期待,整个团队正以前所未有的重视和审慎的态度对待这件事。
无论是生成语音、图像、视频,或是跨模态的数字人,AIGC技术在业务中被赋予的角色可以笼统的归为以下两类。首先是降本增效,以AI替代或者辅助机械、重复的人力工作,例如智能客服、短视频AI配音等;其次是作为生产力工具,让AI成为产品灵魂的一部分,提高音视频内容创作质量,让用户体验到更多的乐趣和价值。
荔枝集团AI团队负责人刘冶告诉我们,在面对AIGC的上述角色,“两条腿走路”是一个很好的解决方式:“短期内主攻提效——这是行业内大家都能看到清晰路径的事情,例如AIGC生成广告图、音频变声等功能,能直接地提升创作者内容制作的效率。而AI技术产品化,则涉及到长期的研发投入。在语音生成领域,如何更好地模拟人声的音色、语气和抑扬顿挫就是一个亟待解决的难题,一旦有所突破,能覆盖到的场景将会非常多,例如允许播客的播主使用完全由AI创造的音色输出内容,或是与AI主播的群聊玩法等。而这些问题的解决相对困难,需要把它当成长期的技术去沉淀,在过程中逐步地探索。”
技术的演进是无止境的,另一边,AIGC的商业化已经从概念照进现实。此前,在《AIGC商业化落地》圆桌中*,PPIO派欧云联合创始人兼CTO王闻宇分享,当前可以从两个维度去思考业务的商业落地:首先是精度的容忍度,AIGC效果惊艳,但稳定性不足,落地主要考虑对精度要求不严格的场景;其次是成本的消耗,以视频为代表的生成式内容的训练会消耗大量的算力资源,因此实现商业盈利的路也相对更为曲折。综合来看,我们可以看到AIGC目前主要的落地都在对成本和精度要求不高的场景,比如互联网To C业务中,尤其是在电商、文娱方向的应用。
即便如此,在可预见的3-5年中,AIGC都将极大的改变B端和C端用户的消费习惯。运用AI技术,用户消费的电子商品可以真正地实现“私人订制”,智能化的交互在办公、游戏、社交娱乐场景中都蕴含了巨大的想象空间。有趣的是,在搜集资料的过程中,我们发现某家提供数字人服务的企业在官网的常见Q&A中,从场地费、运营人员费用、设备费用一笔笔账目详细算起,以回答客户“使用数字人能省多少钱”这一疑问。由此可见,新技术的用户教育已经在路上了。
特别策划:AIGC与音视频未来
Special Feature: AIGC and the Future of Audio-Visual
过去一年,音视频从业者对AIGC的重要性形成了共识。在此前LiveVideoStackCon 2023深圳站中,【AIGC与内容生产】技术专题和【AIGC商业化落地】圆桌讨论在受众中取得了热烈的反响,突显了大家对AIGC动向的高度关注以及对更多相关内容的渴望和期待。
因此,我们着手策划了“AIGC与音视频未来”系列内容。自12月起至明年春节前夕,我们将陆续推出约5篇的系列稿件,通过采访的形式广泛收集素材,将受访者的观点、我们的行业洞察以及AIGC的未来趋势呈现给LiveVideoStack的读者。希望通过这一系列稿件为读者提供更全面、深入的洞见,帮助大家在AIGC领域获得更多了解。
如果你对音视频技术有深入研究,如果你对AIGC如何赋能多媒体充满兴趣,并沉淀了个人的认知与思考,欢迎加入“AIGC与音视频未来”特别策划中来,你可以接受LiveVideoStack的采访或者向我们投稿,分享你的经验与思考。
*参考:
1.艾瑞咨询,2023年中国AIGC产业全景报告
2.LiveVideoStackCon 2023 深圳站 《AIGC商业化落地》圆桌
标签:视频,落地,AI,AIGC,奇点,音视频,多远,2023 From: https://blog.51cto.com/u_13530535/9099094