11月14日,重启后的LiveVideoStack Meet在杭州中国(杭州)5G创新谷举行。
由于杭州城市特使周昌印的努力,本次活动突出了计算机视觉相关的话题,这也引出了另一个问题——计算机视觉与流媒体两个领域是否会逐步融合?计算机视觉与流媒体彼此还有比较清晰的界限的,前者是通过计算机对生物视觉的模拟,强调获得物理的三维信息,并理解空间中物体的属性,后者是将媒体数据压缩并传输,供远端的用户观看。我把这个问题抛给了讲师,得到的反馈是大部分嘉宾认为这两者已经在互相结合了。比如ROI编码,视频自动提取海报图等都用到了计算机视觉技术。
图片来自邹丹平的PPT“视觉SLAM发展历程、新进展与趋势”
计算机视觉在自动驾驶技术的应用方面,特斯拉的马斯克是坚定的拥护者,他完全不认可激光雷达与摄像头促成的混合导航技术。据说最新的特斯拉自动驾驶技术大部分基于摄像头完成,不过仍不完美。如果纯摄像头方案是未来,那么为什么现在做的还不够好?如何人类或者大部分生物都可以运用(几只眼睛的)视觉完成空间定位、物体的识别,而自动驾驶为什么不可以?我把这个问题抛给了上海交通大学邹丹平副教授,他告诉我,目前人类还没有完全搞清我们大脑的运作模式,所以自动驾驶不得不依赖更多的摄像头和传感器混合方案。
下面回顾下现场:
图:视见睿来公司Vistring Inc.的创始人和CEO 周昌印获得上海城市特使奖杯
图:粤港澳大湾区数字经济研究院(简称IDEA)计算机视觉资深研究员 曹成坤 分享“光场相机与新视角合成”
图:峰畅科技联合创始人&CTO 段先德分享“5G VoNR + WebRTC的视频通话落地实践”
图:上海交通大学副教授 邹丹平分享“视觉SLAM发展历程、新进展与未来趋势”
图:阿里巴巴达摩院XR实验室高级算法专家 李宏华分享“面向全景符号识别的超大规模CAD图纸数据集”
图:圆桌“挑战与机遇,现实与理想”,LiveVideoStack联合创始人包研,视见睿来公司Vistring Inc.的创始人和CEO 周昌印,线性资本董事总经理、deep tech方向投资负责人黄松延,灵长智能CEO 苑志超,微帧科技联合创始人、CEO朱政
图:大合影
忙碌之余,必须体验下杭州的生活,可口的小笼包,京杭大运河,满大街的电动车以及有趣的灵魂。每个创业者和技术人都有自己的故事,多媒体圈不乏深耕行业20多年的老炮,从医疗、广告跨界到多媒体的技术人,以及更多90后的创业者。
接下来11月20日周六,LiveVideoStack Meet将移师成都,由于防疫的要求,成都站将通过线上方式进行,扫描下方二维码即可报名。
了解LiveVideoStack Meet后续更多活动信息以及资料下载,请访问 https://shimo.im/docs/gVygrWtq9K9CPg9P/