开发者朋友们大家好:
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
本期编辑:@SSN,@鲍勃
01有话题的新闻
1、美国被曝考虑限制英伟达、AMD 等向中东国家出口 AI 芯片
外媒援引知情人士消息称,美国已讨论限制英伟达、AMD 等美国公司对某些国家人工智能芯片的出口许可证设定上限。这些限制将重点放在波斯湾国家,这些国家对人工智能数据中心的需求越来越大,限制的举措将影响一些国家的人工智能能力。(@腾讯科技)
2、扎克伯格:联想基于 Meta Llama 大模型构建个人 AI 智能体 AI Now
联想集团于当地时间 10 月 15 日在美国西雅图召开年度 Tech World 大会。联想 CEO 杨元庆在主题演讲中,与 Meta 创始人兼 CEO 马克・扎克伯格一道宣布,联想与 Meta 合作基于 Llama 大模型推出面向 PC 的个人 AI 智能体 ——AI Now。扎克伯格通过视频在主题演讲上表示,联想与 Meta 已经合作多年,推出了许多卓越的创新成果,将突破性的 AI 和混合现实技术带给更多人,共同构建一个更加智能的未来。
联想最新的个人 AI 智能体 ——AI Now,它正是基于 Meta 的 Llama 模型进行构建,将 PC 转变为更具实用性和个性化的智能设备。而这也是 Meta 开源 Llama 的一个重要原因,像联想这样的公司可以对大型语言模型进行微调,优化其在特定使用场景中的表现。
近期,Meta 刚刚发布了 Llama 3.2,这是 Meta 的首个开源多模态模型。Meta 发布了 110 亿和 900 亿参数的模型,以及更小的、专为在设备上运行而优化的 10 亿和 30 亿参数的模型。
扎克伯格称,我们相信,开源是目前最具成本效益、最可定制化、最值得信赖且性能最优的选择。如今,Llama 已处于前沿地位,正逐渐成为 AI 领域的行业标准,就像「Linux」在操作系统领域的地位一样。通过与 Llama 合作,联想在我们达到这一转折点的过程中扮演了重要角色,并为消费者带来了令人印象深刻的体验。(@IT 之家)
3、YouTube 上线「用相机拍摄」标签,为真实视频「验明正身」
YouTube 正在推出新的「用相机拍摄」标签,以表明上传的视频是否来自真实相机拍摄,且具有未经修改的画面和声音。
数字内容认证服务 Trupic 上传了一段视频到其频道,展示了新的「用相机拍摄」标签的实际效果,该标签会在视频描述面板中显示。Trupic 表示,这是「YouTube 上第一个带有 C2PA 内容凭证的真实视频」。
YouTube 依靠内容来源与真实性联盟(C2PA)标准来检测上传视频的真实性,这意味着该功能仅适用于支持元数据的录制设备和工具。该网站在关于这一新功能的帮助页面中表示,该标签「意味着创作者使用了特定技术来验证其视频的来源,并确认其音频和视频没有被修改过」。此外,创作者必须专门使用 C2PA 2.1 或更高版本的工具,标签才会出现,所以用户可能在很长一段时间内都不会经常看到这个标签。像徕卡这样的公司去年开始在硬件中实施内容凭证,但目前还不清楚这些凭证是否会触发 YouTube 的标签。
谷歌还在其博客中解释了其在 YouTube 上增加人工智能生成内容透明度的目标,视频不一定需要未经编辑才能获得标签,只是整个过程的每一步都必须支持 C2PA,并且要避免以下情况:
一是破坏来源链的编辑,或者使视频无法追溯到其原始来源。例如,如果用带有 C2PA 元数据的相机拍摄图像,然后将其保存到不支持 C2PA 2.1 或更高版本的手机相册中,这可能会破坏来源链。
二是对视频的核心性质或内容进行重大修改,包括声音和视觉效果。
三是进行使视频与 C2PA 标准(2.1 及以上版本)不兼容的编辑。(@IT 之家)
4、Adobe 推出多款 AI 工具:可构建 3D 场景、消除路人、清洁镜头
据 The Verge 今天凌晨报道,Adobe 近期展示了多款实验性的 AI 工具,可用于动画制作、图像生成、照片及视频的优化等领域,未来有望被整合到 Creative Cloud 中。
Project Scenic:该工具可让用户在使用 Firefly 模型生成图像时拥有更大的控制权。其能够生成一个完整的 3D 场景,用户可以自由添加、移动、调整场景中的物体大小,最终结果会根据 3D 场景生成相应的 2D 图像。
Project Motion:一款两步动画制作工具,用户无需动画经验即可给文本和基础图像添加动态效果。此外,用户也可以通过文本描述和参考图像,进一步为动画视频添加色彩、纹理和背景,从而实现更复杂的效果。
Project Clean Machine:一款专门用于清理图像和视频的工具,能够自动移除诸如相机闪光、路人等干扰元素。例如在移除下图背景烟花导致的过曝现象时,Clean Machine 会自动校正色彩和光线,保证画面一致性。
据报道,上述工具将作为「Sneaks」的一部分在 Adobe MAX 大会上首次亮相。Sneaks 是 Adobe 的一个展示新技术并收集用户反馈的项目,不少在 Photoshop、After Effects 等平台上提供的功能(如内容感知填充)都来源于此。(@IT 之家)
5、AsrTools,一款智能语音转文字工具
AsrTools 是一款智能语音转文字工具,旨在通过高效的批处理和用户友好的界面,将音频文件快速转换为精确的文字。该工具无需 GPU 支持,支持生成 SRT 和 TXT 格式的字幕文件,适合多种应用场景。其界面基于 PyQt5 和 qfluentwidgets,操作简单,适合各类用户使用。(@机器之心 SOTA 模型)
02有态度的观点
1、普林斯顿教授 Arvind:构建大参数模型不再有效,数据正成为瓶颈;社会对 AI 过度恐惧
Arvind Narayanan 是普林斯顿大学的计算机科学教授,同时也是信息技术政策中心的主任。他是《AI Snake Oil》一书的合著者,并大力支持关于仅仅增加计算能力重要性的 AI 扩展迷思。
在一次采访中,Arvind 提到,数据量正成为大模型发展的瓶颈。从历史发展来看,计算资源提升模型性能的方式是通过构建更大的模型,从 GPT-3.5 到 GPT-4 之间最大的变化就是模型的规模。Arvind 认为这种趋势正在走向终结。现有的模型已经在几乎所有可获取的数据上进行了训练,数据量的增加可能不会像以前那样带来根本性的改变或新的能力。
对于合成数据,Arvind 认为其具有很大的局限性。合成数据在提升数据量方面可能并不总是有效的,因为它可能只是在牺牲数据质量,而没有提供新的学习内容。Arvind 认为,小型化可能会成为 AI 模型的未来发展趋势,因为小型模型成本和隐私方面具有优势,并且随着技术进步,小型模型也能保持与大型模型相似的能力水平。
Arvind 提出,社会普遍对 AI 持有过度恐惧的态度,尤其是担心 AI 的自我意识和潜在威胁,但这种恐惧是没有根据的。AI 目前更多的是工具而非自主意识的实体。(@ Z potentials)
写在最后:
我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。
对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。
素材来源官方媒体/网络新闻
标签:RTE,视频,AI,标签,模型,YouTube,Meta,验明正身 From: https://www.cnblogs.com/Agora/p/18470135