首页 > 其他分享 >YouTube 上线「用相机拍摄」标签为真实视频「验明正身」;美国被曝考虑限制向中东国家出口 AI 芯片丨 RTE 开发者日报

YouTube 上线「用相机拍摄」标签为真实视频「验明正身」;美国被曝考虑限制向中东国家出口 AI 芯片丨 RTE 开发者日报

时间:2024-10-16 15:48:07浏览次数:6  
标签:RTE 视频 AI 标签 模型 YouTube Meta 验明正身

 

 

 

开发者朋友们大家好:

 

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

 

本期编辑:@SSN,@鲍勃

01有话题的新闻

1、美国被曝考虑限制英伟达、AMD 等向中东国家出口 AI 芯片

 

外媒援引知情人士消息称,美国已讨论限制英伟达、AMD 等美国公司对某些国家人工智能芯片的出口许可证设定上限。这些限制将重点放在波斯湾国家,这些国家对人工智能数据中心的需求越来越大,限制的举措将影响一些国家的人工智能能力。(@腾讯科技)

 

2、扎克伯格:联想基于 Meta Llama 大模型构建个人 AI 智能体 AI Now

 

 

 

联想集团于当地时间 10 月 15 日在美国西雅图召开年度 Tech World 大会。联想 CEO 杨元庆在主题演讲中,与 Meta 创始人兼 CEO 马克・扎克伯格一道宣布,联想与 Meta 合作基于 Llama 大模型推出面向 PC 的个人 AI 智能体 ——AI Now。扎克伯格通过视频在主题演讲上表示,联想与 Meta 已经合作多年,推出了许多卓越的创新成果,将突破性的 AI 和混合现实技术带给更多人,共同构建一个更加智能的未来。

 

联想最新的个人 AI 智能体 ——AI Now,它正是基于 Meta 的 Llama 模型进行构建,将 PC 转变为更具实用性和个性化的智能设备。而这也是 Meta 开源 Llama 的一个重要原因,像联想这样的公司可以对大型语言模型进行微调,优化其在特定使用场景中的表现。

 

近期,Meta 刚刚发布了 Llama 3.2,这是 Meta 的首个开源多模态模型。Meta 发布了 110 亿和 900 亿参数的模型,以及更小的、专为在设备上运行而优化的 10 亿和 30 亿参数的模型。

 

扎克伯格称,我们相信,开源是目前最具成本效益、最可定制化、最值得信赖且性能最优的选择。如今,Llama 已处于前沿地位,正逐渐成为 AI 领域的行业标准,就像「Linux」在操作系统领域的地位一样。通过与 Llama 合作,联想在我们达到这一转折点的过程中扮演了重要角色,并为消费者带来了令人印象深刻的体验。(@IT 之家)

 

3、YouTube 上线「用相机拍摄」标签,为真实视频「验明正身」

 

 

 

YouTube 正在推出新的「用相机拍摄」标签,以表明上传的视频是否来自真实相机拍摄,且具有未经修改的画面和声音。

 

数字内容认证服务 Trupic 上传了一段视频到其频道,展示了新的「用相机拍摄」标签的实际效果,该标签会在视频描述面板中显示。Trupic 表示,这是「YouTube 上第一个带有 C2PA 内容凭证的真实视频」。

 

YouTube 依靠内容来源与真实性联盟(C2PA)标准来检测上传视频的真实性,这意味着该功能仅适用于支持元数据的录制设备和工具。该网站在关于这一新功能的帮助页面中表示,该标签「意味着创作者使用了特定技术来验证其视频的来源,并确认其音频和视频没有被修改过」。此外,创作者必须专门使用 C2PA 2.1 或更高版本的工具,标签才会出现,所以用户可能在很长一段时间内都不会经常看到这个标签。像徕卡这样的公司去年开始在硬件中实施内容凭证,但目前还不清楚这些凭证是否会触发 YouTube 的标签。

 

谷歌还在其博客中解释了其在 YouTube 上增加人工智能生成内容透明度的目标,视频不一定需要未经编辑才能获得标签,只是整个过程的每一步都必须支持 C2PA,并且要避免以下情况:

 

一是破坏来源链的编辑,或者使视频无法追溯到其原始来源。例如,如果用带有 C2PA 元数据的相机拍摄图像,然后将其保存到不支持 C2PA 2.1 或更高版本的手机相册中,这可能会破坏来源链。

 

二是对视频的核心性质或内容进行重大修改,包括声音和视觉效果。

 

三是进行使视频与 C2PA 标准(2.1 及以上版本)不兼容的编辑。(@IT 之家)

 

4、Adobe 推出多款 AI 工具:可构建 3D 场景、消除路人、清洁镜头

 

 

 

据 The Verge 今天凌晨报道,Adobe 近期展示了多款实验性的 AI 工具,可用于动画制作、图像生成、照片及视频的优化等领域,未来有望被整合到 Creative Cloud 中。

 

Project Scenic:该工具可让用户在使用 Firefly 模型生成图像时拥有更大的控制权。其能够生成一个完整的 3D 场景,用户可以自由添加、移动、调整场景中的物体大小,最终结果会根据 3D 场景生成相应的 2D 图像。

 

Project Motion:一款两步动画制作工具,用户无需动画经验即可给文本和基础图像添加动态效果。此外,用户也可以通过文本描述和参考图像,进一步为动画视频添加色彩、纹理和背景,从而实现更复杂的效果。

 

Project Clean Machine:一款专门用于清理图像和视频的工具,能够自动移除诸如相机闪光、路人等干扰元素。例如在移除下图背景烟花导致的过曝现象时,Clean Machine 会自动校正色彩和光线,保证画面一致性。

 

据报道,上述工具将作为「Sneaks」的一部分在 Adobe MAX 大会上首次亮相。Sneaks 是 Adobe 的一个展示新技术并收集用户反馈的项目,不少在 Photoshop、After Effects 等平台上提供的功能(如内容感知填充)都来源于此。(@IT 之家)

 

5、AsrTools,一款智能语音转文字工具

 

 

 

AsrTools 是一款智能语音转文字工具,旨在通过高效的批处理和用户友好的界面,将音频文件快速转换为精确的文字。该工具无需 GPU 支持,支持生成 SRT 和 TXT 格式的字幕文件,适合多种应用场景。其界面基于 PyQt5 和 qfluentwidgets,操作简单,适合各类用户使用。(@机器之心 SOTA 模型)

02有态度的观点

1、普林斯顿教授 Arvind:构建大参数模型不再有效,数据正成为瓶颈;社会对 AI 过度恐惧

 

Arvind Narayanan 是普林斯顿大学的计算机科学教授,同时也是信息技术政策中心的主任。他是《AI Snake Oil》一书的合著者,并大力支持关于仅仅增加计算能力重要性的 AI 扩展迷思。

 

在一次采访中,Arvind 提到,数据量正成为大模型发展的瓶颈。从历史发展来看,计算资源提升模型性能的方式是通过构建更大的模型,从 GPT-3.5 到 GPT-4 之间最大的变化就是模型的规模。Arvind 认为这种趋势正在走向终结。现有的模型已经在几乎所有可获取的数据上进行了训练,数据量的增加可能不会像以前那样带来根本性的改变或新的能力。

 

对于合成数据,Arvind 认为其具有很大的局限性。合成数据在提升数据量方面可能并不总是有效的,因为它可能只是在牺牲数据质量,而没有提供新的学习内容。Arvind 认为,小型化可能会成为 AI 模型的未来发展趋势,因为小型模型成本和隐私方面具有优势,并且随着技术进步,小型模型也能保持与大型模型相似的能力水平。

 

Arvind 提出,社会普遍对 AI 持有过度恐惧的态度,尤其是担心 AI 的自我意识和潜在威胁,但这种恐惧是没有根据的。AI 目前更多的是工具而非自主意识的实体。(@ Z potentials)

 

写在最后:

 

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

 

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

 

 

 

素材来源官方媒体/网络新闻

标签:RTE,视频,AI,标签,模型,YouTube,Meta,验明正身
From: https://www.cnblogs.com/Agora/p/18470135

相关文章

  • 必看!解读Salesforce最新AI趋势报告
    近年来,AI技术正在快速渗透到各行各业,尤其是在客户关系管理(CRM)领域。据Salesforce最新的《AI在CRM中的趋势》报告显示,尽管AI发展潜力巨大,但许多公司在接受这一新技术时仍然犹豫不决。如何解决数据、信任和伦理等关键问题,成为企业能否真正释放AI潜力的关键。员工在AI领域的“自我......
  • 10月报名 | 海克斯康ODYSSEE平台:AI/ML在仿真中的应用培训
    您好!感谢您长期以来对优飞迪科技与海克斯康的关注与支持。我们诚邀您参加10月24日-25日的海克斯康ODYSSEE平台:AI/ML在仿真中的应用培训培训,本次培训将为您带来ODYSSEE模块、功能及应用案例介绍,ODYSSEECAE功能培训等精彩内容,并辅以联合仿真实操帮助您更好了解ODYSSEE这款跨学......
  • 见证 RTE 的新篇章丨 RTE 年度场景 Showcase 暨第四届 RTE 创新大赛开幕
       人工智能技术的快速发展,推动RTE行业持续进化,让实时互动场景变得更丰富、更有趣、更高效。2024年10月25日-26日,由声网和RTE开发者社区联合主办的RTE2024第十届实时互联网大会将在北京·悠唐皇冠假日酒店正式开启,大会将以“AI爱”为主题,推出覆盖实时互......
  • 独家爆料:OpenAI意外开源,Swarm AI多智能体框架!
    1.OpenAI开源Swarm智能体框架OpenAI刚开源的Swarm多智能体框架,短短时间就在github狂揽11.6w星!让我们先快速了解一下Swarm的主要特点:轻量级:Swarm以轻巧的架构,简化了代理的协调和执行。高度可控:简洁的接口让多代理系统控制变得精准易行。易于测试:设计上便于测试,让开......
  • SpringBoot+mail 轻松实现各类邮件自动推送
    在实际的项目开发过程中,经常需要用到邮件通知功能。例如,通过邮箱注册,邮箱找回密码,邮箱推送报表等等,实际的应用场景非常的多。早期的时候,为了能实现邮件的自动发送功能,通常会使用JavaMail相关的api来完成。后来Spring推出的JavaMailSender工具,进一步简化了邮件的自动发送......
  • ComfyGen:AI驱动的智能图像工作流生成器
    近日,来自Nvidia和特拉维夫大学的研究人员推出了一款名为ComfyGen的创新AI工具,为图像生成领域带来了新的突破。ComfyGen能够基于简单的文本提示自动生成复杂的图像工作流程,极大地简化了高质量图像生成的过程。ComfyGen的核心优势在于其多步骤工作流程approach。不同于传统......
  • 程序员转行做什么好:数据分析师、AI大模型工程师、产品经理和云计算工程师。
    先给结论再说理由:数据分析师、AI大模型工程师、产品经理和云计算工程师。这些领域不仅因应了当前技术发展的趋势,也为程序员提供了转型的广阔舞台和职业发展的新机遇。一起来看看吧!数据分析师:数据驱动决策的关键程序员转行时,应考虑当前市场上的热门行业和岗位需求。例如,A......
  • 为什么说程序员转行首选AI大模型工程师
    AI大模型工程师:科技前沿的探索者选择一个有良好发展前景的行业至关重要。AI和大数据领域目前正处于快速发展阶段,预计未来几年对相关人才的需求将持续增长。现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37......
  • AI赋能R-Meta分析核心技术:从热点挖掘到高级模型、助力高效科研与论文发表
     Meta分析是针对某一科研问题,根据明确的搜索策略、选择筛选文献标准、采用严格的评价方法,对来源不同的研究成果进行收集、合并及定量统计分析的方法,现已广泛应用于农林生态,资源环境等方面,成为Science、Nature论文的重要分析方法。以ChatGPT为代表AI大语言模型带来了新一波人工......
  • 【AIGC】AI Agent 和 AI Workflow 的区别,Agent搭建
    Agent详解引言AIAgent和AIWorkflow的区别1.定义与功能2.自主性与灵活性3.应用场景AIWorkflowAIAgent详解基本特征分类应用场景dify搭建简单的agent结语引言随着AI的不断进步,我们见证了多种不同类型的AI概念的出现。其中,AIAgent和AIWorkflow是两个经常......