首页 > 其他分享 >Meta SAM 2:实时分割图片和视频中对象;Apple Intelligence 首个开发者测试版发布丨 RTE 开发者日报

Meta SAM 2:实时分割图片和视频中对象;Apple Intelligence 首个开发者测试版发布丨 RTE 开发者日报

时间:2024-07-30 15:40:27浏览次数:7  
标签:RTE 视频 Apple AI Intelligence 模型 开发者

 

 

开发者朋友们大家好:

 

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

 

本期编辑:@JLT,@鲍勃

01有话题的新闻

1、Meta SAM 2 登场:首个能在图片和视频中实时分割对象的统一开源 AI 模型

 

Meta AI 宣布推出新一代的 Segment Anything Model (SAM) 2,能够在视频和图像中实现实时的可提示对象分割。

 

SAM 2 可以快速、精确地在任何视频或图像中选择对象。它不仅能在图像中分割对象,还能在视频中追踪对象,即使这些对象在训练时从未见过。该模型支持实时互动,非常适合各种实际应用,比如视频编辑和互动式媒体内容制作。

 

对象分割:它可以在图像或视频中识别出一个特定对象,并将该对象的像素与背景区分开来。例如,在一张包含多个物体的图片中,模型可以准确地找出并标记出某一个物体的轮廓。

 

实时性:模型能够在视频播放的过程中快速处理每一帧,立即识别并分割、跟踪出特定对象。这样可以实现如视频编辑、特效制作等需要快速反馈的应用。

 

可提示:是模型可以根据用户提供的提示(如点击某个物体、框选某个区域等)来进行分割。这种交互方式使得用户可以更精确地控制哪些对象需要被分割。(@小互 AI)

 

2、英伟达「AI 盒子」升级发布软件和服务,黄仁勋打造物理世界的数字副本

 

快科技 7 月 30 日消息,在顶尖计算机图形大会 SIGGRAPH 2024 上,NVIDIA 展示了其在渲染、仿真和生成式 AI 领域的最新进展,其中最引人注目的是 NVIDIA NIM 的全新升级。通过这一平台,用户可以在几分钟内构建 AI 应用,大大简化了 AI 模型的开发和部署过程。

 

黄仁勋将 NIM 形容为「AI-in-a-Box」,即盒子里的人工智能,这次升级通过标准化 AI 模型的复杂部署,进一步优化了性能,使得英伟达在 AI 领域的领导地位更加稳固。

 

英伟达还宣布,Hugging Face 推理即服务平台现在由 Nvidia NIM 提供支持,在云端运行,进一步扩展了 NIM 的应用范围。

 

此外,NVIDIA NIM 微服务通过增强 OpenUSD(通用场景描述)语言的理解,使得各行各业都能够构建基于物理的虚拟世界和数字孪生。(@快科技)

 

3、波形智能发布私人语言模型「Weaver 2.0」,聚焦个性化与自适应技术

 

人工智能初创公司波形智能近日正式发布了新一代多模态无限式长内容生成的个性化自适应私人语言模型「Weaver 2.0」。

 

据介绍,「Weaver 2.0」在技术上实现了多项优化升级,包括千人千面的个性专属、数据为核的自适应/自进化,以及端云结合的高效部署。这些特性使得该模型能够根据用户的个性化需求和使用习惯进行动态调整,从而提供更加精准、高质量的内容生成服务。

 

为了实现模型的持续进化和自我优化,波形智能自研了以数据为核心的可「自主进化」的智能体框架——AIWaves Self-Evolving Agents。这一框架不仅集成了 1.0 版本的可控性能力,还采用 Symbolic Learning 方式,让 Agent 可以在不断更新的数据环境中解析自身的性能表现,并根据用户习惯和反馈定期或主动进行调整。

 

此外,在隐私保护方面,「Weaver 2.0」采用端云结合的高效部署方案,可以根据需求在不同环境下打造「本地私钥」,以确保用户数据的安全性和隐私性。(@环球网科技)

 

4、苹果发布 iPhone AI 首个预览版:暂时向开发者开放

 

据外媒报道,苹果周一发布了 Apple Intelligence 的第一个版本,这是一套人工智能功能,可以改进 Siri、自动生成电子邮件和图像并对通知进行排序。这款名为 Apple Intelligence 的新软件在 iOS 18.1 的开发者测试版中发布。iPad 和 Mac 也有类似的版本。目前,它只对注册的 Apple 开发者开放。

 

此外,用户更新后必须在 Apple 的设置应用中注册候补名单才能访问该服务,这涉及 ping Apple 服务器以处理更复杂的请求。今年晚些时候,它将向公众发布,但 18.1 版本号表明 Apple Intelligence 不会与新 iPhone 硬件一起发布,预计新 iPhone 硬件将于秋季推出运行 iOS 18 的版本。

 

Apple Intelligence 是苹果的一项重要举措。投资者希望人工智能与苹果操作系统的紧密结合能够在未来几年引发一波大规模升级,尤其是考虑到该系统仅适用于 iPhone 15 Pro、iPhone 15 Pro Max 及更新版本。(@鞭牛士)

 

5、OpenAI 旗下 AI 搜索引擎 SearchGPT 官方演示被曝翻车

 

近期,OpenAI 宣布旗下 AI 搜索引擎 SearchGPT 开放内测,但该公司上演了谷歌 Bard 出糗的一幕,SearchGPT 的官方演示被曝出低级错误。据外媒,在回答「8 月在北卡罗来纳 Boone 举办的音乐节」的相关问题时,SearchGPT 出现了幻觉。

 

报道称 OpenAI 发言人已承认了这个错误,但表示「这仅是初始的原型,我们将不断改进。」此外,有参与内测的科技外媒还揭开了 SearchGPT 的搜索机制,与当前 ChatGPT 提供的通用 Bing 搜索功能不同,SearchGPT 更擅长提供实时信息。(@每日经济新闻)

02有态度的观点

1、多名院士专家谈人工智能:中国发展 AI 不能靠「堆芯片」

 

多名院士专家在 2024 中国算力发展专家研讨会上讨论了中国人工智能发展问题。他们认为,中国 AI 发展不能简单模仿美国「堆芯片」模式,而应结合国情,发展具有自主知识产权的「主权级大模型」。专家们提出,智能计算应参考人类智能,从基础理论突破,实现低能耗高智能的计算模式。同时,应重视大模型的算力需求,利用中国在超算领域的技术积累,研发专用超算,克服算力瓶颈。(@环球网)

 

写在最后:

 

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

 

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

 

 

素材来源官方媒体/网络新闻

标签:RTE,视频,Apple,AI,Intelligence,模型,开发者
From: https://www.cnblogs.com/Agora/p/18332577

相关文章

  • [已解决] Rstudio出现炸弹 R Session Aborted
    因为打开了一个过大文件,导致Rstudio环境损坏。查到可以通过替换.history可解决,尝试后无果。重装因为第一次重装没有删除干净,导致重装后再次打开还是同样出现新的问题。卸载再次重装Rstudio在系统中的变量路径全部删除彻底清除Rstudio痕迹,删除隐藏文件夹并在R中运......
  • C# 网络编程:.NET 开发者的核心技能
    原文:C#网络编程:.NET开发者的核心技能-小码编匠-博客园(cnblogs.com) 一、HTTP请求HTTP(HypertextTransferProtocol)是互联网上应用最为广泛的一种网络协议,主要用于从万维网服务器传输超文本到本地浏览器的传输协议。在C#中,处理HTTP请求有多种方式,从传统的System.Ne......
  • ImportError:无法从“langchain_core.utils”导入名称“pre_init”
    当我想从requirements.txt安装langchain库时,我得到ImportError:cannotimportname'pre_init'from'langchain_core.utils'我尝试使用这些命令从终端安装库:pipinstallgigachainpipinstallgigachatpipinstall-Ulangchain-community并且它正在工作,所以我使......
  • ImportError:无法导入名称“_priv_parser”,循环依赖
    我在Pycharm上遇到了这个错误,我正在使用BotCity框架,当出现以下错误时,它并没有开始运行脚本进程:>Traceback(mostrecentcalllast):>>File"<frozenimportlib._bootstrap>",line1176,in_find_and_load>File"<frozenimportlib._bootstrap>"......
  • 国产之光SmartEDA:电子学习界的仿真神器,为何如此受欢迎?
    国产电路仿真新星:SmartEDA为何风靡电子学习界?在电子工程与设计领域,一款名为SmartEDA的国产电路仿真软件正以其独特的魅力和强大的功能,迅速成为广大电子爱好者、学生及专业工程师的宠儿。那么,SmartEDA究竟有何魔力,让它在众多软件中脱颖而出,成为行业内的热门选择呢?在当今这个数......
  • 国产!全志科技T507-H工业开发板( 4核ARM Cortex-A5)规格书
    1评估板简介创龙科技TLT507-EVM是一款基于全志科技T507-H处理器设计的4核ARMCortex-A53国产工业评估板,主频高达1.416GHz,由核心板和评估底板组成。核心板CPU、ROM、RAM、电源、晶振等所有器件均采用国产工业级方案,国产化率100%。同时,评估底板大部分元器件亦采用......
  • Tensorflow:如何将 EagerTensor 转换为 numpy 数组?
    使用标准Tensorflow:importtensorflowastfx=tf.convert_to_tensor([0,1,2,3,4],dtype=tf.int64)y=x+10sess=tf.InteractiveSession()sess.run([tf.local_variables_initializer(),tf.global_variables_initializer(),])coord=tf.train.Coordi......
  • 探索 GPT-4o mini:开发者的新利器
    探索GPT-4omini:开发者的新利器引言随着人工智能技术的迅速发展,OpenAI推出了其最新的GPT-4omini模型。该模型以其卓越的性能和极具竞争力的价格,迅速吸引了开发者的广泛关注。作为一名开发者,我也迫不及待地开始探索这个“迄今为止最具成本效益的小模型”。本文将分享我在......
  • 视野修炼-技术周刊第94期 | 2024 开发者调查报告
    欢迎来到第94期的【视野修炼-技术周刊】,下面是本期的精选内容简介......
  • Django提示mysql版本过低:django.db.utils.NotSupportedError: MySQL 8 or later is re
    这个提示只是Django的版本检测提示,把它注释掉就好了。全局搜索函数:check_database_version_supported() 文件路径是:django_project\dj01\venv\Lib\site-packages\django\db\backends\base\base.py找到第二个,就是就是使用的那个,把它注释了: definit_connection_sta......