开发者朋友们大家好:
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
本期编辑:@CY,@JLT,@鲍勃
01 有话题的新闻
1、红杉资本入局,马斯克麾下 AI 公司接近达成 60 亿美元融资
4 月 26 日,有市场消息称,马斯克可能即将获得数十亿美元的资金,以将其聊天机器人 Grok 打造成为 ChatGPT 的劲敌。
两位知情人士透露,马斯克麾下初创公司 xAI 正在融资 60 亿美元,在不包括这笔投资的情况下,对该公司的估值为 180 亿美元。其中一名知情人士表示,红杉资本是参与本轮 xAI 融资的投资者之一,另一名知情人士表示,预计融资将在未来两周内完成。在人工智能赛道上,这轮融资是规模最大的单笔融资之一。(@第一财经)
2、昆仑万维 2050 全球研究院发布并开源 Vitron
昆仑万维 2050 全球研究院、新加坡国立大学、新加坡南洋理工大学团队联合发布开源了 Vitron 通用像素级视觉多模态大语言模型。
Vitron 支持从视觉理解到视觉生成、从低层次到高层次的一系列视觉任务,包括静态图像和动态视频内容进行全面的理解、生成、分割等任务。同时,Vitron 也解决了图像/视频模型割裂的问题,为通用视觉大模型的终极形态奠定了基础,是迈向通用人工智能(AGI)的重要一步。
Vitron 相关的论文、代码和 Demo 已全部公开,其在综合性、技术创新、人机交互和应用潜力等方面展现出的独特优势和潜力,不仅推动了多模态大模型的发展,还为未来的视觉大模型研究提供了一个新的方向。(@爱范儿)
3、阿里云宣布自研 EMO 模型上线通义 App,用照片 + 音频生成唱歌视频
4 月 25 日,阿里云宣布,通义实验室研发的 AI 模型——EMO 正式上线通义 App,并开放给所有用户免费使用。借助这一功能,用户可以在歌曲、热梗、表情包中任选一款模板,然后通过上传一张肖像照片就能让 EMO 合成演戏唱歌视频。
EMO 是一个由阿里巴巴集团智能计算研究院开发的框架,一个音频驱动的 AI 肖像视频生成系统,能够通过输入单一的参考图像和语音音频,生成具有表现力的面部表情和各种头部姿势的视频。
据介绍,通义 App 首批上线了 80 多个 EMO 模板,但目前暂未不开放自定义音频。(@IT 之家)
4、Open-Sora 全面开源升级:支持 16s 视频生成和 720p 分辨率
Open-Sora 更新支持最长 16 秒视频生成,分辨率达到 720p,全面适应不同宽高比和视频处理需求;技术升级引入了多时间/分辨率/长宽比/帧率的支持,利用多阶段训练方法提升视频质量;完全开源,包括模型架构、权重、数据处理流程,促进社区共享与协作开发。(@机器之心)
5、英伟达收购两家 AI 创企,要让 AI 芯片变得更便宜
4 月 25 日,英伟达宣布达成一项最终协议,收购 Run:ai。据 CTech 报道,这笔交易价预计约为 7 亿美元。同时,英伟达还收购了另一家以色列 AI 公司 Deci。
根据 LinkedIn,Run:ai 约有 150 名员工,累计融资 1.18 亿美元;Deci 拥有约 100 名员工,累计融资 5500 万美元。英伟达与 Deci 的交易未公开披露,交易价未知。
据 The Information 报道,被英伟达最近达成收购交易的这两家创企,旨在降低开发或运行生成式 AI 模型的成本,帮助客户更有效地利用 AI 计算资源,进而提振英伟达 AI 芯片的需求。
过去一年半,英伟达芯片需求随着 AI 热潮飙升,使其收入暴涨。但越来越多企业开始对 AI 模型的高运行成本与难以平衡的回报而感到负担。如果英伟达能帮助降低运行模型的成本,可能有更多企业愿意向英伟达下订单。(@凤凰科技)
6、输入法重大漏洞曝光,近 10 亿用户受影响
近日,Citizenlab 研究人员调查了多家厂商的输入法应用安全漏洞并报告称:除华为以外,百度、荣耀、科大讯飞、OPPO、三星、腾讯、Vivo 和小米等供应商的九款应用程序中有八款均存在安全漏洞。
由于输入法安全漏洞可导致个人财务信息、登录账号和隐私泄露。因此研究人员建议使用这些键盘的用户及时更新应用程序和操作系统,并改用完全在设备上操作的键盘应用程序,以减少这些隐私问题。
同时,应用程序开发人员应注意使用经过严格测试的标准加密协议,而不是开发可能存在安全问题的自制版本。此外,研究人员还敦促应用程序商店运营商不要对安全更新进行地理封锁,并允许开发者证明所有数据都是通过加密传输的。( @FreeBuf )
7、字节跳动称没有出售 TikTok 的计划
昨晚字节跳动发文,称外媒报道字节跳动商讨出售 TikTok 美国业务多数股权的消息不实,字节跳动没有任何出售 TikTok 的计划。
此前,TikTok CEO 周受资在社交平台,用视频方式回应美国总统拜登签署对 TikTok 的剥离法案一事。周受资表示,该法案将会把 TikTok 从「在我们平台上找到社区和连接的 1.7 亿美国用户身边夺走。但请放心,我们不会离开。我们很有信心,将继续在法庭里为你们的权利奋斗」。
在视频中,周受资表示,该法案将会把 TikTok 从「在我们平台上找到社区和连接的 1.7 亿美国用户身边夺走。但请放心,我们不会离开。我们很有信心,将继续在法庭里为你们的权利奋斗」。
当地时间 4 月 24 日,拜登表示他已于当日签署了价值 950 亿美元的对外援助法案。该法案涉及强制字节跳动剥离旗下应用 TikTok 美国业务。在相关条款中,字节跳动被限期约九个月剥离其美国业务,否则将面临美国全国禁令。(@爱范儿)
02 有态度的观点
1、扎克伯格:生成式 AI 可能要投资数年,才能实现有效盈利
扎克伯格表示,在全面扩展 Meta AI、企业 AI 以及其他更多盈利服务之前,Meta 还需要经历几年的投资周期。构建领先的人工智能将是一项更为艰巨的任务,可能需要数年时间才能完成。
不过,从积极的角度看,一旦新人工智能服务达到规模,Meta 就有了实现有效盈利的良好基础。(@腾讯科技)
2、李开复:未来十年,AI 将从聊天机器人变成全模态理解的超级智能助手
4 月 25 日,在 2024 年中关村论坛年会上,创新工场董事长兼零一万物 CEO 李开复发表演讲时提到,人工智能尤其是大模型技术正在成为推动新质生产力发展的关键因素,未来十年,AI 将从聊天机器人变成全模态理解的超级智能助手。(@腾讯科技)
写在最后:
我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。
对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。
素材来源官方媒体/网络新闻
标签:RTE,伟达,视频,TikTok,模型,AI,开发者 From: https://www.cnblogs.com/Agora/p/18159807