首页 > 其他分享 >微软预计年底实现实时语音界面;硅基智能开源 AI 数字人交互平台 Duix丨 RTE 开发者日报

微软预计年底实现实时语音界面;硅基智能开源 AI 数字人交互平台 Duix丨 RTE 开发者日报

时间:2024-07-02 14:32:40浏览次数:14  
标签:RTE Grok AI 模型 Altman 开发者 硅基 GPT

 

 

 

开发者朋友们大家好:

 

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

 

本期编辑:@JLT,@鲍勃

01有话题的新闻

1、Meta 推出 LLM Compiler 代码优化模型,可搭配其他 AI 改善代码生成 / 编译能力

 

IT 之家 6 月 30 日消息,Meta 前天推出了一款名为「LLM Compiler」的模型,该模型基于 Meta 现有的 Code Llama 打造,主打代码优化,目前相关模型已登陆 Hugging Face,提供 70 亿参数及 130 亿参数两个版本,允许学术及商业使用。

 

Meta 认为,尽管业界各大语言模型已在各种编程代码任务中展现了出色的能力,但此类模型在代码优化还有进步空间,目前推出的 LLM Compiler 模型便是一款专为优化代码任务设计的预训练模型,能够模拟编译器对代码进行优化,或将「已经过优化的代码转换回原本的语言」。

 

IT 之家获悉,LLM Compiler 在 5460 亿个 LLVM-IR 和汇编代码标记的庞大语料库上进行了训练,据称能够达到 77% 的“代码优化潜力”,开发者可以自由将相关模型配合其他 AI 模型一起使用,从而改善生成代码的质量。(@IT 之家)

 

2、荣耀宣布与字节豆包大模型达成合作

 

据火山引擎官方消息,荣耀与字节豆包大模型现已达成合作,豆包大模型家族中的语音识别、角色扮演等多款模型将助力荣耀构建移动办公领域垂直模型落地应用的基础能力。据介绍,豆包大模型将为荣耀手机用户提供基于文档理解的互动问答、按照指定格式一键生成会议纪要,以及包括工作总结、演讲稿、会议议程、广告文案、现代诗等在内的多类型、多体裁、多风格智能辅助创作。

 

具体来看,以撰写企业全员活动邀请函这一场景为例,豆包大模型可以提供活动信息、撰写要求,并生成邀请函框架及具体内容,用户也可以通过自然语言对话来对成文进行后续的多次修改。(@CSDN)

 

3、马斯克宣布 xAI 将在 8 月份推出 Grok-2 大模型,预计年底推出 Grok-3

 

7 月 1 日消息,据国外媒体报道,在 3 月份推出 Grok-1.5,4 月份推出 Grok-1.5V 之后,由马斯克创立并领导的人工智能初创公司 xAI,在今年还将对 Grok 系列大模型进行两次重大更新,先后推出 Grok-2 和 Grok-3。

 

Grok-2 和 Grok-3 大模型将在今年推出,是由马斯克在社交媒体上透露的,其中 Grok-2 将在 8 月份推出,Grok-3 则是将在年底推出。

 

此外,马斯克还透露,计划年底推出的 Grok-3,将在 10 万块英伟达的 H100 上训练,有可能超越目前的人工智能基准,并真正抓住全球人工智能爱好者的想象力。(@TechWeb)

 

4、OpenAI CEO Sam Altman:GPT-5 将带来「巨大飞跃」

 

7 月 1 日消息,根据 Aspen Ideas Festival 上的一次访谈,Sam Altman 提到,开发「GPT-5」还需要一些时间。「我们目前持乐观态度,但还有很多工作要做。」Sam Altman 表示。

 

目前尚不清楚 GPT-5 的发布日期,但 Sam Altman 表示它将是「巨大飞跃(significant leap forward)」,或许是相较于其前辈 GPT-4 而言。此前,Sam Altman 曾公开表示 GPT-4「有些糟糕」,并委婉地称之为「充其量只是有点尴尬」。

 

Sam Altman 进一步解释说:「我希望它能取得重大飞跃。GPT-4 经常犯很多错误,比如在推理方面表现不佳,有时还会完全跑偏,犯下低级错误,就像连一个六岁孩子都不会犯的一样。」

 

Sam Altman 关于 GPT-5 的言论暗示,这个模型可能仍处于早期开发阶段。这可能归因于复杂算法、数据问题以及 GPT-5 本身庞大的体量。Sam Altman 将大型语言模型的开发类比为 iPhone 的发布,「第一款 iPhone 仍然存在很多漏洞,但足以让人们使用。」(@IT 之家)

 

5、硅基智能开源 AI 数字人交互平台 Duix,可快速创建部署逼真数字人

 

该平台旨在帮助开发者简化智能数字人的创建和部署过程,提供了丰富的工具和支持,无需技术团队的介入,即可在各种终端设备上部署数字人。用户可以下载多种数字人模型,适用于不同行业需求,并且该项目已开源,便于开发者进行二次开发和个性化定制。功能包括语音输入、语音输出、实时交互和多终端支持等。

 

此外,平台还提供虚拟助理服务,可应用于乘客服务、自动化客户服务、智能咨询服务、虚拟主持人等场景,提升用户体验和服务效率。(@AI 科技评论)

02有态度的观点

1、微软 AI CEO Mustafa Suleyman:今年年底,我们将拥有实时的语音界面,允许完全动态的交互

 

在近日阿斯彭思想节上,微软 AI 负责人 Mustafa Suleyman 与著名财经记者 Andrew Ross Sorkin 进行了一场深入对话。

 

Mustafa Suleyman 预计年底将实现实时语音界面,实现完全动态交互。Suleyman 强调, AI 的发展并不会像加密货币那样成为一时的热潮,而是会持续对社会产生深远影响。他指出,当前的 AI 技术已经在多个领域展现了其价值,这与加密货币在短时间内的表现形成鲜明对比。

 

在谈及中美技术竞争时,Suleyman 呼吁在保持竞争的同时,也应寻求合作的机会。他指出,尽管中美之间存在技术上的分裂,但全球化背景下的合作仍然是不可忽视的趋势。通过共同努力,双方可以在各自的技术生态系统中找到共存的方式。(@有新 Newin)

 

2、扎克伯格最新万字洞察:信息流媒体将转向个人及 AI 互动,看好这三类硬件

 

Meta CEO 扎克伯格预测,未来十年信息流媒体将转向个人及 AI 互动,智能眼镜将逐步取代手机。他看好全息眼镜、神经腕带等三类硬件,认为它们将改变人类互动方式,提升个性化体验。

 

扎克伯格强调 AI 技术将多样化,助力创作者和小企业定制 AI,丰富用户互动。他还提到,技术发展将使更多人追求创造力,AI 不会取代创意工作,而是提供新工具。(@有新 Newin)

 

写在最后:

 

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

 

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

 

 

素材来源官方媒体/网络新闻

标签:RTE,Grok,AI,模型,Altman,开发者,硅基,GPT
From: https://www.cnblogs.com/Agora/p/18279796

相关文章

  • 将硬件的三轴传感器和可燃气体传感器和 AIR780E 数据打包至 EMQX 服务器
    localmqtt_host="www.visionexpand.com.cn"localmqtt_port=1883localmqtt_isssl=falselocalclient_id="emqx"localpub_topic="$thing/up/property/IQMPOB8BI9/temp/humi"localsub_topic="mqtt"localuart2_da......
  • AI冲击创意岗位,OpenAI技术官语出惊人:一些岗位或许本不该存在哈哈,这些段子有意思,太幽默
    现在老美在人工智能领域对我们卡脖子了,但人工智能就像一把达摩克利斯之剑,正威胁着越来越多的创意工作岗位。OpenAI的首席技术官米拉・穆拉蒂(MiraMurati)上个月在达特茅斯大学Thayer工程学院的采访中表示:“一些创意岗位可能会消失。但也许它们本来就不应该存在——如果产......
  • 智能化APP搭建:RPA与AI机器人的融合创新
    随着移动技术的飞速发展,APP已成为连接用户与服务的重要桥梁。本文将深入探讨如何利用机器人流程自动化(RPA)和人工智能(AI)机器人技术,实现APP搭建的自动化和智能化,以提升开发效率和优化用户体验。一、引言:智能化时代的APP搭建在智能化时代,APP搭建不仅是技术活,更是一门艺术。RPA和......
  • 全球AI新闻速递7.1
    全球AI新闻速递1.科大讯飞发布讯飞星火V4.0。2.成都人形机器人创新中心:基于视觉扩散架构的人形机器人任务生成式模型R-DDPRM。3.安徽省人形机器人产业创新中心获批,将打造国内首创、世界领先研究基地。4.亳州牵手华为打造华佗中医药大模型。5.微软:推出视觉基础模型Fl......
  • 【企业级 AI大模型部署白皮书 2024】
    文末有福利!本指南提供全面的AI大模型部署指导,涵盖AI大模型的发展概述、战略决策和部署步骤、方法及选型建议。该指南还指出部署过程中的常见误区,并提供策略自检工具。AI大模型发展关键节点LLM开启的生成式人工智能到底可以解决什么问题,与之前相比,进化在哪儿?企业由数字......
  • 智慧工地AI行为监控系统
    智慧工地AI行为监控系统主要体现在在工地原有的监控系统上面利用智慧工地AI行为监控系统,对分布在工地各处的监控画面传回的视频流进行实时检测。AI行为监控系统可以保障工地施工人员安全,确保工人施工过程及行为符合工地要求规范。这样既保障了工地人员的安全,也同时保证施工企业单......
  • AI模型大宗师Transformer的Encoder魔法棒
       在AI大模型数字王国里,有一位名叫Transformer的魔法大宗师。他有一个神奇的百宝箱,里面有很多魔法工具,其中有个工具叫Encoder,这个工具拥有一种神奇的力量,可以将复杂的输入信息进行编码,提取出关键的特征和依赖关系。   让我们来一起把这个工具掏出来细看一下,看看......
  • LeetCode 2097. Valid Arrangement of Pairs
    原题链接在这里:https://leetcode.com/problems/valid-arrangement-of-pairs/description/题目:Youaregivena 0-indexed 2Dintegerarray pairs where pairs[i]=[starti,endi].Anarrangementof pairs is valid ifforeveryindex i where 1<=i<pairs.l......
  • Karpor - 让 AI 全面赋能 Kubernetes!
    ......
  • AI语音变声器(RVC)小白学习记录
    前言学习RVC变声器的原因,是因为前不久hanser配音的一款国产galgame《饿殍:明末千里行》。看完后劲很大,让人总忍不住回想,意难平。在网上也看到了很多ai训练的游戏主角满穗的声音进行的二创,ai满穗演唱的歌曲等等。于是就萌生了学习ai语言变声器的想法。这个文章主要记录一下......