首页 > 其他分享 >ElevenLabs Voice Design :可通过文本创建个性化语音;苹果推出首个开发者测试版丨 RTE 开发者日报

ElevenLabs Voice Design :可通过文本创建个性化语音;苹果推出首个开发者测试版丨 RTE 开发者日报

时间:2024-10-24 14:42:50浏览次数:1  
标签:RTE Mellum 人工智能 Design 开发者 语音 Voice

 

 

 

开发者朋友们大家好:

 

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

 

本期编辑:@SSN,@鲍勃

01有话题的新闻

1、苹果推出 iOS 18.2 首个开发者测试版,Siri 接入 ChatGPT

 

 

 

今日,苹果向 iPhone 15 Pro 及以上机型推送了 iOS 18.2 首个开发者测试版。新版本包括了更多的 Apple 智能功能更新:

 

Image Playground:允许用户使用提示词生成图片

 

Genmoji:允许用户使用提示词生成自定义的表情符号

 

Siri 接入 ChatGPT:Siri 现在可以把用户的提问和请求移交给 ChatGPT。集成 ChatGPT 的 Siri 支持屏幕响应功能,用户可以发出类似「这张照片中有什么」的提问

 

视觉智能:iPhone 16 系列机型支持,可以用于识别周围的物体和地点,还能获取 Google 搜索结果和 ChatGPT 答案

 

写作工具:重写工具支持描述语气和内容

 

语言更新:新增了对澳大利亚、加拿大、新西兰、南非和英国英语的支持

 

除了 Apple 智能,iOS 18.2 还带来了重新设计的邮件应用、更新的语音备忘录、自定义默认应用等功能。(@ APPSO)

 

2、Runway 推出一键表情复制功能 Act-One

 

 

 

AI 视频生成平台 Runway 发布了全新工具「Act-One」,能够在 Gen-3 Alpha 模型中生成富有表现力的角色表演视频。

 

据介绍,Act-One 可以使用视频和语音表演作为输入源,可以用来进行真人演员的表情捕捉,能够准确地将表演转换为与原始视频比例不同的角色,而不需要传统动作捕捉的大量设备。

 

Act-One 也支持仅靠单个演员和摄像机,生成两个不同的角色的多机位对话场景。(@ APPSO)

 

3、ElevenLabs 推出全新 AI 语音生成工具 Voice Design 可通过文本提示创建个性化语音

 

ElevenLabs 日前发布全新 AI 语音生成工具 Voice Design,通过简单的文本描述即可创建个性化语音,开创了 AI 配音领域的新纪元。

 

这款工具最大的特点是其直观的文本提示功能。用户只需描述所需声音的特征,如「温暖友好的中年女性声音,带着轻微英国口音」,系统便能快速生成符合要求的语音。

 

Voice Design 支持调节多个语音参数,包括年龄、性别、口音、语调和音高等,确保生成的声音精确匹配用户需求。

 

除了模拟真实人声,Voice Design 还突破性地支持创作角色化语音。无论是精灵的空灵之音,还是机器人的金属音效,系统都能准确捕捉并还原这些虚拟角色的声音特征。用户可以反复调整参数,探索无限的创作可能,为游戏开发、有声内容制作等领域提供了强大的创意工具。(@站长之家)

 

4、OpenAI 聘请第一位首席经济学家

 

TechCrunch 报道,OpenAI 聘请了第一位首席经济学家:Aaron Chatterji,他曾为两位美国总统服务,现任杜克大学商业与公共政策教授。

 

Chatterji 将为 OpenAI 研究人工智能造成的经济影响,并领导人工智能如何影响经济增长和就业前景的研究。

 

OpenAI 还任命了前助理副总检察长和 Uber 的合规主管 Scott Schools 为新任首席合规官,将为这家公司就法律要求和道德规范方面进行合作。(@ APPSO)

 

5、JetBrains 为开发者打造最强 AI 助手 Mellum:为编程而生,延迟低、补全快、准确度高

 

 

 

 

JetBrains 公司于 10 月 22 日发布博文,专门设计推出了全新的大语言模型 Mellum,为软件开发者提供更快速、更智能和更具上下文意识的代码补全。

 

官方表示 Mellum 相比较其它大语言模型,最大的亮点就是专门为开发者编程而设计的,具备延迟低、性能强、功能全面等优点,可以在最短时间内为开发者提供相关建议。

 

Mellum 已支持 Java、Kotlin、Python、Go 和 PHP 等流行编程语言,用户可通过加入早期访问计划获取更多语言支持。

 

Mellum 表示补全代码延迟时间是此前的三分之一,显著提高了任务完成速度;完成建议的接受率约为 40%,成为行业内的可靠基准。

 

Mellum 不仅在速度和准确性上表现卓越,还深度集成 JetBrains IDE,让其能够提供符合项目需求的上下文代码建议。

 

JetBrains 承诺 Mellum 的训练数据仅来自公开可用且具有宽松许可的代码,确保用户隐私。(@IT 之家)

02有态度的观点

1、《人类简史》作者尤瓦尔:我们需要防止人工智能失控,确保其符合人类价值观

 

「2024 ESG 全球领导者大会」于 10 月 16 日 -18 日在上海举行。新浪财经欧洲站站长郝倩与知名历史学家、哲学家、《人类简史》、《智人之上》作者尤瓦尔・赫拉利展开对话。

 

尤瓦尔认为,人工智能(AI)的崛起是人类所面临的一大挑战。但不可否认的是,人工智能能够造福人类的观点同样存在。在被问题及,在可持续发展的社会中,人工智能应该扮演什么角色时,尤瓦尔表示,如果能够防止人工智能失控,确保它能符合人类的价值观,那么人工智能可能会成为人类历史上最好的发明。

 

「因为到那时,它的巨大力量将服务于人类社会,而不是危害人类社会」,尤瓦尔举例说,诸如医疗保健等领域,目前没有足够数量的医生为病人服务,而人工智能医生可以在这方面提供巨大帮助。

 

谈及人工智能的监管问题,尤瓦尔强调,「监管非常重要,而且许多国家的政府对此很感兴趣」。

 

他强调,禁止人工智能假冒人类是一项重要规定。「我们欢迎人工智能以医生或教师的身份在社交媒体上与我们互动,但它绝不能假装自己是人类。你在交谈时,需要知道交谈的对象是人类还是人工智能。」

 

此外,同样重要的是,人工智能公司要对其算法的行为负责。如果一家公司研发了一种功能强大的算法,而它对社会、人类心理或其他方面产生了危险的副作用,那么这家公司就必须承担责任,必须对它造成的损害负责。(@IT 之家)

 

写在最后:

 

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

 

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

 

 

素材来源官方媒体/网络新闻

标签:RTE,Mellum,人工智能,Design,开发者,语音,Voice
From: https://www.cnblogs.com/Agora/p/18499577

相关文章

  • 祝大家程序员节快乐,开发者的未来依然可期
    今天是2024年10月24日,是第15个程序员节,祝大家节日快乐!将每年的10月24日作为程序员节,是2010年在园子里发起的(详见博文),然后逐步被越来越多人认同,于是就有了这样一个属于开发者的节日。从2010年到2024年的这十五年,移动互联网与云计算的两波浪潮让开发者队伍飞速壮大,在开发人才紧缺......
  • 报error:0308010C:digital envelope routines::unsupported错--nodejs版本过高(nvm安
    最近小编入职实习,运行(npmrundev)前端项目时报error:0308010C:digitalenveloperoutines::unsupported的错,一查发现原来是nodejs版本过高,与项目不匹配。接下来介绍更换nodejs版本的方法。第一种:官网下载通过nodejs官网下载安装,但有个缺陷,不同版本的nodejs无法顺利的切换......
  • 第七:APP自动化工具-Airtest连接ios系统实操
    一.环境搭建1.苹果电脑(mac笔记本)2.苹果手机3.ios-Tagent3.1.作用:在手机端创建webDriver服务器,可以远程ios设备,定位UI元素3.2.下载地址:[https://github.com/AirtestProject/iOS-Tagent](https://github.com/AirtestProject/iOS-Tagent)3.3.依赖运行:x-code4.x-......
  • HCI_LE_Read_Local_Supported_Features(0x0003)命令全面解析
    目录一、命令概述 二、命令格式2.1.HCI_LE_Read_Local_Supported_Features命令格式2.1.HCICommandComplete响应命令格式三、返回命令 HCICommandComplete参数说明3.1. Status3.2.LE_Features3.3.示例3.4.LE_Features字段中的特性位四、命令执行流程4.1.......
  • Altium Designer10个高效PCB设计技巧大公开
    1、Mil和mm转换快捷键:Q2、标记所有丝印名在使用AltiumDesigner画PCB图的时候,发现元器件的丝印的标号都比器件本身还要大,非常占用空间,默认的字体宽度为0.254mm,高为1.5mm,其实设置成宽为0.15mm,高设置成0.8mm就可以看到,(经验值),那接下来就是如何将PCB板上的所有丝印都改......
  • python中的字典排序--sorted()
    字典的排序:在学习python的时候,了解到相比于列表,字典是一个无序的数据结构,一般都不对其进行排序的。但是要想对字典进行排序,是可以通过sorted()函数进行操作的!关于字典的排序,下面从键key和值value进行代码的运行和分析:【先看代码和执行结果,后面会进行详细的解析】#先定义一......
  • 【Azure Developer】System.Net.WebException: The request was aborted: Could not c
    问题描述在Azure中,使用操作系统为WinServer2019和WinServer2012的虚拟机,同样代码可以链接同一个AzureServiceBus。Win2019成功运行,但是在Win2012上报错:CouldnotcreateSSL/TLSsecurechannel. 问题解答WinServer2012默认不支持TLS1.2,可以通过安装 Update3140245 ......
  • CBDD-Chemical Biology & Drug Design
    文章目录一、征稿简介二、重要信息三、服务简述四、投稿须知五、联系咨询一、征稿简介二、重要信息期刊官网:https://ais.cn/u/3eEJNv三、服务简述本次征文主题包括但不限于:虚拟筛选全新药物设计药物再利用毒性预测临床试验优化性质优化关键词:人工智能;自然......
  • 【Azure Developer】System.Net.WebException: The request was aborted: Could not c
    问题描述在Azure中,使用操作系统为WinServer2019和WinServer2012的虚拟机,同样代码可以链接同一个AzureServiceBus。Win2019成功运行,但是在Win2012上报错:CouldnotcreateSSL/TLSsecurechannel. 问题解答WinServer2012默认不支持TLS1.2,可以通过安装 Update314......
  • 【ID】Adobe 页面设计软件InDesign 软件下载与安装步骤
    目录一、AdobeInDesign软件简介1.1软件概述1.2发展历程1.3应用领域二、AdobeInDesign安装步骤2.1下载2.2安装程序2.3完成安装三、AdobeInDesign功能介绍3.1排版与版面设计3.2图像处理与颜色管理3.3印刷准备与输出3.4自动化与扩展性3.5协作与共......