首页 > 其他分享 >Meta 开源语音 AI 模型支持 1,100 多种语言

Meta 开源语音 AI 模型支持 1,100 多种语言

时间:2023-05-25 10:34:34浏览次数:62  
标签:AI 模型 多种语言 Meta 语音 100

自从ChatGPT火爆以来,各种通用的大型模型层出不穷,GPT4、SAM等等,本周一Meta 又开源了新的语音模型MMS,这个模型号称支持4000多种语言,并且发布了支持1100种语言的预训练模型权重,最主要的是这个模型不仅支持ASR,还支持TTS,也就是说不仅可以语音转文字,还可以文字转语音。

因为以前对语音方面没有研究,所以我就查阅了一下资料,世界上一共有 7,000 多种语言(我一直以为只有几百),目前的语音识别技术目前仅能覆盖100多种,其实我觉得100多种已经够用了,当然如果有特殊的研究需要那要另说。

Facebook (Meta) AI 的最新大型多语言语音 (MMS) 项目可以为 1,100 多种语言提供语音转文本、文本转语音等功能。这是现有模型的 10 倍!它的官网blog上特别提到了Tatuyo 语,只有几百人在使用。这其实对于日常来说没什么用,但是对于研究来说这是一个很好的例子,因为只有几百人如何找到并有效的提炼数据集呢?

完整文章:

https://avoid.overfit.cn/post/b4e41042a2ee4a21a82e4a48f1061f05

标签:AI,模型,多种语言,Meta,语音,100
From: https://www.cnblogs.com/deephub/p/17430411.html

相关文章

  • UE4 AirSim Windows项目交叉编译Linux包
    1、从Linux环境下AirSim文件夹导入相关.a库至对应路径 2、项目插件中禁用VR相关插件libopenvr_api.soissuewhenbuildingprojectagainstUE4.25·Issue#2889·microsoft/AirSim(github.com) ......
  • 《花雕学AI》语言+想象+人工智能=图像魔法:微软 Bing 图像魔法师的功能、价值和评测
    你有没有想过,如果你能够用语言来创造图像,那该有多么神奇和有趣?你有没有想过,如果你能够看到你想象中的图像,那该有多么震撼和美妙?现在,这一切都可以实现了,因为微软Bing图像魔法师来了!微软Bing图像魔法师是一款能够根据用户的描述生成图像的人工智能产品,它可以让你的语言变成视觉,......
  • 百度云原生数据库GaiaDB的HTAP与多地多活技术实践
    摘要:云原生数据库在使用存算分离技术后,可以在完全兼容MYSQL协议和语法的情况下,极大提升单实例所能承载的数据规模与吞吐能力上限。但除了对客户端兼容外,对整个数据生态(地域容灾,数据分析,备份恢复)的适配同样需要大量的设计优化工作。本次分享GaiaDB在跨地域/异构数据同步场景下,吞吐/......
  • 最好用的图片生成AI——Tiamat初体验
    昨天看到Tiamat官方给我发了内测成功的邀请函,内容如下:亲爱的AI魔法师:您好!感谢您对Tiamat一如既往的支持,恭喜您获得Tiamat网页版的体验邀请码!无论是工作还是创意,期待您在Tiamatworld当中都能有所收获!Tiamat网页版地址:www.tiamat.world邀请码:Br10I2Fh1lbuirNl9EUf7官方的邀请函很......
  • nginx: [emerg] bind() to 0.0.0.0:80 failed (98: Address already in use)解决
    nginx:[emerg]bind()to0.0.0.0:80failed(98:Addressalreadyinuse)报错信息nginx:[emerg]bind()to0.0.0.0:80failed(98:Addressalreadyinuse)nginx:[emerg]socket()[::]:80failed(97:Addressfamilynotsupportedbyprotocol)定位方法1.先使用ps-e|......
  • AI智慧安监视频平台EasyCVR用户管理细节优化
    EasyCVR视频融合平台基于云边端一体化架构,具有强大的数据接入、处理及分发能力,平台支持海量视频汇聚管理,可支持多协议接入,包括市场主流标准协议与厂家私有协议及SDK,如:国标GB28181、RTMP、RTSP/Onvif、海康Ehome、海康SDK、宇视SDK等。平台丰富的视频能力包括:视频监控直播、录像、......
  • AI智能视频技术EasyCVR服务正常启动,日志打印实际无进程该如何解决?
    EasyCVR基于云边端协同,可支持海量视频的轻量化接入与汇聚管理。平台既具备传统安防视频监控的能力,比如:视频监控直播、云端录像、云存储、录像检索与回看、智能告警、平台级联、云台控制、语音对讲等,也能接入AI智能分析的能力,包括人脸检测、车辆检测、烟火检测、安全帽检测、区域入......
  • 【异常】Failed to bind properties under ‘logging.level‘ to java.util.Map<java.l
    本文目录一、背景描述二、问题原因原因1:缺少层级原因2:标点符号使用错误三、解决方案方案一:针对原因1方案二:针对原因2一、背景描述项目技术:springboot2.1.5.RELEASE+logback1.2.3项目启动报错:org.springframework.boot.context.properties.bind.BindException:Failedtobindp......
  • 生成式AI:一个创建性的新世界
    导语人类擅长分析事物,而机器在这方面甚至做得就更好了。机器可以分析一组数据,并在其中找到许多用例(usecase)的模式,无论是欺诈还是垃圾邮件检测,预测你的发货时间或预测该给你看哪个TikTok视频,它们在这些任务中变得越来越聪明。这被称为“分析型AI(AnalyticalAI)”,或传统AI。......
  • Meta发布650亿参数语言模型LIMA,媲美GPT-4、Bard
    前言 作为首个全面介绍基于SAM基础模型进展的研究,本文聚焦于SAM在各种任务和数据类型上的应用,并讨论了其历史发展、近期进展,以及对广泛应用的深远影响。本文转载自机器之心欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。......