Meta 开源语音 AI 模型支持 1,100 多种语言

时间：2023-05-25 10:34:34浏览次数：65

自从ChatGPT火爆以来，各种通用的大型模型层出不穷，GPT4、SAM等等，本周一Meta 又开源了新的语音模型MMS，这个模型号称支持4000多种语言，并且发布了支持1100种语言的预训练模型权重，最主要的是这个模型不仅支持ASR，还支持TTS，也就是说不仅可以语音转文字，还可以文字转语音。

因为以前对语音方面没有研究，所以我就查阅了一下资料，世界上一共有 7,000 多种语言（我一直以为只有几百），目前的语音识别技术目前仅能覆盖100多种，其实我觉得100多种已经够用了，当然如果有特殊的研究需要那要另说。

Facebook （Meta） AI 的最新大型多语言语音 (MMS) 项目可以为 1,100 多种语言提供语音转文本、文本转语音等功能。这是现有模型的 10 倍！它的官网blog上特别提到了Tatuyo 语，只有几百人在使用。这其实对于日常来说没什么用，但是对于研究来说这是一个很好的例子，因为只有几百人如何找到并有效的提炼数据集呢？

完整文章：

https://avoid.overfit.cn/post/b4e41042a2ee4a21a82e4a48f1061f05

标签：AI,模型,多种语言,Meta,语音,100
From： https://www.cnblogs.com/deephub/p/17430411.html

UE4 AirSim Windows项目交叉编译Linux包
1、从Linux环境下AirSim文件夹导入相关.a库至对应路径 2、项目插件中禁用VR相关插件libopenvr_api.soissuewhenbuildingprojectagainstUE4.25·Issue#2889·microsoft/AirSim(github.com) ......
《花雕学AI》语言+想象+人工智能=图像魔法：微软 Bing 图像魔法师的功能、价值和评测
你有没有想过，如果你能够用语言来创造图像，那该有多么神奇和有趣？你有没有想过，如果你能够看到你想象中的图像，那该有多么震撼和美妙？现在，这一切都可以实现了，因为微软Bing图像魔法师来了！微软Bing图像魔法师是一款能够根据用户的描述生成图像的人工智能产品，它可以让你的语言变成视觉，......
百度云原生数据库GaiaDB的HTAP与多地多活技术实践
摘要：云原生数据库在使用存算分离技术后，可以在完全兼容MYSQL协议和语法的情况下，极大提升单实例所能承载的数据规模与吞吐能力上限。但除了对客户端兼容外，对整个数据生态（地域容灾，数据分析，备份恢复）的适配同样需要大量的设计优化工作。本次分享GaiaDB在跨地域/异构数据同步场景下，吞吐/......
最好用的图片生成AI——Tiamat初体验
昨天看到Tiamat官方给我发了内测成功的邀请函，内容如下：亲爱的AI魔法师：您好！感谢您对Tiamat一如既往的支持，恭喜您获得Tiamat网页版的体验邀请码！无论是工作还是创意，期待您在Tiamatworld当中都能有所收获！Tiamat网页版地址：www.tiamat.world邀请码：Br10I2Fh1lbuirNl9EUf7官方的邀请函很......
nginx: [emerg] bind() to 0.0.0.0:80 failed (98: Address already in use)解决
nginx:[emerg]bind()to0.0.0.0:80failed(98:Addressalreadyinuse)报错信息nginx:[emerg]bind()to0.0.0.0:80failed(98:Addressalreadyinuse)nginx:[emerg]socket()[::]:80failed(97:Addressfamilynotsupportedbyprotocol)定位方法1.先使用ps-e|......
AI智慧安监视频平台EasyCVR用户管理细节优化
EasyCVR视频融合平台基于云边端一体化架构，具有强大的数据接入、处理及分发能力，平台支持海量视频汇聚管理，可支持多协议接入，包括市场主流标准协议与厂家私有协议及SDK，如：国标GB28181、RTMP、RTSP/Onvif、海康Ehome、海康SDK、宇视SDK等。平台丰富的视频能力包括：视频监控直播、录像、......
AI智能视频技术EasyCVR服务正常启动，日志打印实际无进程该如何解决？
EasyCVR基于云边端协同，可支持海量视频的轻量化接入与汇聚管理。平台既具备传统安防视频监控的能力，比如：视频监控直播、云端录像、云存储、录像检索与回看、智能告警、平台级联、云台控制、语音对讲等，也能接入AI智能分析的能力，包括人脸检测、车辆检测、烟火检测、安全帽检测、区域入......
【异常】Failed to bind properties under ‘logging.level‘ to java.util.Map＜java.l
本文目录一、背景描述二、问题原因原因1：缺少层级原因2：标点符号使用错误三、解决方案方案一：针对原因1方案二：针对原因2一、背景描述项目技术：springboot2.1.5.RELEASE+logback1.2.3项目启动报错：org.springframework.boot.context.properties.bind.BindException:Failedtobindp......
生成式AI：一个创建性的新世界
导语人类擅长分析事物，而机器在这方面甚至做得就更好了。机器可以分析一组数据，并在其中找到许多用例（usecase）的模式，无论是欺诈还是垃圾邮件检测，预测你的发货时间或预测该给你看哪个TikTok视频，它们在这些任务中变得越来越聪明。这被称为“分析型AI（AnalyticalAI）”，或传统AI。......
Meta发布650亿参数语言模型LIMA，媲美GPT-4、Bard
前言作为首个全面介绍基于SAM基础模型进展的研究，本文聚焦于SAM在各种任务和数据类型上的应用，并讨论了其历史发展、近期进展，以及对广泛应用的深远影响。本文转载自机器之心欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。......

Meta 开源语音 AI 模型支持 1,100 多种语言

相关文章

赞助商

阅读排行