继openAI GPT3.5免登录后,OpenAI最近推出了一款名为VoiceEngine
的语音引擎技术,这技术能通过简单的文本输入和15秒的音频样本,就能生成跟原始说话者声音一模一样的语音,不仅逼真,还充满了情感。
这VoiceEngine技术,是在2022年末由OpenAI的大佬们开发出来的。现在,它已经运用到了OpenAI的文本转语音API和ChatGPT的语音和朗读功能里的预设语音里
不过啊,虽然这技术厉害,但OpenAI也知道它可能带来的一些风险。所以啊,目前这技术还只是在小范围内开放给一些可信赖的合作伙伴进行测试。OpenAI这么做,就是想先了解这技术到底能干啥,风险有多大,同时也想听听大家对于如何负责任地使用这个技术的看法。
说到应用。比如,教育科技公司AgeofLearning就用它来给那些不会阅读的小朋友或者孩子们制作旁白,让学习变得更有趣。还有视觉叙事平台HeyGen,它用VoiceEngine来翻译视频,让内容创作者和企业能把内容翻译成各种语言,还保持着原发言人的口音
另外,替代沟通应用Livox也给残障人士提供了多语言的语音选择,让他们能更好地表达自己。还有Norman Prince神经科学研究所,他们甚至探索着用这技术来帮助那些因为疾病说不出话的人恢复声音。
当然了,这技术虽好,但也不能乱来。OpenAI就说了,他们会在推广这技术的同时,实施声音认证,确保原始说话人同意,还要建个“禁用声音列表”,防止有人模仿名人的声音。同时,OpenAI也鼓励大家采取措施来应对这个技术带来的挑战,比如别再用语音来验证身份了,得研究怎么保护个人的声音,也得提高大家对AI技术的认识,还有发展新技术来追踪视听内容的来源。
大家可以去openAI的网站里去看下这项技术,到底有多厉害:
https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices
或者直接点击链接:
https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices