开源生成式AI模型是可以免费下载的、大规模使用而无需增加API调用成本的,并且可以在企业防火墙后面安全运行。但你不要放松警惕,风险仍然存在,有些风险不仅被放大了,而且针对生成式AI的新风险正在出现。
如今似乎任何人都可以制作AI模型,即使你没有训练数据或者编程能力,也可以采用你最喜欢的开源模型,对其进行调整,然后以新名称发布。
根据斯坦福大学今年4月发布的“AI Index Report”报告显示,2023年有149个基础模型发布,其中三分之二是开源的,并且还有数量惊人的变体。Hugging Face目前追踪到仅在文本生成方面就有超过80000个大型语言模型,所幸的是,它有一个排行榜,让你可以根据模型在各种基准上的得分情况快速对模型进行排序。这些模型虽然落后于大型商业模型,但正在迅速得到改进。
安永美洲公司的生成式AI负责人David Guarrera表示,在研究开源生成式AI时,排行榜是一个很好的起点,他表示,HuggingFace的基准测试尤其出色。
“但不要低估参与其中并使用这些模型的价值,因为这些模型是开源的,所以很容易做到这一点,也很容易将它们替换掉。”他说,开源模型与封闭的商业替代方案之间的性能差距正在缩小。
Uber Freight公司工程负责人Val Marchevsky表示:“开源非常棒,我发现开源非常有价值。”他说,开源模型不仅在性能上赶上了专有模型,而且有些模型提供了闭源模型无法比拟的透明度。一些开源模型可以让你看到什么用于推理,什么不用于推理,可审计性对于防止幻觉是很重要的。”
当然,还有价格上的优势。“如果你的数据中心恰好有容量,为什么还要花钱找别人呢?”他说。
企业已经非常熟悉使用开源代码了。根据Synopsys今年2月发布的开源安全和风险分析报告显示,有96%的商业代码库都包含开源组件。
有了这些经验,企业应该知道该怎么做才能确保他们使用的是经过适当许可的代码,如何检查漏洞,如何保持所有内容都已经修补并保持最新状态。不过,其中一些规则和最佳实践存在可能会被忽视的特殊细微差别,以下就是最主要的几条。
1、奇怪的新许可条款
不同开源许可证类型的情况非常复杂。一个项目用于商业用途是否安全,还是仅对于非商业实施是安全的?可以修改和分发吗?可以安全地合并到专有代码库中吗?如今,随着AI时代的到来,一些新的问题开始涌现。首先,有一些新的许可证类型仅在非常宽松的范围下开放源代码。
以Llama许可为例。Llama系列模型是目前最好的开源大型
标签:AI,可以,生成式,安全,开源,十件事,模型 From: https://blog.csdn.net/wjianwei666/article/details/139283683