首页 > 其他分享 >AI模型的开放与封闭:一场不断演化的博弈

AI模型的开放与封闭:一场不断演化的博弈

时间:2024-11-30 22:33:05浏览次数:10  
标签:AI 模型 封闭 演化 开源 Meta Llama 开放

AI模型的开放与封闭:一场不断演化的博弈
黑智
2024年11月18日 17:17 北京
图片
来源|TIME
编译|杨雪涵

目前,像ChatGPT和Claude这样的顶尖AI模型通常伴随着严格的使用限制。它们的开发者对模型的访问方式进行了严格控制,以防止其被滥用。与之形成鲜明对比的是,开放模型则允许任何人自由下载、修改,应用范围也更为广泛。然而,据非营利研究组织Epoch AI的一份最新报告显示,目前可用的开放模型在性能上与这些顶尖的封闭模型相比大约落后了一年。
“目前最好的开放模型在性能上与封闭模型相当,但存在约一年的滞后,”该报告的首席研究员Ben Cottier说道。
以Meta的Llama 3.1 405B为例,它用了近一年半的时间才追赶上GPT-4发布时的水平。如果Llama 4也以开放模型的形式发布,那么这一差距可能会进一步缩小。正值政策制定者努力应对日益强大的AI系统带来的挑战之际,这一研究结果的发布更凸显了问题的紧迫性。这些AI系统不仅在全球选举中重塑了信息环境,还引发了对其潜在风险的担忧。一些专家警告,此类技术未来可能会被用于制造流行病、发动复杂网络攻击,甚至对人类安全造成更严重的威胁。
Epoch AI的研究人员对2018年以来发布的数百个重要AI模型进行了深入分析。他们通过一系列标准化的技术基准测试,对这些模型在处理数学问题、回答常识问题以及逻辑推理等方面的能力进行了量化评估。同时,研究人员还对训练这些模型所需的计算资源进行了仔细的分析。研究结果表明,虽然计算能力一直是衡量AI模型性能的重要指标,但得益于算法的不断优化,开放模型在某些情况下也能以更少的计算资源达到与封闭模型相近的性能。
Epoch AI的研究人员在报告中写道:“开放模型与封闭模型之间存在的性能差距为政策制定者提供了一个宝贵的时间窗口,让他们可以在最先进的AI能力被广泛应用之前,对其进行评估和监管。”
虽然Meta将Llama模型称为“开源模型”,但严格来说,它并不符合上个月开源倡议组织发布的最新开源定义。该组织作为业界公认的开源标准制定者,对开源的定义进行了更严格的界定。根据最新标准,开源不仅仅意味着共享模型本身,还要求公开模型训练所使用的数据和代码。
尽管Meta发布了Llama模型的权重,允许研究者和开发者进行二次开发,但其“开源”的程度却存在争议。虽然用户可以下载并修改这些权重,但Meta并未公开训练模型所用的数据集和代码。此外,Meta还设置了严格的使用限制,用户需签署《可接受使用政策》方可下载,且禁止将模型用于军事、非法或有害目的。然而,一旦模型的权重被下载,如何确保用户遵守这些限制便成为了另一个难题。
Meta 表示不同意开源倡议组织(OSI)提出的新定义。Meta 的一位发言人在发给《时代周刊》(TIME)的邮件声明中表示:“目前没有单一的开源 AI 定义,而定义这一概念是一项挑战,因为以往的开源定义并未涵盖当今快速发展的 AI 模型的复杂性。我们让 Llama 免费且公开可用,同时我们的许可和可接受使用政策通过设置一些限制措施来保障人们的安全。无论技术定义如何,我们将继续与 OSI 和其他行业组织合作,致力于以负责任的方式让 AI 更加开放和可用。”
Meta对开源倡议组织(OSI)提出的最新开源定义并不认同。Meta代表在回复《时代周刊》的邮件中指出,目前业界尚未形成统一的开源AI定义。考虑到AI模型的飞速发展和复杂性,以往的开源定义难以完全适用于当前的AI模型。Meta选择将Llama模型免费公开,同时通过许可和可接受使用政策设置一定的限制,旨在保障用户安全。Meta强调道,无论最终的开源标准如何演变,他们都将积极参与到与OSI等组织的合作中,共同推动AI技术的开放与负责任发展。
开放AI模型被普遍认为是推动技术民主化、创新和竞争的重要驱动力。英国智库Demos的数字政策主管Elizabeth Seger强调道,开放社区的优势之一在于能够吸引来自全球各地的研究者、开发者和非营利组织,共同参与AI的开发。这种多元化的参与不仅能促进创新,还能提升技术开发的效率。Seger指出:“相较于大型科技公司,这些社区的资源有限,因此,如何用更少的资源实现更多的创新成为了他们关注的焦点。”以印度为例,“用于公共服务交付的AI几乎完全基于开源模型开发,”她补充道。
开放模型还能够带来更大的透明度和问责性。Hugging Face 的机器学习与社会负责人 Yacine Jernite 表示:“任何成为社会基础设施的模型都需要一个开放版本,因为我们需要知道问题的来源。”Hugging Face作为一家维护众多开放模型的平台,深谙其重要性。以Stable Diffusion 2为例,这款开源图像生成模型的开放性使研究人员和公众得以审查其训练数据,从而发现并解决潜在的偏见或版权问题。而像OpenAI的DALL-E这样的封闭模型则难以做到这一点。Jernite强调道:“当我们拥有完整的记录和线索时,审查工作会变得更加高效。”
开放模型的“人人可用”特性固然能够促进创新,但也带来了潜在的风险。因为心怀不轨的人可能会利用这些模型制造危害,例如发布儿童性虐待视频,甚至可能被对手国家所利用。上周,路透社报道称,与中国人民解放军有关的研究机构曾使用Meta的旧版Llama模型开发出一款用于军事的AI工具,这一事实凸显了模型一旦公开发布就无法收回的风险。此外,据报道,像阿里巴巴这样的巨头也开发了自己的开放模型,其性能与美国的同类模型相比,相当具有竞争力。
11月4日,Meta宣布将向包括国防和国家安全应用在内的美国政府机构以及支持政府工作的私营公司(如Lockeed Martin、Anduril、Palantir)提供Llama模型。Meta认为,这一战略不仅能带来经济效益,还能提升美国的全球安全竞争力。
封闭的专有模型虽然在安全性方面具有一定优势,但其不透明性也引发了广泛担忧。由于第三方无法访问模型的训练数据,模型中可能存在的偏见、版权问题等难以被发现和解决。此外,尽管封闭模型通常内置了更严格的防护措施,但恶意攻击者仍有可能绕过这些限制,滥用模型。因此,对于处理敏感数据的组织来说,选择封闭模型也存在一定风险。
治理挑战

目前,封闭模型的安全性主要由私营公司把控。然而,随着政府机构如美国人工智能安全研究院(AISI)的介入,这一局面正在发生改变。今年8月,AISI与Anthropic达成的合作协议标志着政府与私营企业在AI安全领域合作的深化,双方将共同致力于模型发布前的安全测试和评估。
开放模型的去中心化特性使其治理面临独特的挑战,尤其是在应对未来AI可能引发的极端风险方面。Demos智库的数字政策主管Seger指出,开放与封闭模型之间的能力差距是影响政策制定关键因素。如果差距持续扩大,封闭模型将成为监管的重点,因为它们更容易控制。然而,如果差距缩小,开放模型也将面临更严格的监管,这将是一个复杂的问题,因为开放生态系统缺乏统一的监管主体。
与OpenAI和Anthropic等公司不同,Meta的商业模式并不依赖于出售模型访问权限。正如马克·扎克伯格在7月份的公开信中所述,Meta致力于将Llama模型打造为行业内最先进的开源模型。通过开放源代码,Meta希望推动AI技术的发展,并降低AI应用的门槛。
Jernite指出,"能力"这一概念在AI领域缺乏一个明确、统一的定义。这使得我们很难在缺乏共通词汇的情况下对不同AI模型的能力进行客观的比较。他强调,开放模型可以适应各种应用场景,甚至在特定任务上超越封闭模型。
沃顿商学院教授兼技术领域知名评论员Ethan Mollick认为,即使AI不再取得任何进展,也可能需要数年时间才能将这些系统完全融入我们的世界。随着AI系统的新功能不断增加——例如前沿AI实验室Anthropic在十月引入了让其模型直接控制计算机的功能(仍处于测试阶段)——对这种技术的治理难度也将愈加复杂。
沃顿商学院教授Ethan Mollick指出,即使人工智能技术不再进步,将现有AI系统全面融入社会也需要相当长的时间。随着AI功能日益丰富,例如前沿AI实验室Anthropic在十月推出的让其模型直接控制计算机的功能(仍处于测试阶段),治理AI的复杂性也随之增加。
对此,Seger表示,要有效应对开放模型带来的风险,首先必须建立清晰的威胁模型。他指出:“我们必须明确哪些潜在危害可能发生,以及模型的开放性是如何导致这些危害的。只有这样,我们才能有针对性地采取措施,在最关键的环节进行干预。”

标签:AI,模型,封闭,演化,开源,Meta,Llama,开放
From: https://blog.csdn.net/zengxiaojian3/article/details/144161589

相关文章

  • LangChain大模型AI应用开发实践:从基础到实战【文末好书推荐】
    《LangChain大模型AI应用开发实践》是一个围绕使用LangChain进行大规模AI应用开发的主题,重点介绍如何通过LangChain框架和相关技术,构建和优化AI应用。LangChain是一个面向大语言模型(LLM)开发的开源框架,特别适用于与多个外部工具、API及数据源的集成。它帮助开发者通过无缝的......
  • 云计算之elastaicsearch logstach kibana面试题
    1.ELK是什么?ELK其实并不是一款软件,而是一整套解决方案,是三个软件产品的首字母缩写Elasticsearch:负责日志检索和储存Logstash:负责日志的收集和分析、处理Kibana:负责日志的可视化这三款软件都是开源软件,通常是配合使用,而且又先后归于Elastic.co公司名下,故被简称为ELK......
  • 【AIGC】利用AI做贴纸项目,小众冷门赛道,一篇文章教会你
    揭秘AI文创贴纸设计,轻松赚外快的小项目!小红书上那些萌到爆炸的文创图文账号,其实是个隐藏的赚钱项目!咱们有位圈友,就靠AI做文创贴纸设计,一周内就搞定了一张3000的定制大单,简直是让人眼红啊!我随手在各大电商平台搜了搜文创贴纸的销量,哇塞,简直惊呆了!更多实操教程和AI绘画工......
  • AIGC知识解读:如何使用Stable Diffusion生成艺术作品
    如何使用StableDiffusion生成艺术作品详细指南****StableDiffusion作为一款强大的文本到图像生成模型,因其灵活性和高质量的输出,在艺术创作领域备受关注。本文将为你提供一份全面的指南,介绍如何使用StableDiffusion生成艺术作品,包括其原理、安装、使用步骤以及创作技......
  • AI开发平台ModelArts-基本配置-在ECS中创建ma-user和ma-group
    在ModelArts训练平台使用的自定义镜像时,默认用户为ma-user、默认用户组为ma-group。如果在训练时调用ECS中的文件,需要修改文件权限改为ma-user可读,否则会出现Permissiondenied错误,因此需要在ECS中提前创建好ma-user和ma-group。在terminal中执行以下命令:default_user=$(gete......
  • AI开发平台ModelArts-run.sh脚本测试ModelArts训练整体流程
    自定义容器在ModelArts上训练和本地训练的区别如下图:图1本地与ModelArts上训练对比ModelArts上进行训练比本地训练多了一步OBS和容器环境的数据迁移工作。增加了和OBS交互工作的整个训练流程如下:说明:建议使用OBSutil作为和OBS交互的工具,如何在本机安装obsutil可以参考ob......
  • 【Unity 特效插件】Trails FX 帮助开发者在游戏中实现物体移动时产生的尾迹效果
    TrailsFX是一款专为Unity开发者设计的特效插件,用于创建动态的尾迹效果(TrailEffects)。这款插件提供了一种快速而高效的方式,帮助开发者在游戏中实现物体移动时产生的尾迹效果,如快速移动的物体、飞行物、粒子效果等。无论是用于角色技能、武器攻击、物体轨迹,还是火焰、光影......
  • 更多开源创新 挑战OpenAI-o1的模型出现和AI个体模拟突破
      每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行!订阅:https://......
  • 【常用】一键AI美化修图神器,让每张照片都绽放光彩,让修图师担心下岗
    貌似好久没有介绍SD的插件了,今天给小伙伴们带来了一个SD的美颜修图神器,可以在我们生成的图片的基础上进行修图,让图片更加生动。并且该插件还可以调整人物在画面中的比例以及位置哦!好了,闲话少说,我们直接开整。该插件需要从网址进行安装,(需要的小伙伴可以文末自行扫描......
  • AI大模型就业全攻略:职位选择、薪资待遇与学习资源
    前言随着AI技术的迅猛发展,大模型(如GPT系列、BERT、ERNIE等)已经成为推动人工智能创新的重要力量。AI大模型的崛起预计将为中国乃至全球带来大量的就业机会,这些岗位将覆盖多个领域。为了帮助大家更好地把握这些机会,以下是对AI大模型相关就业机会的概述,以及一系列学习资料的推......