首页 > 其他分享 >2024 人工智能全景报告《State of AI Report 2024》出炉!

2024 人工智能全景报告《State of AI Report 2024》出炉!

时间:2024-11-13 17:46:10浏览次数:3  
标签:5.2 预测 AI 模型 2024 人工智能 State Part

文章目录


10月10日,我们迎来了2024年的《人工智能全景报告》(《State of AI Report 2024》),该报告已连续七年发布,成为AI行业流行的风向标。

在这里插入图片描述

报告链接:https://docs.google.com/presentation/d/1GmZmoWOa2O92BPrncRcTKa15xvQGhq7g4I4hJSNlC0M/edit?usp=sharing

2024年的《State of AI Report》由AI投资人 Nathan Benaich 和 Air Street Capital 团队制作,有213页,涵盖了研究进展、行业趋势、现有政策、安全问题、未来预测五个方面,对最新的 AI 发展现状和未来预期进行了深度分析。

Part 1:研究进展

1.1 模型性能提升与竞争

前沿实验室模型性能趋同,OpenAI的o1在推理计算上有优势,Llama 3缩小了与闭源模型差距。同时,中国模型在社区排行榜表现出色。

在这里插入图片描述

图:OpenAI在推出o1后保持了其领先地位,规划和推理成为主要的研究前沿。

在这里插入图片描述

图:前沿实验室的性能正在趋同

在这里插入图片描述

图:Llama 3 缩小了开放式和封闭式模型之间的差距。

在这里插入图片描述

图:随着开放源码获得大量社区支持,也成为监管方面的热点问题。它可能被用来混淆不同权重、不同数据集、不同许可和不同访问方法的开放性实践。

在这里插入图片描述

图:尽管受到制裁,中国的 LLM 仍在排行榜上名列前茅,中国开源项目在全球赢得拥趸。

1.2 模型技术创新

  • 架构优化:如尝试模型压缩、混合架构探索等,提高性能并降低资源需求。

  • 数据利用:合成数据应用增加,但存在模型崩溃风险;数据筛选方法改进,如JEST。

  • 多模态发展:VLMs性能提升,扩散模型在图像和视频生成上更先进。

  • 生物医学应用拓展:AI用于生物分子研究和医学领域,但评估和基准测试存在不足。

在这里插入图片描述

图:更好的数据整理方法能否降低训练计算要求?

在这里插入图片描述

图:VLMs 实现开箱即用的 SOTA 性能

在这里插入图片描述

图:图像生成的扩散模型越来越复杂

在这里插入图片描述

图:人工智能荣获诺贝尔奖

基础模型展示了它们超越语言的能力,多模态研究推动了数学、生物学、基因组学、物理科学和神经科学的发展。

在这里插入图片描述

图:AlphaFold 3:超越蛋白质及其与其他生物大分子的相互作用

Part 2:行业趋势

2.1 硬件竞争格局

  • NVIDIA 市场地位稳固,AMD 和 Intel 挑战困难;
  • AI芯片初创公司发展各异。

英伟达(NVIDIA)仍是全球最强大的公司之一,享受着市值达到3万亿美元的辉煌时刻,而监管机构也正在调查生成式人工智能(GenAI)内部的权力集中问题。

在这里插入图片描述

图:英伟达(NVIDIA)仍是全球最强大的公司之一

在这里插入图片描述

图:老牌竞争对手未能与英伟达缩小差距

在这里插入图片描述

图:AI芯片初创公司发展各异:与英伟达不同,他们大多已从销售系统转向开放模型之上的推理接口。

2.2 商业模式转变

  • 企业盈利挑战:一些AI初创公司估值高但盈利难,大型模型提供商收入增长但成本也高。

  • 产品多元化:从模型构建转向产品设计,如聊天机器人与编码环境结合等。

  • 行业应用拓展:在医疗、法律、机器人等多领域应用增加,同时面临版权等问题。

在这里插入图片描述

图:一些AI初创公司估值高但盈利难

在这里插入图片描述

图:OpenAI 的 o1 是最优质的型号,其价格和延迟溢价都很高。

在这里插入图片描述

图:人工智能实验室从建立模型转向设计产品

在这里插入图片描述

图:GenAI 应用继续快速增长

Part 3:现有政策

3.1 各国监管举措

  • 美国有行政命令,各州有不同规则;
  • 欧盟AI法案通过;
  • 中国进入监管执行期;
  • 英国有相关立法动向。

在这里插入图片描述

3.2 数据隐私与安全

各国监管聚焦数据抓取问题,对科技公司提出规范要求。

在这里插入图片描述

Part 4: 安全问题

识别并降低未来高能力人工智能系统可能给我们带来的灾难性风险。

4.1 安全意识转变

从强调安全到加速应用,同时安全研究也在加强。

在这里插入图片描述

图:从美国国会听证会和全球巡回宣传AI(存在)安全议程的时代,领先的前沿模式公司正在加速向消费者分发其人工智能产品。

4.2 安全风险应对

  • 越狱攻击与防御:相关研究增多,但防御难度大。
  • 潜在攻击形式:包括训练数据污染、偏好数据操纵等。
  • 模型可靠性提升:探索提高模型可靠性的方法,如评估和改进不确定性估计。

在这里插入图片描述

图:随着攻击面的扩大,开发人员对越狱的研究也在不断深入

在这里插入图片描述

图:针对红队模型提出无穷无尽的潜在攻击是一项挑战。实验室正越来越多地使用 LLM 来扩展查找和修补漏洞的过程,其中包括 Meta 的两个团队。

在这里插入图片描述

图:LLMs 主要存在两种可靠性错误:与内部知识不一致的反应(幻觉)和与外部知识不一致的信息共享。

在这里插入图片描述

图:我们能否将已知的未知因素公之于众?LLM 通常很难为其输出结果指定可靠的置信度估计。

Part 5:未来预测

预测覆盖了人工智能领域的各个方面,从大型投资到无代码应用的兴起,再到数据隐私和人工智能法规的实施,甚至还涉及了开源技术的竞争、市场领导者的挑战、人形机器人的发展趋势。

5.1 2025十大预测

报告的最后部分,作者提出了他们对未来一年AI发展趋势的一些预测:

  1. 一个主权国家向美国的大型人工智能实验室投资超过100亿美元,引发国家安全审查。
  2. 一个完全没有编码能力的人创建的应用或网站走红,比如进入苹果应用商店前100名。
  3. 前沿实验室在案件开始审判后,对数据收集的实践方式发生了重大转变。
  4. 早期欧盟人工智能法案的实施结果比预期的要宽松,立法者可能会担心他们做得太过分了。
  5. 开源的OpenAI o1替代品在一系列推理基准测试中实现超越。
  6. 挑战者未能在英伟达的市场地位上取得任何有意义的突破。
  7. 由于公司难以实现产品市场契合,对人形机器人的投资水平将下降。
  8. 苹果在设备上的研究取得了强劲的成果,加速了围绕个人设备上人工智能的势头。
  9. 由人工智能科学家生成的研究论文被一个主要的机器学习会议或研讨会接受。
  10. 一个以「生成式人工智能」为元素互动的视频游戏将会取得突破性地位。

在这里插入图片描述

5.2 2023年度报告预测结果

对比去年的10大预测,我们来看看今年实现了几个?

去年报告预测的 10 项,有 5 项被证明是正确的,有 3 项被证明是错误的,有 2 项还没有完全达到,可以等明年再看看。

在这里插入图片描述

5.2.1 正确预测

  1. 好莱坞级别的制作公司开始使用生成式人工智能来制作视觉特效。

证据:虽然大部分效果还不理想,但生成式人工智能视觉特效已经在Netflix和HBO的作品中出现。

  1. 美国联邦贸易委员会(FTC)或英国竞争与市场管理局(CMA)基于竞争理由调查微软/OpenAI的交易。

证据:两个监管机构都在调查合作伙伴关系。

  1. 在全球人工智能治理方面,进展非常有限,会超出高层次的主动承诺(high-level voluntary commitments)。

证据:是的,来自布莱切利和首尔峰会的承诺仍然是自愿和高层次的。

  1. 一首由人工智能创作的歌曲进入公告牌Hot 100前10名或Spotify 2024年热门榜单。

证据:歌曲「Heart on My Sleeve」就是例子,也可以看到一首由人工智能创作的歌曲在德国中位列第27名,并保持了几天。

  1. 随着推理工作负载和成本的显著增长,一家大型人工智能公司(例如OpenAI)收购或建立了一个专注于推理的人工智能芯片公司。

证据:据报道Sam Altman正在筹集大量资金来实现,而谷歌、亚马逊、Meta和微软等公司也在继续构建和改进他们自己的人工智能芯片。

5.2.2 错误预测

  1. 有生成式人工智能媒体公司因其在2024年美国选举期间的滥用行为受到调查。

解释:目前还没有,但让子弹飞一会。

  1. 自我改进的人工智能智能体在复杂环境中(例如AAA级游戏、工具使用、科学探索)超越了现有技术的最高水平。

解释:还没有,尽管在开放性方面有一些比较有前景的工作,如在游戏上的强劲表现。

  1. 科技IPO市场解冻,至少看到一家以人工智能为重点的公司上市(例如DBRX)。

解释:虽然the Magnificent Seven公司已经获得了强劲的增长,但私营公司仍在等待市场稳定;人工智能芯片公司Cerebras已经申请IPO。

5.2.3 不确定预测

  1. 在生成式人工智能的扩展热潮中,有一个团队花费超过10亿美元来训练一个大规模模型。

解释:还没有完全达到,可以等明年再看看。

  1. 金融机构推出GPU债务基金,以取代风险投资股权美元用于计算资金。

解释:还没有,一些风险投资基金传闻提供GPU以换取股权,但还没见过有人走上债务路线。

想要继续阅读报告,请在公众号HsuDan回复「AI20241010」即可获取。

参考:
https://www.stateof.ai/

欢迎各位关注我的个人微信公众号:HsuDan,我将分享更多自己的学习心得、避坑总结、面试经验、AI最新技术资讯。

标签:5.2,预测,AI,模型,2024,人工智能,State,Part
From: https://blog.csdn.net/u012744245/article/details/143748352

相关文章

  • (2024最新毕设合集)基于SpringBoot的广州糖水甜品店推荐系统-28495|可做计算机毕业设计J
    摘要随着人们生活水平的提高和饮食习惯的多样化,甜品在日常生活中扮演着越来越重要的角色。特别是在中国南方地区,甜品店和糖水店已经成为人们经常光顾的地方,而广州作为美食之都,拥有众多具有独特风味的糖水甜品店。然而,由于市场竞争激烈,消费者往往面临选择困难,需要花费大量时间......
  • 阿里云通义大模型团队开源Qwen2.5-Coder:AI编程新纪元
    ......
  • 百度发布 AI 眼镜:全球首搭中文大模型,支持边走边问;OpenAI 联合创始人宣布回归,主抓重大
       开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(Real-TimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编......
  • 对于传统和AI软件开发的拙见
    随着AI技术的不断发展,AI大模型正在重塑软件开发流程,从代码自动生成到智能测试,未来,AI大模型将会对软件开发者、企业,以及整个产业链都产生深远的影响。我个人认为AI大模型还是有不方便的地方,当然这也不是说不方便,而是说有时候AI可能没有弄明白我想要表达的意思。它还是处于......
  • BRICS2024-ST-010-2024一带一路暨金砖国家技能发展与技术创新大赛之企业信息系统安全
    未来技能·创造未来2024一带一路暨金砖国家技能发展与技术创新大赛【企业信息系统安全赛项】BRICS2024-ST-010决赛技术规程金砖国家工商理事会(中方)技能发展工作组一带一路暨金砖国家技能发展与技术创新大赛组会竞赛技术委员会专家组制定2024年4月未来技能·创造未......
  • BRICS2024-ST-010-2024一带一路暨金砖大赛之-企业信息系统安全赛项(选拔赛)技术规程
    未来技能·创造未来2024一带一路暨金砖国家技能发展与技术创新大赛【第二届企业信息系统安全赛项】BRICS2024-ST-010技术规程(选拔赛)金砖国家工商理事会(中方)技能发展工作组一带一路暨金砖国家技能发展与技术创新大赛组会竞赛技术委员会专家组制定2024年4月未来技能......
  • AI辅助项目管理过程风险分析与应对
    背景   在项目管理过程中,风险分析与应对是一个重要的过程,它有助于确保项目的顺利进行并达成目标。常规过程可以分为几个关键步骤:1.风险识别目的:找出可能影响项目成功的各种不确定因素。方法:可以通过研讨会、访谈、问卷调查、历史数据审查等方式来识别潜在的风险。2.风险......
  • 语音 AI 革命:未来,消费者更可能倾向于与 AI 沟通,而非人工客服
    「未来,消费者更可能倾向于与AI沟通,而非人工客服,因为这将成为解决问题的最高效途径。」 这篇来自BessemerVenturePartners的报告,是目前为止对语音AI在企业应用上最完整清晰的一次梳理。 核心要点: 尽管市场规模超过50亿美元,传统的电话客服系统却备受企业和消费......
  • 第十届中国大学生程序设计竞赛 重庆站(CCPC 2024 Chongqing Site)
    B.osu!mania按照题目的公式进行计算,注意四舍五入的精度问题。#include<bits/stdc++.h>usingnamespacestd;usingi32=int32_t;usingi64=longlong;usingldb=longdouble;usingvi=vector<int>;usingpii=pair<int,int>;voidsolve(){ intppmax;......
  • NOIP 模拟赛:2024-11-11
    T1:法一:\(O(n^2)\)的DP。\(dp[i][j][0/1]\)表示在\(i\)的子树内染色,\(i\)是红/黑,使得每个要求的结点的黑点个数都等于\(j\)。法二:\(O(n)\)的神秘做法。取出最浅的被要求结点,把深度\(\le\)它的都染成黑色,其余点都染成红色。T2:对于一个元素属于\([0,2^m)\),且互不相......