首页 > 其他分享 >2023语言与智能技术竞赛开辟“双赛道”:寻找“全民测评官”,探索AI多模态能力

2023语言与智能技术竞赛开辟“双赛道”:寻找“全民测评官”,探索AI多模态能力

时间:2023-05-22 13:00:41浏览次数:43  
标签:模态 竞赛 语言 AI 模型 智能 2023 双赛

2023语言与智能技术竞赛开辟“双赛道”:寻找“全民测评官”,探索AI多模态能力_模态

开年以来,人工智能大语言模型(LLM)掀起新一轮全球科技竞赛,全球科技巨头打响“百模大战”。当大语言模型正深刻改变人类生产生活方式时,该如何进一步释放其潜能,成为业界关注的问题,也成为了2023语言与智能技术竞赛命题的起点。

5月17日,2023语言与智能技术竞赛正式启动,该大赛由中国计算机学会(CCF)和中国中文信息学会(CIPS)联合主办,百度公司、中国计算机学会自然语言处理专委会和中国中文信息学会评测工作委员会承办。本届大赛设置“大语言模型能力评估”和“视频语义理解”两大赛道,立足现实难题,发掘创新人才,助推技术发展。

紧跟技术趋势命题

全球人才集结“揭榜”

语言与智能技术竞赛自2018年开始,已连续举办5届,凭借面向真实应用场景的任务设计和源自真实场景的数据集,获得产学研各界关注,成为全球最权威、最热门的中文自然语言处理赛事之一。

历届竞赛先后组织了阅读理解、人机对话、语义解析、信息抽取等评测任务,覆盖自然语言处理和人工智能领域的重要前沿课题,对于推进相关技术研究及智能搜索、智能推荐、智能交互等人工智能应用发展具有重要意义。每届赛题如同英雄帖,吸引超过2000支队伍前来“揭榜”,其中80%选手来自全球多所顶尖高校和科技企业,覆盖金融、互联网、传媒、通信、工程机械、能源、生物等多个行业。

当前,大语言模型作为“大数据+大算力+强算法”的产物,基于万亿级数据集预训练后能应对多样化需求,被视为 AI 迈向 AGI (通用人工智能)的里程碑技术。本届竞赛紧跟技术趋势,设置“大语言模型能力评估”和“视频语义理解”两大赛道,旨在携手全球创新人才,为推动语言与智能领域技术发展和应用贡献力量。

寻找“全民测评官”

构建大模型能力评估体系

不同于往届竞赛主要面向专业 AI 开发者,本届大赛第一条赛道“大语言模型能力评估”向所有用户发出邀请。该赛道希望选手从底层能力(生成、逻辑等)、专项能力(创作、问答等)以及在真实场景的应用能力等维度出发,制定评估方案和数据示例,为大语言模型构建能力评估体系(请参考下方示例)。

2023语言与智能技术竞赛开辟“双赛道”:寻找“全民测评官”,探索AI多模态能力_模态_02

这一赛题的设置让个人用户和中小规模开发团队尤为振奋。一方面,大语言模型扎推问世,出现同质化等问题,亟待提出全面、有效的评估方法;另一方面,模型参数量已激增至万亿级,单次训练成本高昂,仅少数头部企业有能力承担。而通过参加语言与智能技术竞赛,选手只需从自身对大模型的理解出发,建立逻辑顺畅的评估维度和评价标准,就能低成本地参与技术变革。作为承办方,百度将为所有选手提供全新一代知识增强大语言模型文心一言的邀请码,帮助选手更好地建立大模型评估体系。 这也意味着,第一条赛道几乎“零门槛”。不限年龄、不限专业,无需代码基础,只要有理有据就能担任“全民测评官”,帮助人们了解大语言模型在不同场景的适应性和局限性,从而打造得更加安全、可控。


探索多模态能力“天花板”

强化视频语义理解

第二条赛道“视频语义理解”则重点面向专业 AI 开发者,评测任务以互联网视频为输入,需在感知内容分析(如人脸识别、OCR 识别、语音识别等)的基础上,通过融合知识、NLP、语音等多模信息,结合知识图谱计算与推理,为视频生成多知识维度的语义标签。

这一任务,是大赛对 AI 多模态能力及 AGI 的一步初探。多模态被业界认为是大语言模型下一步的发展方向,和人类基于视觉系统进行大部分信息获取类似,AI 也正从文本、语音、视觉等单模态智能向多种模态融合的 AGI 方向发展,GPT-4 的识图能力和文心一言的文生图能力均是多模态能力的体现。

参与第二条赛道的选手,将获得由百度提供的基于飞桨平台的基线系统,以便快速上手,达成最佳竞赛条件。同时,选手还可以基于百度飞桨的人工智能学习与实训社区 AI Studio,使用在线编程环境,获取免费 GPU 算力支持,打破算力桎梏,不断深化对 AI 多模态能力的认知。

“百模大战”现下正酣,AGI 不再遥远。正如百度 CTO 王海峰所说,“大模型的通用性越来越强,AGI 在一定程度上已经实现,但 AI 为人类带来价值才是我们努力的方向”。本届竞赛两大赛道,既联合 AI 时代最广泛的参与者,构建全面、科学的评估体系,也鼓励专业 AI 开发者坚定地朝着下一个技术高点前行,让 AI 服务于人类更美好的生活和社会的发展。同时,百度也通过竞赛、校企合作等方式,持续推进“5年500万 AI 人才”计划,为国家战略科技力量建设持续贡献。

即日起,2023语言与智能技术竞赛报名通道已开放,详情可前往大赛官网查看。大赛还准备了丰厚的赛事奖池,获奖团队将有机会在2023语言与智能高峰论坛与众多领域专家介绍作品。

标签:模态,竞赛,语言,AI,模型,智能,2023,双赛
From: https://blog.51cto.com/u_15512933/6323233

相关文章

  • 2023江西省赛赛后总结
    大一acmer的第二场线下赛(第一场是天梯赛。去年省赛是线上赛,结果我还因为时间冲突没有去,最后只有我的两个队友去了),比赛前一天晚上睡不着,早上坐车去比赛的时候就一直很困,比赛开始后却立马精神了。最后只过了四题,拿了个三等奖,我好菜啊。。。。。。别人都是fake,只有我是真菜。。。......
  • APIO2023游记
    没报名APIO。Day\(1\)是5.20。Day\(-2\)今天上午怎么有模拟赛。大为震撼。不过徐老师和我们说这场我们可以鸽掉。于是就鸽子了。就看了眼T2,会了。听zak说这是不归之人与望眼欲穿的人们。应徐教练要求,上午我讲课,大概讲了一下【数据删除】,还拿了松松松的【数据删除】做......
  • 本地Stable Diffusion AI 绘画 (四)
    本地StableDiffusionAI绘画(四)前面讲过了如何把StableDiffusion本地化,自己搭建自己的本地AI绘画。0基础绘画小白,今天就给大家画一种现实美女风。今天出几张美女写真集,嘿嘿。那么我们就按照这个风格格调,来出几张类似风格的图。Lora:<lora:cuteGirlMix4_v10:1>,Embeddin......
  • 6月西安 | 2023年易智瑞遥感应用培训班报名开启
    传递遥感技术助力遥感应用2023年易智瑞遥感应用培训班—6月西安站 主办单位易智瑞信息技术有限公司培训简介遥感应用培训班自2009年启动以来,已经举办了14年。已先后在20多个城市举办了120多场培训,共有7000多名学员参加。每年培训班内容都会根据学......
  • TitanIDE + AIGC 编码辅助,打工人的手替 (福音)!
    近期,行云创新将ARM信创版TitanIDE与ChatGPT做了结合,不仅能满足企业研发环境信创化的需求,还能通过对AIGC等相关技术的利用提升开发效率,既保证了研发合规性又提升了研发效率。不难发现,这几个月ChatGPT在全网一直占据热榜,它是一种人工智能技术驱动的自然语言处理工具,拥有语言理......
  • 当k8s拉镜像出现问题时 需要修改 /etc/containerd/config.toml 配置
    找到plugins."io.containerd.grpc.v1.cri".registry添加此两处配置 [plugins."io.containerd.grpc.v1.cri".registry.configs][plugins."io.containerd.grpc.v1.cri".registry.configs."192.168.16.185:8088".tls]insecu......
  • 2023-Liunx命令 第17章 软件包管理
    17.1rpm指令RPM软件包管理器【语法】rpm[选项][参数]【功能介绍】rpm指令是RPM软件包的管理工具。RPM(全称为:RedHatPackageManager)最早由Redhat公司开发,作为RedhatLinux中软件包的管理工具。目前,有很多主流的发行版都是用RPM来管理Linux的软件包 【选项......
  • NOISC 2023 VP 游记
    省里并没有安排,只能VP。T1感觉比种花还水......码量贼小......T2感觉相当套路,\(b\ge3\)的暴力,剩下的随便判判。火速码完前两题,T3一开始没有任何思路,想着想着突然发现了keyobservation,迅速写完。这前3题和NOIP完全不是一个难度啊(此时已经1h+了,T4这熟悉的风格......
  • NOI 2023 联合省选 游记
    合集链接搞笑选手来了,也许是金勾最低分。Day1CSUST的电脑怎么这么垃圾...进场先看题,T1小清新,T2计数,T3...黄金矿工?T1感觉比去年D1T1好,不过反正人均切。然后就是T2。先想树,发现枚举连通块的大小单次可以做到\(O(n)\),而有用的大小只有\(O(\sqrt{n})\)。至于一般图.........
  • java学习日记20230521-HashTable
    存放的键值对k-v键和值都不能为空,否则会抛出NullPointException使用方法和HashMap一致线程安全,HashMap线程不安全继承的dictionary实现了Map接口底层是一个entry数组,初始化大小为11,临界值为8,第一次扩容为23,按照自己的扩容机制,2N+1 ......