首页 > 其他分享 >2023.28 WAIC 大模型

2023.28 WAIC 大模型

时间:2023-07-16 17:35:13浏览次数:34  
标签:智能 WAIC 模型 具身 人工智能 AI 2023.28

2023世界人工智能大会(简称“WAIC”)于7月6日-8日在中国上海开幕。本届世界人工智能大会以“智联世界,生成未来”为主题,涵盖大模型、AI for Science、通用智能体等十大话题方向,充分展现新技术赋能各行各业的多元生态。本次大会有着多个“之最”,参展企业数为400多家,是历届最多;展览面积超过5万平方米,是历届最大。2016年的Alpha go大战李世石开启了人工智能1.0时代。AlphaGo 在 2017 年击败柯洁,第二年,WAIC 第一次在上海举办。当时会场里展示最多的各种巨型屏幕,呈现摄像头监控下的车流或街区,后来这类系统被取名 “智慧城市”。自那时起,人工智能的发展就不完全由市场驱动,而是混合着政府的引导与期待。2022年末OpenAI的ChatGPT引爆生成式AI的创业大潮,人工智能产业正式进入2.0时代。在本届WAIC上,大型科技公司纷纷推出了自己的大模型产品,并且已不局限于大语言模型的文字问答形式,而是拥有着文字生成图片,文字生成视频,图片生成音频等更加创新的应用形态。这次的大模型热潮也不例外,开幕式和一些规模较大的论坛都有官员身影,表态要为推动人工智能产业发展提供政策助力。对比两次浪潮,有人有疑问:“CV(计算机视觉)有安防,大模型会有什么呢?” 会有多少公司愿意每年花上百万、千万元买一个并不完美的聊天机器人帮自己回答客服问题或做文档提炼和摘要。这个疑问展现了大模型热潮的另一面:大模型像是雷神之锤,但如果没有适合它的钉子,就难以发挥被期许的巨大商业价值。增长推力渐弱的当下,大模型是为数不多的亮点,过去半年的狂热炒作后,一些人担心被 AI 替代、颠覆,另一些人决心在被替代前跳入潮流。不过这种全行业的热情暂时缺乏认知基础,多数人还不理解大模型到底是什么、能做什么。一个趋势是行业大模型,比如华为最近发布的盘古大模型。通用大模型在特定场景效果不好。通用大模型一般基于公开文献与网络信息训练,专业知识与行业数据积累不足,导致回答的精准度不够,企业一旦向公众提供了错误信息,可能引起严重后果。行业大模型参数更小、部署成本更低,针对性训练后,回答特定问题时效果更好。而且大公司为各行业公司提供训练或部署大模型服务的云端 MaaS(模型即服务),也能帮助它们先卖一些云服务。另一个趋势是 “具身智能”(Embodied AI),简单来说,具身智能是指人工智能软件与硬件结合起来,去解决现实世界的问题。今年 5 月,英伟达 CEO 黄仁勋说,具身智能会是下一个 AI 浪潮,具身智能的典型代表就是机器人,尤其是能以同一形态产品,完成多种复杂任务的通用机器人。WAIC 现场,机器狗和人形机器人肉眼可见地多了起来,主办方称有 20 多个,往年则是个位数。
当一种新技术热潮显现,往往有两种演进路径:一是新技术兑现了价值,成为基础设施的一部分,不再被关注,比如互联网、推荐算法。另一个是新技术短期内无法兑现价值,然后被新的热潮抢走资源与风头,比如之前的元宇宙,去年 WAIC 大会把元宇宙概念嵌进了主题名,“智联万物、元生无界”,一年过去,只剩下为数不多的 XR (扩展现实)企业将元宇宙作为宣传点,在当下风口过去、融资困难的背景下,企业们大多将有限的预算留给了维持公司经营。现在大模型成为新热点,但过去的一轮轮技术炒作后,局内和局外人都已冷静很多。那些真正想在这个新机会里做些事情的从业者,其实希望大众的热情和期待都更务实一些。


标签:智能,WAIC,模型,具身,人工智能,AI,2023.28
From: https://www.cnblogs.com/doit8791/p/17558177.html

相关文章

  • AI查理芒格—把经典思维模型prompt化
    我又来分享有用的prompt编写思路啦,今天带来的是一则AI思维模型prompt思路:因为今天的prompt使用了嵌套逻辑,会有点绕,所以我先把提纲挈领的部分列在前面,我们的目的是:1:让ChatGPT自己描述思维模型的概念和编写prompt的基本原则,如果有偏差,进行调整2:给ChatGPT写一个prompt示例,让他理解......
  • Python 并发编程之IO模型(转载)
    Python并发编程之IO模型https://www.cnblogs.com/linhaifeng/articles/7454717.htmlIO模型介绍为了更好地了解IO模型,我们需要事先回顾下:同步、异步、阻塞、非阻塞同步(synchronous)IO和异步(asynchronous)IO,阻塞(blocking)IO和非阻塞(non-blocking)IO分别是什么,到底有什么区别......
  • Neutron网络模型
    网络类型VLAN模型VXLAN模型VXLAN和VLANVID转换针对不同场景,VID说法不同。针对VXLAN来说是VNI,针对VLAN来说是VLANID。VLAN和VXLAN共用br-int网桥时,VXLAN解封装后变成VLAN报文,防止br-int上VXLAN报文解封装成VLAN后的内部VLANID可能与VLAN报文的内部VLANID冲突。VLANID......
  • JVM内存模型和类加载
    内存模型JVM内存模型主要分为堆、程序计数器、方法区、虚拟机栈和本地方法栈。堆堆中包含了字符串常量池。程序计数器记录线程执行的字节码的地址。方法区存放已被虚拟机加载的类相关信息,包括类信息、运行时常量池(存放编译生成的字面量和符号引用)。当类加载到内存后,JVM把......
  • 大语言模型中一个调皮的EOS token
    背景最近需要做一个微调的培训,所以不可避免地需要上手一下相关的微调,而受限于机器资源,暂时没法做全参数微调,所以就尝试了目前比较火的两种高效微调方式,分别是PTuning和LoRA。模型选择得自然是现在中文做的比较好的ChatGLM2-6B。微调的代码分别用的是PTuningLoRA在分别尝试了......
  • python TensorFlow保存模型
    TensorFlow保存模型作为经验丰富的开发者,我将指导你如何在Python中使用TensorFlow保存模型。在本文中,我将通过表格展示整个流程,并为每一步提供所需的代码和注释。流程下面是保存TensorFlow模型的整个流程:步骤描述1导入必要的库2创建模型3训练模型4保存模......
  • Linux三剑客,业务模型
    1.三剑客:grep、send、awk作用:主要应用于查看日志、分析日志、命令监控、修改配置文件shell脚本等演示数据:数据1:/etc/passwd数据2:test.sh#!/bin/bashfor((i=1;i<=10;i++))doechotest_$idone数据3:shtest.sh>1.txt 1.1sed功能:编辑,不会改变原来的内容要改变需......
  • 解密Prompt系列11. 小模型也能COT-先天不足后天来补
    前两章我们分别介绍了COT的多种使用方法以及COT的影响因素。这一章更多面向应用,既现实场景中考虑成本和推理延时,大家还是希望能用6B的模型就不用100B的大模型。但是在思维链基础和进阶玩法中反复提到不论是few-shot还是zero-shot的思维链能力似乎都是100B左右的大模型才有的涌现能......
  • 43.三种事件模型是什么
    43.三种事件模型是什么?事件是用户操作网页时发生的交互动作或者网页本身的一些操作,现代浏览器一共有三种事件模型。第一种事件模型是最早的DOM0级模型,这种模型不会传播,所以没有事件流的概念,但是现在有的浏览器支持以冒泡的方式实现,它可以在网页中直接定义监听函数,也可以通......
  • 鸟类识别系统python+TensorFlow+Django网页界面+卷积网络算法+深度学习模型
    一、介绍鸟类识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Django框架,开发网页端操作平台,实现用户上传一张图片识别其名称。二、效果图片三、演示视频and代码视频+......