首页 > 其他分享 >ChatGLM3革新:推理速度提升2-3倍,成本降低一半的AI大模型

ChatGLM3革新:推理速度提升2-3倍,成本降低一半的AI大模型

时间:2023-11-25 10:06:45浏览次数:36  
标签:AI 模型 ChatGLM3 端侧 提升 推理

引言

随着人工智能技术的飞速发展,自然语言处理(NLP)已成为最具挑战性和活跃的研究领域之一。在这个领域,大型预训练模型已被证明是实现卓越性能的关键。智谱 AI 最近发布的 ChatGLM3,作为其第三代对话大模型,不仅在性能上有了显著提升,还在多个方面展现了其技术优势。

ChatGLM3革新:推理速度提升2-3倍,成本降低一半的AI大模型_chatglm3


推理速度和成本

ChatGLM3 的推理框架基于最新的高效动态推理和显存优化技术。在相同的硬件和模型条件下,与目前最佳的开源实现相比,如伯克利大学的 vLLM 和 Hugging Face TGI,ChatGLM3 的推理速度提升了 2-3 倍,推理成本降低了一倍。每千 tokens 的处理成本仅为 0.5 分,这在成本效益上具有显著优势。

性能提升

在 44 个中英文公开数据集的测试中,ChatGLM3 表现出色,在国内同尺寸模型中排名首位。在 MMLU、CEval、GSM8K 和 BBH 等基准测试中,ChatGLM3 分别取得了 36%、33%、179% 和 126% 的性能提升。这一成就主要归功于其独创的多阶段增强预训练方法和更丰富的训练数据。

多模态能力

ChatGLM3 引入了多模态理解能力,特别是其 CogVLM 功能,在多个国际标准图文评测数据集上取得了 SOTA(State of the Art)成果。此外,ChatGLM3 还包括代码增强模块和网络搜索增强功能,这些都是其技术升级的一部分。

ChatGLM3革新:推理速度提升2-3倍,成本降低一半的AI大模型_模态_02

端侧模型

ChatGLM3 推出的端侧模型,如 ChatGLM3-1.5B 和 3B,是为了满足日益增长的边缘计算需求。这些模型特别优化了算法和结构,使其能够在资源受限的设备上高效运行。例如,ChatGLM3-1.5B 在标准智能手机上的响应时间减少到了仅 300 毫秒,而能耗降低了 40%,这使得 AI 技术在移动设备上的应用变得更加广泛和实用。

与二代模型对比

与 ChatGLM 二代模型相比,ChatGLM3 在多个方面都有显著的提升。例如,在处理相同的任务时,ChatGLM3 的准确率提高了 15%,而处理速度提高了 20%。这得益于其改进的算法和更大的训练数据集,使得模型在理解和生成语言方面更加精准和高效。

ChatGLM3革新:推理速度提升2-3倍,成本降低一半的AI大模型_数据集_03

与国际大模型对比

虽然直接的性能对比数据目前尚不可得,但从已公布的技术细节来看,ChatGLM3 在多个方面与国际大模型如 GPT-4V 相媲美。例如,在多模态理解能力方面,ChatGLM3 在国际标准图文评测数据集上的表现与 GPT-4V 相当,显示出其在图文理解和生成方面的强大能力。此外,ChatGLM3 在端侧模型的优化方面也展现了其独特的技术优势,这在国际大模型中尚属罕见。

结语

ChatGLM3 的发布不仅是智谱 AI 技术创新的一个里程碑,也是中国大模型技术发展的一个重要标志。通过不断的技术创新和优化,ChatGLM3 展现了其在自然语言处理领域的强大实力和广阔的应用前景。

参考资料

HuggingFace


https://huggingface.co/THUDM


GitHub


https://github.com/THUDM/ChatGLM3


AI快站免费加速模型下载


https://aifasthub.com/models/THUDM


标签:AI,模型,ChatGLM3,端侧,提升,推理
From: https://blog.51cto.com/u_16323307/8556004

相关文章

  • 【行行AI公开课】AIGC从模型到落地:促进技术落地与产业变革
    11月26日北京大学的北大创新学社将举行“AI-FUSION”系列活动第十期。北大创新学社是北京大学团委和光华管理学院团委指导成立,是2023HICOOL全球创业者峰会唯一受邀参展的高校社团。“首都高校创新创业大赛”发起方及主办单位。“AI-FUSION”是AI创投部人工智能行业社群打造的系列......
  • [Codeforces] CF1703F Yet Another Problem About Pairs Satisfying an Inequality
    时间限制\(2s\)|空间限制\(250M\)题目描述给你一个序列$a_1,a_2,\dotsa_n$。请计算出满足下面条件的$(i,j)(1\leqi,j\leqn)$个数。$a_i<i<a_j<j$.输入格式第一行包含一个整数$t$($1\leqt\leq1000$)—测试数据的个数每一个......
  • Adaptive Sparse Pairwise Loss for Object Re-Identification
    https://blog.csdn.net/amusi1994/article/details/130037400tripletloss中需要计算每个样本之间的距离,从而计算出loss,作者认为同一类的某些样本可能存在有害的信息,所以不应该将所有样本都用于计算loss。作者提出的SPloss中只计算挑选出来的样本的距离,从而得到loss。我们提出......
  • IDC最新报告,增速减缓+AI增势,阿里云视频云中国市场第一
    :::hljs-center国际权威数据公司IDC发布《中国视频云市场跟踪(2023H1)》报告自2018年至今,阿里云持续保持中国视频云整体市场第一整体市场占比达24.4%:::01第一之外,低谷之上近期,国际权威数据公司IDC最新发布了《中国视频云市场跟踪》,2023上半年中国视频云市场规模达到46.2......
  • 拒绝大厂重回OpenAI?秋招学一波奥特曼的选offer思路
    大家好,我是鱼皮。最近编程导航很多同学秋招上岸了,我收到最多的鱼友提问就是:秋招的offer应该怎么选?今年的大厂秋招行情和去年比起来转暖了不少,特别是在一些关键的技术岗位上,大厂们拿出了一种「砸钱抢人」的架势。比如说小红书,今年讨论度很高,被大家说一出手直接【杀死比赛】!比亚......
  • AI智能检测算法与LiteCVR平台铁路沿线周界入侵防护方案
    在现在铁路视频监控系统基础上,结合AI人工智能技术,通过智能算法判断铁路延线相关风险,形成“互联网+专网”常态护路联防模式,实现铁路护路“一键可控”,中心与值勤人员动态联防新格局。铁路周界的入侵防范主要包括人防、物防、技防模式。其中,人防是利用人工巡逻的方式对铁路关键位置......
  • 特斯拉开源 Roadster 文件随便用;微软 Copilot AI 技术开放或不对大陆开放丨 RTE 开发
      开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(RealTimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,......
  • Docker 常用命令 -- 容器(Container)篇
    1.查看容器dockerps列表正在运行的容器dockerps-a列表所有容器dockerps-q只列表容器的ID-aq是所有容器的ID2.运行容器dockerrun-it-d--name要取的别名镜像名:Tag/bin/bash-i以交互模式运行容器通常与-t一起用-t为容器重新分配一个伪终端......
  • General error: 1205 Lock wait timeout exceeded; try restarting transaction【事务
    转载:https://blog.51cto.com/u_12390904/6254246       ......
  • 03_Exception in thread “main“ java.lang.AssertionError
    问题maven构建报错***[INFO]---maven-compiler-plugin:3.8.1:compile(default-compile)@engine_auth---[INFO]Changesdetected-recompilingthemodule![INFO]Compiling38sourcefilestoC:\Users\...\target\classes[INFO]-----------------------------......