首页 > 其他分享 >大模型(LLM)最新趋势总结

大模型(LLM)最新趋势总结

时间:2023-08-03 16:12:34浏览次数:30  
标签:总结 LLM 迭代 模型 开源 版本 Alignment

关键结论:

开源社区模型不具备真正智能,更好的小模型来自大模型的 Scale Down

GPT-4模型信息:采用MoE架构,16个experts,800b参数

如何减少幻觉 hallucination?scaling/retrieval/reward model

指令遵循的开源小模型被过度炒作,已经到达瓶颈,突破方向是更强的 Base Model 和更进一步的反馈数据

用不了多久,大家会把80%算力从 Training 转向 Serving

预计未来模型的迭代节奏会很像手机系统:1-2 年更新一次大版本,中间有无数次小版本迭代;

中期来看,RLHF 不应该是 Alignment 的唯一手段, Direct Preference Optimization 和 Stable Alignment 是新路径

长期来看,小版本迭代的角度:隐私/权限的增强、更多的图片/文件/声音格式的 Embedding

LLM 的 Context Window 就像电脑内存,向量数据库是 LLM 的硬盘

Robot Learning 已成为学界主流研究路线

 

详细见链接:https://new.qq.com/rain/a/20230711A03VL700?no-redirect=1

标签:总结,LLM,迭代,模型,开源,版本,Alignment
From: https://www.cnblogs.com/end/p/17603611.html

相关文章

  • 模拟赛总结(1)
    一.题目解析1.遗忘的来年花期20%:因为序列严格递增,所以直接cout<<0;即可。100%:注意不等号和\(i\)的范围,之后直接模拟。#include<iostream>#include<cstring>#include<cstdio>#include<cmath>#include<algorithm>#include<stack>#include<queue>#......
  • web前端技能方法总结(css、js、jquery、html)(2)
    创建链接块display:block;列表样式在一个无序列表中,列表项的标志(marker)是出现在各列表项旁边的圆点。在有序列表中,标志可能是字母、数字或另外某种计数体系中的一个符号。要修改用于列表项的标志类型,可以使用属性list-style-type:ul{list-style-type:square;}1上面的声明把......
  • 【考后总结】8 月 CSP-S 模拟赛 1
    8.3CSP模拟13\(\text{zero4338round}\)T1y显然\(\text{xt}\)会选择四个角,对每个格子求出到四个角的曼哈顿距离最大值,操作一定会优先选择最大值较小的,所以把距离数组排个序就行了。T2s经典套路是设答案是\(a\),把小于\(a\)的位置设成\(0\),大于等于设成\(1\),这样按......
  • 解决大模型“开发难”,昇思MindSpore自动并行技术应用实践
    本文分享自华为云社区《DTSETechTalk|第35期:解决大模型“开发难”,昇思MindSpore自动并行技术应用实践》,作者华为云社区精选。昇思MindSpore是新一代覆盖端边云全场景的开源AI框架,旨在开创全新的AI编程范式,降低开发者门槛,为开发者打造开发友好、运行高效、部署灵活的AI框架,推动人......
  • Tita 升级|总结模板,满足多种管理要求
    升级详情一、【总结】支持自定义总结模板「总结模板」菜单1.都谁可见总结管理员、超管、老板、助理可见总结模板菜单,并可查看系统模板与公司的所有自定义模板;当你被授权为某个自定义菜单的管理员时,也可看到总结模板菜单与被授权管理的模板;注意:系统模板不可编辑,仅总结管......
  • 微信小程序页面跳转方法总结
    在我们日常的开发过程中,跳转页面是每个项目中必有的需求,包括监听返回按钮,回到指定页面,在小程序中页面跳转即页面路由页面栈框架以栈的形式维护了当前的所有页面。当发生路由切换的时候,页面栈的表现如下:getCurrentPages()函数用于获取当前页面栈的实例,以数组形式按栈的顺序给出,第一......
  • 嵌入式软件开发就业面试题。2022最新,最全总结
    1.select和epoll的区别解题思路(这个我在找面试题之前没了解过,还是学的太少了,多学!!!)select的时间复杂度O(n)。它仅仅知道了,有I/O事件发生了,却并不知道是哪那几个流(可能有一个,多个,甚至全部),我们只能无差别轮询所有流,找出能读出数据,或者写入数据的流,对他们进行操作。所以select具有O......
  • 做每日总结的重要性
    每日总结是一种对自己工作和学习的反思和总结,具有重要的意义和作用。以下是每日总结的重要性:1.提高工作效率:每日总结可以帮助我们回顾一天的工作,发现工作中存在的问题和不足之处,并提出改进的方法和措施。通过总结,我们可以更好地规划和安排下一天的工作,提高工作的效率和质量。2......
  • TabR:检索增强能否让深度学习在表格数据上超过梯度增强模型?
    这是一篇7月新发布的论文,他提出了使用自然语言处理的检索增强RetrievalAugmented技术,目的是让深度学习在表格数据上超过梯度增强模型。检索增强一直是NLP中研究的一个方向,但是引入了检索增强的表格深度学习模型在当前实现与非基于检索的模型相比几乎没有改进。所以论文作者提出......
  • 【Java】多线程面试题总结
    最近在看面试题,所以想用自己的理解总结一下,便于加深印象。为什么使用多线程使用多线程可以充分利用CPU,提高CPU的使用率。提高系统的运行效率,对于一些复杂或者耗时的功能,可以对其进行拆分,比如将某个任务拆分了A、B、C三个子任务,如果子任务之间没有依赖关系,那么就可以使用多线程......