首页 > 其他分享 >Meta MobileLLM

Meta MobileLLM

时间:2024-07-13 13:30:37浏览次数:8  
标签:令牌 人工智能 模型 LLMs Meta GPU MobileLLM

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

人工智能在未来面临巨大的威胁:能源限制。以当前的标准来看,世界能源电网将无法满足对人工智能产品的预期需求。因此,拥有强大的、参数少于十亿的小语言模型(SLMs),即比GPT-4或Claude 3小数千倍的模型,不仅是一个很好的选择,而且是这个领域生存的必要条件。Meta提出了各种算法创新来创建MobileLLM,这是一种新的最先进模型,可能很快成为这一规模的标准,并防止所有人工智能爱好者预见的伟大承诺最终成为空话。

人工智能在未来将面临许多问题,其中一个主要问题是能源供应。假设技术现状保持不变,我们可能很快面临真正的GPU短缺。NVIDIA未能满足大科技公司在资本支出方面的投资需求,导致了一次由资本支出驱动的GPU短缺。然而,未来可能会出现相对于需求的真正GPU短缺,一旦世界开始大量使用LLMs。根据Meta的数据,在一个大多数人每天仅使用LLMs 5%的未来,我们将需要一亿个NVIDIA H100 GPU来为GPT-4提供服务,以达到每秒50个令牌的可接受延迟。

此外,全球对人工智能的预期需求将导致更严重的能源问题。大多数人认为搜索增强的LLMs(长时间推理模型)是解决方案。这些LLMs在直接响应您的请求之前探索解决方案空间,生成多达数百万个可能的响应,然后才定下来。这种范式不仅使平均令牌生成增加了数量级,还可能需要验证者,即在作者寻找解决方案时验证每个想法的附加模型。

然而,边缘人工智能或“设备上”的语言模型可能是一个解决方案,因为这些模型可以在我们个人设备的电池上运行,从而不需要GPU数据中心。然而,这需要克服质量和电池方面的挑战。目前,最好的AI结果来自文件大小远超TB(太字节)范围的模型,而这些模型在智能手机上的存储和运行存在困难。此外,Meta研究人员计算,在0.1 J/令牌消耗的情况下,一个每秒输出10个令牌的LLM将在两小时内耗尽整个电池。

为了应对这些挑战,Meta提出了一些创新方法,例如在较小规模上使用标准的SwiGLU激活函数,并且优先选择更深的网络结构而不是更宽的。研究人员还提出了共享嵌入和解嵌层,以及分组查询注意力来减少KV缓存的约束。此外,他们发现通过重复块来减少内存层次之间的通信开销可以提高准确性。

总的来说,Meta的研究专注于务实,而不是追求AGI或超级智能等遥远的目标。尽管资本支出投资巨大,但实际收入却相形见绌。过分关注“达到AGI”不仅对资本的有效使用不利,而且在能源方面也不可行。Meta的工作表明,提供卓越性能的次十亿LLMs是人工智能领域的未来方向,这将有助于缓解对云服务的巨大需求,并防止能源危机。

标签:令牌,人工智能,模型,LLMs,Meta,GPU,MobileLLM
From: https://blog.csdn.net/2301_79342058/article/details/140398617

相关文章

  • Hive Metastore(元数据存储服务)
    HiveMetastore(元数据存储服务)在ApacheHive中扮演了关键的角色,其主要作用包括:1.存储表和分区元数据:HiveMetastore负责存储Hive中创建的表的定义信息,包括表的结构(字段名、数据类型)、表的存储格式(如存储在HDFS上的路径)、分区信息等。这些元数据是Hive执行查询和管理表时必......
  • 18、Django-admin管理后台-Meta类
    1、先执行数据库迁移--pythonmanage.pymakemigrations--pythonmanage.pymigrate2、在cmd终端先创建管理员账户--pythonmanage.pycreatesuperuser3、登录--http://127.0.0.1:8000/admin/  注册自定义的模型类若要自己定义的模型类也能在/admin后台......
  • 读论文《OSCNet: Orientation-Shared ConvolutionalNetwork for CT Metal Artifact Le
    论文题目:面向共享的CT金属伪影学习卷积网络论文主题:金属伪影去噪论文地址:OSCNet_TMI2023.pdf-Google云端硬盘这个是oscnet+,oscnet进阶版,感觉和acdnet很像其实,本文读论文,下一篇博客讲讲复现摘要:        在本文中,我们仔细研究了具有旋转对称条纹图案的金属工件......
  • metabase邮件去除标志
    1、    修改预警邮件标题(1)    src/metabase/pulse.clj第171行将Metabase改成Daip改为 2、测试邮件(2)、src\metabase\api\email.clj第105行和第108行将Metabase改为Daip原:改:3、邮件中的metabase的logo(3)src\metabase\email\_footer.mustache 第7行......
  • 将metabase中的/auth/login替换为/daip/common/toLogin
    将metabase中的/auth/login替换为/daip/common/toLoginmetabase-0.31.2\frontend\src\metabase\routes.jsx109行修改为/auth/logout181行修改为/daip/common/toLoginmetabase-0.31.2\frontend\src\metabase\auth\components\BackToLogin.jsx第6行修改为/daip/common/toL......
  • 修改metabase的cookies时长和Session时长及登录限制
    修改metabase的cookies时长和Session时长及登录限制  Cookiesmetabase-0.31.2\frontend\src\metabase\lib\cookies.js  14行 原值14改为1/2单位天 Sessionmetabase-0.31.2\src\metabase\config.clj  27行原值20160改为720单位分钟 多次登录限制metab......
  • python3.7报错ModuleNotFoundError: No module named 'importlib.metadata'
    1.问题今天在使用一个项目的时候遇到以下的问题:ModuleNotFoundError:Nomodulenamed'importlib.metadata'个人的情况:python3.7conda环境中安装了importlib-meta的工具包,版本为6.7.0在引入的过程中,还是出现了问题。这是由于,包的引入方式和包名不一致引起的。具体如下......
  • 最新文生3D模型——Meta 3D Gen:1 分钟搞定3D创作!
    Meta公司(前身为Facebook)最近推出了一款名为Meta3DGen(3DGen)的新型人工智能模型,能实现1分钟内的端到端生成,从文本直出高质量3D资产,不仅纹理清晰、形态逼真自然,而且生成速度比其他替代方案加快了3-60倍!目前,模型还没有开放试用API以及相应的代码,官方消息中也没有透露下一步......
  • OpenAI 向少部分用户推出 GPT-4o(S2S)模型;Meta 发布 3D Gen AI 模型丨 RTE 开发者日报
      开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(Real-TimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,......
  • Meta平台新纪元 Facebook机器人源码/部署实战教程
    随着Meta平台的不断升级,Facebook机器人成为了连接品牌与用户的新桥梁。本文将为您提供一份详尽的Facebook机器人源码及部署实战教程,助您在新纪元中抢占先机,实现精准营销。一、了解Meta平台与Facebook机器人首先,深入了解Meta平台的最新动态及Facebook机器人的应用场景。明确机......