首页 > 其他分享 >解读 | 阿里通义千问模型全尺寸开源 “诚意满满“背后的名与利

解读 | 阿里通义千问模型全尺寸开源 “诚意满满“背后的名与利

时间:2023-12-21 13:04:38浏览次数:25  
标签:千问 对于 模型 开源 阿里 算力 通义


解读 | 阿里通义千问模型全尺寸开源 “诚意满满“背后的名与利_阿里


大家好,我是极智视界,欢迎关注我的公众号,获取我的更多前沿科技分享

12 月 1 日阿里开源了 72B 和 18B 大模型以及音频大模型 Qwen-Audio,再加上之前八月份、九月份开源的 7B 和 14B 大模型,号称是 "全尺寸开源"。我也去 Github 上瞅了一眼,通义应该确实是 "兜库底" 了,所有规格的模型都开源了。

解读 | 阿里通义千问模型全尺寸开源 “诚意满满“背后的名与利_大模型开源_02

对于这个事情,我的第一反应是:难得啊,对于阿里这种技术相对封闭的公司来说。但是仔细想想,目前对于大模型来说,开不开源真的很重要吗?其实是需要打个问号的,除非你 OpenAI 的 GPT-4 开源,不然业界应该很难激起过多的浪花,因为大家都见多不怪了。现在对于大模型真正卡脖子地方是在 "算力" 和 "数据" 上,而不在 "算法" 上。以前是这三驾马车都很重要,然后算法可能会更加重要一些。但是现在大模型时代则不太一样,特别是在美国芯片禁令的情况下,主要矛盾已经明显倾向于对于算力的需求上。现在国内很多大模型从算法实现角度,都可以用 "套壳" LLaMA 来达到 "自研大模型" 商业化的目的,这个时候你通义开不开源其实并不太重要。而说到 "套壳",就又是另外一个有意思的话题了,这里不过多展开。

解读 | 阿里通义千问模型全尺寸开源 “诚意满满“背后的名与利_阿里云_03

解读 | 阿里通义千问模型全尺寸开源 “诚意满满“背后的名与利_阿里_04

现在主要矛盾点在于我要有足够的算力、足够高质量的数据来进行微调甚至是从头训练。对于很多大模型厂商来说,区别只是在我选 LLaMA 来微调还是选通义大模型来微调,而相信大多还是会选 LLaMA。这其实可以类比到手机领域,安卓大家都可以用,很多时候有安卓就够了,你鸿蒙开源对于小米、对于 vivo 的操作系统研发意义大吗,我小米会把自己手机操作系统切到基于鸿蒙的吗 (可能确实有参考意义,比如对于小米澎湃 OS 的研发,但是对于大多数厂商来说还是用安卓就够够的了),大家更加在意的是能够拥有性能更加好的芯片、算力更加好的处理器,比如前段时间经常上热搜的全大核天玑 9300,这才是核心竞争力。

解读 | 阿里通义千问模型全尺寸开源 “诚意满满“背后的名与利_通义千问_05

虽然 (是反转没错了),在大家有 LLaMA 可选的情况下,通义的开源意义确实不大。但是开源总能赢得好名声,这点毋庸置疑,何况通义开源了自己全规格的模型,其开源的 70B 大模型也是目前开源大模型中最大规模的,可以说 "诚意满满",对于博一个好名声应该是不难的,这是 ""。

然后咱们来说说 "",通义大模型是开源了,大家要用、要微调得要有算力吧,算力哪里来,答案就是阿里云,你品,你细品。来,继续分析,阿里还有个号称国产 HaggingFace 的魔塔 ModelScope,要用开源的通义你就得上魔塔,而魔塔部署在哪里呢,魔塔的算力来源于哪里呢,答案依旧是阿里云,你品,你细品。阿里的这招太 "精明" 了,真的是既想要名也想要利啊

解读 | 阿里通义千问模型全尺寸开源 “诚意满满“背后的名与利_前沿科技_06

从这个角度来说,其实在 12 月 1 日阿里宣布全量开源通义前问大模型的时候,阿里已经彻底换赛道了,已经是不想跟大家玩大模型了,已经不再是 "百模大战" 中的一员了。未来,"百模大战" 肯定会继续,而阿里更加聪明,烧钱去做大模型,效果嘛打不过 GPT-4,落地商业化嘛又难,竞争对手又像疯了一样的涌进来,换个赛道,躺着挣钱它不香嘛。这大概率也是在学英伟达、特别是在学 AWS。提供付费算力,这才是大模型时代正确的挣钱的方式啊,这些才是大模型时代挣麻了的企业啊。继续给阿里支招,继续开源数据集,让大家在阿里云上训练(烧钱)彻底没有技术上的障碍,而变成一个愿不愿意花钱的问题。

解读 | 阿里通义千问模型全尺寸开源 “诚意满满“背后的名与利_前沿科技_07

阿里云,是懂计算的。计算无法计算的价值,数钱数到手抽筋

解读 | 阿里通义千问模型全尺寸开源 “诚意满满“背后的名与利_前沿科技_08


【极智视界】


标签:千问,对于,模型,开源,阿里,算力,通义
From: https://blog.51cto.com/u_15531854/8921498

相关文章

  • 23k star!居家备份好帮手,开源自托管备份工具:immich
    你用过多少备份软件,x度网盘?阿x云盘?黑x晖?xxx助手?可能太多,那有没有考虑过部署一个自己的备份服务呢?今天我们推荐一款开源替代的备份工具:immich。它适合拥有自己服务器,希望构建自托管备份服务的同学,在GitHub已超过23KStar。immich是什么?Immich是一个直接从iPhone、Android手机上备......
  • 微软官方发布的C#开源、免费、实用的Windows工具箱
    前言今天分享一款由微软官方发布的C#开源、免费、实用的Windows工具箱(帮助用户调整和简化Windows系统的体验,从而提高工作效率):MicrosoftPowerToys。项目介绍MicrosoftPowerToys是使用C++和C#编程语言开发的。它利用了Windows操作系统的底层功能和API,以及Microsoft......
  • 国产670亿参数的DeepSeek:超越Llama2,全面开源
    模型概述DeepSeek,一款国产大型语言模型(LLM),凭借其670亿参数的规模,正引领着人工智能领域的新浪潮。这款模型不仅在多项中英文公开评测榜单上超越了700亿参数的Llama2,而且在推理、数学和编程能力方面表现突出。最引人注目的是,DeepSeek在匈牙利最新高中数学考试中获得了65分的高分,显示......
  • 【Dotnet 工具箱】推荐一个 Flutter 和 .NET 开源的实时聊天 APP
    1.推荐一个Flutter和.NET开源的实时聊天APPHeyy-chat-appHeyy-chat-app是一个开源的聊天应用,使用Flutter、Asp.NetCoreWebApi、SignalR、WebRTC等技术构建的。Flutter作为用户客户端。Asp.NetCoreRESTful作为后端服务。Signalr和WebRTC用于实时通信。SQ......
  • 好家伙,这个开源项目硬生生复制了一个 ChatGPT Plus 出来
    最近有一款聊天机器人框架LobeChat火出了天际,它不仅支持多模态,支持语音会话,还有一个强大的FunctionCalling插件生态系统(可以作为ChatGPT插件的平替)。最重要的是,它的UI很漂亮,一看就是小姐姐精心设计过的~连Vercel的CEO都给它点赞了:项目地址:https://github.com/lob......
  • 开源低代码平台能给企业带来什么赋能?
    在现代化企业办公职场中,想要提升企业市场竞争力,提升企业办公效率,除了要提升各职员的办公效率以外,还需要采用专业的办公工具,才能应对业务量激增的办公需求。开源低代码平台就是其中一种办公赋能神器,是助推实现数字化转型、畅享流程化办公的得力助手。流辰信息是驻扎在低代码研发领......
  • 超越巨头:Zephyr-7B领跑7B级模型竞赛,开源且笔记本可运行
    引言在AI界的大语言模型(LLM)竞赛中,Zephyr-7B作为HuggingFaceH4团队的最新力作,展现了令人瞩目的技术突破。它不仅性能超越了700亿参数的LLaMA2模型,更引人注目的是,这一开源模型可在常规笔记本电脑上运行,极大地提高了AI技术的可达性。技术背景Zephyr-7B基于MistralAI的开源大模型Mis......
  • 开源不挣钱?这个项目上线半年月入超 30w
    很兴奋的告诉大家,Sealos自从6月份上线以来,仅半年时间注册用户已经突破7万,月收入超过30w,本文来向大家介绍我们是怎么做开源商业化的。每月平均增速超过40%,而且这些收入大部分来自用户充值,或者是通过开源社区主动找到我们付费。商业化的重要性作为一家创业公司做开源,我们除......
  • 利用夜莺开源版对H3C无线设备监控
    编者荐语:真正搞监控的人肯定知道SNMP水有多深,有时我甚至腹黑猜测,这些厂商是故意的吧,,,指标不标准,格式各异,只能靠一款灵活的采集器了,本文是夜莺社区用户写的文章,转给大家参考。author:网络小斐关于夜莺SNMP插件前文说明了利用夜莺开源版如何监控H3C交换机的,算是抛砖引玉;秉持着授......
  • Databend 开源周报第 124 期
    Databend是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn。What'sOnInDatabend探索Databend本周新进展,遇到更贴近你心意的Databend。新增对Delta和Iceberg表引擎的支持Databend新增......