首页 > 其他分享 > 【必看!】阿里云推出QWen-7B和QWen-7b-Chat,开放免费商用!

【必看!】阿里云推出QWen-7B和QWen-7b-Chat,开放免费商用!

时间:2023-08-07 10:36:38浏览次数:37  
标签:7B 必看 模型 QWen 开源 Chat history

阿里云于8月3日宣布开源两款重要的大型模型——QWen-7B和QWen-7b-Chat。这两款模型的参数规模达到了令人瞩目的70亿,并且已经在Hugging Face和ModelScope平台上开放,并可免费商用。以下是相关链接:

GitHub项目主页:https://github.com/QwenLM/Qwen-7B
Hugging Face:https://huggingface.co/Qwen/Qwen-7B-Chat
ModelScope:https://modelscope.cn/studios/qwen/Qwen-7B-Chat-Demo/summary/
TopGpt:https://www.topgpt.one

事实上,阿里云在今年4月份推出了通用问答聊天机器人,算得上是较早的开发者。然而,在早期阶段,该项目采用了内部测试制度,因此对外开放的用户数量并不多。

时至今日,已过去了将近4个月的时间,国内的大型模型发展已经形成了一场激烈的竞争战。而此时,阿里云选择在开源领域继续前进,对于用户来说,无疑是喜闻乐见的消息。

阿里云之所以选择开源这两款模型,是因为开源模型能够赢得用户的支持。开源的优势在于能够吸引更多的开发者参与其中,共同改进模型的性能和功能。

同时,开源模型也能够避免封闭式的开发,引起他人的关注和审查。这对于保护用户的隐私和数据安全非常重要。如果模型不开源,可能会引发人们对于模型中是否存在安全漏洞或潜在风险的担忧。

当然,现在大型模型的热度可能有所下降,但阿里云选择开源模型仍然是为了保持竞争力。开源模型不仅可以吸引更多的用户,还可以通过众包的方式快速获得反馈和改进。

快速入门文档

在本地使用需要先安装环境,您也可以直接获取官方镜像安装在本地。

下载并安装ModelScope library

更多关于下载安装ModelScope library的问题参考环境安装

pip install modelscope

模型加载和推理

更多关于模型加载和推理的问题参考模型的推理Pipeline。

import os
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

model_id = 'qwen/Qwen-7B-Chat'

pipe = pipeline(
            task=Tasks.chat, model=model_id, device_map='auto')
history = None

text = '浙江的省会在哪里?'
results = pipe(text, history=history)
response, history = results['response'], results['history']
print(f'Response: {response}')
text = '它有什么好玩的地方呢?'
results = pipe(text, history=history)
response, history = results['response'], results['history']
print(f'Response: {response}')
"""
Response: 浙江的省会是杭州。
Response: 杭州是一座历史悠久、文化底蕴深厚的城市,拥有许多著名景点,如西湖、西溪湿地、灵隐寺、千岛湖等,其中西湖是杭州最著名的景点,被誉为“天下第一湖”。此外,杭州还有许多古迹、文化街区、美食和艺术空间等,值得一去。
"""

image

使用

当然,你也可以直接在modelscope平台使用Qwen-7B-Chat模型,地址链接:https://modelscope.cn/studios/qwen/Qwen-7B-Chat-Demo/summary

image

拿来比较发现,确实还是逊色很多,毕竟还是刚开源阶段,但我相信总有一天国内的大模型可以媲美;

image

结语

最后,我想分享一下对于QWen-7B/QWen-7b-Chat的个人看法。近期,大型模型的热度逐渐消退,这也是有原因的。我认为,这主要有两个方面的原因。

首先,用户的新鲜感逐渐减弱。起初,很多用户因为好奇心而去尝试各种新产品,但随着可供选择的产品越来越多,并且经过长期的使用和体验,大型模型逐渐失去了其"神秘感"。然而,尽管新鲜感逐渐消退,仍然有一部分用户真正希望通过人工智能提升生产力,这部分用户占比并不大。

其次,市场投资者对于AI大型模型的热情也逐渐降温。一方面,这受到用户数量增长趋于平缓的影响,另一方面,目前的大型模型还没有找到良好的发展路径和盈利模式。

然而,对于互联网公司来说,面对人工智能和AI的不可阻挡的发展趋势,大型模型的研发是一条不能放弃的道路。你可以做得不好,但不能没有所作为。在这种情况下,像阿里云这样选择采用开源模型来维持在领域中竞争地位的公司,无疑是一个不错的选择。

这一点可以参考OpenAI,他们在逐步走向商业化之后,选择了不开源,甚至在GPT-4模型发布后,其模型结构、参数和训练细节等都不再对外公开,以至于很多人戏称OpenAI应该改名为CloseAI。然而,越是不开源,越是吸引他人的关注,最终可能导致自身形象受损。最近发生的GPT-4模型信息泄露事件就是很好的例子,有人在网上泄露了一份详细解析GPT-4技术细节的文档,尽管OpenAI并未做出任何回应,但很多人都认为这份文件应该是真实的。

综上所述,开源模型能够赢得用户的支持,并且能够避免引起他人的关注和潜在风险。阿里云选择开源QWen-7B和QWen-7b-Chat模型,既能保护用户的隐私和数据安全,又能提高模型的性能和功能。我期待着看到这两款模型在未来的发展中取得更大的成功。

标签:7B,必看,模型,QWen,开源,Chat,history
From: https://www.cnblogs.com/guoxiaoyu/p/17610375.html

相关文章

  • 玩一玩通义千问Qwen开源版,Win11 RTX3060本地安装记录!
    大概在两天前,阿里做了一件大事儿。   就是开源了一个低配版的通义千问模型--通义千问-7B-Chat。这应该是国内第一个大厂开源的大语言模型吧。虽然是低配版,但是在各类测试里面都非常能打。官方介绍:Qwen-7B是基于Transformer的大语言模型,在超大......
  • Android面试必看手册,错过了金三银四可别再错过金九银十了
    眼看着时间一天一天地过去,距离金九银十也就二十多天的日子了,还有多少程序员是两眼摸黑不知道面试要做哪些准备的朋友?还不知道进大厂需要复习哪些资料的朋友可以看过来,知道有些朋友会没什么准备跟无头苍蝇一样所以博主早在一个月前就已经在各大网站和教育平台收集了大量面试相关的资......
  • [刷题笔记] CF607B Zuma
    Problem貌似还是某场cfdiv1的BDescription一个数组\(a\),每次可以消掉其中的一个回文串,求至少经过几次操作能消掉字符串\(s\)?Solution我们发现本题满足大区间包含小区间的特性,即通过小区间可以推出大区间,符合区间dp。考虑状态转移,枚举一个区间\(l,r\),如果\(a_l=a_r\)则答案......
  • win11 xshell 应用程序无法正常启动(0xc000007b)。请单击“确定”关闭应用程序。
    安装 最新支持的VisualC++可再发行程序包下载|MicrosoftDocs下载x86版本下载x86版本下载x86版本正常打开。......
  • SHRM认证考试介绍,人力资源必看!
    SHRM即美国人力资源管理协会(SocietyforHumanResourceManagement)成立于1948年,是该领域全球公信力最高、历史最悠久、认证会员数最多的人力资源管理专业协会。现已拥有会员超过30万人,遍及全球165个国家。美国人力资源管理协会依托70多年的专业积累和沉淀,整合各国专家和大师的丰......
  • 在矩池云使用Llama2-7B的方法
    今天给大家分享如何在矩池云服务器使用Llama2-7b模型。硬件要求矩池云已经配置好了Llama2WebUI环境,显存需要大于8G,可以选择A4000、P100、3090以及更高配置的等显卡。租用机器在矩池云主机市场:https://matpool.com/host-market/gpu,选择显存大于8G的机器,比如A4000......
  • 淘宝客新手必看:3分钟快速掌握淘宝京东优惠券赚钱秘籍
    为什么会有优惠券这个东西?每个商家都有自己的品牌定位。如果直接降价会伤害到自己的品牌,发放优惠券就是一个比较好的行销手段。我们熟知的肯德基就是这么做的。今天我们要讲的是淘宝京东领券怎么赚钱。首先,我们来说一下为什么淘宝京东优惠券能够赚钱。实际上,这个赚钱的核心就是信......
  • (小白必看)详解yolov5训练自己的数据集 & 使用香烟数据集训练yolov5识别香烟
    创建数据集目录在YOLOv5根目录下创建mydata文件夹(名字可以自定义),目录结构如下,将之前labelImg标注好的xml文件和图片放到对应目录下mydata…images#存放图片…xml#存放图片对应的xml文件…dataSet#之后会在Main文件夹内自动生成train.txt,val.txt,test.txt和trainval.txt四个......
  • 开发必看!一文读懂Salesforce测试策略实用建议!
    可靠的测试策略是确定重大决策的关键工具,以便参与测试的人员能够做出符合共同目标的决策。测试软件的次数越多,就越能从制定高级计划中受益。本文将详细介绍测试策略,以及如何建立测试策略的实用建议。01什么是测试策略?测试策略,是测试过程的战略布局,是指导测试过程设计和进行的......
  • 外汇MT4交易软件使用心得有哪些?新手投资者必看
    外汇投资市场复杂,掌握更多投资知识,投资者才能化险为夷,抓住盈利机会。在进行外汇交易时,每个人都需要使用交易软件,一款功能齐全、性能安全的外汇交易软件,是投资的基础。在众多外汇交易软件中,MT4软件是世界上使用最多的软件之一,MT4软件具有较高的安全性和保密性,也有较强的分析和交易能......