首页 > 其他分享 >阿里通义千问 Qwen2 大模型开源发布

阿里通义千问 Qwen2 大模型开源发布

时间:2024-06-10 21:32:52浏览次数:11  
标签:72B 千问 Qwen2 模型 开源 DPO 对齐 Qwen1.5

阿里通义千问 Qwen2 大模型开源发布

Qwen2 系列模型是 Qwen1.5 系列模型的重大升级。该系列包括了五个不同尺寸的预训练和指令微调模型:Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 以及 Qwen2-72B。
在这里插入图片描述

在中文和英文的基础上,Qwen2 系列的训练数据中还增加了其他27种语言相关的高质量数据。此外,上下文长度的支持进一步扩展,最高可达到128K个 tokens(Qwen2-72B-Instruct)。

据公告称,Qwen2 模型相比 Qwen1.5 在大规模模型实现了非常大幅度的效果提升。在针对预训练语言模型的评估中,Qwen2-72B 在包括自然语言理解、知识、代码、数学以及多语言等多个能力上均显著超越了当前最优的开源模型,如 Llama-3-70B 和 Qwen1.5 最大的模型 Qwen1.5-110B。这得益于其预训练数据和训练方法的优化。

Qwen2-72B 在自然语言理解和逻辑推理等方面,尤其是科学类问题上,表现的优势更为明显。在代码测试中,Qwen2-72B 也取得了不俗的成绩,并且在多个编程语言上具有突出的表现。此外,数学能力也因为预训练数据中数学部分的优化而有了大幅度的提升。值得注意的是,在多语言表现上,Qwen2-72B 在多个领域的多语言评测上也具有一定的优势。这也意味着,Qwen2 有潜力在更多的国家和地区得到实际应用。

项目团队在微调和对齐上投入了大量的精力进行研究。Qwen2 的策略包括广泛采集指令和提示词,并利用合成数据,例如使用拒绝采样、代码执行反馈和回译等方法。

为了进一步与人类偏好保持一致,Qwen2 使用了DPO的方法。除了常见的DPO以及其变体如IPO、KTO,Qwen2 还探索了DPO与在线学习的结合,以提升模型能力上限。而为了降低对齐所产生的 “对齐税”,Qwen2 使用模型合并的方法来缓解这个问题。这一系列的努力最终帮助大幅度提升了指令微调模型的基础能力和智能等级。结果如下所示:
在这里插入图片描述

此次 Qwen2 采用了不同的模型许可。除了 Qwen2-72B 仍然使用此前的 Qianwen License 外,其余模型,包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B 以及 Qwen2-57B-A14B 在内,均采用 Apache 2.0 的许可。

标签:72B,千问,Qwen2,模型,开源,DPO,对齐,Qwen1.5
From: https://blog.csdn.net/xixixixixixixi21/article/details/139578016

相关文章

  • ollama gpu 集成测试qwen2 7b 模型
    昨天测试了下基于ollamacpu模式运行的qwen2对于小参数0.5b以及1.5b的速度还行,但是你的cpu核数以及内存还是需要大一些今天测试下基于gpu的qwen27b模型,以下简单说明下安装ollama如果我们申请的机器包含了GPU,ollama的安装cli还是比较方便的,会直接帮助我们进行gpu驱......
  • ollama qwen2 运行&openai 兼容api 测试
    qwen2模型已经发布了,各种新闻都说很不错,所以通过ollama测试下安装ollamaclicurl-fsSLhttps://ollama.com/install.sh|sh启动服务ollamaserve拉取qwen2:1.5b模型使用了api模式clicurl-XPOSThttp://localh......
  • openEuler 24.03 LTS - 华为欧拉开源版(华为 RHEL 兼容发行版)
    openEuler24.03LTS-华为欧拉开源版(华为RHEL兼容发行版)华为红帽企业Linux兼容发行版请访问原文链接:https://sysin.org/blog/openeuler/,查看最新版。原创作品,转载请保留出处。作者主页:sysin.orgopenEuler通过开放的社区形式与全球开发者共同构建一个开放、多元和架构......
  • Zabbix 7.0 LTS - 企业级开源监控解决方案
    Zabbix7.0LTS-企业级开源监控解决方案Zabbix|TheEnterprise-ClassOpenSourceNetworkMonitoringSolution请访问原文链接:https://sysin.org/blog/zabbix-7/,查看最新版。原创作品,转载请保留出处。作者主页:sysin.orgZabbix简介全方位监控获取整个IT基础架构栈......
  • 开源C++静态代码检测工具clang-tidy、cppcheck和oclint的比较
    以下是clang-tidy、cppcheck和oclint的比较关于Clang-Tidy的使用请参考:使用Clang-Tidy进行静态代码分析:完整的配置与CMake集成实例关于Cppcheck的使用请参考:使用Cppcheck进行静态代码分析:完整的shell脚本与CMake集成实例关于OCLint的使用请参考:使用OCLint......
  • [AI资讯·0609] SamAltman建立了庞大投资帝国,通义千问Qwen2发布即爆火,OpenAI泄密者公
    AI资讯奥特曼28亿「投资帝国」曝光!不要OpenAI股份,当CEO最不赚钱开源超闭源!通义千问Qwen2发布即爆火,网友:GPT-4o危OpenAI泄密者公布165页文件:2027年实现AGI、计算集群将耗资千亿美元清华系细胞大模型登Nature子刊!能对人类2万基因同时建模奥特曼百万年薪挖角谷歌TPU人才,欲砸7万......
  • 开源模型应用落地-LangSmith试炼-入门初体验-Prompts(六)
    一、前言  在许多应用程序中,特别是在大型语言模型(LLM)应用程序中,收集用户反馈以了解应用程序在实际场景中的表现是非常重要的。  本章是LangSmith系列最后一篇文章,通过学习Prompts功能,用户可以上传、浏览、检索和管理提示(Prompt)。这个Prompts功能简化了提示(Prompt)的......
  • 我终于有我的开源项目了!!!
    前言嗨,大家好啊,我是雪荷。正如标题所示我耗时几个月打造了一个厚米匹配系统,并且打算把它开源出来供大家体验和学习。大家觉得还不错的话,欢迎给我点赞收藏,给反馈哈。项目介绍homie匹配系统是一个移动端网页的在线云交友平台。实现了按标签匹配、查找用户,基于RedisGEO实现......
  • 打败GPT-4的最强开源中文大模型GLM-4终于亮相了(附:超详细搭建过程)
    GLM-4是由智谱AI推出的新一代基座预处理大模型,具有与GPT-4相近的性能,尤其在中文能力上可以比肩GPT-4。它在多个方面进行了优化和提升,包括支持更长的上下文长度、更快的推理速度、降低推理成本,以及增强了智能体能力。GLM-4能够处理128k的上下文窗口长度,单次提示词可以处理的文......
  • 仿东郊到家《十大教程》公众号+小程序+APP 往约到家 上门预约服务 全开源 运营版 预约
    修复技师定位问题1、数据概况(新增业务城市用户投票功能,更加直观的查看业务城市的关注度、人气和影响力,促进业务开展)2、数据概况(增加可视化数据大盘,代理商端可查看自己下面的技师服务时长、在线时长、业绩、积分、加钟率、退单率、退单数量、总订单量等数据,更加直观的查看......