首页 > 其他分享 >2023年9月中旬大模型新动向集锦

2023年9月中旬大模型新动向集锦

时间:2023-09-27 19:06:07浏览次数:42  
标签:伟达 AI 模型 ai 开源 Gemini 集锦 2023 新动向


2023年9月中旬大模型新动向集锦

  • 2023.9.20
  • 版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。

1、微软发布13亿参数小模型phi-1.5

微软研究院于2023年9月11日发布了名为 phi-1.5 的全新预训练语言模型,共有 13 亿个参数,适用于 QA 问答、聊天格式和代码等等场景。phi-1.5 采用来自 StackOverflow 平台关于 Python 板块的 Q&A 内容、code_contests 中的竞争代码、合成 Python 教科书,gpt-3.5-turbo-0301 生成等各种数据集,此外还包括各种 NLP 合成文本组成的新数据源。

微软表示,在测试常识、语言理解和逻辑推理的基准下,phi-1.5 的表现超出了大部分参数低于 100 万的模型。phi-1.5 在 AGIEval 得分上超过了拥有 70 亿参数、来自 Meta 的 llama-2;在带 LM-Eval Harness 的 GPT4AL 跑分套件中,可以媲美 70 亿参数的 llama-2。

2、人工智能应用 Character.ai 月活跃用户数正在赶超 ChatGPT

Character.ai 是一家人工智能应用程序开发商,允许用户设计自己的 AI 角色。根据市场情报公司 Similarweb 最近的分析,得到 a16z 支持的 Character.ai 的 iOS 和 Android 应用程序在美国现在每月有 420 万活跃用户,而 ChatGPT 的移动应用程序在美国的月活跃用户数接近 600 万。话虽如此,在网页上 ChatGPT 仍然远远领先于 Character.ai——很可能是因为 Character.ai 的许多用户更喜欢在个人移动设备上构建和与其 AI 聊天机器人交互,而不是通过网站。

3、Stability AI 推出 Stable Audio,基于文本生成最长 90 秒音频

Stability AI 公司近日推出 Stable Audio,可以基于用户输入的文本内容,自动生成音乐或者音频。免费版 Stable Audio 可以生成最长 20 秒的音乐片段,而用户在购买 Pro 订阅之后,可以生成最长 90 秒的音频内容。

4、英伟达发布开源软件TensorRT-LLM测试版

英伟达发布开源软件TensorRT-LLM测试版,用户需注册英伟达开发者计划才能申请下载。该软件正式版预计于未来几周内发布,并将很快集成到英伟达NeMo框架中,这个框架是英伟达的企业级AI软件平台AI Enterprise的一部分。TensorRT-LLM是一个开源库,可加速和优化英伟达Tensor Core GPU上最新LLM的推理性能。

5、百度智能云千帆大模型平台适配Falcon-180B

百度智能云的千帆大模型平台近日适配了6日发布的Falcon-180B大模型,并提供模型微调、部署、应用开发的全流程工具链和开发环境,方便企业和开发者率先体验。Falcon-180B-Chat由TII研发的仅使用解码器的180B模型,在Ultrachat, Platypus和Airoboros的混合数据集上进行微调,具备优异的推理效果。该模型目前面向测试企业用户开放,如需使用请填写申请表单.

6、阿里AI大模型应用“淘宝问问”开始内测

阿里AI大模型应用“淘宝问问”正在进行内测。据称,淘宝问问可以理解消费者跨类别、跨领域的需求,实现信息搜索、创意内容生成等方面的需求和场景。目前,该应用可通过淘宝App搜索“淘宝问问”提交内测申请,或通过邀请码参与测试。官方暂未透露应用全量上线的时间。

类似的,国外的电商巨头eBay近日面向卖家推出一款AI工具,可以根据单张照片生成商品列表,目前仅提供iOS版本,安卓版本将在未来几周内推出。该工具可以根据照片自动编写标题和描述,以及包括产品发布日期在内的信息,并提供类别、子类别、标价和运费建议等。简而言之,就是以图搜产品的功能。

7、用好提示词,性能最高提升50%

谷歌DeepMind团队发表论文,称大模型自己设计的提示词在Big-Bench Hard数据集上的表现最高提升50%。团队称,如果在提示词中加上“深呼吸”(Take a deep breath),AI大模型的数学成绩可以再涨8.4分,而这个提示词是AI自己找出来的。用这个新提示词结合此前发现的“一步一步地想”(Let’s think step by step),大模型在GSM8K数据集上的成绩可以从71.8分提高到80.2分。

8、蚂蚁集团开源CodeFuse代码大模型

近日,蚂蚁集团首次开源了代码大模型CodeFuse。CodeFuse基于蚂蚁基础大模型研发,在近期代码补全的HumanEval评测中,CodeFuse得分74.4%,超过GPT-4的67%和WizardCoder-34B的73.2%。本次开源内容包括代码框架、模型等,现已上架HuggingFace等平台。代码框架部分包括自研的多任务微调(Multi-task fine-tuning,MFT)框架,支持代码生成、代码翻译、测试用例生成、bug修复等数10个任务一起微调。模型部分包括CodeFuse13B-4K、CodeFuse-CodeLlaMa34B-MFT两个大模型。

9、多模态大模型Gobi对决Gemini

据外媒The Information爆料,OpenAI的一款名为Gobi的全新多模态大模型,已经在紧锣密鼓地筹备了。OpenAI计划,在Gemini发布之前就推出多模态LLM,彻底击败谷歌。跟GPT-4不同,Gobi从一开始就是按多模态模型构建的。

另一边,谷歌也在开始邀请部分外部开发者加急测试,即将推出的下一代多模态大模型Gemini。近日The Information独家报道称,Gemini可能很快准备好进行测试发布,并会集成到自家的Google Cloud Vertex AI等服务中。据一位参与测试过的人士透漏,Gemini至少在一个方面比GPT-4有优势:除了网络上的公开信息外,该模型还利用了大量谷歌消费产品(搜索、Youtube)的专有数据。Gemini在理解用户对特定查询的意图时应该特别准确,而且它产生的错误答案(即幻觉),似乎更少。谷歌的下一代大模型Gemini,已经开始在新的TPUv5 Pod上进行训练,算力高达~1e26 FLOPS,比训练GPT-4的算力还要大5倍。


标签:伟达,AI,模型,ai,开源,Gemini,集锦,2023,新动向
From: https://blog.51cto.com/prettycms/7627381

相关文章

  • ICCV 2023 清华ETH提出 Retinexformer 刷新十三大暗光增强榜单
    前言 本文介绍了ICCV2023上的新工作《Retinexformer:One-stageRetinex-basedTransformerforLow-lightImageEnhancement》本文转载自我爱计算机视觉仅用于学术分享,若侵权请联系删除欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读......
  • 2023/9/25 进行实验
     结果为false,因为比较的是地址,而不是数,所以结果为false ......
  • 2023/09/27
    四则运算课堂测试三 1、可定制(数量):输入大的出题数量值,测试一下系统是否崩溃,反向查找系统是否优化的余地;2、定制操作数的个数、定制是否有乘除法、定制是否有括号(随机加入)、定制数值范围(确定操作数的取值范围);3、定义方法实现错题集、错题重练并记录错题的次数功能。4、能处理......
  • 2023年台州市初赛Misc
    2023年台州市初赛Misc这是神马冰蝎流量,找到key<?php@error_reporting(0);session_start();$key="144a6b2296333602";$_SESSION['k']=$key;session_write_close();$post=file_get_contents("php://input");i......
  • 【2023-09-27】新旧交替
    20:00不自反者,看不出一身病痛;不耐烦者,做不成一件事业。                                                 ——清·金缨《格言联璧》今天是最后一天在旧办公室上班。......
  • 龙蜥社区与您相约 2023 KubeCon
    作为云原生领域最负盛名的技术大会之一,KubeCon+CloudNativeCon+OpenSourceSummitChina2023吸引全球顶尖的云原生专家们汇聚其中。2023年9月26-28日,将于上海跨国采购会展中心展示最前沿的技术创新,上百位嘉宾带来上百场主题演讲,为所有与会者提供了交流、学习和探索"......
  • 龙蜥社区与您相约 2023 KubeCon
    作为云原生领域最负盛名的技术大会之一,KubeCon+CloudNativeCon+OpenSourceSummitChina2023吸引全球顶尖的云原生专家们汇聚其中。2023年9月26-28日,将于上海跨国采购会展中心展示最前沿的技术创新,上百位嘉宾带来上百场主题演讲,为所有与会者提供了交流、学习和探索"......
  • debug集锦
    查询GPU时无进程运行,但是显存却被占用了https://ddelephant.blog.csdn.net/article/details/123104958sudofuser-v/dev/nvidia*......
  • 增材云荣获2023世界制造业大会“安徽省重点工业互联网平台”称号
    9月21日上午,2023世界制造业大会工业互联网专场发布会在合肥滨湖会展中心发布厅成功举办。会上发布了安徽省工业互联网领域的系列研究成果和创新应用案例。增材云平台深耕3D打印领域,整合3D打印产业链六大资源,以专业全面的技术助推行业快速发展效果卓著,从多家申报企业中脱颖而出,成功......
  • 【免费】2023云栖大会门票开抢啦!数量有限,先到先得!
    ......