首页 > 其他分享 >微软发布功能强大的全新 Phi-3.5 机型,击败谷歌、OpenAI 等公司

微软发布功能强大的全新 Phi-3.5 机型,击败谷歌、OpenAI 等公司

时间:2024-08-21 12:56:52浏览次数:6  
标签:Phi 微软 人工智能 模型 Instruct 3.5 OpenAI

在这里插入图片描述
微软并没有因为与 OpenAI 的合作而满足于其在人工智能领域的成功。 相反,这家因总部位于华盛顿州而被称为雷德蒙德(Redmond)的公司今天发布了其不断发展的语言/多模态人工智能 Phi 系列中的 3 个新模型。这三个模型分别针对基本/快速推理、更强大的推理和视觉(图像和视频分析)任务而设计。

这三个模型都允许开发者在Hugging Face上下载、使用和微调,并采用微软的MIT许可,允许商业使用和无限制修改。 令人惊讶的是,这三个模型在一些第三方基准测试中的性能也接近最先进水平,甚至在某些情况下击败了其他人工智能提供商,包括谷歌的Gemini 1.5 Flash、Meta的Llama 3.1,甚至OpenAI的GPT-4o。

在这里插入图片描述

Phi-3.5 Mini Instruct: 为计算受限环境而优化

Phi-3.5 Mini Instruct 模型是一款拥有 38 亿个参数的轻量级人工智能模型,专为遵守指令而设计,支持 128k 标记上下文长度。 该模型非常适合在内存或计算受限环境中需要强大推理能力的场景,包括代码生成、数学问题求解和逻辑推理等任务。

尽管体积小巧,Phi-3.5 Mini Instruct 模型在多语言和多轮会话任务中表现出了极具竞争力的性能,与前代产品相比有了显著改进。 它在多项基准测试中的性能接近最先进水平,并在衡量 "长上下文代码理解 "的 RepoQA 基准测试中超越了其他类似尺寸的模型(Llama-3.1-8B-instruct 和 Mistral-7B-instruct)。

在这里插入图片描述

Phi-3.5 MoE: 微软的 “专家混合物”

Phi-3.5 MoE(专家混合物)模型似乎是该公司推出的第一个模型类别,它将多种不同的模型类型整合到一个模型中,每种模型都擅长不同的任务。 该模型利用具有 420 亿个活动参数的架构,支持 128k 标记上下文长度,为要求苛刻的应用提供可扩展的人工智能性能。 Phi-3.5 MoE 专为各种推理任务而设计,在代码、数学和多语言语言理解方面表现出色,在特定基准测试(包括 RepoQA)中的表现往往优于大型模型:

在这里插入图片描述
此外,在科技、人文和社会科学等学科的 5 次 MMLU(大规模多任务语言理解)测试中,它也在不同的专业水平上击败了 GPT-4o mini,令人印象深刻。

在这里插入图片描述
MoE 模型的独特架构使其能够在处理跨多种语言的复杂人工智能任务时保持高效。

Phi-3.5 Vision Instruct: 高级多模态推理

Phi-3.5 Vision Instruct 模型将文本和图像处理功能整合在一起,完成了三重奏。 这种多模态模型特别适用于一般图像理解、光学字符识别、图表和表格理解以及视频摘要等任务。

与 Phi-3.5 系列中的其他模型一样,Vision Instruct 支持 128k 标记上下文长度,使其能够管理复杂的多帧视觉任务。 微软强调,该模型的训练结合了合成数据集和经过过滤的公开数据集,侧重于高质量、推理密集的数据。

训练新的 Phi 三巨头

Phi-3.5 Mini Instruct 模型使用 512 个 H100-80G GPU,历时 10 天,在 3.4 万亿个代币上进行了训练;Vision Instruct 模型使用 256 个 A100-80G GPU,历时 6 天,在 5000 亿个代币上进行了训练。 Phi-3.5 MoE 模型采用专家混合架构,使用 512 个 H100-80G GPU,历时 23 天,在 4.9 万亿个代币上进行了训练。

MIT 许可下的开放源码

所有三种 Phi-3.5 型号均在 MIT 许可下提供,体现了微软支持开放源码社区的承诺。 该许可允许开发人员自由使用、修改、合并、发布、分发、转授权或出售软件副本。 该许可还包括一项免责声明,即软件按 "原样 "提供,不提供任何形式的保证。 微软和其他版权持有者对因使用该软件而可能产生的任何索赔、损害或其他责任不承担任何责任。 微软发布 Phi-3.5 系列代表着多语言和多模态人工智能的发展向前迈出了重要一步。 通过在开源许可下提供这些模型,微软使开发人员能够将尖端的人工智能功能集成到他们的应用程序中,从而促进商业和研究领域的创新。

标签:Phi,微软,人工智能,模型,Instruct,3.5,OpenAI
From: https://blog.csdn.net/weixin_41446370/article/details/141389208

相关文章

  • 亲测好用,吐血整理 ChatGPT 3.5/4.0 新手使用手册~ 【2024.08 更新】
    废话不多说,直接分享正文~以下是小编为大家搜集到的最新的ChatGPT国内站,各有优缺点。1、AIPlus(稳定使用)推荐指数:⭐⭐⭐⭐⭐     yixiaai.com该网站已经稳定运营了1年多了。2023年3月份第一批上线的网站。网站支持GPT-3.5、4.0及4o、4omini模型,手机和电脑都能用......
  • 亲测好用,吐血整理 ChatGPT 3.5/4.0 新手使用手册~ 【2024.08.21 更新】
    现在人工智能很强大,聊聊天、写论文、搞翻译、写代码、写文案、审合同、情感陪伴等,真是无所不能~本来以为ChatGPT早已普及了,没想到仍然有很多小伙伴还没用上。。。其实使用很简单,可以选通义、智谱、Deepseek等“83分”的国产大模型~国产大模型,平均80分左右~也可选国内的......
  • 使用sphinx自动提取python中的注释成为接口文档
    写好了代码,交付给他人使用的时候,查看代码固然可以了解各类和函数的功能细节,但接口文档能更方便的查找和说明功能。所以,一价与代码同步的接口文档是很有必要的。sphinx可以根据python中的注释,自动的生成接口文档,这样有利于保证文档和代码功能的同步。让我们来了解如何自动生......
  • 知识图谱——Gephi梳理学术脉络
    Gephi是一款开源的图形可视化和分析工具,它主要用于处理和可视化大型网络数据集。虽然Gephi主要用于图形分析,但它也可以作为一种有用的工具来辅助学术写作,尤其是在需要分析和展示研究领域内的网络关系时。下面我将详细介绍如何使用Gephi进行学术写作,并给出一个具体的例子。Geph......
  • delphi加密C#解密(AES-256)
    因为公司内部业务需要,用delphi加密的内容(流和字符串)要用C#解密,因为不懂delphi,我这里只是问同事要了代码,贴上delphi加密:共两个文件(AES.pas和ElAES.pas)AES.pas:(**************************************************************)(*......
  • Delphi 的 TMS 控件安装方法
    * 参考:tmsxdataaurliussparkle的手工安装(XE7)--------------------------------------------------------------------------------------------说明:下述安装方法的意思是:1)将所有包项目的编译结果放在 /Bin目录中,并将/Bin路径,放入系统变量Path的查找路径中。因编译......
  • 极简代码使用gradio openai 搭建chatbot
    主要用来方便测试接口。gr.ChatInterface()是比gr.Chatbot()更高一级的封装,如果只是需要一个纯文字聊天的窗口(见下图),完全满足需求。如果需要更多定制化的功能,比如定义prompt,显示图片等,那么就要使用gr.Chatbot()开发。修改为自己的接口,只需要修改predict_stream或者......
  • 吐血整理 ChatGPT 3.5/4.0 新手使用手册~ 【亲测好用】
    都知道ChatGPT很强大,聊聊天、写论文、搞翻译、写代码、写文案、审合同等等,无所不能~那么到底怎么使用呢?其实很简单了,国内AI产品发展也很快,很多都很好用了~我一直在用,建议收藏下来~  有最先进、最新的GPT模型,还有很多其他效率工具都是在各自领域,绝对领先地位的产品~①......
  • 亲测好用,吐血整理 ChatGPT 3.5/4.0 新手使用手册~
    都知道ChatGPT很强大,聊聊天、写论文、搞翻译、写代码、写文案、审合同等等,无所不能~那么到底怎么使用呢?其实很简单了,国内AI产品发展也很快,很多都很好用了~我一直在用,建议收藏下来~  有最先进、最新的GPT模型,还有很多其他效率工具都是在各自领域,绝对领先地位的产品~①......
  • Delphi下将自己写的Form加入到对象库
    1、设计好窗体,在窗体空白的地方点击右键,在弹出的菜单中选中“AddtoRespository”。在弹出的对话框中填写标题、描述、作者等信息,选择存放的页。完成后点“OK”保存。2、打开Tools->Repository,选中相应的页,可以修改已加入对象(窗体)的属性或删除已加入的对象。相关资料:对象库(Obje......