首页 > 其他分享 >微软的Phi-3.5系列发布三重威胁

微软的Phi-3.5系列发布三重威胁

时间:2024-08-22 16:25:33浏览次数:14  
标签:Phi 微软 模型 Instruct 任务 3.5 三重

微软通过新的 Phi-3.5 系列在 AI 领域迈出了新的一步,提供了三种为不同任务设计的最先进模型。这些模型不仅功能强大,而且用途广泛,使开发人员能够轻松处理从基本编码到复杂问题解决,甚至视觉任务。无论您是使用有限资源,还是需要高级的 人工智能 功能,Phi-3.5 系列模型都能满足您的需求,以下是一个快速概览。

解析微软的Phi-3.5模型

微软最新发布的 Phi 3.5 系列引入了三种先进的 AI 模型:Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct 和 Phi-3.5-vision-instruct。每个模型都是为特定需求而设计的,从基本逻辑推理到高级多模态任务处理。

所有三个微软 Phi-3.5 模型都在 MIT 许可下发布,这允许开发人员在几乎没有限制的情况下使用、修改和分发这些模型。这种开源方法支持广泛采用,并促进了各个应用和研究领域的创新。

Phi-3.5 Mini Instruct:高效紧凑

微软 Phi-3.5 Mini Instruct 模型在计算资源有限的环境中表现出色。拥有 38 亿参数,专为需要强逻辑推理能力但不需要大量计算能力的任务而设计。使用 512 个 H100-80G GPU 训练了 3.4 万亿个标记,耗时 10 天。

主要特点:

  • 参数: 38 亿
  • 上下文长度: 128k 个标记
  • 主要用途: 代码生成、数学问题解决、基于逻辑的推理
  • 性能: 尽管尺寸较小,它在多语言和多回合对话任务中表现出色。它在测量长上下文代码理解的基准测试 RepoQA 中表现优异,超过了 Llama-3.1-8B-instruct 等类似尺寸的模型。

Phi-3.5 Mini Instruct 的高效设计使其在资源受限的情况下仍能提供强大的性能。这使其适合在计算资源有限但仍需要高性能的情况下部署。

Phi-3.5 MoE:专家混合架构

微软 Phi-3.5 MoE(专家混合) 模型通过将多个专门的模型组合成一个代表了一种复杂的 AI 架构方法。它具有独特的设计,不同的“专家”根据任务被激活,优化各个领域的性能。使用 512 个 H100-80G GPU 训练了 4.9 万亿个标记,耗时 23 天。

主要特点:

  • 参数: 420 亿(活跃),其中 66 亿在操作期间被激活
  • 上下文长度: 128k 个标记
  • 主要用途: 复杂推理任务、代码理解、多语种语言理解
  • 性能: MoE 模型在代码和数学任务中表现出色,并具有较强的多语种理解能力。它在某些基准测试中经常超过更大的模型,包括在 5 轮 MMLU(大规模多任务语言理解)测试中明显优于 GPT-4o mini。

Phi-3.5 MoE 架构通过激活与给定任务相关的一部分参数来增强可扩展性和效率。这使得模型能够处理各种应用,同时在不同语言和主题中保持高性能。

Phi-3.5 Vision Instruct:高级多模态能力

微软Phi-3.5 Vision Instruct 模型旨在处理文本和图像数据,使其成为多模态 AI 任务处理的强大工具。它集成了先进的图像处理和文本理解,支持多种复杂的视觉和文本分析任务。使用 256 个 A100-80G GPU 训练了 5000 亿个标记,耗时 6 天。

主要特点:

  • 参数: 41.5 亿
  • 上下文长度: 128k 个标记
  • 主要用途: 图像理解、光学字符识别(OCR)、图表和表格理解、视频摘要
  • 性能: 在合成和过滤的公共数据集上训练,Vision Instruct 模型在处理复杂的多帧图像处理任务中表现出色,并提供视觉和文本信息的全面分析。

Phi-3.5 Vision Instruct 模型能够处理和集成文本和图像,使其在需要详细视觉分析的应用中高度多功能化。这种能力在处理多种数据类型和格式的任务中尤其有价值。

Phi-3.5 Vision Instruct 模型还可以通过 Azure AI Studio 访问。

标签:Phi,微软,模型,Instruct,任务,3.5,三重
From: https://blog.csdn.net/2401_86753260/article/details/141431464

相关文章

  • 微软发布 Phi-3.5 系列模型,涵盖端侧、多模态、MOE;字节 Seed-ASR:自动识别多语言丨 RTE
       开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(Real-TimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编......
  • delphi webbrowser屏蔽右键菜单 防止右键 防止ctrl N
    本文介绍了如何在Delphi中通过事件处理和消息过滤,阻止WebBrowser控件中的右键菜单以及防止用户使用Ctrl+N快捷键。通过`ProcessMsg`和`ApplicationEvents1Message`等方法实现对浏览器行为的控制。{关键字=webbrowser屏蔽右键菜单防止右键防止ctrlN采集软件=MKM-我的知识管理......
  • 从零到一,全面掌握Apache DolphinScheduler发版流程,实战派经验分享!
    引言ApacheDolphinScheduler的发版流程对于确保软件质量和社区协作至关重要,社区Committer王兴杰为我们详细介绍了ApacheDolphinScheduler的发版流程,包括环境准备、流程文档、基础工具准备、依赖包确认等关键步骤,并指出了发版流程中可能会遇到的麻烦以及相应的解决方案,欢迎学习......
  • 微软发布功能强大的全新 Phi-3.5 机型,击败谷歌、OpenAI 等公司
    微软并没有因为与OpenAI的合作而满足于其在人工智能领域的成功。相反,这家因总部位于华盛顿州而被称为雷德蒙德(Redmond)的公司今天发布了其不断发展的语言/多模态人工智能Phi系列中的3个新模型。这三个模型分别针对基本/快速推理、更强大的推理和视觉(图像和视频分析)任......
  • 亲测好用,吐血整理 ChatGPT 3.5/4.0 新手使用手册~ 【2024.08 更新】
    废话不多说,直接分享正文~以下是小编为大家搜集到的最新的ChatGPT国内站,各有优缺点。1、AIPlus(稳定使用)推荐指数:⭐⭐⭐⭐⭐     yixiaai.com该网站已经稳定运营了1年多了。2023年3月份第一批上线的网站。网站支持GPT-3.5、4.0及4o、4omini模型,手机和电脑都能用......
  • 亲测好用,吐血整理 ChatGPT 3.5/4.0 新手使用手册~ 【2024.08.21 更新】
    现在人工智能很强大,聊聊天、写论文、搞翻译、写代码、写文案、审合同、情感陪伴等,真是无所不能~本来以为ChatGPT早已普及了,没想到仍然有很多小伙伴还没用上。。。其实使用很简单,可以选通义、智谱、Deepseek等“83分”的国产大模型~国产大模型,平均80分左右~也可选国内的......
  • 使用sphinx自动提取python中的注释成为接口文档
    写好了代码,交付给他人使用的时候,查看代码固然可以了解各类和函数的功能细节,但接口文档能更方便的查找和说明功能。所以,一价与代码同步的接口文档是很有必要的。sphinx可以根据python中的注释,自动的生成接口文档,这样有利于保证文档和代码功能的同步。让我们来了解如何自动生......
  • 知识图谱——Gephi梳理学术脉络
    Gephi是一款开源的图形可视化和分析工具,它主要用于处理和可视化大型网络数据集。虽然Gephi主要用于图形分析,但它也可以作为一种有用的工具来辅助学术写作,尤其是在需要分析和展示研究领域内的网络关系时。下面我将详细介绍如何使用Gephi进行学术写作,并给出一个具体的例子。Geph......
  • delphi加密C#解密(AES-256)
    因为公司内部业务需要,用delphi加密的内容(流和字符串)要用C#解密,因为不懂delphi,我这里只是问同事要了代码,贴上delphi加密:共两个文件(AES.pas和ElAES.pas)AES.pas:(**************************************************************)(*......
  • Delphi 的 TMS 控件安装方法
    * 参考:tmsxdataaurliussparkle的手工安装(XE7)--------------------------------------------------------------------------------------------说明:下述安装方法的意思是:1)将所有包项目的编译结果放在 /Bin目录中,并将/Bin路径,放入系统变量Path的查找路径中。因编译......