微软的Phi-3.5系列发布三重威胁

时间：2024-08-22 16:25:33浏览次数：20

微软通过新的 Phi-3.5 系列在 AI 领域迈出了新的一步，提供了三种为不同任务设计的最先进模型。这些模型不仅功能强大，而且用途广泛，使开发人员能够轻松处理从基本编码到复杂问题解决，甚至视觉任务。无论您是使用有限资源，还是需要高级的人工智能功能，Phi-3.5 系列模型都能满足您的需求，以下是一个快速概览。

解析微软的Phi-3.5模型

微软最新发布的 Phi 3.5 系列引入了三种先进的 AI 模型：Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct 和 Phi-3.5-vision-instruct。每个模型都是为特定需求而设计的，从基本逻辑推理到高级多模态任务处理。

所有三个微软 Phi-3.5 模型都在 MIT 许可下发布，这允许开发人员在几乎没有限制的情况下使用、修改和分发这些模型。这种开源方法支持广泛采用，并促进了各个应用和研究领域的创新。

Phi-3.5 Mini Instruct：高效紧凑

微软 Phi-3.5 Mini Instruct 模型在计算资源有限的环境中表现出色。拥有 38 亿参数，专为需要强逻辑推理能力但不需要大量计算能力的任务而设计。使用 512 个 H100-80G GPU 训练了 3.4 万亿个标记，耗时 10 天。

主要特点：

参数： 38 亿
上下文长度： 128k 个标记
主要用途： 代码生成、数学问题解决、基于逻辑的推理
性能： 尽管尺寸较小，它在多语言和多回合对话任务中表现出色。它在测量长上下文代码理解的基准测试 RepoQA 中表现优异，超过了 Llama-3.1-8B-instruct 等类似尺寸的模型。

Phi-3.5 Mini Instruct 的高效设计使其在资源受限的情况下仍能提供强大的性能。这使其适合在计算资源有限但仍需要高性能的情况下部署。

Phi-3.5 MoE：专家混合架构

微软 Phi-3.5 MoE（专家混合）模型通过将多个专门的模型组合成一个代表了一种复杂的 AI 架构方法。它具有独特的设计，不同的“专家”根据任务被激活，优化各个领域的性能。使用 512 个 H100-80G GPU 训练了 4.9 万亿个标记，耗时 23 天。

主要特点：

参数： 420 亿（活跃），其中 66 亿在操作期间被激活
上下文长度： 128k 个标记
主要用途： 复杂推理任务、代码理解、多语种语言理解
性能： MoE 模型在代码和数学任务中表现出色，并具有较强的多语种理解能力。它在某些基准测试中经常超过更大的模型，包括在 5 轮 MMLU（大规模多任务语言理解）测试中明显优于 GPT-4o mini。

Phi-3.5 MoE 架构通过激活与给定任务相关的一部分参数来增强可扩展性和效率。这使得模型能够处理各种应用，同时在不同语言和主题中保持高性能。

Phi-3.5 Vision Instruct：高级多模态能力

微软Phi-3.5 Vision Instruct 模型旨在处理文本和图像数据，使其成为多模态 AI 任务处理的强大工具。它集成了先进的图像处理和文本理解，支持多种复杂的视觉和文本分析任务。使用 256 个 A100-80G GPU 训练了 5000 亿个标记，耗时 6 天。

主要特点：

参数： 41.5 亿
上下文长度： 128k 个标记
主要用途： 图像理解、光学字符识别（OCR）、图表和表格理解、视频摘要
性能： 在合成和过滤的公共数据集上训练，Vision Instruct 模型在处理复杂的多帧图像处理任务中表现出色，并提供视觉和文本信息的全面分析。

Phi-3.5 Vision Instruct 模型能够处理和集成文本和图像，使其在需要详细视觉分析的应用中高度多功能化。这种能力在处理多种数据类型和格式的任务中尤其有价值。

Phi-3.5 Vision Instruct 模型还可以通过 Azure AI Studio 访问。

标签：Phi,微软,模型,Instruct,任务,3.5,三重
From： https://blog.csdn.net/2401_86753260/article/details/141431464

delphi webbrowser屏蔽右键菜单防止右键防止ctrl N
本文介绍了如何在Delphi中通过事件处理和消息过滤，阻止WebBrowser控件中的右键菜单以及防止用户使用Ctrl+N快捷键。通过`ProcessMsg`和`ApplicationEvents1Message`等方法实现对浏览器行为的控制。{关键字=webbrowser屏蔽右键菜单防止右键防止ctrlN采集软件=MKM-我的知识管理......
从零到一，全面掌握Apache DolphinScheduler发版流程，实战派经验分享！
引言ApacheDolphinScheduler的发版流程对于确保软件质量和社区协作至关重要，社区Committer王兴杰为我们详细介绍了ApacheDolphinScheduler的发版流程，包括环境准备、流程文档、基础工具准备、依赖包确认等关键步骤，并指出了发版流程中可能会遇到的麻烦以及相应的解决方案，欢迎学习......
微软发布功能强大的全新 Phi-3.5 机型，击败谷歌、OpenAI 等公司
微软并没有因为与OpenAI的合作而满足于其在人工智能领域的成功。相反，这家因总部位于华盛顿州而被称为雷德蒙德（Redmond）的公司今天发布了其不断发展的语言/多模态人工智能Phi系列中的3个新模型。这三个模型分别针对基本/快速推理、更强大的推理和视觉（图像和视频分析）任......
亲测好用，吐血整理 ChatGPT 3.5/4.0 新手使用手册~ 【2024.08 更新】
废话不多说，直接分享正文~以下是小编为大家搜集到的最新的ChatGPT国内站，各有优缺点。1、AIPlus（稳定使用）推荐指数：⭐⭐⭐⭐⭐ yixiaai.com该网站已经稳定运营了1年多了。2023年3月份第一批上线的网站。网站支持GPT-3.5、4.0及4o、4omini模型，手机和电脑都能用......
亲测好用，吐血整理 ChatGPT 3.5/4.0 新手使用手册~ 【2024.08.21 更新】
现在人工智能很强大，聊聊天、写论文、搞翻译、写代码、写文案、审合同、情感陪伴等，真是无所不能~本来以为ChatGPT早已普及了，没想到仍然有很多小伙伴还没用上。。。其实使用很简单，可以选通义、智谱、Deepseek等“83分”的国产大模型~国产大模型，平均80分左右~也可选国内的......
使用sphinx自动提取python中的注释成为接口文档
写好了代码，交付给他人使用的时候，查看代码固然可以了解各类和函数的功能细节，但接口文档能更方便的查找和说明功能。所以，一价与代码同步的接口文档是很有必要的。sphinx可以根据python中的注释，自动的生成接口文档，这样有利于保证文档和代码功能的同步。让我们来了解如何自动生......
知识图谱——Gephi梳理学术脉络
Gephi是一款开源的图形可视化和分析工具，它主要用于处理和可视化大型网络数据集。虽然Gephi主要用于图形分析，但它也可以作为一种有用的工具来辅助学术写作，尤其是在需要分析和展示研究领域内的网络关系时。下面我将详细介绍如何使用Gephi进行学术写作，并给出一个具体的例子。Geph......
delphi加密C#解密（AES-256）
因为公司内部业务需要，用delphi加密的内容（流和字符串）要用C#解密，因为不懂delphi，我这里只是问同事要了代码，贴上delphi加密：共两个文件（AES.pas和ElAES.pas）AES.pas：(**************************************************************)(*......
Delphi 的 TMS 控件安装方法
* 参考：tmsxdataaurliussparkle的手工安装（XE7）--------------------------------------------------------------------------------------------说明：下述安装方法的意思是：1）将所有包项目的编译结果放在 /Bin目录中，并将/Bin路径，放入系统变量Path的查找路径中。因编译......

微软的Phi-3.5系列发布三重威胁

解析微软的Phi-3.5模型

Phi-3.5 Mini Instruct：高效紧凑

Phi-3.5 MoE：专家混合架构

Phi-3.5 Vision Instruct：高级多模态能力

相关文章

赞助商

阅读排行