首页 > 其他分享 >大模型分类及代表性模型列表

大模型分类及代表性模型列表

时间:2024-12-08 15:02:51浏览次数:9  
标签:模态 文本 代表性 模型 生成 特点 应用 列表

大模型分类及代表性模型列表

以下是截至2024年较为全面的大模型分类及其代表性模型列表,涵盖国内外的模型,分为通用语言模型、多模态模型、垂直领域模型、基础模型等类别,具体特点和应用也总结如下:


一、通用语言模型(Natural Language Processing)

国外模型:

  1. GPT系列(OpenAI)

    • 模型版本:GPT-3、GPT-3.5、GPT-4
    • 特点:基于Transformer架构,训练数据覆盖面广,支持上下文理解、生成多轮对话、代码生成等。
    • 应用:聊天机器人、代码辅助、内容生成、知识问答等。
  2. PaLM系列(Google DeepMind)

    • 模型版本:PaLM、PaLM 2
    • 特点:支持多语言任务,注重推理能力和高效训练。
    • 应用:文本生成、翻译、信息抽取、问题解答等。
  3. Claude系列(Anthropic)

    • 模型版本:Claude 1、Claude 2
    • 特点:对安全性和稳健性高度优化,适合处理复杂对话和大规模数据。
    • 应用:聊天机器人、企业客户支持、敏感信息分析等。
  4. LLaMA系列(Meta)

    • 模型版本:LLaMA 1、LLaMA 2
    • 特点:开源模型,低计算成本,适合研究与二次开发。
    • 应用:文本生成、代码编写、知识问答等。

国内模型:

  1. 文心一言(百度)

    • 特点:支持中英文,结合百度知识图谱,强调搜索增强生成能力。
    • 应用:搜索问答、文本生成、内容创作等。
  2. 通义千问(阿里巴巴)

    • 特点:支持高效推理和生成任务,集成在阿里云产品中。
    • 应用:电商客户服务、文本生成、企业场景优化等。
  3. 讯飞星火(科大讯飞)

    • 特点:针对教育、医疗等领域优化,强调精准生成。
    • 应用:智能教育、专业文档生成、语音辅助等。
  4. 智谱悟道(智谱 AI)

    • 特点:面向科研和工业场景,强调解释性和可控性。
    • 应用:科研文献分析、工程设计优化等。

二、多模态模型(Multi-Modal Models)

国外模型:

  1. DALL-E系列(OpenAI)

    • 特点:将文本转为图像,支持创意内容生成。
    • 应用:插画设计、广告创意、内容生成等。
  2. CLIP(OpenAI)

    • 特点:联合文本和图像嵌入,用于分类和匹配任务。
    • 应用:图像搜索、内容推荐、多模态检索等。
  3. Imagen(Google)

    • 特点:高质量文本生成图像模型,支持超清分辨率输出。
    • 应用:广告设计、内容生成、视觉效果优化等。
  4. Flamingo(DeepMind)

    • 特点:支持连续的图像与文本输入,处理视频和多模态数据流。
    • 应用:视频分析、多模态内容理解、场景描述等。

国内模型:

  1. 紫东太初(华为)

    • 特点:融合语言、视觉和语音能力,面向多场景。
    • 应用:多模态搜索、智能问答、工业设计等。
  2. M6(阿里巴巴)

    • 特点:大规模多模态预训练模型,支持文本到图像生成。
    • 应用:内容电商、广告设计、视频制作等。
  3. 盘古α(华为)

    • 特点:支持多模态生成和工业应用场景。
    • 应用:智能制造、自动驾驶、医疗图像分析等。

三、垂直领域模型(Domain-Specific Models)

国外模型:

  1. Bloom(BigScience)

    • 特点:支持多语言处理,开源模型,专注于研究和开发。
    • 应用:多语言翻译、跨文化内容生成等。
  2. MedPaLM(Google DeepMind)

    • 特点:专注于医疗文本理解和生成,结合领域知识。
    • 应用:医学问答、诊断支持、病历分析等。
  3. CodeX(OpenAI)

    • 特点:优化代码生成任务,适配多种编程语言。
    • 应用:代码自动补全、编程助手、代码审查等。

国内模型:

  1. 慧医大模型(平安科技)

    • 特点:针对医疗领域优化,强调诊断支持和知识问答。
    • 应用:医疗问诊、辅助诊断、健康管理等。
  2. 智算大模型(清华大学)

    • 特点:覆盖金融、法律等垂直领域,训练数据精准。
    • 应用:法律文书生成、金融数据分析、智能推荐等。

四、基础模型(Foundation Models)

国外模型:

  1. BERT系列(Google)

    • 特点:预训练-微调架构,擅长上下文理解。
    • 应用:情感分析、文本分类、命名实体识别等。
  2. T5(Google)

    • 特点:统一文本到文本任务框架。
    • 应用:翻译、问答、摘要生成等。

国内模型:

  1. 悟道系列(北京智源研究院)
    • 特点:超大规模预训练,支持多模态任务。
    • 应用:通用人工智能研究、跨领域开发等。

总结

大模型的应用涵盖了通用对话、内容生成、专业领域优化以及多模态任务。未来的发展趋势将更注重模型的高效性、跨模态能力、领域适配性以及开放性。如需了解更细节的模型原理或技术实现,可进一步深入具体模型的研究文献。

标签:模态,文本,代表性,模型,生成,特点,应用,列表
From: https://blog.csdn.net/u012953777/article/details/144325997

相关文章

  • 帝国CMS 在超态信息插件中为sinfo模型增加字段
    在Sinfo插件中,可以在sinfo数据表中新增字段,控制单独每个sinfo的属性。以下是新增字段说明。可以仅选择新增其中某个字段。字段名:sinfo_md字段标识:页面模式字段类型:TINYINT存放表:副表输入表单显示元素:单选框初始值:0==默认:default1==列表式2==封面式其它各项默认。友......
  • 产品热设计结构模型预处理思路与solidworks处理方法
     ......
  • 【深度学习】利用Java DL4J 构建和训练医疗影像分析模型
    ......
  • 【推荐算法】推荐系统中的单目标精排模型
    前言:推荐系统中模型发展较快,初学者【也就是笔者】很难对模型进行一个系统的学习。因此,这篇文章总结了王树森中的视频以及《深度学习推荐系统》中的单目标精排模型,绘制了一个单目标精排模型的思维导图来帮助初学者【笔者】更好的学习。在后面的学习过程中,会加入更多的单目标......
  • 搭建人工智能多模态大语言模型的通用方法
    上一篇:《理解多模态大语言模型,主流技术与最新模型简介》序言:动手搭建建多模态LLM的两大通用主流方法是:统一嵌入-解码器架构和跨模态注意力架构,它们都是通过利用图像嵌入与投影、跨注意力机制等技术来实现的。构建多模态LLM的常见方法构建多模态LLM(大型语言模型)主要有两种......
  • 解决|diffusion transformer的环境安装慢问题、vae预训练模型下载失败问题、扩散模型
    目录环境安装慢1、换源2、直接下载包到本地vae预训练模型下载失败1、去huggingface官网下载对应的模型2、传输至服务器的某个文件夹3、在代码里直接加载下载好的模型:扩散模型的损失参考链接环境安装慢这个问题有很多解决方法,我比较喜欢的是以下两种:1、换源我体验下来,清华源是......
  • 什么是隐马尔可夫模型
    隐马尔可夫模型(HiddenMarkovModel,HMM)隐马尔可夫模型(HMM)是一个统计模型,用来描述一个由不可观测(隐含)状态组成的马尔可夫过程,并且这些隐状态是通过可观测的变量(观测数据)来间接推测的。模型基本结构HMM是一个典型的概率图模型,由以下几个主要元素组成:隐状态集合(Hidden......
  • 【推荐算法】推荐系统中的单目标精排模型
    前言:推荐系统中模型发展较快,初学者【也就是笔者】很难对模型进行一个系统的学习。因此,这篇文章总结了王树森中的视频以及《深度学习推荐系统》中的单目标精排模型,绘制了一个单目标精排模型的思维导图来帮助初学者【笔者】更好的学习。在后面的学习过程中,会加入更多的单目标精排论......
  • BlueLM-V-3B:在手机上实现高性能多模态大型语言模型的创新路径
    目录一、前言二、方案概述三、技术创新1、动态图像分辨率优化2、硬件感知的系统优化3、令牌下采样4、模型量化与整体框架优化四、方案亮点五、性能展示1、宽松纵横比匹配效果2、不同基准测试中的表现3、部署效率评估六、应用场景1、智能语音助手2、图像识别与理解3、多......
  • 大模型真的带来了很多机会,关键是找准赛道
    先做个自我介绍:【如果咱们已经是老朋友了,这部分文字请直接跳过。】我是一位20年经验的编程老师傅。做过创业公司的CEO,也在上市企业担任过技术总监和首席专家。现在是中科院某重点实验室的高级工程师、研究组负责人。一直在这个领域深耕,我也深刻感受到随着软件系统越来越庞......