大模型现有领域研究

时间：2024-04-05 19:31:32浏览次数：21

分类参考https://csdnnews.blog.csdn.net/article/details/137337597?spm=1000.2115.3001.5926&ydreferer=aHR0cHM6Ly93d3cuY3Nkbi5uZXQv

对现有领域热点进行总结，后续会基于这些进行补充，会对其中的名词进行解释。

开始编辑日期2024/4//4，最后编辑时间2024/4/4

1. 大语言模型技术演进

LLM: Large Language Model大语言模型

AGI: Artificial General Intelligence人工通用智能

2. 多模态大模型

多模态：多模态即多种异构模态数据协同推理。多模态数据分析外需与高级认知智能内需相互促进。在人工智能领域中，往往指感知信息，如图像、文本、语音等协同，帮人工智能更准确地理解外部世界。可用方法包含：双路卷积神经网络等。

3 大模型工程与架构

分布式：基于多节点/机器的，之间通过网络互联，可以是高性能网络、也可以是Internet网络。

4 大模型应用开发实践

大模型RAG：Retrieval-Augmented Generation检索增强生成

具体来说，RAG通过以下方式工作：

它首先利用检索模块从大规模知识库中检索与当前任务相关的信息。
然后，这些检索到的信息与大型语言模型结合，以生成符合上下文的准确回答。这种结合不仅提高了答案的准确性，还增强了其相关性。

RAG的应用范围广泛，包括问答系统、文本摘要、对话系统等多个领域。它的主要技术优势在于能够提供准确且符合上下文的答案，同时减少模型幻觉，提升对实时性要求较高问题的处理能力。这与传统仅依赖LLM生成内容的方法相比，RAG技术可以从外部知识库中检索信息，避免了模型的幻觉问题，并提升了对实时性要求较高问题的处理能力。

5 GenAI

GenAI（生成式人工智能）是一种基于深度学习和自然语言处理技术的人工智能系统，能够生成类似人类的文本、图像、音频等内容。

GenAI利用大规模神经网络模型，根据训练数据对文本、图像、视频、音频等进行自动生成。其代表应用包括对话系统如ChatGPT）、图像生成模型（如DALL-E），以及其他模态的生成模型。GenAI不仅能分析现有数据，还能生成新数据，甚至探索未知领域。

6 代码大模型

论文综述：A Survey on Language Models for Code

https://arxiv.org/pdf/2311.07989v1.pdf

7 大模型应用框架

例如：TensorRT-LLM

8 AI 智能代理 (AI Agent)

LLM-based Agent: 例如定制化的LLM

复旦团队调研：https://github.com/WooooDyy/LLM-Agent-Paper-List?tab=readme-ov-file

9 AI Infra 大模型基础设施

AI Infra，即人工智能基础设施,是连接算力和应用的AI中间层基础设施。它涵盖了数据准备、模型训练、模型部署和应用整合等环节,其中的基础软件工具有较高商业化潜力。AI Infra包括处理器、操作系统、存储系统、网络基础设施、云计算平台等底层技术设施。

10 ML/LLM Ops 大模型运维

MLOps是一种将软件工程的原则和实践应用于机器学习(ML)系统的实践，旨在自动化和管理机器学习模型的生命周期。

MLOps涵盖数据处理、模型训练、模型部署、模型监控和模型更新等阶段。MLOps的核心目标是提高机器学习系统的可靠性、可重复性、可扩展性和安全性，以更好地满足业务需求。MLOps不仅仅是一组工具或技术，而是一种整合数据科学家、工程师和运营人员之间合作的实践方法，旨在实现高效、协作的机器学习开发和部署流程。

标签：模态,RAG,AI,模型,领域,LLM,现有,生成
From： https://blog.csdn.net/qq_33345365/article/details/137376033

ARM架构的异常模型
一、异常级别1、异常级别0（EL0）用户模式，是四个异常级别中权限最低的一个。目标软件：应用程序代码设计用途：运行绝大多数终端用户的软件，如文档编辑器、游戏和通讯应用。这些应用程序运行在一个受限的环境中，以减少它们对系统安全性和稳......
在深度学习模型中引入先验
当面对复杂问题的时候，在深度学习模型提取特征的过程中完全抛弃知识是非常不明智的策略。虽然有很多研究者在深度网络处理数据之前，利用具有某种知识的模型驱动方法对数据进行预处理，但是这种方法没有进行实质性地改造深度网络，且这种两阶段方法从端到端学习策略来看很难达到最优。......
书生·浦语大模型全链路开源体系——学习笔记day2&day3--纯纯新手入门
学习链接：tutorial/helloworld/hello_world.mdatmain·InternLM/tutorial(github.com) 【精彩，照着做就能体验很多本来遥不可及的东西】笔记分享链接：https://github.com/InternLM/tutorial/discussions/37 本笔记定位是对学习链接的补充和小白发牢骚，希望大佬能愿意点评一......
three.js基础之几何体颜色、纹理贴图、外部模型
几何体颜色<body><canvasid="mainCanvas"width="400px"height="300px"></canvas></body><scripttype="importmap">{"imports":{"three":"./js/build/......
突破编程_C++_网络编程（TCPIP 四层模型（传输层））
1传输层的功能与作用在TCP/IP四层模型中，传输层位于网络层之上和应用层之下，负责在源主机和目标主机之间提供端到端的可靠数据传输服务。传输层的主要功能与作用体现在以下几个方面：分段与重组：由于网络层的数据包大小有限制（如IP数据包的最大长度为65535字节），而应用层......
【系统深入学习GO】Go 的并发机制-原理探究线程实现模型
在操作系统提供的内核线程之上，Go搭建了一个特有的两级线程模型。*两级线程模型：两级线程模型也称为多对多（M:N）的线程实现。与其他模型相比，两级线程模型提供了更求的灵活性。在此模型下，一个进程可以与多个KSE相关联，这与内核级线程模型相似。但与内核级线程模型不同的是，进程......
springAI初体验让人人都能跑大模型
springAI初体验让人人都能跑大模型SpringAI是一个旨在简化开发包含人工智能功能的应用程序的项目。它受到Python项目如LangChain和LlamaIndex的启发，但并非这些项目的直接移植。SpringAI的核心理念是为开发AI应用程序提供基础抽象，这些抽象有多个实现，使得在不同实现之间......
OpenAI劲敌出手！Claude 3正式发布，全面超越GPT-4。Claude3模型特点和使用教程分享
已有GPT官方账号不会升级GPT4请参考：【国内如何用gpt4？如何升级gpt4？保姆级教程】一、Claude震撼发布焦点分析1.Claude震撼发布北京时间2024年3月4日晚间，Anthropic，毫无预警地发布了最新一代大模型Claude3，距离上一代的Claude2发布，仅相隔8个月。Claude发布了最新的大模型Cla......
数学模型，第2章训练题，超市购物，垂钓俱乐部，圆盘加工，动物尺寸，python，论文
目录 1.题目描述2. 题目描述3.题目描述4.题目描述5.问题描述1. 题目描述在超市购物时你注意到大包装商品比小包装商品便宜这种现象了吗？比如佳洁士牙膏120g装的每支10.80元，200g装的每支15.80元，二者单位质量的价格比是1.14:1。使用比例方法构造模型解......
windows编程模型
WinMain函数的定义int WINAPI WinMain(HINSTANCE hInstance,//应用程序实例HINSTANCE hPrevInstance,//上一个应用程序实例LPSTR lpCmdLine,//命令行参数int nShowCmd);//窗口显示的样式 WINAPI：是一个宏，它代表的是__stdcall（注意是两个下划线），表示的是参数传递......